在 Python 中以 UTF8 進行編碼

Fariba Laiq 2022年7月18日
在 Python 中以 UTF8 進行編碼

UTF 代表 Unicode 轉換格式。它是一種可變寬度編碼系統,將 Unicode 覆蓋的所有字元編碼為一到四個位元組的二進位制字串。

它允許表示國際字元,例如中文。它還向後相容 ASCII。

UTF-8 主要用於對電子郵件和網頁進行編碼。

在 Python 中使用 encode() 以 UTF-8 編碼字串

在 Python 中,如果我們想以 UTF-8 編碼字串,我們將使用 encode() 方法。它是一種返回字串編碼版本的內建方法。

預設情況下,它不接受任何引數並將字串轉換為 UTF-8。但是,它可以接受兩個可選引數,encodingerrors

encoding 是指使用的編碼技術,errors 表示編碼失敗時的響應。預設響應是 strict,它會在失敗時引發 UnicodeDecodeError 異常。

在下面的程式碼中,我們編碼了單詞 Naïve,其中包含一個特殊字元ïencode() 方法將整個文字轉換為 UTF-8 版本。

示例程式碼:

string="Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())

輸出:

String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
Author: Fariba Laiq
Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

相關文章 - Python Encode