在 Python 中以 UTF8 進行編碼
Fariba Laiq
2022年7月18日
UTF 代表 Unicode 轉換格式
。它是一種可變寬度編碼系統,將 Unicode 覆蓋的所有字元編碼為一到四個位元組的二進位制字串。
它允許表示國際字元,例如中文。它還向後相容 ASCII。
UTF-8 主要用於對電子郵件和網頁進行編碼。
在 Python 中使用 encode()
以 UTF-8 編碼字串
在 Python 中,如果我們想以 UTF-8 編碼字串,我們將使用 encode()
方法。它是一種返回字串編碼版本的內建方法。
預設情況下,它不接受任何引數並將字串轉換為 UTF-8。但是,它可以接受兩個可選引數,encoding
和 errors
。
encoding
是指使用的編碼技術,errors
表示編碼失敗時的響應。預設響應是 strict
,它會在失敗時引發 UnicodeDecodeError
異常。
在下面的程式碼中,我們編碼了單詞 Naïve
,其中包含一個特殊字元ï
。encode()
方法將整個文字轉換為 UTF-8 版本。
示例程式碼:
string="Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())
輸出:
String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
Author: Fariba Laiq
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn