在 Python 中以 UTF8 进行编码
Fariba Laiq
2022年7月18日
UTF 代表 Unicode 转换格式
。它是一种可变宽度编码系统,将 Unicode 覆盖的所有字符编码为一到四个字节的二进制字符串。
它允许表示国际字符,例如中文。它还向后兼容 ASCII。
UTF-8 主要用于对电子邮件和网页进行编码。
在 Python 中使用 encode()
以 UTF-8 编码字符串
在 Python 中,如果我们想以 UTF-8 编码字符串,我们将使用 encode()
方法。它是一种返回字符串编码版本的内置方法。
默认情况下,它不接受任何参数并将字符串转换为 UTF-8。但是,它可以接受两个可选参数,encoding
和 errors
。
encoding
是指使用的编码技术,errors
表示编码失败时的响应。默认响应是 strict
,它会在失败时引发 UnicodeDecodeError
异常。
在下面的代码中,我们编码了单词 Naïve
,其中包含一个特殊字符ï
。encode()
方法将整个文本转换为 UTF-8 版本。
示例代码:
string="Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())
输出:
String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
Author: Fariba Laiq
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn