在 Python 中以 UTF8 进行编码

Fariba Laiq 2022年7月18日
在 Python 中以 UTF8 进行编码

UTF 代表 Unicode 转换格式。它是一种可变宽度编码系统,将 Unicode 覆盖的所有字符编码为一到四个字节的二进制字符串。

它允许表示国际字符,例如中文。它还向后兼容 ASCII。

UTF-8 主要用于对电子邮件和网页进行编码。

在 Python 中使用 encode() 以 UTF-8 编码字符串

在 Python 中,如果我们想以 UTF-8 编码字符串,我们将使用 encode() 方法。它是一种返回字符串编码版本的内置方法。

默认情况下,它不接受任何参数并将字符串转换为 UTF-8。但是,它可以接受两个可选参数,encodingerrors

encoding 是指使用的编码技术,errors 表示编码失败时的响应。默认响应是 strict,它会在失败时引发 UnicodeDecodeError 异常。

在下面的代码中,我们编码了单词 Naïve,其中包含一个特殊字符ïencode() 方法将整个文本转换为 UTF-8 版本。

示例代码:

string="Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())

输出:

String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
Author: Fariba Laiq
Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

相关文章 - Python Encode