在 Python 中将字符串转换为 Unicode

Muhammad Maisam Abbas 2023年1月30日 2022年5月17日
  1. 在 Python 2 中将字符串转换为 Unicode
  2. 在 Python 3 中将字符串转换为 Unicode 格式
在 Python 中将字符串转换为 Unicode

本教程将讨论在 Python 中将常规字符串转换为 Unicode 字符串。

在 Python 2 中将字符串转换为 Unicode

在 Python 2 中,常规字符串称为字节字符串,我们可以使用内置的 unicode() 函数 将这些字节字符串转换为 Unicode 字符串。此代码片段向我们展示了如何在 Python 2 中将常规字符串转换为 Unicode 字符串。

regular = "regular string"
unicode_string = unicode(regular, "utf-8")
print(type(regular))
print(type(unicode_string))

输出:

<type 'str'>
<type 'unicode'>

我们使用 Python 2 中的 unicode() 函数将常规字节字符串转换为 Unicode 字符串。

在 Python 3 中将字符串转换为 Unicode 格式

在 Python 3 中,默认情况下字符串是 Unicode 字符串,我们无法将常规字符串转换为 Unicode 字符串。因此,以下代码在 Python 2 和 Python 3 上给出了不同的结果。

regular = "regular string"
unicode_string = u"Unicode string"
print(type(regular))
print(type(unicode_string))

Python 2 输出:

<type 'str'>
<type 'unicode'>

Python 3 输出:

<class 'str'>
<class 'str'>

在上面的代码中,我们在 Python 2 和 Python 3 中都初始化了一个 Unicode 字符串。在 Python 2 中,字符串属于 unicode 类,因为常规字符串和 Unicode 字符串之间存在区别,而在 Python 3 中,字符串属于类 str。毕竟,Unicode 字符串与常规字符串相同。

Muhammad Maisam Abbas avatar Muhammad Maisam Abbas avatar

Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.

LinkedIn