Python 数据类型 - 集合
我们将来学习在 Python 中如何创建集合,以及如何增加和删除其中的元素。
集合包含了不重复以及没有排序的元素。
集合是可变数据类型,所以你可以增加或者删除集合中的元素。
创建集合
集合可以通过大括号 {}
来创建,里面的元素用逗号 ,
来分开。你也可以通过 Python 的内置函数 set()
来创建集合。
集合中的元素可以为不同的数据类型,而且元素必须是不可变数据类型,比如,元组可以作为集合的元素,但是集合、列表或者字典就不能是集合的元素。
>>> x = {3, 5, 7, 2, 4, 5}
>>> print(x) #prints the set variable
{2, 3, 4, 5, 7}
>>> print(type(x)) #checking type of x
<class 'set'>
你可以通过 set()
函数 with empty parameters to create an empty list. If you write {}
to create an empty object, it is interpreted as a dictionary:
>>> x = {}
>>> print(type(x))
<class 'dict'>
>>> x = set()
>>> print(type(x))
<class 'set'>
更新集合
索引和切片操作不能用来更新集合中的元素,因为集合不是一个有序的数据类型。可以通过 add()
方法来向集合中添加一个新元素,如果你想添加多个元素的话,可以使用 update()
方法。
>>> s = {2, 4}
>>> print(s)
{2, 4}
>>> s.add(6)
>>> print(s)
{2, 4, 6}
>>> s.update([2, 4, 6])
>>> print(s)
{2, 4, 6}
>>> s.update([5,6], {7, 8, 9})
>>> print(s)
{2, 4, 5, 6, 7, 8, 9}
删除集合中的元素
集合可以通过 discard()
或 remove()
方法来删除其中的某个元素。discard()
和 remove()
方法的差别在于当要去除的元素在集合中不存在时,discard()
不会报错,而 remove()
会产生错误信息。
>>> s = {2, 4, 5, 6, 7, 8, 9}
>>> print(s)
{2, 4, 5, 6, 7, 8, 9}
>>> s.discard(6)
>>> print(s)
{2, 4, 5, 7, 8, 9}
>>> s.remove(8)
>>> print(s)
{2, 4, 5, 7, 9}
>>> s.discard(6) #no error
>>> s.remove(8) #generated an error
Traceback (most recent call last):
File "<pyshell#18>", line 1, in <module>
s.remove(8)
KeyError: 8
你可以通过 pop()
方法来删除集合中的一个元素,但 pop()
方法删除的元素可能是集合中的任意的一个元素。
>>> s = set("Python")
>>> s
{'o', 'n', 'h', 'P', 'y', 't'}
>>> s.pop()
o
>>> s.pop()
n
>>> s
{'h', 'P', 'y', 't'}
>>> s.clear()
>>> print(s)
set()
clear()
方法是用来删除集合中的所有元素。
>>> s = set("Python")
>>> s.clear()
>>> s
set()
集合的操作
集合的操作方法包括以下几种,比如 union
、intersection
、difference
和 symmetric_difference
。
假设你有下面两个集合 x
和 y
:
>>> x = {1, 2, 3, 4, 5, 6}
>>> y = {7, 8, 9, 10, 11, 12}
并集
两个集合的并集是包含两集合中所有元素的集合,Python 中可以使用 |
操作符或者 union()
方法来求两集合的并集。
>>> print(x | y)
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
#using union() method on x
>>> x.union(y)
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
#union on y
>>> y.union(x)
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
交集
两个集合的并集是在两集合中都有的元素的集合,Python 中可以使用 &
操作符或者 intersection()
方法来求两集合的交集。
>>> x = {1, 2, 3, 4, 5, 6}
>>> y = {7, 8, 9, 2, 6, 1}
>>> print(x & y)
{1, 2, 6}
#using intersection() method on x
>>> x.intersection(y)
{1, 2, 6}
#intersection on y
>>> y.intersection(x)
{1, 2, 6}
差集
集合 x
和 y
的差集是元素在 x
中存在,而在 y
中不存在的元素的集合,比如,x - y
中的元素在集合 x
而不在集合 y
中。Python 可以使用操作符 -
或者 difference()
方法来求差集。
>>> x = {1, 2, 3, 4, 5, 6}
>>> y = {7, 8, 9, 2, 6, 1}
>>> print(x - y)
{3, 4, 5}
#using difference() method on x
>>> x.difference(y)
{3, 4, 5}
#diference on y
>>> y.difference(x)
{8, 9, 7}
对称差集
对称差集是其中的元素不同时在两个集合中出现的集合,Python 求对称差集可以使用^
操作符或者 symmetric_difference()
方法。
>>> x = {1, 2, 3, 4, 5, 6}
>>> y = {7, 8, 9, 2, 6, 1}
>>> print(x ^ y)
{3, 4, 5, 7, 8, 9}
#using symmetric_difference() method on x
>>> x.symmetric_difference(y)
{3, 4, 5, 7, 8, 9}
#symmetric_diference on y
>>> y.symmetric_difference(x)
{3, 4, 5, 7, 8, 9}
集合方法
方法 | 描述 |
---|---|
add() |
增加一个元素到集合 |
clear() |
清空整个集合 |
copy() |
返回集合的拷贝(浅拷贝) |
difference() |
求差集 |
difference_update() |
求差集并且将集合更新为该差集 |
discard() |
从集合中删除某一元素 |
intersection() |
求交集 |
intersection_update() |
求交集并且将集合更新为该交集 |
isdisjoint() |
当两个集合没有交集时,返回 True |
issubset() |
当另外一个集合包含此集合时,返回 True |
issuperset() |
当该集合包含另外一个集合时,返回 True |
pop() |
从集合弹出一任意元素 |
remove() |
从集合中删除某一元素,假如集合中不存在该元素,报错 |
symmetric_difference() |
求对称交集 |
symmetric_difference_update() |
求对称交集,并将该集合更新为此对称交集 |
union() |
求并集 |
update() |
将集合更新为此集合和参数集合的并集 |
集合其他操作
集合成员检查
可以使用 in
关键字来检查某元素是否存在在集合中。
>>> s = set("Blue")
>>> print('o' in s)
False
>>> print('l' in s)
True
遍历集合
你可以通过 for
循环来遍历集合。
>>> for i in set("Blue"):
print(i)
B
l
u
e
适用于集合的内置函数
以下是 Python 中适用于集合的内置函数的列表
函数 | 描述 |
---|---|
all() |
如果集合中有所有元素为 True 返回 True ,当集合为空时,返回 True |
any() |
如果集合中有一个元素为 True 返回 True ,当集合为空时,返回 False |
enumerate() |
返回所有元素的索引和元素本身,索引和元素组成一个元组;最终返回的是一个 enumerate 类型 |
len() |
返回集合中的元素数目或者集合的长度 |
set() |
定义一个集合 |
max() |
返回集合中元素的最大值 |
min() |
返回集合中元素的最小值 |
sorted() |
返回一个包含集合所有元素的排序列表 |
sum() |
返回集合中所有元素的总和 |
Python 不可变集合
不可变集合是一种特殊集合,它在被赋值后元素不能被更新和修改。不可变集合是不可变类型的集合。
集合是可变类型的,所以你无法把它作为词典的键,但因为不可变集合是不可变类型的,所以它是可以作为字典的键的。
不可变集合可以用 frozenset()
来创建,fronzenset
支持以下的方法:
copy()
difference()
intersection()
isdisjoint()
issubset()
issuperset()
symmetric_difference()
union()
>>> x = frozenset([2,6,3,9])
>>> y = frozenset([6,1,2,4])
>>> x.difference(y)
frozenset({9, 3})
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn