Python教程(12)——Python数据结构集合set介绍

2023-09-03 11:32:10 浏览数 (3)

集合是一种无序、可变的数据结构,它也是一种变量类型,集合用于存储唯一的元素。集合中的元素不能重复,并且没有固定的顺序。在Python 提供了内置的 set 类型来表示集合,所以关键字set就是集合的意思。

你可以使用大括号 {} 或者 set() 函数来创建一个集合。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}  # 使用大括号创建集合
print(my_set)  # 输出: {1, 2, 3}

my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set)  # 输出: {1,2, 3}

需要注意的是,集合是无序的,没有固定的顺序。因此,集合元素的顺序可能与你创建或添加的顺序不同。

集合具有以下特点:

  • 集合中的元素是唯一的,不重复。如果重复相同的元素,集合将自动去重。
  • 集合是无序的,没有固定的顺序。因此,你无法像列表或元组那样索引来访问集合中的元素。
  • 集合是可迭代的,你可以使用 for 循环遍历集合中的元素。
  • 集合是可变的,你可以添加、删除和修改集合中的元素

创建集合

要使用集合,首先就必须要创建,那么在 Python 中,有哪些创建集合的方式呢?你可以使用以下几种方式创建集合。

1、 使用大括号 {} 或者 set() 函数创建一个集合,将元素用逗号隔开:

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}  # 使用大括号创建集合
print(my_set)  # 输出: {1, 2, 3}

my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set)  # 输出: {1, 2, 3}

注意,如果你使用空的大括号 {} 来创建一个对象,那么创建的将是一个空字典,而非空集合。因此,你必须使用 set() 函数来创建一个空集合:

代码语言:python代码运行次数:0复制
empty_set = set()
print(empty_set)  # 输出: set()

2、 使用集合推导式来创建集合。集合推导式的语法类似于列表推导式,只需将中括号 [ ] 替换为大括号 { }

代码语言:python代码运行次数:0复制
my_set = {i for i in range(1, 5)}
print(my_set)  # 输出: {1, 2, 3, 4}

3、 将其他可迭代的对象(列表、字符串、元组等)转换为集合,可以使用 set() 函数来实现:

代码语言:python代码运行次数:0复制
my_list = [1, 2, 3, 2]
my_set = set(my_list)
print(my_set)  # 输出: {1, 2, 3}

my_string = 'hello'
my_set ={my_string}
print(my_set)  # 输出: {'h', 'e', 'l', 'o'}

访问集合

由于集合是无序的,没有固定的索引,使用索引访问集合中的元素是不可行的,要访问集合中的元素,你可以使用迭代器或者通过成员运算符来实现。

1、 使用迭代器:通过使用 for 循环遍历集合中的每个元素。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}
for item in my_set:
    print(item)

2、 使用成员运算:使用 in 或者 not in 运算符来检查元素是否存在于集合中。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}
print(2 in my_set)  # 输出: True
print(4 not in my_set)  # 输出: True

删除集合

在 Python 中,可以使用 del 关键字来删除集合:

1、 使用 del 关键字删除集合变量,删除之后如果再次访问,就会发生错误。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}
del my_set

修改集合元素

创建的集合,我们可以对其中的集合元素进行操作,不仅可以添加元素,还是可以删除其中的元素。

添加集合元素

1、使用 add() 方法向集合中添加元素。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}
my_set.add(4)
print(my_set)  # 输出: {1, 2, 3, 4}

2、使用列表的解包操作添加多个元素。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3}
new_elements = [4, 5]
my_set.update(new_elements)
print(my_set)  # 输出: {1, 2, 3, 4, 5}

因为集合的元素是唯一的,所以如果添加了重复的元素,那么重复的元素不会被添加到集合中,当然执行的过程并不会发生报错,只是不会被添加进去而已。在使用update()方法时,传入的参数可以是一个集合、列表或者其他可迭代对象。

删除集合元素

1、 使用 remove() 方法删除指定元素:remove() 方法会从集合中删除指定的元素。如果集合中不存在该元素,会引发 KeyError 异常。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3, 4}
my_set.remove(3)
print(my_set)  # 输出: {1, 2,4}

my_set.remove(5)  # 删除不存在的元素,引发 KeyError 异常

2、 使用 discard() 方法删除指定元素:discard() 方法会从集合中删除指定的元素。如果集合不存在该元素,该不会引发异常而是不进行任何操作。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3 4}
my_set.discard(3)
(my_set)  # 输出: {1, 2, 4}

my_set.discard(5)  # 删除不存在的元素,不会引发异常

3、 clear() 方法清空集合:clear() 方法会清空集合元素。

代码语言:python代码运行次数:0复制
my_set = {1, 2, 3, 4}
my_set.clear()
print(my_set)  # 输出: set()

集合运算:

集合的运算指的是对集合进行一系列操作,包括求并集、交集、差集和对称差集等。这些运算可通过运算符或方法来进行。

并集(Union)

可以使用 | 运算符或者 union() 方法来获取两个集合的并集。所谓的并集就是包含set1和set2集合的所有元素。

代码语言:python代码运行次数:0复制
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 | set2  # 使用 | 运算符
# 或者使用 union() 方法
# set3 = set1.union(set2)
print(set3)  # 输出: {1, 2, 3, 4, 5}

交集(Intersection)

可以使用 & 运算符或者 intersection() 方法来获取两个集合的交集。所谓的交集就是取set1和set2集合的相同元素,没有相同元素的话返回的就是set()

代码语言:python代码运行次数:0复制
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 & set2  # 使用 & 运算符
# 或者使用 intersection() 方法
# set3 = set1.intersection(set2)
print(set3)  # 输出: {3}

差集(Difference)

可以使用 - 运算符或者 difference() 方法来获取两个集合的差集。所谓的差集就是set1中独有的元素,如果set1中的元素,在set2中也有,那么就该元素就不能在差集中。如果是set2 - set1,那就是set2中独有的元素。结果为空的返回就是set()

代码语言:python代码运行次数:0复制
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 - set2  # 使用 - 运算符
# 或者使用 difference() 方法
# set3 = set1.difference(set2)
print(set3)  # 输出: {1, 2}

对称差集(Symmetric Difference)

可以使用 ^ 运算符或者 symmetric_difference() 方法来获取两个集合的对称差集。所谓的对称差集就是set1和set2中相同的元素剔除,剩下的元素就是对称差集。

代码语言:python代码运行次数:0复制
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 ^ set2  #使用 ^ 运算符
# 或者使用 symmetric_difference() 方法
# set3 = set1.symmetric_difference(set2)
print(set3)  # 输出: {1, 2, 4, 5}

需要注意的是,在使用集合运算符时,两个集合的元素类型必须一致。另外,集合的元素是唯一的,不会出现重复。

除了运算符外,还有其他一些常用的集合方法,比如 intersection_update() 方法用于在原集合上更新为两个集合的交集,difference_update() 方法用于在原集合上更新为两个集合的差集,symmetric_difference_update() 方法用于在原集合上更新为两个集合的对称差集。

集合的相关函数

Python中的集合也有不少相关的方法,以下就是列举了集合中常用的方法,如有错误的地方欢迎指出。

函数名

解释

add(element)

向集合中添加一个元素。

clear()

移除集合中的所有元素。

copy()

返回集合的副本。

difference(other_set, ...)

返回该集合与其他集合的差集。

difference_update(other_set, ...)

移除该集合中与其他集合相同的元素,并更新原集合。

discard(element)

移除集合中指定的元素。

intersection(other_set, ...)

返回该集合与其他集合的交集。

intersection_update(other_set, ...)

移除该集合中与其他集合不同的元素,并更新原集合。

isdisjoint(other_set)

如果两个集合没有共同的元素,则返回 True;否则返回 False。

issubset(other_set)

如果该集合是另一个集合的子集,则返回 True;否则返回 False。

issuperset(other_set)

如果该集合是另一个集合的超集,则返回 True;否则返回 False。

pop()

随机移除并返回集合中的一个元素。

remove(element)

移除集合中指定的元素。若元素不存在,将引发 KeyError 错误。

symmetric_difference(other_set)

返回该集合与其他集合的对称差集。

symmetric_difference_update(other_set)

移除该集合中与其他集合相同的元素,并更新原集合。

union(other_set, ...)

返回该集合与其他集合的并集。

update(other_set, ...)

向集合中添加其他集合的元素,并更新原集合。

0 人点赞