Python3 集合
什么是集合呢?
说到集合,我首先想到了高中的数学。高中,人生学习中最繁忙的一段时光。直到现在,我能回忆起最多的就是学习、学习、还是读书……言归正传,高一时的数学,我们就接触到了集合。书中应该是这样定义的:
集合:由一个或多个确定的元素所构成的整体。若x是集合A的元素,则记作x∈A。
集合中的元素有三个特征:
1. 确定性:集合中的元素必须是确定的;
2. 互异性:集合中的元素互不相同,例如:集合A={1,a},则a不能等于1);
3. 无序性:集合中的元素没有先后之分,例如:集合{3,4,5}和{3,5,4}算作同一个集合。
Python 3.x中的set特征与数学中类似。我们之前学过list、tuple以及dict。其实,set与dict大致相同,但set没有Value,只有key。因此,set只是一组key的集合。由于key不能重复,所以,在set中,没有重复的key。
关于集合的建立,举例如下:
s_1 = set('hello')
s_2 = {'java', 'python', 'c'}
print(s_1, type(s_1))#集合的特性,不安顺序输出,相同的元素只输出一个其余的自动屏蔽
print(s_2, type(s_2))
输出如下:
{'h', 'l', 'o', 'e'} <class 'set'>
{'python', 'java', 'c'} <class 'set'>
再给大家粘个例子:
>>>basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket) # 这里演示的是去重功能
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket # 快速判断元素是否在集合内
True
>>> 'crabgrass' in basket
False
>>> # 下面展示两个集合间的运算.
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a
{'a', 'r', 'b', 'c', 'd'}
>>> b
{'a', 'l', 'z', 'c', 'm'}
>>> a - b # 集合a中包含而集合b中不包含的元素
{'r', 'd', 'b'}
>>> a | b # 集合a或b中包含的所有元素
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b # 集合a和b中都包含了的元素
{'a', 'c'}
>>> a ^ b # 不同时包含于a和b的元素
{'r', 'd', 'b', 'm', 'z', 'l'}
突然想起来一个事情,我们不妨复习一下:
set_1 = set(['python', 'java', 'c']) set_1.update(('php',)) print(set_1) set_2 = set(['python', 'java', 'c']) set_2.update(('php')) print(set_2)
输出结果如下:
{'python', 'php', 'java', 'c'} {'python', 'h', 'p', 'c', 'java'}
我们是不是发现了单个元素的元祖必须要在最后添加逗号啊!否则系统会把单个元素且未添加逗号的元祖误判为是运算符!
集合的基本操作
1、添加元素
语法格式如下:
s.add( x ) |
---|
举例如下:
set_1 = set(['python', 'java', 'c'])
set_1.add(('php', 'go'))
print(set_1)
输出如下:
{'python', 'java', 'c', ('php', 'go')}
类似列表推导式,同样集合支持集合推导式(Set comprehension):
s = {x for x in 'asdfsggh' if x not in 'asd' }
print(s)
输出如下:
{'f', 'g', 'h'}
列表推导式参考:http://www.liujiangblog.com/course/python/36
有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:
s.update( x ) |
---|
x 可以有多个,用逗号分开。
s = {'优酷', '腾讯视频'}
s.update(['爱奇艺'])#x是列表
print(s)
s.update({'k1':'v1'})#x是集合
print(s)
s.update(('百度影音',))#x是元祖
print(s)
输出结果为:
{'腾讯视频', '爱奇艺', '优酷'}
{'腾讯视频', '爱奇艺', 'k1', '优酷'}
{'百度影音', '爱奇艺', '腾讯视频', 'k1', '优酷'}
2、移除元素
语法格式如下:
s.remove( x ) |
---|
将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。
s = {'蔡文姬', '东皇太一', '庄周', '明世隐', '太乙真人'}
s.remove('庄周') #可以顺利删除
print(s)
s.remove('橘右京')#如果要删除的这项没有,就会报错
print(s)
输出如下:
Traceback (most recent call last):
{'明世隐', '东皇太一', '太乙真人', '蔡文姬'}
File "D:/bilibili大学/简书代码/set_3.py", line 5, in <module>
s.remove('橘右京')
KeyError: '橘右京'
此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:
s.discard( x ) |
---|
s = {'蔡文姬', '东皇太一', '庄周', '明世隐', '太乙真人'}
s.discard('庄周') #可以顺利删除
print(s)
s.discard('橘右京')#如果要删除的这项没有,也不会报错
print(s)
输出结果如下:
{'蔡文姬', '明世隐', '东皇太一', '太乙真人'}
{'蔡文姬', '明世隐', '东皇太一', '太乙真人'}
我们也可以设置随机删除集合中的一个元素,语法格式如下:
s.pop() |
---|
s = {'蔡文姬', '东皇太一', '庄周', '明世隐', '太乙真人'}
s.pop()#pop()函数会随机删掉一个元素
print(s)
输出如下:
{'东皇太一', '太乙真人', '明世隐', '庄周'}
多次执行测试结果都不一样。
然而在交互模式(命令行代码),pop 是删除集合的第一个元素(排序后的集合的第一个元素),实例如下:
>>> s = {'蔡文姬', '东皇太一', '庄周', '明世隐', '太乙真人'}
>>> s.pop()
'蔡文姬'
>>> print(s)
{'明世隐', '太乙真人', '庄周', '东皇太一'}
>>> s.pop()
'明世隐'
>>> print(s)
{'太乙真人', '庄周', '东皇太一'}
3、计算集合元素个数
语法格式如下:
len(s)
计算集合 s 元素个数,举例如下:
s = {'蔡文姬', '东皇太一', '庄周', '明世隐', '太乙真人'}
print(len(s))
输出如下:
5
遇到一个这样的问题!
unhashable是无法被哈希的问题!
hash() 函数可以应用于数字、字符串和对象,不能直接应用于 list、set、dictionary。
在 hash() 对对象使用时,所得的结果不仅和对象的内容有关,还和对象的 id(),也就是内存地址有关。
稍微了解即可,哈希问题属于算法和数据结构那块儿,后期我会更新。
4、清空集合
语法格式如下:
s.clear() |
---|
清空集合, 实例:
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.clear()
>>> print(thisset)
set()
4、判断元素是否在集合中存在
语法格式如下:
x in s |
---|
判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
实例如下:
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> "Runoob" in thisset
True
>>> "Facebook" in thisset
False
>>>
集合内置方法完整列表
方法 | 描述 |
---|---|
add() | 为集合添加元素 |
clear() | 移除集合中的所有元素 |
copy() | 拷贝一个集合 |
difference() | 返回多个集合的差集 |
difference_update() | 移除集合中的元素,该元素在指定的集合也存在。 |
discard() | 删除集合中指定的元素 |
intersection() | 返回集合的交集 |
intersection_update() | 删除集合中的元素,该元素在指定的集合中不存在。 |
isdisjoint() | 判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。 |
issubset() | 判断指定集合是否为该方法参数集合的子集。 |
issuperset() | 判断该方法的参数集合是否为指定集合的子集 |
pop() | 随机移除元素 |
remove() | 移除指定元素 |
symmetric_difference() | 返回两个集合中不重复的元素集合。 |
symmetric_difference_update() | 移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。 |
union() | 返回两个集合的并集 |
update() | 给集合添加元素 |
网友评论