Ⅰ python中集合的特点和注意点
1、集合概念
Python中的集合,是一个无序的、没有重复项的集。它支持数学概念上的集合操作,如交集、并集、补集和差集。集合是可变的,可以在其中添加或删除项。集合用花括号“{}”括起来,并用逗号“,”来分隔其中的项。
2、创建集合
可以使用花括号“{}”创建集合,集合会自动去除重复的项。下面的集合包含了几种用字符串表示的水果:
>>>#创建fruits集合时,'apple'出现了两次
>>>fruits={'apple','banana','watermelon','strawberry','apple'}
>>>fruits#查看fruits集合,'apple'只有保留了一个
{'apple','strawberry','banana','watermelon'}
与列表、元组、字典一样,集合也可以用工厂函数set()来创建。set()函数的参数要么为空,要么为可迭代对象(如列表、元组和字符串):
>>>fruits=set(['apple','banana','watermelon','strawberry','apple'])#以列表为参数创建集合
>>>fruits
{'apple','strawberry','banana','watermelon'}
>>>numbers=set((1,2,3,3,2,4))#以元组为参数创建集合
>>>numbers
{1,2,3,4}
>>>letters=set('banana')#以字符串为参数创建集合
>>>letters
{'b','a','n'}
如果想要创建一个空集合,那么使用空的花括号“{}”是行不通的,因为这样创建的是一个空字典:
>>>empty={}
>>>empty
{}
>>>type(empty)
<class'dict'>
创建空集合的唯一方式就是使用不包含任何参数的set()函数:
>>>empty=set()
>>>empty#空集合表示为set()
set()
>>>type(empty)
<class'set'>
3、集合添加项
集合是可变的数据类型,在创建集合之后,可以使用集合的add()方法向其添加项:
>>>numbers={1,2,3}
>>>numbers.add(4)#向numbers集合中添加整数4
>>>numbers
{1,2,3,4}
>>>numbers.add('five')#向numbers集合中添加字符串'five'
>>>numbers
{1,2,3,4,'five'}
>>>numbers.add((5,6,7))#向numbers集合中添加元组(5,6,7)
>>>numbers
{1,2,3,4,(5,6,7),'five'}
如果向某个集合中添加已经存在的项,那么什么也不会发生:
>>>fruits={'apple','strawberry','banana','watermelon'}
>>>fruits
{'banana','apple','watermelon','strawberry'}
>>>fruits.add('apple')#添加已经存在的项'apple'
>>>fruits#fruits集合并没有改变
{'banana','apple','watermelon','strawberry'}
也可以使用集合的update()方法向集合中添加项,参数必须是可迭代对象,如列表、字符串或另一个集合。类似于列表的append()方法和extend()方法,但区别是集合的update()方法总是会将可迭代对象“展开”:
>>>numbers={1}
>>>numbers
{1}
>>>numbers.update((5,6,7))
>>>numbers#可以看出update()方法和add()方法的区别
{1,5,6,7}
>>>numbers.update({4,5},{6,7,8})#参数为两个集合
>>>numbers
{1,4,5,6,7,8}
4、集合删除项
可以使用集合的remove()方法删除某个集合中的指定项:
>>>numbers={1,2,3,5,7}
>>>numbers.remove(1)
>>>numbers
{2,3,5,7}
>>>numbers.remove(3)
>>>numbers
{2,5,7}
如果试图删除集合中不存在的项,那么Python解释器会报错:
>>>numbers={1,2,3,5,7}
>>>numbers.remove(4)
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<mole>
KeyError:4
还可以使用集合的discard()方法来删除项,它和remove()方法唯一的区别是,当试图删除不存在的项时,discard()方法并不会报错,而是什么也不会发生:
>>>numbers={1,2,3,5,7}
>>>numbers.discard(1)
>>>numbers
{2,3,5,7}
>>>numbers.discard(3)
>>>numbers
{2,5,7}
>>>numbers.discard(4)
>>>numbers#什么也没发生
{2,5,7}
5、检查某个项是否在集合中
集合的in操作符用于检查指定项是否在集合中,not in操作符用于检查指定项是否不在集合中:
>>>numbers={1,2,3,5,7}
>>>1innumbers#1在numbers集合中,返回True
True
>>>3innumbers#3在numbers集合中,返回True
True
>>>4innumbers#4不在numbers集合中,返回False
False
>>>4notinnumbers#notin是in的反向操作
True
6、查看集合的长度
集合的内建函数len()用于查看集合的长度,即集合中项的个数:
>>>empty=set()
>>>len(empty)
0
>>>numbers={1,2,3,5,7}
>>>len(numbers)
5
Ⅱ Python的集合有哪些操作
集合是一个无序的,不重复的数据组合,它有着两个主要作用:去重以及关系测试。去重指的是当把一个列表变成了集合,其中重复的内容就自动的被去掉了
关系测试指的是,测试两组数据之间的交集、差集、并集等关系。
去重测试代码如下:
#创建一个列表--里面存在一些重复值
test_list = [1,2,3,4,2,2,3,4,3,2,3,4]
#利用集合将列表中重复的内容去掉
test_list = set(test_list)
#打印测试并且查看test_list被赋予新值后的数据类型print(test_list,type(test_list)) # {1, 2, 3, 4}
Tip:需要注意的是,集合和字典一样都是无序的。
获取交集需要使用集合中的方法intersection方法,获取两个集合中的交集代码如下:
#创建两个集合,并且获取集合的交集
test_list_01 = set(['YanYan','LiBai','LuLu','YangMi'])
test_list_02 = set(['YanYan','LiuDeHua','ZhangXueYou','LiBai'])
#在上面的两个集合中,存在相同的值,那么现在我们取出两个集合中的交集
test_intersection = test_list_01.intersection(test_list_02)print(test_intersection) # {'YanYan', 'LiBai'}
获取并集的方式需要采用集合中union方法,获取两个集合的并集代码如下:
#创建两个集合,并且获取集合的交集
test_list_01 =set(['YanYan','LiBai','LuLu','YangMi'])
test_list_02 =set(['YanYan','LiuDeHua','ZhangXueYou','LiBai'])
#采用集合中的union方法获取并集
test_list_union = test_list_01.union(test_list_02)
print(test_list_union) # {'LiBai', 'LuLu', 'ZhangXueYou', 'LiuDeHua', 'YangMi', 'YanYan'}
获取差集的方式要采用集合中的difference方法,获取两个集合的差集的代码如下所示:
#创建两个集合,并且获取集合的交集
test_list_01 = set(['YanYan','LiBai','LuLu','YangMi'])
test_list_02 = set(['YanYan','LiuDeHua','ZhangXueYou','LiBai'])
#使用集合中的difference方法来获取差集
test_difference = test_list_01.difference(test_list_02)
test_difference2 = test_list_02.difference(test_list_01)
print(test_difference) # {'LuLu', 'YangMi'}print(test_difference2) # {'ZhangXueYou', 'LiuDeHua'}
判断一个集合是否是另外一个集合的子集可以使用issubset()方法,同样,还可以使用issuperset()方法判断一个集合是否是另外一个集合的父级
代码如下:
#创建两个集合
list_set = set([1,2,3,4])
list_son = set([2,3])
#判断list_son是否是list_set的子集print(list_son.issubset(list_set)) # True#判断list_set是否是list_son的父级print(list_set.issuperset(list_son)) # True
对称差集(又有人称之为叫做反向差集),指的是取出两个集合中互相都没有的值取出放在一个集合中。
代码如下:
#创建两个集合
list_set_num1 = set([1,3,5,7,9])
list_set_num2 = set([2,3,4,6,9,10])
#获取两个集合的对称差集print(list_set_num1.symmetric_difference(list_set_num2)) # {1, 2, 4, 5, 6, 7, 10}
如果上述的难以理解的话,可以对对称差集理解为去掉两个集合中都存在的内容,将剩余的内容取到一个新的集合中。
除了上述的这些方法实现的关系功能之外,还有一个方法isdisjoint(),功能是判断两个集合中是否有相同的值,如果两个集合中没有相同的值(即没有交集),那么返回True
代码如下:
#创建集合
test_set_num1 = set([1,2,3,4])
test_set_num2 = set([5,6,7,8])
test_set_num3 = set([1,3,7,8])
#使用isdisjoint()方法来判断print(test_set_num1.isdisjoint(test_set_num2)) # Trueprint(test_set_num1.isdisjoint(test_set_num3)) # False
通过运算符来进行关系测试
在上面的应用中,主要是通过python中的方法进行的关系测试,那么在python中,除了使用方法以外,还可以使用关系运算符来进行关系测试。
实例代码如下:
test_list_01 =set(['YanYan','LiBai','LuLu','YangMi'])
test_list_02 =set(['YanYan','LiuDeHua','ZhangXueYou','LiBai'])
#获取交集&print(test_list_01 & test_list_02) # {'LiBai', 'YanYan'}
#获取并集|print(test_list_01 | test_list_02) # {'LuLu', 'LiBai', 'LiuDeHua', 'YanYan', 'ZhangXueYou', 'YangMi'}
#获取差集-print(test_list_01 - test_list_02) # {'LuLu', 'YangMi'}print(test_list_02 - test_list_01) # {'LiuDeHua', 'ZhangXueYou'}
#获取对称差集print(test_list_01 ^ test_list_02) # {'ZhangXueYou', 'YangMi', 'LuLu', 'LiuDeHua'}
集合的增删改查
添加
语法:Set.add()
代码如下:
#创建一个集合
test_set =set(['YanYan'])
#添加
test_set.add('LiBai') #添加一项
test_set.update(['LuLu','JingJing']) #一次性向集合中添加多项
#输出集合
print(test_set) #{'YanYan', 'LuLu', 'LiBai', 'JingJing'}
删除
删除集合中的某一个元素可以使用remove方法
代码如下:
#创建一个集合
test_set = set(['YanYan'])
#使用remove方法删除元素
test_set.remove('YanYan')print(test_set) # set()
删除项目除了使用remove以外,还可以使用pop()方法,但是pop()方法删除内容不能够指定,只是随机删除。
pop方法会把删除的内容返回,示例代码如下:
#创建一个集合
test_set = set([20,9,'a',1,2,3,4])print(test_set.pop()) # 1print(test_set.pop()) # 2print(test_set.pop()) # 3
删除元素还可以使用discard()方法,这个方法没有返回值,如果打印返回值的话会输出None
#创建一个集合
test_list = set([1,2,3,4,5])
#使用discard()方法删除--注意,discard()方法删除返回None,也就是没有返回值print(test_list.discard(3)) # None#此时原集合中的3已经被删除了print(test_list) # {1, 2, 4, 5}
查询
xins #判断x是否是s的成员
xnotins 判断x是否是s的成员
len(x) #查看x的长度
s <= t #测试是否s中的每一个元素都在t中
s >= t #测试是否t中的每一个元素都在s中
Ⅲ python集合的使用怎么样的
Python set 集合最常用的操作是向集合中添加、删除元素,以及集合之间做交集、并集、差集等运算。
向set集合中添加元素
set 集合中添加元素,可以使用 set 类型提供的 add() 方法实现,该方法的语法格式为:
1
setname.add(element)
其中,setname 表示要添加元素的集合,element 表示要添加的元素内容。
需要注意的是,使用 add() 方法添加的元素,只能是数字、字符串、元组或者布尔类型(True 和 False)值,不能添加列表、字典、集合这类可变的数据,否则 Python 解释器会报 TypeError 错误。例如:
1
2
3
4
5
a = {1,2,3}
a.add((1,2))
print(a)
a.add([1,2])
print(a)
运行结果为:
1
2
3
4
5
{(1, 2), 1, 2, 3}
Traceback (most recent call last):
File "C:\Users\mengma\Desktop\1.py", line 4, in
a.add([1,2])
TypeError: unhashable type: 'list'
从set集合中删除元素
删除现有 set 集合中的指定元素,可以使用 remove() 方法,该方法的语法格式如下:
1
setname.remove(element)
使用此方法删除集合中元素,需要注意的是,如果被删除元素本就不包含在集合中,则此方法会抛出 KeyError 错误,例如:
1
2
3
4
5
a = {1,2,3}
a.remove(1)
print(a)
a.remove(1)
print(a)
运行结果为:
1
2
3
4
5
{2, 3}
Traceback (most recent call last):
File "C:\Users\mengma\Desktop\1.py", line 4, in
a.remove(1)
KeyError: 1
Ⅳ Python的集合介绍
和列表类似,集合也是一个数据集合,其也不要求元素的类型一致。但是集合有下面两个特点:
•集合内元素唯一。如不可以用1、2、1、1组成集合,因为其包含重复的1。
•集合是无序的,添加元素时不能指定位置,删除元素时也不能通过指定位置,只能通过指定值。当然也不能通过位置来定位某个元素。
1、创建集合
我们可以从列表创建集合,将列表中的元素都加入到集合中,如果有重复的元素就仅保留一个。
a = set([1, 1, 3])
print(a)#输出结果:set([1, 3])
也可以从元组、字典和其他集合构建集合。比如:
a = set((0, 1, 2, 3, 3, 2))
使用的是字典的键来构建集合,字典的值没有被使用到,比如:
a = set({1:10, 2:20, 3:30})
从字符串构建集合,其每个字符都成为集合的一个元素,比如:
a = set("abcdefabc")
输出结果:a={'c', 'e', 'f', 'b', 'd', 'a'}
另外一个集合构建集合,比如:
a = set([1, 2, 3])
b = set(a) 输出结果:b={1, 2, 3}
当然也可以构造一个空的集合,使用的方法是set()。空集合没有任何元素,比如:
a = set()
1.添加元——add(值)
该函数只能添加一个元素。
如果添加的元素已经在集合中存在,那么不会发生任何变化。
2.扔掉元素——discard(值)
该函数删除集合中指定的值对应的元素。
如果指定值在集合中不存在,则不做任何操作。
3.删除指定值——remove(值)
该函数和discard()的不同之处在于,如果指定的值在集合中不存在,会抛出异常。
4.清空所有元素——clear()
该函数扔掉所有的元素。执行完该函数后,该集合将变成一个空的集合。
a.clear()
5.删除第一个元素——pop()
如果集合中有元素,则返回值为删除掉的元素的值。
如果集合为空,则抛出异常。
6.得到差集——difference(集合对象)
该函数返回一个新的集合,该集合包含所有属于a而不属于b的元素,如图所示。该操作不会改变原始集合a或者b的内容。
7.差集操作符(-)
该操作符和difference()类似,返回一个新的集合,该集合包含所有属于a而不属于b的元素。该操作不会改变原始输入集合a或者b的内容。
8.从集合中删除另一个集合中存在的元素——difference_update(集合对象)
该函数和difference()的不同是操作数a会被修改,而且没有返回值。
9.得到两个集合的交集——intersection(集合)
该函数返回所有的同时属于集合a和集合b的元素组成的集合,即返回的是一个集合,该集合的所有元素都同时属于集合a和b,如图所示。输入集合a和b在该过程中没有发生任何改变。
10.交集操作符(&)
该操作符和intersection()的效果是一样的。
11.删除集合a中所有不属于集合b的元素——intersection_update(集合)
该函数也是求交集,与intersection()不同的是其修改原始输入集合,并且没有返回值。这也是为何该接口函数后面带有update字样,因为其更新了原来的输入集合。
12.是否存在交集——isdisjoint()
该函数判断是否存在这样的元素,其同时属于集合a和集合b。如果存在这样的元素,返回False;否则返回True。
13.并集——union(集合a,集合b)
该函数返回一个新的集合,该集合的元素要么属于输入集合a要么属于集合b。该操作不修改作为输入的两个集合a和b。如图表示该函数返回的集合的内容。
14.并集操作符(|)
该操作符和union()的效果是一样的。其返回一个并集,并且不修改输入集合的内容。
15.添加属于b而不属于a的元素——update()
该函数在集合a中添加属于b而不属于a的所有元素。该操作和union()不同的是,其修改了输入集合a,并且没有返回值。
16.外集——symmetric_difference()
外集就是由只属于集合a或者只属于集合b的元素组成的集合,如图所示。该操作返回一个新的集合,并且不修改原来的输入集合a和b。
17.外集操作符(^)
该操作符和symmetric_difference()的效果是一样的,也是返回一个新的集合,并且不会修改输入的集合a或者b。
18.a和b的并集减去a和b的交集——symmetric_difference_update()
该函数和symmetric_difference()的区别是,其修改了集合a的值,并且没有返回值。
19.是指定集合的子集吗——issubset()
a是b的子集就是说集合a的所有元素都属于集合b。
如果a等于b,那么a和b互为子集。
20.是指定集合的超集吗——issuperset()
a是b的超集合就是说集合b中的所有元素都属于集合a。
如果a是b的超集,那么b就是a的子集。
如果a等于b,那么它们互为子集,同时也互为超集。
Ⅳ python集合的运算(交集、并集、差集、补集)
我们在遇到一些问题的时候,使用集合的交集、并集和差集能够更便捷的帮助我们去解决问题,看下面一个例子。
某学校有两个班级,班级A需要学习数学、语文、英语、物理、化学和生物,班级B需要学习数学、语文、英语、政治、地理和历史。
我们可以直接看出A班级和B班级的交集为数学、语文和英语,并集为数学、语文、英语、物理、化学、生物、政治、地理、历史,A和B的差集为物理、化学和生物。
那么怎么使用Python去完成这些运算?
我们先在这里定义两个集合,
因为是求交集,因此A和B的位置调换依然不影响结果。
使用集合求并集的方式同样也是两种方式,一种是使用 ‘|’ 运算符进行操作,一种是使用 union() 方法来实现。
求并集的时候同样不需要注意 A 和 B 的位置关系。
使用集合求差集的方式同样也是两种方式,一种是使用 ‘-’ 运算符进行操作,一种是使用 difference() 方法来实现。
在方法2中注意 A 和 B 的位置不同的时候是有区别的,如果是 A 使用 difference() 方法,那么是输出 A 中有而 B 中没有的元素,如果是 B 使用 difference() 方法,那么是输出 B 中有而 A 中没有的元素。
学习完了集合,四种核心集合我们已经基本掌握,接下来几节我们来通过学习一些字符串的相关操作,学习字符串的过程中会穿插着前面简单介绍过但没仔细讲解的方法及操作。