❶ python精讲:Python中集合的交集并集差集和对称差集运算方法详解
欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是《Python中集合的交集、并集、差集和对称差集运算方法详解》。主要讲的是集合运算的相关的概念,及运算方法,包括:集合的交集、集合的并集、集合的差集、集合的对称差集、集合的交集运算方法、集合的并集运算方法、集合的差集运算方法、集合的对称差集运算方法。
在Python中,集合最常用的操作就是进行交集、并集、差集和对称差集的运算。
要想学习集合的交集、并集、差集和对称差集运算方法,首先我们来了解这些名词的含义:
设A、B两个集合,由所有属于集合A且属于集合B的元素所组成的集合,叫做集合A与集合B的交集。在Python中,进行交集运算时使用“&”符号。
给定两个集合A、B,把他们所有的元素合并在一起组成的集合,叫做集合A与集合B的并集。在Python中,进行并集运算时使用“|”符号。
设A,B是两个集合,则所有属于A且不属于B的元素构成的集合,叫做集合A与集合B的差集。在Python中,进行差集运算时使用“-”符号。
对称差集也称为对称差分或者补集,设A,B是两个集合,所有不相同的集合,叫做集合A与集合B的对称差集(对称差分或者补集)。在Python中,进行对称差集运算时使用“^”符号。
上面都是概念性的描述,下面站长在线来举实际的场景来对交集、并集、差集和对称差集运算方法进行深入浅出的解读。
场景模拟:某高中三年级,文科班高考的科目是语文、数学、英语、政治、 历史 和地理。理科班高考的科目是语文、数学、英语、物理、化学和生物。
设定集合A为文科班高考的科目,集合B为理科班高考的科目。
A = {'语文','数学','英语','政治',' 历史 ','地理'}
B = {'语文','数学','英语','物理','化学','生物'}
我们使用集合的交集运算的时候可以采用两种方式,一种是使用“&”运算符进行操作,另一种是使用 intersection() 方法来实现。
运行结果:
运行结果:
同理集合B和集合A的交集也是一样。我这里就不重复了,自己去体验一下。
集合的并集运算也有两种方式,一种是使用“|”运算符进行操作,另一种是使用union()方法来实现。
运行结果如下:
运行结果为:
同理集合B和集合A的并集也是一样。自己去体验一下吧!
集合的差集运算也有两种方式,一种是使用“-”运算符进行操作,另一种是使用difference()方法来实现。
运行结果为:
上面是集合A和集合B的差集,但是集合B和集合A的差集就不是一样的了哦!
运行结果为:
从上面可以看出,集合A和集合B的差集 与 集合B和集合A的差集是不一样的,(A - B)是A中存在的部分,(B - A)是B中存在的部分。
运行结果:
同理,使用difference()方法进行集合B和集合A的差集也是不同的
运行结果:
集合的差集运算也有两种方式,一种是使用“^”运算符进行操作,另一种是使用symmetric_difference()方法来实现。
运行结果为:
运行结果为:
同样的,集合B与集合A的对称差集也是一样,自己去体验一下。
我们对集合的交集、并集、差集和对称差集运算方法全部详细的讲解了一遍,通过运行结果,我们得出结论:
集合中进行交集、并集、对称差集进行运算的时候,集合A与集合B,位置替换的时候,结果相同。
集合中进行差集运算的时候,集合A与集合B,位置替换的时候,结果不同,为前面那个集合独立存在的部分。
到此为止,本节课的内容《Python中集合的交集、并集、差集和对称差集运算方法详解》就完全讲完了,主要讲的集合运算的相关的概念,及运算方法,包括:集合的交集、集合的并集、集合的差集、集合的对称差集、集合的交集运算方法、集合的并集运算方法、集合的差集运算方法、集合的对称差集运算方法。
❷ Python的集合介绍
和列表类似,集合也是一个数据集合,其也不要求元素的类型一致。但是集合有下面两个特点:
•集合内元素唯一。如不可以用1、2、1、1组成集合,因为其包含重复的1。
•集合是无序的,添加元素时不能指定位置,删除元素时也不能通过指定位置,只能通过指定值。当然也不能通过位置来定位某个元素。
1、创建集合
我们可以从列表创建集合,将列表中的元素都加入到集合中,如果有重复的元素就仅保留一个。
a = set([1, 1, 3])
print(a)#输出结果:set([1, 3])
也可以从元组、字典和其他集合构建集合。比如:
a = set((0, 1, 2, 3, 3, 2))
使用的是字典的键来构建集合,字典的值没有被使用到,比如:
a = set({1:10, 2:20, 3:30})
从字符串构建集合,其每个字符都成为集合的一个元素,比如:
a = set("abcdefabc")
输出结果:a={'c', 'e', 'f', 'b', 'd', 'a'}
另外一个集合构建集合,比如:
a = set([1, 2, 3])
b = set(a) 输出结果:b={1, 2, 3}
当然也可以构造一个空的集合,使用的方法是set()。空集合没有任何元素,比如:
a = set()
1.添加元——add(值)
该函数只能添加一个元素。
如果添加的元素已经在集合中存在,那么不会发生任何变化。
2.扔掉元素——discard(值)
该函数删除集合中指定的值对应的元素。
如果指定值在集合中不存在,则不做任何操作。
3.删除指定值——remove(值)
该函数和discard()的不同之处在于,如果指定的值在集合中不存在,会抛出异常。
4.清空所有元素——clear()
该函数扔掉所有的元素。执行完该函数后,该集合将变成一个空的集合。
a.clear()
5.删除第一个元素——pop()
如果集合中有元素,则返回值为删除掉的元素的值。
如果集合为空,则抛出异常。
6.得到差集——difference(集合对象)
该函数返回一个新的集合,该集合包含所有属于a而不属于b的元素,如图所示。该操作不会改变原始集合a或者b的内容。
7.差集操作符(-)
该操作符和difference()类似,返回一个新的集合,该集合包含所有属于a而不属于b的元素。该操作不会改变原始输入集合a或者b的内容。
8.从集合中删除另一个集合中存在的元素——difference_update(集合对象)
该函数和difference()的不同是操作数a会被修改,而且没有返回值。
9.得到两个集合的交集——intersection(集合)
该函数返回所有的同时属于集合a和集合b的元素组成的集合,即返回的是一个集合,该集合的所有元素都同时属于集合a和b,如图所示。输入集合a和b在该过程中没有发生任何改变。
10.交集操作符(&)
该操作符和intersection()的效果是一样的。
11.删除集合a中所有不属于集合b的元素——intersection_update(集合)
该函数也是求交集,与intersection()不同的是其修改原始输入集合,并且没有返回值。这也是为何该接口函数后面带有update字样,因为其更新了原来的输入集合。
12.是否存在交集——isdisjoint()
该函数判断是否存在这样的元素,其同时属于集合a和集合b。如果存在这样的元素,返回False;否则返回True。
13.并集——union(集合a,集合b)
该函数返回一个新的集合,该集合的元素要么属于输入集合a要么属于集合b。该操作不修改作为输入的两个集合a和b。如图表示该函数返回的集合的内容。
14.并集操作符(|)
该操作符和union()的效果是一样的。其返回一个并集,并且不修改输入集合的内容。
15.添加属于b而不属于a的元素——update()
该函数在集合a中添加属于b而不属于a的所有元素。该操作和union()不同的是,其修改了输入集合a,并且没有返回值。
16.外集——symmetric_difference()
外集就是由只属于集合a或者只属于集合b的元素组成的集合,如图所示。该操作返回一个新的集合,并且不修改原来的输入集合a和b。
17.外集操作符(^)
该操作符和symmetric_difference()的效果是一样的,也是返回一个新的集合,并且不会修改输入的集合a或者b。
18.a和b的并集减去a和b的交集——symmetric_difference_update()
该函数和symmetric_difference()的区别是,其修改了集合a的值,并且没有返回值。
19.是指定集合的子集吗——issubset()
a是b的子集就是说集合a的所有元素都属于集合b。
如果a等于b,那么a和b互为子集。
20.是指定集合的超集吗——issuperset()
a是b的超集合就是说集合b中的所有元素都属于集合a。
如果a是b的超集,那么b就是a的子集。
如果a等于b,那么它们互为子集,同时也互为超集。
❸ python集合的作用有哪些
集合可以像元组一样,设置不可改变的类型;也可以默认像字典,列表一样,可以迭代改变;同时集合里的元素可以是列表,元组,字典。
1、python集合的作用——创建字典
可使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
>>> my_set = set(('apple',))
>>> my_set
{'apple'}
2、python集合的作用——添加元素(add(),update())
# add 作为一个整体添加到集合中
my_set = set()
my_set.add("abc")
print(my_set)
#update 是把要传入的元素拆分,做为个体传入到集合中
my_set = set()
my_set.update("abc")
print(my_set)
3、python集合的作用——删除元素(remove(),pop(),discard())
#remove 如果集合种有,则直接删除;如果没有,程序报错 格式:集合名.remove(元素)
my_set = {11, 13, 15}
my_set.remove(13)
print(my_set) my_set.remove(131)
print(my_set)
#pop 随机删除集合中的元素 如果集合中没有元素则程序报错
my_set = {11, 13, 15}
my_set.pop()
print(my_set)
#discard 如果集合中元素存在,直接删除; 如果元素不存在 不做任何操作 格式: 集合名.discard(元素)
my_set = {11, 13, 15}
my_set.discard(13)
print(my_set)
my_set.discard(131)
print(my_set)
4、python集合的作用——交集( & )
set1 = {9, 2, 3, 4}
set2 = {3, 4, 5, 16}
new_set = set1 & set2
print(new_set)
# result {3, 4}
5、python集合的作用——并集( | )
set1 = {1, 2, 3, 4}
set2 = {3, 5, 5, 6}[page]
new_set = set1 | set2
print(new_set)
# result {1, 2, 3, 4, 5, 6}
6、python集合的作用——差集(-)
项在前一个集合中,但不在后一个集合中。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 - set2
print(new_set)
# result {1, 2}
7、python集合的作用——对称差集( ^ )
即项在前一个集合或后一个集合中,但不会同时出现在二者中。即交集减去并集。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 ^ set2
print(new_set)
# result {1,2,5,6}
8、python集合的作用——子集判断
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判断set1是否是set2的子集
print(set1.issubset(set2))
# result True
9、python集合的作用——父集判断
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判断set1是否是set2的父集
print(set1.issuperset(set2))
# result False
10、python集合的作用——迭代和枚举
s={34,56,76,34,56,54,43,23,56}
for i in s:
print(i) ##迭代输出其内容
for i,v in enumerate(s):
print('index: %s,value: %s' %(i,v))
"""
result:
index: 0,value: 34
index: 1,value: 43
index: 2,value: 76
index: 3,value: 54
index: 4,value: 23
index: 5,value: 56
"""
可观察出,集合会自动过滤掉相同元素。
python集合的作用都有哪些?原来这些功能才是最实用的,集合可以像元组一样,设置不可改变的类型;也可以默认像字典,列表一样,可以迭代改变;同时集合里的元素可以是列表,元组,字典,你能处理好吗?如果您还担心自己入门不顺利,可以点击本站的其他文章进行学习。
❹ python常见数据类型
一,python整数类型所表示的数据。
1,一般用以表示一类数值:所有正整数,0和负整数;
2,整型作为最常用的,频繁参与计算的数据类型,在python3.5中解释器会自动在内存中创建-5-3000之间的(包含5,不包含3000)整型对象,也就是说在该范围内,相等都是同一个已经创建好的整型对象。范围之外的即使相等也表示不同对象,该特性随python版本而改变,不要过于依赖。
3,bool型继承了int型,他是int的子类。
4,Python2中有长整型long,数值范围更大,在python3中已取消,所有整型统一由int表示。
5,参与所有数值计算,数学运算,科学计算。这也是所有编程语言都有的数据类型,因为编程语言生而需要模拟人的思维,借助数学方式,自动计算、更好的解决大量重复性的事务,因此数值类型、整数类型在编程语言中不可或缺。
6,支持二进制(0b\0B开头),十进制,八进制(0o\0O),十六进制(0x\0X)
二,python整数和浮点型支持常规的数值运算
整数和浮点数都可参与的运算:+ - * / %(取余) //(整除) **(幂)
Python字符型:
python字符型表示的数据:
python3支持Unicode编码,由字母、数字和符号组成的形式就叫字符串,更接近或者相同与人们文字符号表示,因此在信息表示和传递时它也是最受认可的形式。在程序编写中也是非常常用,对应的可操作的方法也很多,很有意思。
字符串不可被修改,可以拼接等方法创建新字符串对象;
支持分片和下标操作;a[2:]
支持+拼接,*重复操作和成员关系in/not in;
表示形式:用单引号双引号包含起来的符号;a = str(‘sdfsdfsdf’) 或 r’\t\nabcd’ 原始字符,Bytes:b’abcd’;
6,字符串属于不可变数据类型,内部机制为了节省空间,相同的两个字符串表示相同的一个对象。a = ‘python’ b = ‘python’ a is b :True
二, 字符串支持的运算方法
1,capitalize() :首字母大写后边的字母小写 a = ‘abcd’ b = a.capitalize() b:Abcd
2,casefold() lower():字母转换为全小写
3,center(width,fillchar) :居中,width填补的长度;fillchar添加的字符
a = a.center(10,’_’) //’____abcd____’ 默认无fillchar填充空格
4,count(sub,star,end) :字母计数:sub要查询的字符
5,encode(encoding=’utf-8’,errors=’strict’) 设置编码
Errors :设置错误类型
6,endswith(suffix,star,end) : 若以suffix结尾返回True
7,expandtabs(8) :设置字符串中tab按键符的空格长度:’\tabcde’
8,find(sub,star,end) : 返回指定范围内的字符串下标,未找到返回-1
9,index(sub,star,end) :返回指定范围字符串下标未找到抛出异常
10,isalnum() :判断字符串是否是字母或数字,或字母和数字组合
11,isalpha() :判断是否全是字母
12,isdecimal() :判断字符串是否是十进制数值
13,isdigit() :判断字符串是否是数字
14,isidentifier() :判断字符串中是否包含关键字
15,islower() :判断是否全小写
16,isnumeric() :判断全是数字
17,isspace() :判断是否是空格
18,isupper() 判断是否大写
19,istitle() :判断是否首字母大写
20,join(iterable) :把可迭代对象用字符串进行分割:a.join(‘123’)
21,ljust(width,fillchar);rjust() :左对齐右对齐
22, upper() :将字符串改为大写
23,split(sep=None,maxsplit=-1) :分割一个字符串,被选中字符在字符串中删除
‘ab1cd1efg’.split(‘1’) :[‘ab’,’cd’,’efg’]
三,字符串格式化:按照规格输出字符串
format(*args,**kwargs) :args位置参数,kwargs关键字参数
‘{0:.1f}’.format(123.468) :格式化参数,小数点后保留1位四舍五入
四,字符串操作符%
1,%s :格式化字符串 ‘abcd%sdef’%’dddd’
2,%d:格式化整数
3,%o格式化无符号八进制
4,%x格式化无符号十六进制
5,%f格式化定点数
6, %e: 科学计数法格式化定点数
7,%g 根据值大小自动选%f,%e
8, %G E X :大写形式
五,格式化辅助命令:
m.n :m最小总宽度,n小数点后位数:’%12.4f’%23456.789
六,转义字符:字符串前r避免转义:r’\nhello\thi’
\n:换行符
\t:横向制表符
\':'
\":"
\b:退格符
\r:回车
\v:纵向制表符
\f:换页符
\o,\x:八进制和十六进制
\0:空字符串
Python列表list
一,Python的列表list类型表示的数据:
Python列表在cpython中被解释为长度可变的数组,用其他对象组成的连续数组。
列表中元素可以是相同或不同的数据类型;
当列表元素增加或删除时,列表对象自动进行扩展或收缩内存,保证元素之间没有缝隙,总是连续的。
Python中的列表是一个序列,也是一个容器类型
创建列表:a = []; b = [1,’python’]; c = list(); d = list((1,3,4,5))
支持切片操作list[start,stop,step]
python列表常用方法
1,append添加单个元素:list.append(object); //a.append(‘python’)
2,extend添加可迭代对象: list.extend(iterable); //a.extend(‘abcde’/[1,2,3])
3,insert 插入元素:list.insert(index,object): 在index下标前插入元素//a.insert(2,’python’)
4,clear 清空所有元素:list.clear() //a.clear()
5,pop 删除并返回一个元素:list.pop(index) //默认删除默认一个元素
remove 删除指定元素:list.remove(v) ,v元素不存在报错 //a.remove(‘c’)
7,count 返回这个值在列表中数量:list.count(value)
8, 浅拷贝一个新列表:list.()
9,sort:排序list.sort(reverse=False/True) :默认升序
排序函数:sorted(list)
10,reverse: 原地翻转:list.reverse()
11,index(value,star,stop) :指定范围内该值下标:list.index(2,0,5)
列表元素访问:
下标访问:list[1]
For循环遍历
通过下标修改元素:list[2 ] = ‘hello’
列表常用运算符:
1,比较运算符:从第一个元素开始对比
2,+ 拼接一个新列表:l1+ l2
3, 重复操作符:* ,多个列表拼接
成员关系操作符:in/ not in
逻辑运算符:and not or
列表常用的排序方法:
冒泡排序;选择排序;快速排序;归并排序
Python元组tuple
一,Python元组tuple数据类型表示的数据:
元组是受到限制的、不可改变的列表;
可以是同构也可以是异构;
元组是序列类型、是可迭代对象,是容器类型。
元组的创建: a = (1,2,3)或a=1,2,3; b = tuple(); c = tuple(iterable)
支持切片操作tuple[start,stop,step]
二,python元组常用方法
1,index(value,star,stop) :指定范围内该值下标:tuple.index(2,0,5)
2,count(value) :值出现次数
三,支持运算:
1,比较运算符:从第一个元素开始对比
2,+ 拼接一个新元组:l1+ l2
3, 重复操作符:* ,多个元组拼接
4成员关系操作符:in/ not in
逻辑运算符:and not or
四,元组的访问
下标操作;
For循环遍历访问。
Python字典类型
一,Python字典dict表示的数据:{key:value}
可根据关键字:键快速索引到对应的值;
字典是映射类型,键值对一一对应关系,不是序列;
字典元素是无序的;
字典是可迭代对象,是容器类型;
字典的创建:k = {}; k1={‘keyword’:object}; k2 = dict();
K3 = dict(mapping); dict=(iterable)
二,字典的访问:
通过key:k[‘key’]
修改key对应的值:K[‘key’] = value
For循环遍历出来的是key;
For循环键值对:for I in d.items():
For 循环enumerate: for k,v in enumerate(k1):
In/not in 成员关系查询键不支持查值
三,字典常用方法
get(key,de):获取值:k.get(key,de) //若不存在则默认输出de
pop(k,de):删除一个键值对,不存在输出de,未设置报错;
keys() :返回字典所有key组成的序列:list(k.keys()) [1,2,3];
values():返回字典所有value组成的序列:list(k.values())
items():返回键值对组成的元组为元素的序列:(类set)list(k.items())
update(e):更新字典:e可是字典或两元素组成的单位元素序列:e=[(5,6),(7,8)];
k.update(e)
clear():清空字典;
popitem()删除某个键值对,若字典为空则报错
() :浅拷贝
10, fromkeys(iterable,value=None):从可迭代对象创建字典
{}.fromkeys([1,2,3]) -----{1:None,2:None,3:None}
11,setdefault(k,d=None) :若key不存在则生成一个键值对
k.setdefault(‘keyword’)
Python 集合set
集合表示的数据:
多个元素的无序组合,集合是无序的,集合元素是唯一的;
字典的键是由集合实现的;
集合是可迭代对象
集合创建:s = {1,2}; s1 = set(); s2 = set(iterable)
集合元素的访问:
For 循环将集合所有元素全部访问一遍,不重复
常用方法:
add(object):s.add(‘hi’) 向集合添加一个元素
pop() :弹栈,集合为空则报错:删除任意一个元素;
clear():清空集合,返回一个空集合对象;
remove(object):删除一个元素,不存在和报错:s.remove(‘hi’)
update(集合):更新另一个集合,元素不存在则不更新;
() :浅拷贝
集合的运算:
交集:s1&s2;
差集,补集:s1-s2;
并集:s1|s2;
Issubset():判断是否是子集:s1.issubset(s2) s1是否s2的集合子集
Issuperset():判断是否是父集:s1.issuperset()
不可变集合:
Frozenset():返回一个空的不可变集合对象
Frozenset(iterable):
S = frozenset(iterable)
Python序列类型共同特性
一,序列类型共同特性
python序列类型有:str字符串,list列表,tuple元组
都支持下标索引,切片操作;
下标都是从0开始,都可通过下标进行访问;
拥有相同的操作符
二,支持的函数:
len(obj):返回对象长度;
list(iterable):将可迭代对象转为列表;
tuple(iterable):将可迭代对象转为元组;
str(ojb):将任何对象转为字符串形式;
max(iterable): python3中元素要是同类型,python2中元素可异构:max([‘a’,1])
min(iterable):和max类似;
sum(iterable,star=0),求可迭代对象和,默认star为0,元素不能为字符串
sorted(iterable,key=None,reverse=False)
s=[(‘a’,3),(‘b’,2),(‘c’,9)]
sorted(s,key=lambda s:s[1]) //按照数字排序
reversed(sequence):翻转序列,返回迭代器
enumerate(iterable):返回enumerate对象,其元素都是一个元组(下标,值)
zip(iter1,iter2): zip([1,2],[3,4]) ----[(1,3),(2,4)]
序列类型的切片操作:
Slice:
L[index]; 访问某个元素;
L[1:4]; 区间
L[star:stop:step]; 设置步长取区间元素
❺ python集合的运算(交集、并集、差集、补集)
我们在遇到一些问题的时候,使用集合的交集、并集和差集能够更便捷的帮助我们去解决问题,看下面一个例子。
某学校有两个班级,班级A需要学习数学、语文、英语、物理、化学和生物,班级B需要学习数学、语文、英语、政治、地理和历史。
我们可以直接看出A班级和B班级的交集为数学、语文和英语,并集为数学、语文、英语、物理、化学、生物、政治、地理、历史,A和B的差集为物理、化学和生物。
那么怎么使用Python去完成这些运算?
我们先在这里定义两个集合,
因为是求交集,因此A和B的位置调换依然不影响结果。
使用集合求并集的方式同样也是两种方式,一种是使用 ‘|’ 运算符进行操作,一种是使用 union() 方法来实现。
求并集的时候同样不需要注意 A 和 B 的位置关系。
使用集合求差集的方式同样也是两种方式,一种是使用 ‘-’ 运算符进行操作,一种是使用 difference() 方法来实现。
在方法2中注意 A 和 B 的位置不同的时候是有区别的,如果是 A 使用 difference() 方法,那么是输出 A 中有而 B 中没有的元素,如果是 B 使用 difference() 方法,那么是输出 B 中有而 A 中没有的元素。
学习完了集合,四种核心集合我们已经基本掌握,接下来几节我们来通过学习一些字符串的相关操作,学习字符串的过程中会穿插着前面简单介绍过但没仔细讲解的方法及操作。
❻ python 里的差集,交集,并集是什么意思
这是 set的用法
首先set是集合,集合是无序不重复的
t=set([1,2,3,4,5])
s=set([5,6,7,8,9])
并集:
a = t | s # t 和 s的并集,计算的是t和s加在一起有多少不重复的元素,根据上面的例子,a就是一个包含1、2、3、4、5、6、7、8、9这九个元素的集合
交集:
b = t & s # t 和 s的交集,计算的是t和s有多少共同拥有不重复的元素,根据上面的例子,a就是一个包含5这一个元素的集合
差集:
c = t - s # 求差集(项在t中,但不在s中),根据上面的例子,a就是一个包含1、2、3、4这四个元素的集合