❶ python的集合介绍
和列表类似,集合也是一个数据集合,其也不要求元素的类型一致。但是集合有下面两个特点:
•集合内元素唯一。如不可以用1、2、1、1组成集合,因为其包含重复的1。
•集合是无序的,添加元素时不能指定位置,删除元素时也不能通过指定位置,只能通过指定值。当然也不能通过位置来定位某个元素。
1、创建集合
我们可以从列表创建集合,将列表中的元素都加入到集合中,如果有重复的元素就仅保留一个。
a = set([1, 1, 3])
print(a)#输出结果:set([1, 3])
也可以从元组、字典和其他集合构建集合。比如:
a = set((0, 1, 2, 3, 3, 2))
使用的是字典的键来构建集合,字典的值没有被使用到,比如:
a = set({1:10, 2:20, 3:30})
从字符串构建集合,其每个字符都成为集合的一个元素,比如:
a = set("abcdefabc")
输出结果:a={'c', 'e', 'f', 'b', 'd', 'a'}
另外一个集合构建集合,比如:
a = set([1, 2, 3])
b = set(a) 输出结果:b={1, 2, 3}
当然也可以构造一个空的集合,使用的方法是set()。空集合没有任何元素,比如:
a = set()
1.添加元——add(值)
该函数只能添加一个元素。
如果添加的元素已经在集合中存在,那么不会发生任何变化。
2.扔掉元素——discard(值)
该函数删除集合中指定的值对应的元素。
如果指定值在集合中不存在,则不做任何操作。
3.删除指定值——remove(值)
该函数和discard()的不同之处在于,如果指定的值在集合中不存在,会抛出异常。
4.清空所有元素——clear()
该函数扔掉所有的元素。执行完该函数后,该集合将变成一个空的集合。
a.clear()
5.删除第一个元素——pop()
如果集合中有元素,则返回值为删除掉的元素的值。
如果集合为空,则抛出异常。
6.得到差集——difference(集合对象)
该函数返回一个新的集合,该集合包含所有属于a而不属于b的元素,如图所示。该操作不会改变原始集合a或者b的内容。
7.差集操作符(-)
该操作符和difference()类似,返回一个新的集合,该集合包含所有属于a而不属于b的元素。该操作不会改变原始输入集合a或者b的内容。
8.从集合中删除另一个集合中存在的元素——difference_update(集合对象)
该函数和difference()的不同是操作数a会被修改,而且没有返回值。
9.得到两个集合的交集——intersection(集合)
该函数返回所有的同时属于集合a和集合b的元素组成的集合,即返回的是一个集合,该集合的所有元素都同时属于集合a和b,如图所示。输入集合a和b在该过程中没有发生任何改变。
10.交集操作符(&)
该操作符和intersection()的效果是一样的。
11.删除集合a中所有不属于集合b的元素——intersection_update(集合)
该函数也是求交集,与intersection()不同的是其修改原始输入集合,并且没有返回值。这也是为何该接口函数后面带有update字样,因为其更新了原来的输入集合。
12.是否存在交集——isdisjoint()
该函数判断是否存在这样的元素,其同时属于集合a和集合b。如果存在这样的元素,返回False;否则返回True。
13.并集——union(集合a,集合b)
该函数返回一个新的集合,该集合的元素要么属于输入集合a要么属于集合b。该操作不修改作为输入的两个集合a和b。如图表示该函数返回的集合的内容。
14.并集操作符(|)
该操作符和union()的效果是一样的。其返回一个并集,并且不修改输入集合的内容。
15.添加属于b而不属于a的元素——update()
该函数在集合a中添加属于b而不属于a的所有元素。该操作和union()不同的是,其修改了输入集合a,并且没有返回值。
16.外集——symmetric_difference()
外集就是由只属于集合a或者只属于集合b的元素组成的集合,如图所示。该操作返回一个新的集合,并且不修改原来的输入集合a和b。
17.外集操作符(^)
该操作符和symmetric_difference()的效果是一样的,也是返回一个新的集合,并且不会修改输入的集合a或者b。
18.a和b的并集减去a和b的交集——symmetric_difference_update()
该函数和symmetric_difference()的区别是,其修改了集合a的值,并且没有返回值。
19.是指定集合的子集吗——issubset()
a是b的子集就是说集合a的所有元素都属于集合b。
如果a等于b,那么a和b互为子集。
20.是指定集合的超集吗——issuperset()
a是b的超集合就是说集合b中的所有元素都属于集合a。
如果a是b的超集,那么b就是a的子集。
如果a等于b,那么它们互为子集,同时也互为超集。
❷ 电脑python并集符号怎么打
首先打开pyharm编辑器。
❸ python 里的差集,交集,并集是什么意思
这是 set的用法
首先set是集合,集合是无序不重复的
t=set([1,2,3,4,5])
s=set([5,6,7,8,9])
并集:
a = t | s # t 和 s的并集,计算的是t和s加在一起有多少不重复的元素,根据上面的例子,a就是一个包含1、2、3、4、5、6、7、8、9这九个元素的集合
交集:
b = t & s # t 和 s的交集,计算的是t和s有多少共同拥有不重复的元素,根据上面的例子,a就是一个包含5这一个元素的集合
差集:
c = t - s # 求差集(项在t中,但不在s中),根据上面的例子,a就是一个包含1、2、3、4这四个元素的集合
❹ python字典的并交集
没看太懂,如果只是对key值求交集和并集,下面这个程序就好了,不是的话,说清楚
def union_intersection(d1,d2,mark):
"""
@attention: 这个是只对Key值做的
"""
temp = []
if mark == "union":
temp = list(set(d1.keys()+d2.keys()))
else:
temp = list(set(d1.keys())&set(d2.keys()))
tempdict = {}
for item in temp:
tempdict.setdefault(item,None)
return tempdict
if __name__ == '__main__':
d1 = {1:'a', 2:'b', 3:'c'}
d2 = {2:'2', 3:'3', 4:'4'}
print union_intersection( d1, d2, 'union' )
print union_intersection( d1, d2, 'intersection' )
❺ python集合可以用来做什么原来这些功能才是最实用的
集合可以像元组一样,设置不可改变的类型;也可以默认像字典,列表一样,可以迭代改变;同时集合里的元素可以是列表,元组,字典。
1、python集合可以用来做什么——创建字典
可使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
>>> my_set = set(('apple',))
>>> my_set
{'apple'}
2、python集合可以用来做什么——添加元素(add(),update())
# add 作为一个整体添加到集合中
my_set = set()
my_set.add("abc")
print(my_set)
#update 是把要传入的元素拆分,做为个体传入到集合中
my_set = set()
my_set.update("abc")
print(my_set)
3、python集合可以用来做什么——删除元素(remove(),pop(),discard())
#remove 如果集合种有,则直接删除;如果没有,程序报错 格式:集合名.remove(元素)
my_set = {11, 13, 15}
my_set.remove(13)
print(my_set) my_set.remove(131)
print(my_set)
#pop 随机删除集合中的元素 如果集合中没有元素则程序报错
my_set = {11, 13, 15}
my_set.pop()
print(my_set)
#discard 如果集合中元素存在,直接删除; 如果元素不存在 不做任何操作 格式: 集合名.discard(元素)
my_set = {11, 13, 15}
my_set.discard(13)
print(my_set)
my_set.discard(131)
print(my_set)
4、python集合可以用来做什么——交集( & )
set1 = {9, 2, 3, 4}
set2 = {3, 4, 5, 16}
new_set = set1 & set2
print(new_set)
# result {3, 4}
5、python集合可以用来做什么——并集( | )
set1 = {1, 2, 3, 4}
set2 = {3, 5, 5, 6}[page]
new_set = set1 | set2
print(new_set)
# result {1, 2, 3, 4, 5, 6}
6、python集合可以用来做什么——差集(-)
项在前一个集合中,但不在后一个集合中。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 - set2
print(new_set)
# result {1, 2}
7、python集合可以用来做什么——对称差集( ^ )
即项在前一个集合或后一个集合中,但不会同时出现在二者中。即交集减去并集。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 ^ set2
print(new_set)
# result {1,2,5,6}
8、python集合可以用来做什么——子集判断
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判断set1是否是set2的子集
print(set1.issubset(set2))
# result True
9、python集合可以用来做什么——父集判断
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判断set1是否是set2的父集
print(set1.issuperset(set2))
# result False
10、python集合可以用来做什么——迭代和枚举
s={34,56,76,34,56,54,43,23,56}
for i in s:
print(i) ##迭代输出其内容
for i,v in enumerate(s):
print('index: %s,value: %s' %(i,v))
"""
result:
index: 0,value: 34
index: 1,value: 43
index: 2,value: 76
index: 3,value: 54
index: 4,value: 23
index: 5,value: 56
"""
可观察出,集合会自动过滤掉相同元素。
python集合可以用来做什么?原来这些功能才是最实用的,集合可以像元组一样,设置不可改变的类型;也可以默认像字典,列表一样,可以迭代改变;同时集合里的元素可以是列表,元组,字典,你能处理好吗?如果您还担心自己入门不顺利,那么本科目的其他文章一定会帮助你。
❻ python常见数据类型
一,python整数类型所表示的数据。
1,一般用以表示一类数值:所有正整数,0和负整数;
2,整型作为最常用的,频繁参与计算的数据类型,在python3.5中解释器会自动在内存中创建-5-3000之间的(包含5,不包含3000)整型对象,也就是说在该范围内,相等都是同一个已经创建好的整型对象。范围之外的即使相等也表示不同对象,该特性随python版本而改变,不要过于依赖。
3,bool型继承了int型,他是int的子类。
4,Python2中有长整型long,数值范围更大,在python3中已取消,所有整型统一由int表示。
5,参与所有数值计算,数学运算,科学计算。这也是所有编程语言都有的数据类型,因为编程语言生而需要模拟人的思维,借助数学方式,自动计算、更好的解决大量重复性的事务,因此数值类型、整数类型在编程语言中不可或缺。
6,支持二进制(0b\0B开头),十进制,八进制(0o\0O),十六进制(0x\0X)
二,python整数和浮点型支持常规的数值运算
整数和浮点数都可参与的运算:+ - * / %(取余) //(整除) **(幂)
Python字符型:
python字符型表示的数据:
python3支持Unicode编码,由字母、数字和符号组成的形式就叫字符串,更接近或者相同与人们文字符号表示,因此在信息表示和传递时它也是最受认可的形式。在程序编写中也是非常常用,对应的可操作的方法也很多,很有意思。
字符串不可被修改,可以拼接等方法创建新字符串对象;
支持分片和下标操作;a[2:]
支持+拼接,*重复操作和成员关系in/not in;
表示形式:用单引号双引号包含起来的符号;a = str(‘sdfsdfsdf’) 或 r’\t\nabcd’ 原始字符,Bytes:b’abcd’;
6,字符串属于不可变数据类型,内部机制为了节省空间,相同的两个字符串表示相同的一个对象。a = ‘python’ b = ‘python’ a is b :True
二, 字符串支持的运算方法
1,capitalize() :首字母大写后边的字母小写 a = ‘abcd’ b = a.capitalize() b:Abcd
2,casefold() lower():字母转换为全小写
3,center(width,fillchar) :居中,width填补的长度;fillchar添加的字符
a = a.center(10,’_’) //’____abcd____’ 默认无fillchar填充空格
4,count(sub,star,end) :字母计数:sub要查询的字符
5,encode(encoding=’utf-8’,errors=’strict’) 设置编码
Errors :设置错误类型
6,endswith(suffix,star,end) : 若以suffix结尾返回True
7,expandtabs(8) :设置字符串中tab按键符的空格长度:’\tabcde’
8,find(sub,star,end) : 返回指定范围内的字符串下标,未找到返回-1
9,index(sub,star,end) :返回指定范围字符串下标未找到抛出异常
10,isalnum() :判断字符串是否是字母或数字,或字母和数字组合
11,isalpha() :判断是否全是字母
12,isdecimal() :判断字符串是否是十进制数值
13,isdigit() :判断字符串是否是数字
14,isidentifier() :判断字符串中是否包含关键字
15,islower() :判断是否全小写
16,isnumeric() :判断全是数字
17,isspace() :判断是否是空格
18,isupper() 判断是否大写
19,istitle() :判断是否首字母大写
20,join(iterable) :把可迭代对象用字符串进行分割:a.join(‘123’)
21,ljust(width,fillchar);rjust() :左对齐右对齐
22, upper() :将字符串改为大写
23,split(sep=None,maxsplit=-1) :分割一个字符串,被选中字符在字符串中删除
‘ab1cd1efg’.split(‘1’) :[‘ab’,’cd’,’efg’]
三,字符串格式化:按照规格输出字符串
format(*args,**kwargs) :args位置参数,kwargs关键字参数
‘{0:.1f}’.format(123.468) :格式化参数,小数点后保留1位四舍五入
四,字符串操作符%
1,%s :格式化字符串 ‘abcd%sdef’%’dddd’
2,%d:格式化整数
3,%o格式化无符号八进制
4,%x格式化无符号十六进制
5,%f格式化定点数
6, %e: 科学计数法格式化定点数
7,%g 根据值大小自动选%f,%e
8, %G E X :大写形式
五,格式化辅助命令:
m.n :m最小总宽度,n小数点后位数:’%12.4f’%23456.789
六,转义字符:字符串前r避免转义:r’\nhello\thi’
\n:换行符
\t:横向制表符
\':'
\":"
\b:退格符
\r:回车
\v:纵向制表符
\f:换页符
\o,\x:八进制和十六进制
\0:空字符串
Python列表list
一,Python的列表list类型表示的数据:
Python列表在cpython中被解释为长度可变的数组,用其他对象组成的连续数组。
列表中元素可以是相同或不同的数据类型;
当列表元素增加或删除时,列表对象自动进行扩展或收缩内存,保证元素之间没有缝隙,总是连续的。
Python中的列表是一个序列,也是一个容器类型
创建列表:a = []; b = [1,’python’]; c = list(); d = list((1,3,4,5))
支持切片操作list[start,stop,step]
python列表常用方法
1,append添加单个元素:list.append(object); //a.append(‘python’)
2,extend添加可迭代对象: list.extend(iterable); //a.extend(‘abcde’/[1,2,3])
3,insert 插入元素:list.insert(index,object): 在index下标前插入元素//a.insert(2,’python’)
4,clear 清空所有元素:list.clear() //a.clear()
5,pop 删除并返回一个元素:list.pop(index) //默认删除默认一个元素
remove 删除指定元素:list.remove(v) ,v元素不存在报错 //a.remove(‘c’)
7,count 返回这个值在列表中数量:list.count(value)
8, 浅拷贝一个新列表:list.()
9,sort:排序list.sort(reverse=False/True) :默认升序
排序函数:sorted(list)
10,reverse: 原地翻转:list.reverse()
11,index(value,star,stop) :指定范围内该值下标:list.index(2,0,5)
列表元素访问:
下标访问:list[1]
For循环遍历
通过下标修改元素:list[2 ] = ‘hello’
列表常用运算符:
1,比较运算符:从第一个元素开始对比
2,+ 拼接一个新列表:l1+ l2
3, 重复操作符:* ,多个列表拼接
成员关系操作符:in/ not in
逻辑运算符:and not or
列表常用的排序方法:
冒泡排序;选择排序;快速排序;归并排序
Python元组tuple
一,Python元组tuple数据类型表示的数据:
元组是受到限制的、不可改变的列表;
可以是同构也可以是异构;
元组是序列类型、是可迭代对象,是容器类型。
元组的创建: a = (1,2,3)或a=1,2,3; b = tuple(); c = tuple(iterable)
支持切片操作tuple[start,stop,step]
二,python元组常用方法
1,index(value,star,stop) :指定范围内该值下标:tuple.index(2,0,5)
2,count(value) :值出现次数
三,支持运算:
1,比较运算符:从第一个元素开始对比
2,+ 拼接一个新元组:l1+ l2
3, 重复操作符:* ,多个元组拼接
4成员关系操作符:in/ not in
逻辑运算符:and not or
四,元组的访问
下标操作;
For循环遍历访问。
Python字典类型
一,Python字典dict表示的数据:{key:value}
可根据关键字:键快速索引到对应的值;
字典是映射类型,键值对一一对应关系,不是序列;
字典元素是无序的;
字典是可迭代对象,是容器类型;
字典的创建:k = {}; k1={‘keyword’:object}; k2 = dict();
K3 = dict(mapping); dict=(iterable)
二,字典的访问:
通过key:k[‘key’]
修改key对应的值:K[‘key’] = value
For循环遍历出来的是key;
For循环键值对:for I in d.items():
For 循环enumerate: for k,v in enumerate(k1):
In/not in 成员关系查询键不支持查值
三,字典常用方法
get(key,de):获取值:k.get(key,de) //若不存在则默认输出de
pop(k,de):删除一个键值对,不存在输出de,未设置报错;
keys() :返回字典所有key组成的序列:list(k.keys()) [1,2,3];
values():返回字典所有value组成的序列:list(k.values())
items():返回键值对组成的元组为元素的序列:(类set)list(k.items())
update(e):更新字典:e可是字典或两元素组成的单位元素序列:e=[(5,6),(7,8)];
k.update(e)
clear():清空字典;
popitem()删除某个键值对,若字典为空则报错
() :浅拷贝
10, fromkeys(iterable,value=None):从可迭代对象创建字典
{}.fromkeys([1,2,3]) -----{1:None,2:None,3:None}
11,setdefault(k,d=None) :若key不存在则生成一个键值对
k.setdefault(‘keyword’)
Python 集合set
集合表示的数据:
多个元素的无序组合,集合是无序的,集合元素是唯一的;
字典的键是由集合实现的;
集合是可迭代对象
集合创建:s = {1,2}; s1 = set(); s2 = set(iterable)
集合元素的访问:
For 循环将集合所有元素全部访问一遍,不重复
常用方法:
add(object):s.add(‘hi’) 向集合添加一个元素
pop() :弹栈,集合为空则报错:删除任意一个元素;
clear():清空集合,返回一个空集合对象;
remove(object):删除一个元素,不存在和报错:s.remove(‘hi’)
update(集合):更新另一个集合,元素不存在则不更新;
() :浅拷贝
集合的运算:
交集:s1&s2;
差集,补集:s1-s2;
并集:s1|s2;
Issubset():判断是否是子集:s1.issubset(s2) s1是否s2的集合子集
Issuperset():判断是否是父集:s1.issuperset()
不可变集合:
Frozenset():返回一个空的不可变集合对象
Frozenset(iterable):
S = frozenset(iterable)
Python序列类型共同特性
一,序列类型共同特性
python序列类型有:str字符串,list列表,tuple元组
都支持下标索引,切片操作;
下标都是从0开始,都可通过下标进行访问;
拥有相同的操作符
二,支持的函数:
len(obj):返回对象长度;
list(iterable):将可迭代对象转为列表;
tuple(iterable):将可迭代对象转为元组;
str(ojb):将任何对象转为字符串形式;
max(iterable): python3中元素要是同类型,python2中元素可异构:max([‘a’,1])
min(iterable):和max类似;
sum(iterable,star=0),求可迭代对象和,默认star为0,元素不能为字符串
sorted(iterable,key=None,reverse=False)
s=[(‘a’,3),(‘b’,2),(‘c’,9)]
sorted(s,key=lambda s:s[1]) //按照数字排序
reversed(sequence):翻转序列,返回迭代器
enumerate(iterable):返回enumerate对象,其元素都是一个元组(下标,值)
zip(iter1,iter2): zip([1,2],[3,4]) ----[(1,3),(2,4)]
序列类型的切片操作:
Slice:
L[index]; 访问某个元素;
L[1:4]; 区间
L[star:stop:step]; 设置步长取区间元素
❼ Python将两个字典合并成一个字典
d1={'tudou':3,'yangcong':1,'mitao':8}
d2={'mitao':3,'pantao':5,'wutongshu':2,'lian':1}
d1.update(d2)
这个d2就追加到d1里了,但是update返回的是None,是更新了d1的内容,请注意使用
如果d1和d2有重复的键,则会重写。
❽ 关于python集合运算
差集 a-b 从集合a中去除所有在集合b中出现的元素集合
并集 a|b 集合a,b中所有不重复的元素集合
交集 a&b 集合a,b中均出现的元素集合
如 a={1,2,3,4} b={2,4,6,8} a集合中减去b中出现的2,4 a-b为{1,3}
a|b 为 {1,2,3,4,6,8} a&b为 a ,b中均出现的{2,4}
❾ 怎么用python实现两个文件逐行计算两个区间的并集
有时候,为来了需求,需要统计两个 list 之间的交集,并集,差集。查询了一些资料,现在源总结在下面:
1. 获取两个list 的zd交集
#方法一:
a=[2,3,4,5]
b=[2,5,8]
tmp = [val for val in a if val in b]
print tmp
#[2, 5]
#方法二
print list(set(a).intersection(set(b)))
2. 获取两个list 的并集
print list(set(a).union(set(b)))
3. 获取两个 list 的差集
print list(set(b).difference(set(a))) # b中有而a中没有的
❿ python中如何去两个文件的并集
有时候,为了需求,需要统计两个 list 之间的交集,并集,差集。查询了一些资料,现在总结在下面:
1. 获取两个list 的交集
#方法一:
a=[2,3,4,5]
b=[2,5,8]
tmp = [val for val in a if val in b]
print tmp
#[2, 5]
#方法二
print list(set(a).intersection(set(b)))
2. 获取两个list 的并集
print list(set(a).union(set(b)))
3. 获取两个 list 的差集
print list(set(b).difference(set(a))) # b中有而a中没有的