❶ python的集合介紹
和列表類似,集合也是一個數據集合,其也不要求元素的類型一致。但是集合有下面兩個特點:
•集合內元素唯一。如不可以用1、2、1、1組成集合,因為其包含重復的1。
•集合是無序的,添加元素時不能指定位置,刪除元素時也不能通過指定位置,只能通過指定值。當然也不能通過位置來定位某個元素。
1、創建集合
我們可以從列表創建集合,將列表中的元素都加入到集合中,如果有重復的元素就僅保留一個。
a = set([1, 1, 3])
print(a)#輸出結果:set([1, 3])
也可以從元組、字典和其他集合構建集合。比如:
a = set((0, 1, 2, 3, 3, 2))
使用的是字典的鍵來構建集合,字典的值沒有被使用到,比如:
a = set({1:10, 2:20, 3:30})
從字元串構建集合,其每個字元都成為集合的一個元素,比如:
a = set("abcdefabc")
輸出結果:a={'c', 'e', 'f', 'b', 'd', 'a'}
另外一個集合構建集合,比如:
a = set([1, 2, 3])
b = set(a) 輸出結果:b={1, 2, 3}
當然也可以構造一個空的集合,使用的方法是set()。空集合沒有任何元素,比如:
a = set()
1.添加元——add(值)
該函數只能添加一個元素。
如果添加的元素已經在集合中存在,那麼不會發生任何變化。
2.扔掉元素——discard(值)
該函數刪除集合中指定的值對應的元素。
如果指定值在集合中不存在,則不做任何操作。
3.刪除指定值——remove(值)
該函數和discard()的不同之處在於,如果指定的值在集合中不存在,會拋出異常。
4.清空所有元素——clear()
該函數扔掉所有的元素。執行完該函數後,該集合將變成一個空的集合。
a.clear()
5.刪除第一個元素——pop()
如果集合中有元素,則返回值為刪除掉的元素的值。
如果集合為空,則拋出異常。
6.得到差集——difference(集合對象)
該函數返回一個新的集合,該集合包含所有屬於a而不屬於b的元素,如圖所示。該操作不會改變原始集合a或者b的內容。
7.差集操作符(-)
該操作符和difference()類似,返回一個新的集合,該集合包含所有屬於a而不屬於b的元素。該操作不會改變原始輸入集合a或者b的內容。
8.從集合中刪除另一個集合中存在的元素——difference_update(集合對象)
該函數和difference()的不同是操作數a會被修改,而且沒有返回值。
9.得到兩個集合的交集——intersection(集合)
該函數返回所有的同時屬於集合a和集合b的元素組成的集合,即返回的是一個集合,該集合的所有元素都同時屬於集合a和b,如圖所示。輸入集合a和b在該過程中沒有發生任何改變。
10.交集操作符(&)
該操作符和intersection()的效果是一樣的。
11.刪除集合a中所有不屬於集合b的元素——intersection_update(集合)
該函數也是求交集,與intersection()不同的是其修改原始輸入集合,並且沒有返回值。這也是為何該介面函數後面帶有update字樣,因為其更新了原來的輸入集合。
12.是否存在交集——isdisjoint()
該函數判斷是否存在這樣的元素,其同時屬於集合a和集合b。如果存在這樣的元素,返回False;否則返回True。
13.並集——union(集合a,集合b)
該函數返回一個新的集合,該集合的元素要麼屬於輸入集合a要麼屬於集合b。該操作不修改作為輸入的兩個集合a和b。如圖表示該函數返回的集合的內容。
14.並集操作符(|)
該操作符和union()的效果是一樣的。其返回一個並集,並且不修改輸入集合的內容。
15.添加屬於b而不屬於a的元素——update()
該函數在集合a中添加屬於b而不屬於a的所有元素。該操作和union()不同的是,其修改了輸入集合a,並且沒有返回值。
16.外集——symmetric_difference()
外集就是由只屬於集合a或者只屬於集合b的元素組成的集合,如圖所示。該操作返回一個新的集合,並且不修改原來的輸入集合a和b。
17.外集操作符(^)
該操作符和symmetric_difference()的效果是一樣的,也是返回一個新的集合,並且不會修改輸入的集合a或者b。
18.a和b的並集減去a和b的交集——symmetric_difference_update()
該函數和symmetric_difference()的區別是,其修改了集合a的值,並且沒有返回值。
19.是指定集合的子集嗎——issubset()
a是b的子集就是說集合a的所有元素都屬於集合b。
如果a等於b,那麼a和b互為子集。
20.是指定集合的超集嗎——issuperset()
a是b的超集合就是說集合b中的所有元素都屬於集合a。
如果a是b的超集,那麼b就是a的子集。
如果a等於b,那麼它們互為子集,同時也互為超集。
❷ 電腦python並集符號怎麼打
首先打開pyharm編輯器。
❸ python 里的差集,交集,並集是什麼意思
這是 set的用法
首先set是集合,集合是無序不重復的
t=set([1,2,3,4,5])
s=set([5,6,7,8,9])
並集:
a = t | s # t 和 s的並集,計算的是t和s加在一起有多少不重復的元素,根據上面的例子,a就是一個包含1、2、3、4、5、6、7、8、9這九個元素的集合
交集:
b = t & s # t 和 s的交集,計算的是t和s有多少共同擁有不重復的元素,根據上面的例子,a就是一個包含5這一個元素的集合
差集:
c = t - s # 求差集(項在t中,但不在s中),根據上面的例子,a就是一個包含1、2、3、4這四個元素的集合
❹ python字典的並交集
沒看太懂,如果只是對key值求交集和並集,下面這個程序就好了,不是的話,說清楚
def union_intersection(d1,d2,mark):
"""
@attention: 這個是只對Key值做的
"""
temp = []
if mark == "union":
temp = list(set(d1.keys()+d2.keys()))
else:
temp = list(set(d1.keys())&set(d2.keys()))
tempdict = {}
for item in temp:
tempdict.setdefault(item,None)
return tempdict
if __name__ == '__main__':
d1 = {1:'a', 2:'b', 3:'c'}
d2 = {2:'2', 3:'3', 4:'4'}
print union_intersection( d1, d2, 'union' )
print union_intersection( d1, d2, 'intersection' )
❺ python集合可以用來做什麼原來這些功能才是最實用的
集合可以像元組一樣,設置不可改變的類型;也可以默認像字典,列表一樣,可以迭代改變;同時集合里的元素可以是列表,元組,字典。
1、python集合可以用來做什麼——創建字典
可使用大括弧 { } 或者 set() 函數創建集合,注意:創建一個空集合必須用 set() 而不是 { },因為 { } 是用來創建一個空字典。
>>> my_set = set(('apple',))
>>> my_set
{'apple'}
2、python集合可以用來做什麼——添加元素(add(),update())
# add 作為一個整體添加到集合中
my_set = set()
my_set.add("abc")
print(my_set)
#update 是把要傳入的元素拆分,做為個體傳入到集合中
my_set = set()
my_set.update("abc")
print(my_set)
3、python集合可以用來做什麼——刪除元素(remove(),pop(),discard())
#remove 如果集合種有,則直接刪除;如果沒有,程序報錯 格式:集合名.remove(元素)
my_set = {11, 13, 15}
my_set.remove(13)
print(my_set) my_set.remove(131)
print(my_set)
#pop 隨機刪除集合中的元素 如果集合中沒有元素則程序報錯
my_set = {11, 13, 15}
my_set.pop()
print(my_set)
#discard 如果集合中元素存在,直接刪除; 如果元素不存在 不做任何操作 格式: 集合名.discard(元素)
my_set = {11, 13, 15}
my_set.discard(13)
print(my_set)
my_set.discard(131)
print(my_set)
4、python集合可以用來做什麼——交集( & )
set1 = {9, 2, 3, 4}
set2 = {3, 4, 5, 16}
new_set = set1 & set2
print(new_set)
# result {3, 4}
5、python集合可以用來做什麼——並集( | )
set1 = {1, 2, 3, 4}
set2 = {3, 5, 5, 6}[page]
new_set = set1 | set2
print(new_set)
# result {1, 2, 3, 4, 5, 6}
6、python集合可以用來做什麼——差集(-)
項在前一個集合中,但不在後一個集合中。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 - set2
print(new_set)
# result {1, 2}
7、python集合可以用來做什麼——對稱差集( ^ )
即項在前一個集合或後一個集合中,但不會同時出現在二者中。即交集減去並集。
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
new_set = set1 ^ set2
print(new_set)
# result {1,2,5,6}
8、python集合可以用來做什麼——子集判斷
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判斷set1是否是set2的子集
print(set1.issubset(set2))
# result True
9、python集合可以用來做什麼——父集判斷
set1 = { 3, 4}
set2 = {3, 4, 5, 6}
# 判斷set1是否是set2的父集
print(set1.issuperset(set2))
# result False
10、python集合可以用來做什麼——迭代和枚舉
s={34,56,76,34,56,54,43,23,56}
for i in s:
print(i) ##迭代輸出其內容
for i,v in enumerate(s):
print('index: %s,value: %s' %(i,v))
"""
result:
index: 0,value: 34
index: 1,value: 43
index: 2,value: 76
index: 3,value: 54
index: 4,value: 23
index: 5,value: 56
"""
可觀察出,集合會自動過濾掉相同元素。
python集合可以用來做什麼?原來這些功能才是最實用的,集合可以像元組一樣,設置不可改變的類型;也可以默認像字典,列表一樣,可以迭代改變;同時集合里的元素可以是列表,元組,字典,你能處理好嗎?如果您還擔心自己入門不順利,那麼本科目的其他文章一定會幫助你。
❻ python常見數據類型
一,python整數類型所表示的數據。
1,一般用以表示一類數值:所有正整數,0和負整數;
2,整型作為最常用的,頻繁參與計算的數據類型,在python3.5中解釋器會自動在內存中創建-5-3000之間的(包含5,不包含3000)整型對象,也就是說在該范圍內,相等都是同一個已經創建好的整型對象。范圍之外的即使相等也表示不同對象,該特性隨python版本而改變,不要過於依賴。
3,bool型繼承了int型,他是int的子類。
4,Python2中有長整型long,數值范圍更大,在python3中已取消,所有整型統一由int表示。
5,參與所有數值計算,數學運算,科學計算。這也是所有編程語言都有的數據類型,因為編程語言生而需要模擬人的思維,藉助數學方式,自動計算、更好的解決大量重復性的事務,因此數值類型、整數類型在編程語言中不可或缺。
6,支持二進制(0b\0B開頭),十進制,八進制(0o\0O),十六進制(0x\0X)
二,python整數和浮點型支持常規的數值運算
整數和浮點數都可參與的運算:+ - * / %(取余) //(整除) **(冪)
Python字元型:
python字元型表示的數據:
python3支持Unicode編碼,由字母、數字和符號組成的形式就叫字元串,更接近或者相同與人們文字元號表示,因此在信息表示和傳遞時它也是最受認可的形式。在程序編寫中也是非常常用,對應的可操作的方法也很多,很有意思。
字元串不可被修改,可以拼接等方法創建新字元串對象;
支持分片和下標操作;a[2:]
支持+拼接,*重復操作和成員關系in/not in;
表示形式:用單引號雙引號包含起來的符號;a = str(『sdfsdfsdf』) 或 r』\t\nabcd』 原始字元,Bytes:b』abcd』;
6,字元串屬於不可變數據類型,內部機制為了節省空間,相同的兩個字元串表示相同的一個對象。a = 『python』 b = 『python』 a is b :True
二, 字元串支持的運算方法
1,capitalize() :首字母大寫後邊的字母小寫 a = 『abcd』 b = a.capitalize() b:Abcd
2,casefold() lower():字母轉換為全小寫
3,center(width,fillchar) :居中,width填補的長度;fillchar添加的字元
a = a.center(10,』_』) //』____abcd____』 默認無fillchar填充空格
4,count(sub,star,end) :字母計數:sub要查詢的字元
5,encode(encoding=』utf-8』,errors=』strict』) 設置編碼
Errors :設置錯誤類型
6,endswith(suffix,star,end) : 若以suffix結尾返回True
7,expandtabs(8) :設置字元串中tab按鍵符的空格長度:』\tabcde』
8,find(sub,star,end) : 返回指定范圍內的字元串下標,未找到返回-1
9,index(sub,star,end) :返回指定范圍字元串下標未找到拋出異常
10,isalnum() :判斷字元串是否是字母或數字,或字母和數字組合
11,isalpha() :判斷是否全是字母
12,isdecimal() :判斷字元串是否是十進制數值
13,isdigit() :判斷字元串是否是數字
14,isidentifier() :判斷字元串中是否包含關鍵字
15,islower() :判斷是否全小寫
16,isnumeric() :判斷全是數字
17,isspace() :判斷是否是空格
18,isupper() 判斷是否大寫
19,istitle() :判斷是否首字母大寫
20,join(iterable) :把可迭代對象用字元串進行分割:a.join(『123』)
21,ljust(width,fillchar);rjust() :左對齊右對齊
22, upper() :將字元串改為大寫
23,split(sep=None,maxsplit=-1) :分割一個字元串,被選中字元在字元串中刪除
『ab1cd1efg』.split(『1』) :[『ab』,』cd』,』efg』]
三,字元串格式化:按照規格輸出字元串
format(*args,**kwargs) :args位置參數,kwargs關鍵字參數
『{0:.1f}』.format(123.468) :格式化參數,小數點後保留1位四捨五入
四,字元串操作符%
1,%s :格式化字元串 『abcd%sdef』%』dddd』
2,%d:格式化整數
3,%o格式化無符號八進制
4,%x格式化無符號十六進制
5,%f格式化定點數
6, %e: 科學計數法格式化定點數
7,%g 根據值大小自動選%f,%e
8, %G E X :大寫形式
五,格式化輔助命令:
m.n :m最小總寬度,n小數點後位數:』%12.4f』%23456.789
六,轉義字元:字元串前r避免轉義:r』\nhello\thi』
\n:換行符
\t:橫向製表符
\':'
\":"
\b:退格符
\r:回車
\v:縱向製表符
\f:換頁符
\o,\x:八進制和十六進制
\0:空字元串
Python列表list
一,Python的列表list類型表示的數據:
Python列表在cpython中被解釋為長度可變的數組,用其他對象組成的連續數組。
列表中元素可以是相同或不同的數據類型;
當列表元素增加或刪除時,列表對象自動進行擴展或收縮內存,保證元素之間沒有縫隙,總是連續的。
Python中的列表是一個序列,也是一個容器類型
創建列表:a = []; b = [1,』python』]; c = list(); d = list((1,3,4,5))
支持切片操作list[start,stop,step]
python列表常用方法
1,append添加單個元素:list.append(object); //a.append(『python』)
2,extend添加可迭代對象: list.extend(iterable); //a.extend(『abcde』/[1,2,3])
3,insert 插入元素:list.insert(index,object): 在index下標前插入元素//a.insert(2,』python』)
4,clear 清空所有元素:list.clear() //a.clear()
5,pop 刪除並返回一個元素:list.pop(index) //默認刪除默認一個元素
remove 刪除指定元素:list.remove(v) ,v元素不存在報錯 //a.remove(『c』)
7,count 返回這個值在列表中數量:list.count(value)
8, 淺拷貝一個新列表:list.()
9,sort:排序list.sort(reverse=False/True) :默認升序
排序函數:sorted(list)
10,reverse: 原地翻轉:list.reverse()
11,index(value,star,stop) :指定范圍內該值下標:list.index(2,0,5)
列表元素訪問:
下標訪問:list[1]
For循環遍歷
通過下標修改元素:list[2 ] = 『hello』
列表常用運算符:
1,比較運算符:從第一個元素開始對比
2,+ 拼接一個新列表:l1+ l2
3, 重復操作符:* ,多個列表拼接
成員關系操作符:in/ not in
邏輯運算符:and not or
列表常用的排序方法:
冒泡排序;選擇排序;快速排序;歸並排序
Python元組tuple
一,Python元組tuple數據類型表示的數據:
元組是受到限制的、不可改變的列表;
可以是同構也可以是異構;
元組是序列類型、是可迭代對象,是容器類型。
元組的創建: a = (1,2,3)或a=1,2,3; b = tuple(); c = tuple(iterable)
支持切片操作tuple[start,stop,step]
二,python元組常用方法
1,index(value,star,stop) :指定范圍內該值下標:tuple.index(2,0,5)
2,count(value) :值出現次數
三,支持運算:
1,比較運算符:從第一個元素開始對比
2,+ 拼接一個新元組:l1+ l2
3, 重復操作符:* ,多個元組拼接
4成員關系操作符:in/ not in
邏輯運算符:and not or
四,元組的訪問
下標操作;
For循環遍歷訪問。
Python字典類型
一,Python字典dict表示的數據:{key:value}
可根據關鍵字:鍵快速索引到對應的值;
字典是映射類型,鍵值對一一對應關系,不是序列;
字典元素是無序的;
字典是可迭代對象,是容器類型;
字典的創建:k = {}; k1={『keyword』:object}; k2 = dict();
K3 = dict(mapping); dict=(iterable)
二,字典的訪問:
通過key:k[『key』]
修改key對應的值:K[『key』] = value
For循環遍歷出來的是key;
For循環鍵值對:for I in d.items():
For 循環enumerate: for k,v in enumerate(k1):
In/not in 成員關系查詢鍵不支持查值
三,字典常用方法
get(key,de):獲取值:k.get(key,de) //若不存在則默認輸出de
pop(k,de):刪除一個鍵值對,不存在輸出de,未設置報錯;
keys() :返回字典所有key組成的序列:list(k.keys()) [1,2,3];
values():返回字典所有value組成的序列:list(k.values())
items():返回鍵值對組成的元組為元素的序列:(類set)list(k.items())
update(e):更新字典:e可是字典或兩元素組成的單位元素序列:e=[(5,6),(7,8)];
k.update(e)
clear():清空字典;
popitem()刪除某個鍵值對,若字典為空則報錯
() :淺拷貝
10, fromkeys(iterable,value=None):從可迭代對象創建字典
{}.fromkeys([1,2,3]) -----{1:None,2:None,3:None}
11,setdefault(k,d=None) :若key不存在則生成一個鍵值對
k.setdefault(『keyword』)
Python 集合set
集合表示的數據:
多個元素的無序組合,集合是無序的,集合元素是唯一的;
字典的鍵是由集合實現的;
集合是可迭代對象
集合創建:s = {1,2}; s1 = set(); s2 = set(iterable)
集合元素的訪問:
For 循環將集合所有元素全部訪問一遍,不重復
常用方法:
add(object):s.add(『hi』) 向集合添加一個元素
pop() :彈棧,集合為空則報錯:刪除任意一個元素;
clear():清空集合,返回一個空集合對象;
remove(object):刪除一個元素,不存在和報錯:s.remove(『hi』)
update(集合):更新另一個集合,元素不存在則不更新;
() :淺拷貝
集合的運算:
交集:s1&s2;
差集,補集:s1-s2;
並集:s1|s2;
Issubset():判斷是否是子集:s1.issubset(s2) s1是否s2的集合子集
Issuperset():判斷是否是父集:s1.issuperset()
不可變集合:
Frozenset():返回一個空的不可變集合對象
Frozenset(iterable):
S = frozenset(iterable)
Python序列類型共同特性
一,序列類型共同特性
python序列類型有:str字元串,list列表,tuple元組
都支持下標索引,切片操作;
下標都是從0開始,都可通過下標進行訪問;
擁有相同的操作符
二,支持的函數:
len(obj):返回對象長度;
list(iterable):將可迭代對象轉為列表;
tuple(iterable):將可迭代對象轉為元組;
str(ojb):將任何對象轉為字元串形式;
max(iterable): python3中元素要是同類型,python2中元素可異構:max([『a』,1])
min(iterable):和max類似;
sum(iterable,star=0),求可迭代對象和,默認star為0,元素不能為字元串
sorted(iterable,key=None,reverse=False)
s=[(『a』,3),(『b』,2),(『c』,9)]
sorted(s,key=lambda s:s[1]) //按照數字排序
reversed(sequence):翻轉序列,返回迭代器
enumerate(iterable):返回enumerate對象,其元素都是一個元組(下標,值)
zip(iter1,iter2): zip([1,2],[3,4]) ----[(1,3),(2,4)]
序列類型的切片操作:
Slice:
L[index]; 訪問某個元素;
L[1:4]; 區間
L[star:stop:step]; 設置步長取區間元素
❼ Python將兩個字典合並成一個字典
d1={'tudou':3,'yangcong':1,'mitao':8}
d2={'mitao':3,'pantao':5,'wutongshu':2,'lian':1}
d1.update(d2)
這個d2就追加到d1里了,但是update返回的是None,是更新了d1的內容,請注意使用
如果d1和d2有重復的鍵,則會重寫。
❽ 關於python集合運算
差集 a-b 從集合a中去除所有在集合b中出現的元素集合
並集 a|b 集合a,b中所有不重復的元素集合
交集 a&b 集合a,b中均出現的元素集合
如 a={1,2,3,4} b={2,4,6,8} a集合中減去b中出現的2,4 a-b為{1,3}
a|b 為 {1,2,3,4,6,8} a&b為 a ,b中均出現的{2,4}
❾ 怎麼用python實現兩個文件逐行計算兩個區間的並集
有時候,為來了需求,需要統計兩個 list 之間的交集,並集,差集。查詢了一些資料,現在源總結在下面:
1. 獲取兩個list 的zd交集
#方法一:
a=[2,3,4,5]
b=[2,5,8]
tmp = [val for val in a if val in b]
print tmp
#[2, 5]
#方法二
print list(set(a).intersection(set(b)))
2. 獲取兩個list 的並集
print list(set(a).union(set(b)))
3. 獲取兩個 list 的差集
print list(set(b).difference(set(a))) # b中有而a中沒有的
❿ python中如何去兩個文件的並集
有時候,為了需求,需要統計兩個 list 之間的交集,並集,差集。查詢了一些資料,現在總結在下面:
1. 獲取兩個list 的交集
#方法一:
a=[2,3,4,5]
b=[2,5,8]
tmp = [val for val in a if val in b]
print tmp
#[2, 5]
#方法二
print list(set(a).intersection(set(b)))
2. 獲取兩個list 的並集
print list(set(a).union(set(b)))
3. 獲取兩個 list 的差集
print list(set(b).difference(set(a))) # b中有而a中沒有的