導航:首頁 > 編程語言 > python所支持的文件格式

python所支持的文件格式

發布時間:2022-12-26 20:51:35

1. python支持的數據類型

數字:數字類型是不可更改的對象。對變數改變的數字值就是生成/創建新的對象。Python支持多種數字類型:整型、布爾型、雙精度浮點型、十進制浮點型、復數等。
字元串:字元串是不可變類型。就是說改變一個字元串的元素需要新建一個新的字元串,字元串是由獨立的字元組成的,並且這些字元可以通過切片操作順序地訪問。Python裡面通過在引號間包含字元的方式創建字元串,單引號和雙引號的作用是相同的。Python實際上有三類字元串,通常意義的字元串和Unicode字元串實際上都是抽象類basestring的子類。
列表:像字元串類型一樣,列表類型也是序列式的數據類型,字元串只能由字元組成,而且是不可變的,列表則是能保留任意數目的Python對象的靈活的容器。列表不僅可以包含Python的標准類型,可以用用戶定義的對象作為自己的元素。列表可以包含不同類型的對象,要比C或者Python自己的數組類型都要靈活,因為數組類型所有的元素只能是一種類型。列表可以執行pop、sort、reverse等操作。
元組:元組類型在很多操作上跟列表一樣,許多用在列表上的例子在元組上照樣可以用。他們主要不同在於元組是不可變的,或者說是只讀的,所以那些用於更新列表的操作,比如用切片操作來更新一部分元素的操作,就不能用於元組類型。
字典:字典是Python語言中唯一的映射類型。映射類型對象里哈希值(鍵,key) 和指向的對象(值。value)
是一對多的關系。一個字典對象是可變的,它是一個容器類型,能存儲任意個數的Python對象,其中包括其他容器類型。字典類型和序列類型容器類的區別是存儲和訪問數據的方式不同。序列類型只用數字類型的鍵。映射類型可以用其他對象類型做鍵,一般最常用的是用字元串做鍵。字典常見的操作有:字典創建、字典賦值、字典中值的訪問、字典更新、字典元素刪除等操作。
集合。最早出現在Python2.3版本中,通過集合模塊來創建,並通過immutableset類和set類進行訪問。集合有兩種不同的類型,可變集合和不可變集合。可變集合,可以添加和刪除元素,不可變集合則不允許這樣做。

2. python的數據類型有哪些

第一種:整數

python可以處理任意大小的整數,當然包含負整數,在python程序中,整數的表示方法和數學上的寫法一模一樣,比如:1,100,-8080,0,等。

計算機由於使用二進制,所以有時候用十六進製表示整數比較方便,十六進制用0x前綴和0-9,a-f表示,比如:0xff00。

第二種:浮點數

浮點數也就是小數,之所以稱為浮點數,是因為按照科學計數法表示時,一個浮點數的小數點位置是可變的。浮點數可以用數學寫法,比如1.23,3.15,-9.01等。但是對於很大或者很小的浮點數,就必須用科學計數法表示,把10用e替代,1.23x10^9就是1.23e9。

整數和浮點數在計算機內部存儲的方法是不同的,整數運算永遠是精確的,而浮點數運算則可能會有四捨五入的誤差。

第三種:字元串

字元串是以「或」括起來的任意文本,比如'abc','xyz'等。請注意,「或」本身只是一種表示方式,不是字元串的一部分,因此,字元串'abc'只有a,b,c這3個字元。

第四個:布爾值

布爾值和布爾代數的表示完全一致,一個布爾值只有True、False兩種值,要麼是True,要麼是False,在python中,可以直接用True、False表示布爾值,也可以通過布爾運算計算出來。

布爾值可以用and、or或not運算。

and運算是與運算,只有所有都為True,and運算結果才是True。

or運算是或運算,只要其中有一個為True,or運算結果就是True。

not運算是非運算,它是一個單目運算符,把True變成False,False變成True。

第五個:空值

空值是python里一個特殊的值,用None表示。None不能理解為0,因為0是有意義的,而None是一個特殊的空值。

此外,python還提供了列表、字典等多種數據類型,還允許創建自定義數據類型。

3. Python處理Excel文件(csv, xls, xlsx)

Excel文件格式主要有csv,xlsx和xlsx,對於不同的格式,我們使用不同的包來進行處理。

其中, encoding='utf-8-sig' 是為了編碼正常可以正確顯示中文, spamreader 中的每一個 row 為list格式,可以循環取出每個單元格的值。

結果:

如果csv文件是數據類的,那麼使用 pandas 包讀寫數據會更方便。

結果:

參數:

結果:

參數:

Excel文件有三層對象:工作薄、工作表和三元格,分別對應 openpyxl 包中的workbook、sheet和cell。

: openpyxl 功能全面,還支持:合並單元格、數學運算、單元格格式、迭代器 ws.iter_rows() 操作等。

: xlrd 打開為只讀模式,不可修改。

結果:

結果:

4. 想問python能處理哪些類型的文件

可以處理doc(x) xls (x)ppt(x)等文件,有相關的庫,網路選一個。
文件格式基本上標准庫里有處理html xml json csv等的
其他差不多都有第三方模塊,題主自己搜索。

5. python中都有哪些數據類型

python中數據類型有:整型、長整型、浮點型、字元串類型、布爾類型、列表類型、元組類型、字典類型、集合類型。

數據類型是每種編程語言必備屬性,只有給數據賦予明確的數據類型,計算機才能對數據進行處理運算,因此,正確使用數據類型是十分必要的,不同的語言,數據類型類似,但具體表示方法有所不同,以下是Python編程常用的數據類型:

1. 數字類型

Python數字類型主要包括int(整型)、long(長整型)和float(浮點型),但是在Python3中就不再有long類型了。

int(整型)

在32位機器上,整數的位數是32位,取值范圍是-231~231-1,即-2147483648~214748364;在64位系統上,整數的位數為64位,取值范圍為-263~263-1,即9223372036854775808~9223372036854775807。

long(長整型)

Python長整型沒有指定位寬,但是由於機器內存有限,使用長的長整數數值也不可能無限大。

float(浮點型)

浮點型也就是帶有小數點的數,其精度和機器有關。

complex(復數)

Python還支持復數,復數由實數部分和虛數部分構成,可以用 a + bj,或者 complex(a,b) 表示, 復數的實部 a 和虛部 b 都是浮點型。

2. 字元串

在Python中,加了引號的字元都被認為是字元串,其聲明有三種方式,分別是:單引號、雙引號和三引號;Python中的字元串有兩種數據類型,分別是str類型和unicode類型,str類型採用的ASCII編碼,無法表示中文,unicode類型採用unicode編碼,能夠表示任意字元,包括中文和其他語言。

3. 布爾型

和其他編程語言一樣,Python布爾類型也是用於邏輯運算,有兩個值:True(真)和False(假)。

4. 列表

列表是Python中使用最頻繁的數據類型,集合中可以放任何數據類型,可對集合進行創建、查找、切片、增加、修改、刪除、循環和排序操作。

5. 元組

元組和列表一樣,也是一種序列,與列表不同的是,元組是不可修改的,元組用」()」標識,內部元素用逗號隔開。

6. 字典

字典是一種鍵值對的集合,是除列表以外Python之中最靈活的內置數據結構類型,列表是有序的對象集合,字典是無序的對象集合。

7. 集合

集合是一個無序的、不重復的數據組合,它的主要作用有兩個,分別是去重和關系測試。

推薦課程:Python3機器學習快速入門(黑馬程序員)

6. python語法

python語法如下:

1、Python標識符

在Python里,標識符有字母、數字、下劃線組成。

在Python中,所有標識符可以包括英文、數字以及下劃線(_),但不能以數字開頭。

Python中的標識符是區分大小寫的。

以下劃線開頭的標識符是有特殊意義的。以單下劃線開頭_foo的代表不能直接訪問的類屬性,需通過類提供的介面進行訪問,不能用from xxx import而導入。

以雙下劃線開頭的foo代表類的私有成員;以雙下劃線開頭和結尾的foo代表Python里特殊方法專用的標識,如init__()代表類的構造函數。

2、Python有五個標準的數據類型

Numbers(數字)String(字元串)List(列表)Tuple(元組)Dictionary(字典)。

Python支持四種不同的數字類型:int(有符號整型)long(長整型[也可以代表八進制和十六進制])float(浮點型)complex(復數)。

python的字串列表有2種取值順序:從左到右索引默認0開始的,最大范圍是字元串長度少1;從右到左索引默認-1開始的,最大范圍是字元串開頭;List(列表)是Python中使用最頻繁的數據類型。

列表可以完成大多數集合類的數據結構實現。它支持字元,數字,字元串甚至可以包含列表(即嵌套)。列表用[]標識,是python最通用的復合數據類型。

列表中值的切割也可以用到變數[頭下標:尾下標],就可以截取相應的列表,從左到右索引默認0開始,從右到左索引默認-1開始,下標可以為空表示取到頭或尾。加號+是列表連接運算符,星號*是重復操作。元組是另一個數據類型,類似於List(列表)。

元組用「()」標識。內部元素用逗號隔開。但是元組不能二次賦值,相當於只讀列表。
字典(dictionary)是除列表以外python之中最靈活的內置數據結構類型。

列表是有序的對象結合,字典是無序的對象集合。兩者之間的區別在於:字典當中的元素是通過鍵來存取的,而不是通過偏移存取。字典用「{}」標識。字典由索引(key)和它對應的值value組成。

7. python的標准數據類型

沒有標不標准,分為基本數據類型和一些重要常用數據類型,基本類型包含整形浮點型字元串以及布爾類型,重要類型包含列表字典集合等,它們代表了python的設計哲學,簡潔優雅高效

8. Python csv模塊(讀寫文件)

CSV文件又稱為逗號分隔值文件,是一種通用的、相對簡單的文件格式,用以存儲表格數據,包括數字或者字元。CSV是電子表格和資料庫中最常見的輸入、輸出文件格式。

通過爬蟲將數據抓取的下來,然後把數據保存在文件,或者資料庫中,這個過程稱為數據的持久化存儲。本節介紹Python內置模塊CSV的讀寫操作。

1)csv.writer()

csv模塊中的writer類可用於讀寫序列化的數據,其語法格式如下:

參數說明:

csvfile:必須是支持迭代(Iterator)的對象,可以是文件(file)對象或者列表(list)對象。

dialect:編碼風格,默認為excel的風格,也就是使用逗號,分隔。

fmtparam:格式化參數,用來覆蓋之前dialect對象指定的編碼風格。

如果想同時寫入多行數據,需要使用writerrows()方法,代碼如下所示:

aggs.csv文件內容:

2)csv.DictWriter()

當然也可使用DictWriter類以字典的形式讀寫數據,使用示例如下:

name.csv文件內容,如下所示:

1)csv,reader()

csv模塊中的reader類和DictReader類用於讀取文件中的數據,其中reader()語法格式如下:

2)csv.DictReader()

應用示例如下:

輸出結果:

開課吧廣場-人才學習交流平台

9. python常見數據類型

一,python整數類型所表示的數據。

1,一般用以表示一類數值:所有正整數,0和負整數;

2,整型作為最常用的,頻繁參與計算的數據類型,在python3.5中解釋器會自動在內存中創建-5-3000之間的(包含5,不包含3000)整型對象,也就是說在該范圍內,相等都是同一個已經創建好的整型對象。范圍之外的即使相等也表示不同對象,該特性隨python版本而改變,不要過於依賴。

3,bool型繼承了int型,他是int的子類。

4,Python2中有長整型long,數值范圍更大,在python3中已取消,所有整型統一由int表示。

5,參與所有數值計算,數學運算,科學計算。這也是所有編程語言都有的數據類型,因為編程語言生而需要模擬人的思維,藉助數學方式,自動計算、更好的解決大量重復性的事務,因此數值類型、整數類型在編程語言中不可或缺。

6,支持二進制(0b\0B開頭),十進制,八進制(0o\0O),十六進制(0x\0X)

二,python整數和浮點型支持常規的數值運算

整數和浮點數都可參與的運算:+ - * / %(取余) //(整除) **(冪)

Python字元型:

python字元型表示的數據:
python3支持Unicode編碼,由字母、數字和符號組成的形式就叫字元串,更接近或者相同與人們文字元號表示,因此在信息表示和傳遞時它也是最受認可的形式。在程序編寫中也是非常常用,對應的可操作的方法也很多,很有意思。
字元串不可被修改,可以拼接等方法創建新字元串對象;
支持分片和下標操作;a[2:]
支持+拼接,*重復操作和成員關系in/not in;
表示形式:用單引號雙引號包含起來的符號;a = str(『sdfsdfsdf』) 或 r』\t\nabcd』 原始字元,Bytes:b』abcd』;
6,字元串屬於不可變數據類型,內部機制為了節省空間,相同的兩個字元串表示相同的一個對象。a = 『python』 b = 『python』 a is b :True

二, 字元串支持的運算方法

1,capitalize() :首字母大寫後邊的字母小寫 a = 『abcd』 b = a.capitalize() b:Abcd

2,casefold() lower():字母轉換為全小寫

3,center(width,fillchar) :居中,width填補的長度;fillchar添加的字元

a = a.center(10,』_』) //』____abcd____』 默認無fillchar填充空格

4,count(sub,star,end) :字母計數:sub要查詢的字元

5,encode(encoding=』utf-8』,errors=』strict』) 設置編碼

Errors :設置錯誤類型

6,endswith(suffix,star,end) : 若以suffix結尾返回True

7,expandtabs(8) :設置字元串中tab按鍵符的空格長度:』\tabcde』

8,find(sub,star,end) : 返回指定范圍內的字元串下標,未找到返回-1

9,index(sub,star,end) :返回指定范圍字元串下標未找到拋出異常

10,isalnum() :判斷字元串是否是字母或數字,或字母和數字組合

11,isalpha() :判斷是否全是字母

12,isdecimal() :判斷字元串是否是十進制數值

13,isdigit() :判斷字元串是否是數字

14,isidentifier() :判斷字元串中是否包含關鍵字

15,islower() :判斷是否全小寫

16,isnumeric() :判斷全是數字

17,isspace() :判斷是否是空格

18,isupper() 判斷是否大寫

19,istitle() :判斷是否首字母大寫

20,join(iterable) :把可迭代對象用字元串進行分割:a.join(『123』)

21,ljust(width,fillchar);rjust() :左對齊右對齊

22, upper() :將字元串改為大寫

23,split(sep=None,maxsplit=-1) :分割一個字元串,被選中字元在字元串中刪除

『ab1cd1efg』.split(『1』) :[『ab』,』cd』,』efg』]

三,字元串格式化:按照規格輸出字元串

format(*args,**kwargs) :args位置參數,kwargs關鍵字參數

『{0:.1f}』.format(123.468) :格式化參數,小數點後保留1位四捨五入

四,字元串操作符%

1,%s :格式化字元串 『abcd%sdef』%』dddd』

2,%d:格式化整數

3,%o格式化無符號八進制

4,%x格式化無符號十六進制

5,%f格式化定點數

6, %e: 科學計數法格式化定點數

7,%g 根據值大小自動選%f,%e

8, %G E X :大寫形式

五,格式化輔助命令

m.n :m最小總寬度,n小數點後位數:』%12.4f』%23456.789

六,轉義字元:字元串前r避免轉義:r』\nhello\thi』

\n:換行符

\t:橫向製表符

\':'

\":"

\b:退格符

\r:回車

\v:縱向製表符

\f:換頁符

\o,\x:八進制和十六進制

\0:空字元串

Python列表list

一,Python的列表list類型表示的數據:

Python列表在cpython中被解釋為長度可變的數組,用其他對象組成的連續數組。

列表中元素可以是相同或不同的數據類型;
當列表元素增加或刪除時,列表對象自動進行擴展或收縮內存,保證元素之間沒有縫隙,總是連續的。
Python中的列表是一個序列,也是一個容器類型
創建列表:a = []; b = [1,』python』]; c = list(); d = list((1,3,4,5))
支持切片操作list[start,stop,step]
python列表常用方法
1,append添加單個元素:list.append(object); //a.append(『python』)

2,extend添加可迭代對象: list.extend(iterable); //a.extend(『abcde』/[1,2,3])

3,insert 插入元素:list.insert(index,object): 在index下標前插入元素//a.insert(2,』python』)

4,clear 清空所有元素:list.clear() //a.clear()

5,pop 刪除並返回一個元素:list.pop(index) //默認刪除默認一個元素

remove 刪除指定元素:list.remove(v) ,v元素不存在報錯 //a.remove(『c』)
7,count 返回這個值在列表中數量:list.count(value)

8, 淺拷貝一個新列表:list.()

9,sort:排序list.sort(reverse=False/True) :默認升序

排序函數:sorted(list)

10,reverse: 原地翻轉:list.reverse()

11,index(value,star,stop) :指定范圍內該值下標:list.index(2,0,5)

列表元素訪問:
下標訪問:list[1]
For循環遍歷
通過下標修改元素:list[2 ] = 『hello』
列表常用運算符:
1,比較運算符:從第一個元素開始對比

2,+ 拼接一個新列表:l1+ l2

3, 重復操作符:* ,多個列表拼接

成員關系操作符:in/ not in
邏輯運算符:and not or
列表常用的排序方法:
冒泡排序;選擇排序;快速排序;歸並排序

Python元組tuple

一,Python元組tuple數據類型表示的數據:

元組是受到限制的、不可改變的列表;
可以是同構也可以是異構;
元組是序列類型、是可迭代對象,是容器類型。
元組的創建: a = (1,2,3)或a=1,2,3; b = tuple(); c = tuple(iterable)
支持切片操作tuple[start,stop,step]

二,python元組常用方法

1,index(value,star,stop) :指定范圍內該值下標:tuple.index(2,0,5)

2,count(value) :值出現次數

三,支持運算:

1,比較運算符:從第一個元素開始對比

2,+ 拼接一個新元組:l1+ l2

3, 重復操作符:* ,多個元組拼接

4成員關系操作符:in/ not in

邏輯運算符:and not or
四,元組的訪問

下標操作;
For循環遍歷訪問。

Python字典類型

一,Python字典dict表示的數據:{key:value}

可根據關鍵字:鍵快速索引到對應的值;
字典是映射類型,鍵值對一一對應關系,不是序列;
字典元素是無序的;
字典是可迭代對象,是容器類型;
字典的創建:k = {}; k1={『keyword』:object}; k2 = dict();
K3 = dict(mapping); dict=(iterable)

二,字典的訪問:

通過key:k[『key』]

修改key對應的值:K[『key』] = value

For循環遍歷出來的是key;

For循環鍵值對:for I in d.items():

For 循環enumerate: for k,v in enumerate(k1):

In/not in 成員關系查詢鍵不支持查值

三,字典常用方法

get(key,de):獲取值:k.get(key,de) //若不存在則默認輸出de
pop(k,de):刪除一個鍵值對,不存在輸出de,未設置報錯;
keys() :返回字典所有key組成的序列:list(k.keys()) [1,2,3];
values():返回字典所有value組成的序列:list(k.values())
items():返回鍵值對組成的元組為元素的序列:(類set)list(k.items())
update(e):更新字典:e可是字典或兩元素組成的單位元素序列:e=[(5,6),(7,8)];
k.update(e)

clear():清空字典;
popitem()刪除某個鍵值對,若字典為空則報錯
() :淺拷貝
10, fromkeys(iterable,value=None):從可迭代對象創建字典

{}.fromkeys([1,2,3]) -----{1:None,2:None,3:None}

11,setdefault(k,d=None) :若key不存在則生成一個鍵值對

k.setdefault(『keyword』)

Python 集合set

集合表示的數據:
多個元素的無序組合,集合是無序的,集合元素是唯一的;
字典的鍵是由集合實現的;
集合是可迭代對象
集合創建:s = {1,2}; s1 = set(); s2 = set(iterable)
集合元素的訪問:
For 循環將集合所有元素全部訪問一遍,不重復

常用方法:
add(object):s.add(『hi』) 向集合添加一個元素
pop() :彈棧,集合為空則報錯:刪除任意一個元素;
clear():清空集合,返回一個空集合對象;
remove(object):刪除一個元素,不存在和報錯:s.remove(『hi』)
update(集合):更新另一個集合,元素不存在則不更新;
() :淺拷貝
集合的運算:
交集:s1&s2;
差集,補集:s1-s2;
並集:s1|s2;
Issubset():判斷是否是子集:s1.issubset(s2) s1是否s2的集合子集
Issuperset():判斷是否是父集:s1.issuperset()
不可變集合:
Frozenset():返回一個空的不可變集合對象

Frozenset(iterable):

S = frozenset(iterable)

Python序列類型共同特性

一,序列類型共同特性

python序列類型有:str字元串,list列表,tuple元組
都支持下標索引,切片操作;
下標都是從0開始,都可通過下標進行訪問;
擁有相同的操作符
二,支持的函數:

len(obj):返回對象長度;
list(iterable):將可迭代對象轉為列表;
tuple(iterable):將可迭代對象轉為元組;
str(ojb):將任何對象轉為字元串形式;
max(iterable): python3中元素要是同類型,python2中元素可異構:max([『a』,1])
min(iterable):和max類似;
sum(iterable,star=0),求可迭代對象和,默認star為0,元素不能為字元串
sorted(iterable,key=None,reverse=False)
s=[(『a』,3),(『b』,2),(『c』,9)]

sorted(s,key=lambda s:s[1]) //按照數字排序

reversed(sequence):翻轉序列,返回迭代器
enumerate(iterable):返回enumerate對象,其元素都是一個元組(下標,值)
zip(iter1,iter2): zip([1,2],[3,4]) ----[(1,3),(2,4)]

序列類型的切片操作:

Slice:

L[index]; 訪問某個元素;

L[1:4]; 區間

L[star:stop:step]; 設置步長取區間元素

閱讀全文

與python所支持的文件格式相關的資料

熱點內容
dvd光碟存儲漢子演算法 瀏覽:757
蘋果郵件無法連接伺服器地址 瀏覽:962
phpffmpeg轉碼 瀏覽:671
長沙好玩的解壓項目 瀏覽:144
專屬學情分析報告是什麼app 瀏覽:564
php工程部署 瀏覽:833
android全屏透明 瀏覽:736
阿里雲伺服器已開通怎麼辦 瀏覽:803
光遇為什麼登錄時伺服器已滿 瀏覽:302
PDF分析 瀏覽:484
h3c光纖全工半全工設置命令 瀏覽:143
公司法pdf下載 瀏覽:381
linuxmarkdown 瀏覽:350
華為手機怎麼多選文件夾 瀏覽:683
如何取消命令方塊指令 瀏覽:349
風翼app為什麼進不去了 瀏覽:778
im4java壓縮圖片 瀏覽:362
數據查詢網站源碼 瀏覽:150
伊克塞爾文檔怎麼進行加密 瀏覽:892
app轉賬是什麼 瀏覽:163