python處理文件內容_python對文件的讀操作方法有哪些

A. python如何讀取文件的內容

# _*_ coding: utf-8 _*_

import pandas as pd

# 獲取文件的內容

def get_contends(path):

with open(path) as file_object:

contends = file_object.read()

return contends

# 將一行內容變成數組

def get_contends_arr(contends):

contends_arr_new = []

contends_arr = str(contends).split(']')

for i in range(len(contends_arr)):

if (contends_arr[i].__contains__('[')):

index = contends_arr[i].rfind('[')

temp_str = contends_arr[i][index + 1:]

if temp_str.__contains__('"'):

contends_arr_new.append(temp_str.replace('"', ''))

# print(index)

# print(contends_arr[i])

return contends_arr_new

if __name__ == '__main__':

path = 'event.txt'

contends = get_contends(path)

contends_arr = get_contends_arr(contends)

contents = []

for content in contends_arr:

contents.append(content.split(','))

df = pd.DataFrame(contents, columns=['shelf_code', 'robotid', 'event', 'time'])

(1)python處理文件內容擴展閱讀：

python控制語句茄團

1、if語句，當條件成立時運行語句塊。經常與else, elif(相當於else if) 配合使用。

2、for語句，遍歷列表、字元串、字典、集合等迭代器，依次處理迭代器中的每個元素。

3、while語句，當條件為真時，循環運行語句塊。

4、try語句，與except,finally配合使用處理在程序運行中出現的異常情況。

5、class語句，用於定義頃納拍類型。

6、def語句，用於定義函數和類型的方法。雀羨

B. Python Word文檔處理上篇：python-docx

某天我收到一個需求：希望能夠用python對word文檔進行一些處理，比如更換一些文字以及添加批註。

簡單搜索後，我發現 python-docx 是一個處理docx文檔的常用python庫，因此我打算用它來進行進一步開發。

官方文檔提供了一個簡單的示例

python-docx 將文檔抽象為document對象、paragraph對象以及run對象，提供了圍繞這些對象進行簡單處理的API

然而在文檔中並沒有出現關於批註操作的部分，我在搜尋一些文章後發現了在某個 issue 中提及了添加批註相關信息，然而還是沒有得到具體的解決辦法

docx文檔底層是由XML文件組成的

我們可以將一個 xx.docx 文件的後綴名改為 .rar 然後將其手動解壓，可以得到下面這些文件

在諸多文件當中主要用到的是 document.xml 文件，這里保存了文檔的內容

打開一份 document.xml 文件，拋開header、footer、table以及其他特殊項，去掉樣式等修飾項，一份樸素的docx文檔主要可以分為三個部分：paragraph、run、text

paragraph即段落，就是我們在word當中看到的一段。text即文本，就是真實的內容。run比較抽象，我們可以將其理解為片段，即語句的切分。

為了更好地理解run是什麼，打開一篇word文檔定位其中一句話

讓我們看看這篇文檔解壓之後的 document.xml 文件中對應的部分

OK，我們可以看到原本完整的一句話在word中被拆分成了許多個 <w:r> 標簽，這就是 run ，word切分 run 的規則很多，有的根據標點符號，有的根據中文分詞，句子中如果存在不同樣式的字詞也會單獨切分出來，因此我們很難預估一句話究竟會被分成幾個片段。

在issue中搜索comment關鍵字發現在一個 merge request 上已經給出了添加批註的解決方案，可以通過 paragraph 對象上的 add_comment 方法給一個段落添加批註

但這還是不符合我的需求，我的目標是精準添加到某個詞或者短語上

打開這個貢獻者的源碼進行研究

其實就是在P標簽內插入comment標簽引用，同時添加comment標簽到xx文件

同理我們可以在r標簽內插入comment標簽引用，同時添加comment標簽到xx文件，這樣就能實現給特定詞添加批註的需求了

C. Python 自動化處理 Yaml 文件-

Yaml文件內容—示例1：

Yaml文件內容—示例2：

從上述示例文件內容可以看到 Yaml 數據結構：

1). 對象：鍵值對的集合（簡稱 "映射或字典"）

例如：family 和 address 這兩個對象後面分別有對應的鍵值對集合。

2). 鍵值對用冒號「:」結構表示，冒號與值之間需用空格分隔

例如：

family 對象中的 key 為 name 與其對應的 value 值 Smile_Family 之間是使用空格分隔的。

address 對象中的 key 為 province 與其對應的 value 值 BeiJing 之間是使用空格分隔的。

3). 數組：一組按序排列的值（簡稱 "序列或列表"），數組前加有「-」符號，符號與值之間需用空格分隔

例如：

parents 中的 John 和 Jane

children 中的 Lily 和 Frank

4). 純量(scalars)：單個的、不可再分的值。例如：字元串、bool值、整數、浮點數、時間、日期、null等

None值可用null也可用 ~ 表示；

yaml文件內容如下：

Python解析輸出為：

這個例子輸出一個字典，其中value包括所有基本類型

Yaml文件內容如下：

Python解析輸出為：

Yaml文件內容如下：

Python輸出為:

如果字元串沒有空格或特殊字元，不需要加引號，但如果其中有空格或特殊字元，則需要加引號。

這里要注意單引號和雙引號的區別：

單引號中的特殊字元轉到 Python 會被轉義，也就是到最後是原樣輸出；

雙引號不會被 Python 轉義，到最後是輸出了特殊字元；

Yaml文件內容如下：

Python輸出：

D. Python其實很簡單第十五章文件操作

在各種變數中保存的數據都是臨時的，隨著程序運行結束都會丟失。要做到數據長期有效，必須建立在磁碟中建立文件，將數據輸入到文件中並保存。需要獲取數據時需要打開文件讀取。

而我們自己建立的程序都是應用程序，從本質上講，應用程序是無法直接操作計算機的硬體的，譬如讀寫磁碟中文件，這就需要調用操作系統中的相應命令。接下來我們使用的Python內置函數open()、write()都是通過調用操作系統的相關命令才實現文件讀寫的，至於其中的細節，我們就不需要考慮了。

15.1創建和打開文件

在Python 中創建或打開文件，實際上是建立一個對象，該對象通過調用內置的open()函數創建或打開一個文件。

語法：

file object = open(filename [, mode][, buffering])

參數說明如下：

filename：file_name變數是一個包含了你要訪問的文件名稱的字元串值；

mode：mode決定了打開文件的模式：只讀，寫入，追加等。所有可取值見如下的完全列表。這個參數是非強制的，默認文件訪問模式為只讀(r)。

Buffering：如果buffering的值被設為0，就不會有寄存；如果buffering的值取1，訪問文件時會寄存行；如果將buffering的值設為大於1的整數，表明了這就是的寄存區的緩沖大小；如果取負值，寄存區的緩沖大小則為系統默認。

mode參數的參數值及說明

對於其中最難區別的r、r+、w、w+、a、a+幾個參數的區別總結如下，要特別注意指針的位置：

下面舉例說明open( )函數的使用方法。

例1：

>>> file=open(Ƈ.py')

如果文件「1.py」存在，則可以打開此文件；如果文件「1.py」不存在，則會出現如下提示：

Traceback (most recent call last):

File " ", line 1, in

file=open(Ƈ.py')

FileNotFoundError: [Errno 2] No such file or directory: Ƈ.py'

例2：

>>> file=open(Ɗ.py',』a+』)

雖然文件「4.py」不存在，但運行並未出現錯誤，參見上表，「a+」的含義是以讀寫模式打開文件，如果該文件已經存在，新內容將以追加方式寫入；如果該文件不存在，則新建文件用於寫入。查看文件夾，發現已經生成了一個新的文件4.py。

例3：

file=open('python.png','rb')

print(file)

運行結果：

這就是說，雖然Python可以打開一個圖片格式的文件，但print()並不能將其輸出，還需要第三方庫中模塊的相應方法去處理，如PIL中的open()f方法。

例4：

file = open("f.txt", "w",encoding='utf-8')

# 以只寫模式打開文件f.txt，編碼方式為utf-8

print( "文件名: ", file.name) # 輸出文件名

print( "是否已關閉 : ", file.closed) # 文件是否打開

print( "訪問模式 : ", file.mode) # 文件訪問模式

運行結果：

文件名: f.txt

是否已關閉 : False

訪問模式 : w

例5：

15.2關閉文件

打開文件使用後要及時關閉，以免造成不必要的破壞，同時也可以釋放內存。在Python中使用close()方法可以關閉文件。

語法格式：

file.close()

其中，file為文件對象。

15.3 with語句

with 語句適用於對資源進行訪問的場合，確保不管使用過程中是否發生異常都會執行必要的「清理」操作，釋放資源，比如文件使用後自動關閉、線程中鎖的自動獲取和釋放等。

with語句的語法格式如下：

with expression as target:

with-body

其中，expression用於指定一個表達式，譬如打開文件的open()函數。target用於指定一個變數，並且將expression的結果保存到該變數中，譬如文件對象file。with-body用於指定with語句體，譬如一些文件操作的相關語句，如果沒有要執行的語句體，則直接用pass語句代替。

假設python當前目錄下存在一個test.txt文件，其內容如下：

Python是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。

Python是互動式語言：這意味著，您可以在一個 Python 提示符 >>> 後直接執行代碼。

Python是面向對象語言: 這意味著Python支持面向對象的風格或代碼封裝在對象的編程技術。

Python是初學者的語言：Python 對初級程序員而言，是一種偉大的語言，它支持廣泛的應用程序開發。

舉例如下：

with open('test.txt','r',encoding='utf-8') as file:

line=file.readline() # readline()方法可以讀取文件一行數據，接下來就會講到。

print(line)

運行結果如下：

Python是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。

而此時，我們給該段代碼with語句之外再增加一個讀取文件的語句，代碼如下：

with open('test.txt','r',encoding='utf-8') as file:

line=file.readline()

print(line)

line2=file.readline()

print(line2)

發現出現了如下錯誤提示：

Traceback (most recent call last):

File "C:/Users/zym/AppData/Local/Programs/Python/Python39/3.py", line 5, in

line2=file.readline()

ValueError: I/O operation on closed file.

意思是要讀取的文件已經被關閉了。

由此可知，當with語句運行結束後，被打開的test.txt文件就自動關閉了。

15.4讀取文件

在Python 中讀取文件的方法有：

1、讀取指定個數的字元

格式如下：

File.read([size])

其中，file為打開的文件對象。size為可選參數，可以指定要讀取的字元個數，省缺表示讀取所有內容。

在調用read()方法讀取文件內容時，文件必須是以r（只讀）或者r+(讀寫）方式打開。

如：

with open('test.txt','r',encoding='utf-8') as file:

txt=file.read() （或txt=file.read(10)）

print(txt)

將讀取、輸出test.txt文件的全部內容（或前10個字元）。

2、移動文件的指針

對於剛打開的文件，文件指針總是指向文件頭的。也可以通過seek()方法將文件的指針移動到新的位置。

格式如下：

file.seek(offset[,whence])

其中，file表示已經打開的文件對象；offset用於指定移動的字元個數；whence表示從哪個位置起始計算個數，其值為0表示從文件頭開始計算，其值為1表示從當前位置開始計算，其值為2表示從文件尾開始計算，默認值為0。

例如：

with open('test.txt','r',encoding='utf-8') as file:

string=file.read(9)

print('取9個字元： '+string)

file.seek(2) #指針從文件頭開始移動2個字元

string=file.read(9) #從當前位置讀取10個字元

輸出結果：

取9個字元：

Python是一種

取9個字元：

thon是一種解釋

而下面的代碼會拋出錯誤：

with open('test.txt','r',encoding='utf-8') as file:

file.seek(2,1) #指針從當前位置開始移動2個字元

string=file.read(10) #從當前位置讀取10個字元

print('取10個字元： '+string)

錯誤提示為：

Traceback (most recent call last):

File "C:.py", line 7, in

file.seek(2,1) #指針從當前位置開始移動2個字元

io.UnsupportedOperation: can't do nonzero cur-relative seeks

原因在於，必須使用b模式（即rb）打開文件，才能使用whence參數。但是，b模式（二進制）不適合文本文件。對於test.txt這樣的文本文件，為了解決通過改變指針讀取任意位置字元，可以採用加一個位置變數的方法來存儲指針的值。

例如：

with open('test.txt','r',encoding='utf-8') as file:

#utf-8漢字與英文字元都佔一個字元

string='' #設置一個空字元串

pointer=0 #當前指針為0

str1=file.read(6) #讀取6個字元

pointer+=6 #指針變數後移6個字元

string+=str1 #string用來存放已讀取的字元

print('取6個字元： ',str1)

file.seek(pointer) #指針從文件頭開始移動2個字元

str1=file.read(8) #從當前位置讀取10個字元

pointer+=8 #指針跳過已讀取的字元

string+=str1

print('再取8個字元： ',str1)

print('所有讀取的字元： ',string)

print('當前指針所處的位置： ',pointer)

str1=file.read(1)

print('當前指針所處的字元： ',str1)

運行結果如下：

取6個字元：

Python

再取8個字元：

是一種解釋型語言

所有讀取的字元：

Python是一種解釋型語言

當前指針所處的位置：

當前指針所處的字元：

：

3、讀取一行數據readline()方法

語法格式：

file.readline()

例：

with open('test.txt','r',encoding='utf-8') as f:

string=f.read(1) # 讀取文件的第一個字元

if string != '': # 防止文件為空文件

lineno=0

while True:

line=f.readline()

if line != '':

lineno+=1

print('第'+str(lineno)+'行：'+line,end='')

# 因為每行都有自帶的分行符，print()語句不允許換行

else:

break # 出現空行時停止讀取

else:

print('要讀取的文件為空文件！')

運行結果：

第1行：ython是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。

第2行：Python是互動式語言：這意味著，您可以在一個 Python 提示符 >>> 後直接執行代碼。

第3行：Python是面向對象語言: 這意味著Python支持面向對象的風格或代碼封裝在對象的編程技術。

第4行：Python是初學者的語言：Python 對初級程序員而言，是一種偉大的語言，它支持廣泛的應用程序開發。

4、讀取全部行命令readlines()方法

語法格式：

File.readlines()

該方法與read()方法一樣，在調用read()方法讀取文件內容時，文件必須是以r（只讀）或者r+(讀寫）方式打開。

例：

with open('test.txt','r',encoding='utf-8') as f:

txt=f.readlines()

print(txt)

運行結果：

['Python是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。 ', 'Python是互動式語言：這意味著，您可以在一個 Python 提示符 >>> 後直接執行代碼。 ', 'Python是面向對象語言: 這意味著Python支持面向對象的風格或代碼封裝在對象的編程技術。 ', 'Python是初學者的語言：Python 對初級程序員而言，是一種偉大的語言，它支持廣泛的應用程序開發。 ']

從上面的運行結果可以看出，readlines()方法的返回值為一個字元串列表。所以，也可以以讀取列表元素的方法輸出。如下所示：

with open('test.txt','r',encoding='utf-8') as f:

txt=f.readlines()

for line in txt:

print(line,end='')

運行結果：

Python是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。

Python是互動式語言：這意味著，您可以在一個 Python 提示符 >>> 後直接執行代碼。

Python是面向對象語言: 這意味著Python支持面向對象的風格或代碼封裝在對象的編程技術。

Python是初學者的語言：Python 對初級程序員而言，是一種偉大的語言，它支持廣泛的應用程序開發。

15.5 寫入文件內容

語法格式如下：

file.write(string)

其中，file為打開的文件對象，string為要寫入的字元串。

寫入文件內容時，文件必須以w（可寫）或a（追加）模式打開。否則，會拋出如下異常提示：

Traceback (most recent call last):

File "C:.py", line 2, in

f.write('人生苦短，我用Python！')

io.UnsupportedOperation: not writable

關於write()方法的用法舉例如下：

with open('test.txt','a',encoding='utf-8') as f:

f.write('人生苦短，我用Python！')

with open('test.txt','r',encoding='utf-8') as f:

txt=f.read()

print(txt)

運行結果：

Python是一種解釋型語言：這意味著開發過程中沒有了編譯這個環節。類似於PHP和Perl語言。

Python是互動式語言：這意味著，您可以在一個 Python 提示符 >>> 後直接執行代碼。

Python是面向對象語言: 這意味著Python支持面向對象的風格或代碼封裝在對象的編程技術。

Python是初學者的語言：Python 對初級程序員而言，是一種偉大的語言，它支持廣泛的應用程序開發。

人生苦短，我用Python！

可以看出，由於文件的打開方式為a模式（追加模式），寫入的內容被寫入到文件的末尾。

在Python中，文件操作方法里沒有類似於字元串內的計算長度、查找、替換、截取、分隔等方法，為什麼沒有？原因可能是文件的類型太復雜，譬如說二進制文件，上述操作的意義不大。如果僅僅要對文本文件進行上述操作，完全可以先把文件的內容讀取到字元串中，再用相應的字元串函數或方法去操作就可以了。譬如，要將test.txt文件中的字元串『Python』替換為』PHP』，則可以用如下代碼完成：

txt1=''

with open('test.txt','r',encoding='utf-8') as f:

txt1=f.read() #先將文件內容存入字元串txt1中

txt2=txt1.replace('Python','PHP') #將txt1中的'Python'替換為'PHP'，並存入txt2

with open('test.txt','w',encoding='utf-8') as f:

f.write(txt2) #將字元串txt2的內容寫回到文件中

這里之所以分兩步打開文件（第一次為r模式，第二次為w模式），而沒有採用一次讀寫（r+、w+方式），因為那樣比較容易出錯。實踐證明，將文件的讀操作和寫操作分開其實是非常正確的選擇。

E. python對文件的讀操作方法有哪些

摘要 1 文件讀取全文本操作

導航:首頁 > 編程語言 > python處理文件內容

python處理文件內容

與python處理文件內容相關的資料