python寫文件編碼_python寫文件中文亂碼

A. python解決csv文件用excel打開亂碼問題

【問題】

python輸出的csv文件用excel打開，裡面的中文會變成亂碼，但用window下的記事本或mac下的numbers打開就正常顯示。

原因是python輸出的文件是utf-8編碼寫入的，excel默認以gbk方式讀取，導致亂碼發生。

【解決方法1】文件產出時encoding設置為utf-8-sig

用excel打開csv時，excel會先檢查文件的第一個字元，來了解這個文件是什麼編碼方式，如果這個字元是BOM，excel就知道用utf-8的方式打開這個文件。python自帶了處理BOM的編碼方式uft-8-sig，因此只需要在文件產出時將encoding設置為utf-8-sig。

如果文件不是由python產出的，只需要以utf-8方式讀入再以utf-8-sig方式存儲即可

【解決方法2】懶人法，適用只含簡體中文的文件

用記事本打開，點擊另存為，右下角編碼方式選擇「ANSI」，這個過程是把這個文件改成gbk編碼格式，excel就是默認用gbk方式打開的。

參考： Python寫的csv文件，如何讓 Excel 雙擊打開不亂碼？ - 雲+社區 - 騰訊雲

對編碼格式一竅不通的可以閱讀以下網頁

python筆記——二進制和文件編碼_砍柴姑娘Jourosy的博客-CSDN博客

編碼方式之ASCII、ANSI、Unicode概述 - 藍海人 - 博客園

【簡單總結】：

1. 首先需要了解字元集和字元編碼兩個概念，字元集定義了字元和二進制的一一對應關系，字元編碼規定了如何將字元的編號存儲到計算機中。

2. Unicode是字元集，包含了全球文字的唯一編碼，utf-8是編碼方式，將unicode以某種方式存儲到計算機中。

3. 有些字元集和編碼是結合在一起的，稱作字元集還是編碼都無所謂，比如ASCII，GBK

4. ANSI是各個國家地區不同擴展編碼方式的總稱，互不兼容（可以看出來通用性沒有utf好）

5. 不同編碼方式在轉換時，通常需要以unicode作為中間編碼，即先將其他編碼的字元串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。

B. python怎麼中文寫txt文件

本文以txt 文本為例，只是介紹ANSI，Unicode，UTF-8 三種編碼的文件的讀寫過程，對於編碼不做深究了

一、用記事本另存為時，可以選擇保存文本使用的的幾種編碼模式，分別為：

ANSI：默認保存的編碼格式，採用本地操作系統默認的內碼，簡體中文一般為GB2312。
Unicode：UTF-16的小端位元組序，加上BOM簽名：0xFFFE。
Unicode bigendian：Unicode編碼：UTF-16的大端位元組序，加上BOM簽名：0xFEFF。
UTF-8：編碼格式是：UTF-8，其BOM為0xEF BB BF（UTF-8不區分位元組序，這個BOM僅標志UTF-8編碼）

Python對於讀取的txt文件，最好在讀取的時候進行decode成unicode編碼，

def read_out(self): with codecs.open(self.filename, 'r+') as get: return get.read().decode('gbk')

然後再寫入的時候進行encode成對應想要的編碼類型，這樣可以保證源文件的編碼方式不會改變，且中文不會亂碼

整個代碼過程保持使用unicode編碼方式利用try…except 來進行編碼判別具體使用了那種編碼方式

f.write(self.filename.encode('gbk'))

二、對於raw_input 通過鍵盤輸入的文字，通過sys模塊中的stdin.encodeing來進行解碼

content = raw_input().decode(sys.stdin.encoding)

type(content) 是unicode

暫時這么多

C. python讀寫有中文的文件時，是否需要設置編碼格式

需要：
with open("路徑","模式",encoding="utf8") as f:

如果不確定編碼格式，後面讀取可能會出問題

D. python 寫文件怎麼寫gbk編碼的文件

open('文件名','wt',encoding='gbk')
用這樣就可以了，加一個encoding參數就行了

E. python讀寫文件

讀文件

1）使用open()方法打開文件，返回一個文件對象

原型：open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)

舉例：f = open('test.txt', 'r')

test.txt表示文件路徑(包含文件名，這個file參數可以是絕對或者相對路徑)

      r表示是讀文本文件，rb是讀二進制文本文件。（這個mode參數默認值就是r）

    2）使用close()方法關閉文件

      f.close()

打開後的文件必須關閉，因為文件對象會佔用系統資源，系統打開文件數量也就有限了

  3）打開文件時的異常處理

      f=open('test.txt', 'r')

f.read()

f.close()

        FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'

        文件讀寫時都有可能產生異常IOError(比如文件不存在)，這樣其後面的f.read()，f.close()就不會調用。為保證無論是否異常都可以關閉文件，一般使用try ... finally來處理：

      try:

        f = open('test.txt', 'r')

f.read()

        finally:

        if f:

        f.close()

        但這種寫法過於繁瑣，所以Python引入了with語句來自動調用close()方法：

        with open('test.txt', 'r') as f:

            f.read()

4）讀文件 - read()、readline() 和 readlines()

        read() 一次讀取整個文件，它通常用於將文件內容放到一個字元串變數中。如果文件過大，內存不夠，可以通過反復調用read(size)方法，每次最多讀取size個位元組的內容。

        readline() 一次讀取文件中一行內容，可反復調用

        readlines() 一次讀取所有內容並按行返回列表，該列表可以由for ... in ... 結構再進一步處理。

特別注意：

        這三種方法是把每行末尾的'\n'也讀進來了，如有需要就得我們手動去掉'\n'

        with open('test.txt', 'r') as f:

        list = f.readlines()

        for i in range(0, len(list)):

        list[i] = list[i].rstrip('\n')

寫文件

1）寫文件和讀文件是一樣的，唯一區別是open文件時，傳入標識符不同，即'w'或者'wb'表示寫文本文件或寫二進制文件

    f = open('test.txt', 'w')

    f = open('test.txt', 'wb')

    f = open('test.txt', 'a')

f.close()

特別注意：

1. 如果沒有這個文件，會自動創建一個新文件；如果有，就會先把原文件的內容清空再寫入；若不想清空原來的內容而是直接在後面追加新的內容，就用'a'這個模式

2. 寫文件，操作系統往往不會立刻把數據寫入磁碟，而是放到內存緩存起來，空閑的時候再慢慢寫入。只有調用close()方法時，操作系統才保證把沒有寫入的數據全部寫入磁碟。忘記調用close()的後果是數據可能只寫了一部分到磁碟，剩下的丟失了。

  2）寫文件 - write()、writelines()

  write()方法和read()、readline()方法對應，是將字元串寫入到文件中。

    writelines()方法和readlines()方法對應，也是針對列表的操作。它接收一個字元串列表作為參數，將他們寫入到文件中。

特別注意：

換行符不會自動的加入，需要顯式的加入換行符。

  f = open('test.txt', 'w')

    f.writelines(["111\n", "222\n", "333\n"])

補充說明：

1）對於非默認編碼(utf-8)的文件，需要open時添加encording參數，選擇對應的編碼方式

2）r+, w+, a+，可讀可寫

3）seek()方法，移動文件指針

seek(offset[, whence]) ，offset是相對於某個位置的偏移量。位置由whence決定，默認whence=0，從開頭起；whence=1，從當前位置算起；whence=2相對於文件末尾移動，通常offset取負值。

F. Python 文件操作

open(filename[,mode,encoding="編碼"]) ：第一個參數文件名如果不加路徑，默認在該py文件目錄下（路徑舉例： E:/XXX或E:\xxx ），第二個是模式，默認為 'r' ——只讀，舉例： f = open('E:/abc.txt') ，如果要轉編碼並寫入模式：
f = open('E:/abc.txt','w',encoding='utf-8')
1. 模式

2. 方法
(1) close() : 關閉文件，因為文件寫入時是寫在內存，只有關閉時才寫入硬碟，所以寫完記得關閉
(2) read(size = -1) ：讀取文件size個字元，不寫默認是-1，此時讀取所有內容（換行按來表示，很不好看），並作為字元串返回，一定要注意 讀完以後文件指針將會指向末尾 ，所以下一次在用read方法時會發現讀取不出內容了，所以這個就要用seek移動指針或者關閉文件重新定義
(3) tell() ：返回當前文件指針指向的位置
(4) seek(offset,from) ：移動文件指針，代表從from參數開始偏移offset個位元組，0代表起始位置，1代表當前位置，2代表文件末尾
(5) readline() ：按序列讀取一行內容，默認為邊界
(6) write() ：寫入內容，但必須要有寫入許可權才行，否則報錯，寫完會返回寫入的長度，例如： len1 = f.write('abc') ，此時len1就為3
(7) truncate() ：刪除內容，把當前指針以後的內容全刪了，舉例：

註：
1.文件還可以轉化為 list 之類的，例如： list1 = list(f) ，此時文件內容的按被隔開，然後可以用for語句讀取文件所有內容，舉例：

2.上面輸出文件內容方法相對低效，所以一般都直接用for輸出整個文件，舉例：

通過 fileno 函數，我們可以查看一個文件對應的文件描述符，對應的是程序中打開的文件序號，舉例：

可以看出python在啟動時會先啟動標准流的文件（文件描述符分別為：0/1/2），所以之後打開的文件就從3開始遞增，當釋放一個文件資源時，該描述符序號被釋放，之後打開的文件可以繼續使用該序號的文件描述符

python中的 print 的本質是通過 sys.stdout 來進行內容輸出，而 sys.stdout 的本質是一個"文件"，相當於我們所有的輸入輸出的本質都是在對 sys.stdin / sys.stdout / sys.stderr 這些文件來進行讀寫操作，舉例：

open 函數不僅可以打開本地文件，也可以打開文件描述符，而該參數默認為 True ，代表 close 後會將對應的文件資源釋放，而對於一些文件描述符，我們只是希望 close 時將打開文件描述符的對象釋放，而不釋放對應的文件資源，那麼則可以設置 closefd=False ，舉例：

需要使用到 chardet 模塊，按二進制可讀打開文件，然後通過 detect() 方法查看，舉例：

所以就可以根據文件來設置編碼了：

有時候使用文件的編碼解碼也可能會出現無法解析的情況，例如兩種編碼混在同一個文件里的時候，此時可以設置 errors 參數為 ignore 來避免該問題，示例：

可用 os 模塊下的 chmod() 函數，具體參考： http://www.runoob.com/python/os-chmod.html

使用 os 模塊下的 remove() 函數可以實現刪除文件，舉例：

可以使用自帶的 zipfile 模塊來進行操作，舉例：

可以使用自帶的 tarfile 模塊來進行操作，舉例：

https://www.cnblogs.com/lotusto/p/5805543.html

G. 使用 Python 讀寫文件

有些數據是臨時的，它們在應用程序運行時存儲在內存中，然後丟棄。但是有些數據是持久的。它們存儲在硬碟驅動器上供以後使用，而且它們通常是用戶最關心的東西。對於程序員來說，編寫代碼讀寫文件是很常見的，但每種語言處理該任務的方式都不同。本文演示了如何使用 Python 處理文件數據。

在 Linux 上，你可能已經安裝了 Python。如果沒有，你可以通過發行版軟體倉庫安裝它。例如，在 CentOS 或 RHEL 上：

在 macOS 上，你可以使用 MacPorts或Homebrew安裝。在 Windows 上，你可以使用Chocolatey安裝。

一旦安裝了 Python，打開你最喜歡的文本編輯器，准備好寫代碼吧。

如果你需要向一個文件中寫入數據，記住有三個步驟：

這與你在計算機上編碼、編輯照片或執行其他操作時使用的步驟完全相同。首先，打開要編輯的文檔，然後進行編輯，最後關閉文檔。

在 Python 中，過程是這樣的：

這個例子中，第一行以寫模式打開了一個文件，然後用變數 f 表示，我使用了 f 是因為它在 Python 代碼中很常見，使用其他任意有效變數名也能正常工作。

在打開文件時，有不同的模式：

第二行表示向文件中寫入數據，本例寫入的是純文本，但你可以寫入任意類型的數據。

最後一行關閉了文件。

對於快速的文件交互，常用有一種簡短的方法可以寫入數據。它不會使文件保持打開狀態，所以你不必記得調用 close 函數。相反，它使用 with 語法：

如果你或你的用戶需要通過應用程序需要向文件中寫入一些數據，然後你需要使用它們，那麼你就需要讀取文件了。與寫入類似，邏輯一樣：

同樣的，這個邏輯反映了你一開始使用計算機就已知的內容。閱讀文檔，你可以打開、閱讀，然後關閉。在計算機術語中，「打開」文件意味著將其載入到內存中。

實際上，一個文本文件內容肯定不止一行。例如，你需要讀取一個配置文件、游戲存檔或樂隊下一首歌曲的歌詞，正如你打開一本實體書時，你不可能立刻讀完整本書，代碼也只能解析已經載入到內存中的文件。因此，你可能需要遍歷文件的內容。

示例的第一行指明使用讀模式打開一個文件，然後文件交由變數 f 表示，但就像你寫數據一樣，變數名是任意的。 f 並沒有什麼特殊的，它只是單詞「file」的最簡表示，所以 Python 程序員會經常使用它。

在第二行，我們使用了 line ，另一個任意變數名，用來表示 f 的每一行。這告訴 Python 逐行迭代文件的內容，並將每一行的內容列印到輸出中（在本例中為終端或IDLE）。

就像寫入一樣，使用 with 語法是一種更簡短的方法讀取數據。即不需要調用 close 方法，方便地快速交互。

使用 Python 有很多方法向文件寫入數據，包括用 JSON、YAML、TOML等不同的格式寫入。還有一個非常好的內置方法用於創建和維護SQLite資料庫，以及許多庫來處理不同的文件格式，包括圖像、音頻和視頻等。

via: https://opensource.com/article/21/7/read-write-files-python

作者：Seth Kenlon選題：lujun9972譯者：MjSeven校對：turbokernel

H. python 文件的打開與讀寫

/python通過解釋器內置的open()函數打開一個文件,並實現該文件與一個程序變數的關聯,open()函數格式如下:

/open()函數包含有兩個參數:文件名和打開模式.當文件與執行文件在同一文件夾中,直接輸入文件名,亦可輸入文件的完整路徑.打開模式是指以何種方式打開文件,python提供了7種打開模式.

/r/w/x/a模式與b/t/+模式可以組合使用,比如'rt'為文本只讀.'rb'為二級制只讀.

/文件使用結束後,需要使用close()關閉文件使用許可權,釋放內存.

/當文件使用文本格式打開時,讀寫按照字元串方式,採用計算機當前編碼或指定編碼.
/當文件以二進制方式打開時,讀寫按照位元組流方式.

/python本身將文件讀取為一個行序列.

I. python寫文件中文亂碼

解決思路：

修改excel 打開csv 文件的編碼（可能會影響其它文件的打開，不作為首選方式）
修改python 打開文件的編碼 utf-8 -> utf-8-sig
修改前的編碼
f=open(filename,'w',encoding='utf-8')
修改後的編碼
f=open(filename,'w',encoding='utf-8-sig')

J. Python文件讀寫

常見的讀寫操作：

Python內置了讀寫文件的函數，用法和C是兼容的。本節介紹內容大致有：文件的打開/關閉、文件對象、文件的讀寫等。僅示例介紹 TXT 類型文檔的讀寫，也就是最基礎的文件讀寫，也需要注意編碼問題；

open() close() with open(...) as ...

看以下示例就能了解 Python 的 open() 及 close() 函數。這邊調用 read()方法可以一次讀取文件的全部內容，Python把內容讀到內存，用一個str對象表示，具體使用參見下文。

在 E 盤 python_file 文件夾下新建一 a.txt，輸入隨意，如下：

Python 操作打開及關閉方式如下：

注意 open() 之後一定要 close()。但由於文件讀寫時都可能產生IOError，為了保證無論是否出錯都能正確地關閉文件，我們用 try ... finally 來實現：

python 簡化了改寫法，即用 with open(...) as ... ；建議之後文件讀寫都用該寫法：

上面，你肯定注意到了參數 "r"；該參數決定了打開文件的模式：只讀，寫入，追加等。所有可取值見如下的完全列表。這個參數是非強制的，默認文件訪問模式為只讀(r)。

相關參數：

File 對象

file 為一對象，它有一些內置屬性，如下

file對象的屬性：

read() read(size) readline() readlines()

之前的例子已經接觸到了 read() 函數，該函數會會一次性讀取文件的全部內容，如果能確保文件的大小，自然可以。但若文件過大，內存就爆了，所以，可以反復調用read(size)方法，每次最多讀取size個位元組的內容；也可調用 readline() 每次讀取一行內容；而調用readlines()可以一次讀取所有內容並按行返回list。總之，根據需求來。僅以 txt 文件為例，其他的文件讀取需要特殊處理；另外，文件的格式編碼方式也需要注意；這邊僅介紹讀取方法，其他的會出專題來學習。

在D:\python_file 下新建 poet.txt；示例如下，由於一個中文會佔多個位元組，故read(size) 部分會亂碼，如：

write()

寫文件和讀文件是一樣的，唯一區別是調用open()函數時，傳入標識符'w'或者'wb'表示寫文本文件或寫二進制文件；'a' 對應的表示追加等。

如下示例，由於 write.txt 文件不存在，創建該文件並寫入：

在上例基礎上，繼續，該文件被重寫：

繼續，這次使用追加，會在文件結尾追加：

https://blog.csdn.net/msspark/article/details/86745391

https://www.cnblogs.com/tianyiliang/p/8192703.html

https://www.cnblogs.com/camilla/p/7234657.html

https://blog.csdn.net/songlh1234/article/details/83316468

https://www.php.cn/python-tutorials-412484.html

https://blog.csdn.net/weay/article/details/80946152

https://blog.csdn.net/xc_zhou/article/details/81044836

導航:首頁 > 編程語言 > python寫文件編碼

python寫文件編碼

與python寫文件編碼相關的資料