⑴ 在linux如何讓更改文件的字元編碼
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
2.
enconv
轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下
enconv
-L
zh_CN
-x
UTF-8
filename
3.
iconv
轉換,iconv的命令格式如下:
iconv
-f
encoding
-t
encoding
inputfile
比如將一個UTF-8
編碼的文件轉換成GBK編碼
iconv
-f
GBK
-t
UTF-8
file1
-o
file2
查看文件編碼file命令
file
ip.txt
ip.txt:
UTF-8
Unicode
text,
with
escape
sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換
iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。
用法:
iconv
[選項...]
[文件...]
有如下選項可用:
輸入/輸出格式規范:
-f,
--from-code=名稱
原始文本編碼
-t,
--to-code=名稱
輸出編碼
信息:
-l,
--list
列舉所有已知的字元集
輸出控制:
-c
從輸出中忽略無效的字元
-o,
--output=FILE
輸出文件
-s,
--silent
關閉警告
--verbose
列印進度信息
-?,
--help
給出該系統求助列表
--usage
給出簡要的用法信息
-V,
--version
列印程序版本號
例子:
iconv
-f
utf-8
-t
gb2312
aaa.txt
>bbb.txt
這個命令讀取aaa.txt文件,從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。
⑵ Linux中如何查看文件編碼及對文件進行編碼轉換
查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。
文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8
文件名編碼轉換:
從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名 中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由於編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。
在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。
首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。
下面看一下convmv的具體用法:
convmv -f 源編碼 -t 新編碼 [選項] 文件名
常用參數:
-r 遞歸處理子文件夾
--notest 真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:
convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以後"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)
⑶ 如何在 Linux 中將文件編碼轉換為 UTF-8
在Linux中轉換文件的編碼可以使用iconv命令,iconv命令很簡單,記住它的三個參數就可以了,下面是它的三個參數:
-f參數:表示from,就是原本的編碼格式
-t參數:表示to,就是後來的新編碼
-o參數:表示輸出文件,就是轉換編碼後的新文件的文件名,如果沒有這個參數新文件會將原來的文件覆蓋掉。
下面是將GB2312編碼的文件轉換成UTF-8編碼的例子:
iconv -f gb2312 -t utf8 mygb2312.txt -o myutf8.txt
這個例子中mygb2412.txt就是要轉換的文件,myutf8.txt就是轉換後的新文件。
其實還有一個方法是用一個圖形界面的Linux文本編輯器軟體打開要轉換的那個文件(比如用各發行版自帶的gedit這個軟體),然後選擇另存為功能,在保存文件的對話框中選擇需要的編碼,比如選擇UTF-8編碼,然後輸入一個新文件名再點擊保存就轉換成功了。
⑷ linux環境如何查看文件編碼和如何實現編碼轉換
處於linux命令,想在linux系統中處理一些表格信息,但是在linux輸入cat solr |head -2中文字元出現亂碼,網路之後才知道linux下文件編碼必須是utf-8中文字元才不會出現亂碼。經過多方求助,才得知解決方法。
linux環境如何查看文件編碼:
file filename
file是命令,filename是文件名
可以從上圖看出solr.txt的編碼是utf-16,所以要轉換成utf-8。
linux環境如何實現編碼轉換:
iconv -f utf-8 -t utf-16 keyword -o keyword1
iconv -f 源文件格式 -t 想要轉成的格式 文件名 -o 輸出文件名
上圖所示,中文字元亂碼經過轉換之後可以輸出正常的中文字元。
⑸ 如何在 Linux 中將文件編碼轉換為 UTF-8
在Linux中轉換文件的編碼可以使用iconv命令,iconv命令很簡單,記住它的三個參數就可以了,下面是它的三個參數:
-f參數:表示from,就是原本的編碼格式
-t參數:表示to,就是後來的新編碼
-o參數:表示輸出文件,就是轉換編碼後的新文件的文件名,如果沒有這個參數新文件會將原來的文件覆蓋掉。
下面是將GB2312編碼的文件轉換成UTF-8編碼的例子:
iconv -f gb2312 -t utf8 mygb2312.txt -o myutf8.txt
這個例子中mygb2412.txt就是要轉換的文件,myutf8.txt就是轉換後的新文件。
其實還有一個方法是用一個圖形界面的Linux文本編輯器軟體打開要轉換的那個文件(比如用各發行版自帶的gedit這個軟體),然後選擇另存為功能,在保存文件的對話框中選擇需要的編碼,比如選擇UTF-8編碼,然後輸入一個新文件名再點擊保存就轉換成功了。
⑹ linux轉換文件編碼格式
在 Vim 中直接進行轉換文件編碼,比如將一個文件轉換成 utf-8格式 :set fileencoding=utf-8;
iconv 轉換,iconv 的命令格式如下:輸入/輸出格式規范:iconv -f, --from-code=名稱 原始文本編碼 -t, --to-code=名稱 ,比如說將一個 UTF-8 編碼的文件轉換成 GBK 編碼 iconv -f GBK -t UTF-8 file1 -o file2
enconv 轉換文件編碼 比如要將一個 GBK 編碼的文件轉換成 UTF-8編碼,操作如下 enconv -L zh_CN -x UTF-8 filename
⑺ linux查看文件編碼命令
1,使用file 命令查看文件的編碼格式
[root@dep-184 /]# file 1.txt
1.txt: ISO-8859 text
2,vim 命令
使用vim命令進入文件 1.txt,然後在使用 「:set fileencoding」 查看文件當前展示的編碼格式(這里必須確保展示內容無亂碼,才可以得到內容真實的編碼格式)
3,enca命令 《Linux就該這么學》
使用enca可以直接查看文件內容的編碼格式,如下
[root@dep-184 /]# enca 1.txt
Simplified Chinese National Standard; GB2312
⑻ 如何在 Linux 中將文件編碼轉換為 UTF-8
1、iconv命令來轉換文件的編碼,格式:
iconv -f 原本的編碼格式 -t 要轉換成的編碼 文件名 -o 新文件名
2、例如:
iconv -f gb2312 -t utf8 a.txt -o utf8.txt
3、vim 文件名.txt
:set fileencoding
:set fenc
查看現在文本的編碼
:set fenc=編碼
轉換當前文本的編碼為指定的編碼
:set encoding=編碼
:set enc=編碼
以指定的編碼顯示文本,但不保存到文件中。
輸入 :e ++enc=gbk 強制用gbk打開
輸入 :w ++enc=utf8 轉換到utf8保存。
4、可以使用 file 命令,並添加 -i 或 --mime 參數來查看一個文件的字元編碼
file -i a.txt