A. linux下的文件名怎麼是亂碼的
如果你需要在Linux中操作windows下的文件,那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看編碼的方法
方法一:file
filename
方法二:在Vim中可以直接查看文件編碼
:set
fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc
文件中添加以下內容:
set
encoding=utf-8
fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開
文件編碼轉換
多平台方法:
iconv
提供標準的程序和API來進行編碼轉換;
convert_encoding.py
基於Python的文本文件轉換工具;
decodeh.py
提供演算法和模塊來談測字元的編碼;
linux下文件編碼轉換:
方法一:
在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
或者
11)設置文件集合,即要對哪些文件進行操作,可以使用通配符,比如我通常是對
C/C++
源程序進行編碼轉換
:args
*.h
*.cpp
2)給出要在每個文件上執行的命令,這里是轉換編碼:
:argdo
set
fenc=utf-8
|
update
方法二:
iconv
轉換
5.案例:
假如說我們將windows下的一個UTF-8的文件傳到linux環境下,linux環境下的系統編碼是GB18030,我們cat的時候就會出現亂碼,這個時候就應該想到轉碼了,下面我們來進行試驗:
我們將windows下一個名為UTF-8.sh的文件傳到linux系統中,其中UTF-8.sh的內容如下:
我是中文編碼UTF-8模式~
而linux系統的系統語言設置為:
[root@sor-sys
zy]#
cat
/etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼:
[root@sor-sys
zy]#
file
UTF-8.sh
UTF-8.sh:
UTF-8
Unicode
text,
with
no
line
terminators
[root@sor-sys
zy]#
cat
UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys
zy]#
[root@sor-sys
zy]#
這個時候我們就需要轉換編碼了,記得使用iconv
[root@sor-sys
zy]#
iconv
-f
UTF-8
-t
GB18030
UTF-8.sh
-o
GB18030.sh
[root@sor-sys
zy]#
cat
GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys
zy]#
[root@sor-sys
zy]#
file
GB18030.sh
GB18030.sh:
Non-ISO
extended-ASCII
text,
with
no
line
terminators
[root@sor-sys
zy]#
convmv就是更改文件名編碼方式的一個工具。
比如
sudo
convmv
-f
gbk
-t
utf-8
-r
–notest
/home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里
-f
後面為原來的編碼方式,-t
後面是要更改為的編碼方式,
-r
表示這個目錄下面的所有文件,
–notest
表示馬上執行,而不是僅僅測試而已。另外這命令好像要root才能執行,因此要加上
sudo。
B. linux中文文件顯示亂碼怎麼解決
Linux文件名、文件內容亂碼,主要原因是windows上的中文編碼默認是GBK,而Linux默認中文編碼為UTF-8,由於編碼不一致,所以導致亂碼問題。 為了解決這個亂碼,需要對文件進行轉碼,具體如下: 1、前提保證已安裝了convmv; 2、具體convmv的用法: Convmv –f 源編碼 –t 新編碼 [選項] 文件名 一般常用參數: -r 遞歸處理子目錄 --notest 真正進行操作,默認情況下是不對文件進行真實操作的,只是一個預覽 --list 顯示所有支持的編碼 --unescap 可以做一個轉義 3、比如我們有一個utf8的文件名,要求轉換成gbk編碼,命令如下: Convmv –f utf-8 –t gbk –notest 文件名 也可以使用linux下最好用的編碼轉換工具iconv來進行轉碼操作。 例子:將GBK編碼的文件轉換成UTF-8 iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt
C. linux系統中命令行敲進去cat /usr/share/terminfo/l/linux 後出現亂碼無法恢復
他是一個二進制文件,用cat 看肯定是亂碼,用ctrl+c 結束就行了。
D. Linux系統下文件名出現中文亂碼如何重命名回來
一不小心在給文件重命名的時候輸入了中文字元,結果導致文件名亂碼,無法通過cat, less, rm 或者mv 之類的命令操作了。
如何重新命名它,使得其恢復正常呢?
據說linux下每個文件還有一個文件節點編號,對應於每個特定的文件。可以通過find 該節點編號來執行重命名操作。
ls -i res???_out.txt
144117972422752993 res???_out.txt
前面的數字串就是節點編號
find . -inum 144117972422752993 -exec mv {} res_out.txt \;