1. linux下 cat查看了一個文件, 導致界面亂碼,怎麼辦
應該是二進制文件里有些字元正好構成了指令,改變了系統的環境變數。
不需重起系統,只需退出當前終端,然後重新登錄就可以了。
2. linux打開文件通用命令
滑鼠雙擊根本就不是「通用」程序。滑鼠雙擊是通過文件管理器識別被雙擊的文件屬性,之後分別調用不同的程序來打開。
這個世界上目前我還沒看到可以在命令行下面進行這種功能的程序。
不過你可以自己寫一個,方法很簡單。
file
命令可以識別文件類型,你寫個腳本用這個返回類型進行區別調用即可。
用
gedit
請回圖形界面。文件管理器就可以了。
PS:字元界面我建議用
nano
作為文件編輯器。不過有的系統默認不用,vi
和
nano
一般只保留一個。
再PS:你的
.c
文件
cat
是亂碼?你的這個
.c
文件有問題,或者你的字元環境有問題,不是
cat
的問題。
3. linux下cat命令使用參數-v中文文件就變成亂碼
這些其實一般是被處理過的UTF-8碼。是什麼碼主要看該文檔用什麼編碼存儲的文本,一般默認為UTF-8碼。
Linux對cat命令的詳細解釋為:
`-v'
`--show-nonprinting'
Display control characters except for LFD and TAB using `^'
notation and precede characters that have the high bit set with `M-'.
意思是:
用『^』輸出控制字元除了LFD和TAB
每個位元組最高位為1的字元就用『M-』替代每個位元組的最高位(隱含的意思是一個位元組的最高位為1的話就把最高位和低7位分離開來,並分別表示,最高位用『M-』表示,低7位根據ASCII碼表用對應的字元表示)
可以看出,這個-v是直接讀取文件的位元組來輸出的,除了LFD、TAB和分隔符之外全部用以上規則輸出。文件頭部分的位元組當然就忽略啦,因為文件頭部分記錄了該文本文件用什麼編碼存儲,不是文本具體內容。
控制字元用『^』的表示方法如下表(若讀取到的位元組屬於控制字元的范圍就認定為控制字元,即位元組00000000~00011111):
例如(如果是以UTF-8碼的形式存儲):
漢字「文」,其UTF-8碼為(十六進制):E6 96 87,二進製表示為:11100110,10010110,10000111;每個位元組最高位都為1,所以每個字元前都帶一個『M-』;剩下的低7位為:01100110,00010110,00000111,對應的ASCII碼字元為:f ^V ^G;依次連接起來後就是:
M-fM-^VM-^G
想驗證可以這樣:倒著來轉換,先找出3個ASCII碼字元,然後進行轉換,轉成3個二進製表示的位元組,然後每個位元組最高位置為1,然後再用UTF-8與Unicode之間的轉換規則轉成Unicode碼,然後用字元映射表進行查找、驗證,看是不是正確的字元。
「UTF-8與Unicode之間的轉換規則」詳見:http://blog.csdn.net/xiongxiao/article/details/3741731
不同的編碼存儲的位元組是不一樣的,例如:『文』字,UTF-8碼為E6 96 87,Unicode碼為65 87,GBK碼為CE C4。
4. 為什麼在linux中用make之後生成的東西 用cat查看的時候會亂碼
顯示的問題,這個查看本來就是亂碼,就想XP裡面你去查看裡面軟體解壓縮的包一樣,給計算機看的。
5. linux下的文件名怎麼是亂碼的
如果你需要在Linux中操作windows下的文件,那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看編碼的方法
方法一:file
filename
方法二:在Vim中可以直接查看文件編碼
:set
fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc
文件中添加以下內容:
set
encoding=utf-8
fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開
文件編碼轉換
多平台方法:
iconv
提供標準的程序和API來進行編碼轉換;
convert_encoding.py
基於python的文本文件轉換工具;
decodeh.py
提供演算法和模塊來談測字元的編碼;
linux下文件編碼轉換:
方法一:
在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
或者
11)設置文件集合,即要對哪些文件進行操作,可以使用通配符,比如我通常是對
C/C++
源程序進行編碼轉換
:args
*.h
*.cpp
2)給出要在每個文件上執行的命令,這里是轉換編碼:
:argdo
set
fenc=utf-8
|
update
方法二:
iconv
轉換
5.案例:
假如說我們將windows下的一個UTF-8的文件傳到linux環境下,linux環境下的系統編碼是GB18030,我們cat的時候就會出現亂碼,這個時候就應該想到轉碼了,下面我們來進行試驗:
我們將windows下一個名為UTF-8.sh的文件傳到linux系統中,其中UTF-8.sh的內容如下:
我是中文編碼UTF-8模式~
而linux系統的系統語言設置為:
[root@sor-sys
zy]#
cat
/etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼:
[root@sor-sys
zy]#
file
UTF-8.sh
UTF-8.sh:
UTF-8
Unicode
text,
with
no
line
terminators
[root@sor-sys
zy]#
cat
UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys
zy]#
[root@sor-sys
zy]#
這個時候我們就需要轉換編碼了,記得使用iconv
[root@sor-sys
zy]#
iconv
-f
UTF-8
-t
GB18030
UTF-8.sh
-o
GB18030.sh
[root@sor-sys
zy]#
cat
GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys
zy]#
[root@sor-sys
zy]#
file
GB18030.sh
GB18030.sh:
Non-ISO
extended-ASCII
text,
with
no
line
terminators
[root@sor-sys
zy]#
convmv就是更改文件名編碼方式的一個工具。
比如
sudo
convmv
-f
gbk
-t
utf-8
-r
–notest
/home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里
-f
後面為原來的編碼方式,-t
後面是要更改為的編碼方式,
-r
表示這個目錄下面的所有文件,
–notest
表示馬上執行,而不是僅僅測試而已。另外這命令好像要root才能執行,因此要加上
sudo。
6. linux系統中命令行敲進去cat /usr/share/terminfo/l/linux 後出現亂碼無法恢復
他是一個二進制文件,用cat 看肯定是亂碼,用ctrl+c 結束就行了。
7. jfreechart,windows下中文顯示正常,linux下亂碼.在線等。。。急急急!!
初入linux的程序員們,經常會受到亂碼的問候。可謂「始亂終棄」。因為亂碼,並且最終放棄了linux的不在少數。好吧,言歸正傳,先看看各類亂碼是怎麼形成的。
中文字元亂碼
這種情況一般是安裝了中文控制端,但沒有啟用中文應用造成的。只需要啟動相應軟體即可,如zhcon。或者是啟用了相應軟體,但字元集不對,需設置相應字元集,例如export LANG=zh_CN.UTF-8
ORACLE安裝界面亂碼
雖說ORACLE支持多國語言,會根據環境變數自動選擇字元集,但中文安裝好像還有問題,不過10.2以後的版本好像沒有該問題了,具體可以執行命令export LANG=en_US來設置為英文字元集環境
英文字元亂碼
一般該字元亂碼多出現在cat了二進制的文件時,因為二進制文件中多有控制碼,會導致終端界面亂碼,通常解決方法是用reset終端復位命令解決問題
其他偽終端亂碼
有時是通過SSH進入遠程LINUX伺服器時,cat一個core文件,並且用reset命令都不能成功,怎麼辦?很簡單,看以下試驗,首先cat一個python的編譯文件
oracle@linux-suse:~> cat fibo.pyc
m?
{?鯡c@sd
Zd
ZdS(cCs:d\}}x'||jo|G|||}}qWdS(Nii(ii(tatbtn(RRR((tfibo.pytfibs
cCsIg}d\}}x0||jo"|i||||}}qW|S(Nii(ii(tresultRRRtappend(RRRR((Rtfib2 s
N(RR(RR((Rt?s oracle@linux-suse:~> VT102VT102
\-bash: VT102VT102: command not found
oracle@linux-suse:~>
在SSH終端上看到是的亂碼,提示符都是亂的,可以用以下命令恢復
oracle@linux-suse:~> tput sgr0
亂碼問題產生的原因是SSH的問題,因為在其他終端下,cat用樣一個文件,不會產生亂碼,於是試驗亂碼產生的原因
oracle@linux-suse:~> ^N
只要用ctrl+v,ctrl+n就使用屏幕亂碼,當然恢復後再試驗
oracle@linux-suse:~> echo -e '\xe'
屏幕再次亂碼,好,再恢復
oracle@linux-suse:~> echo -e '\xf'
以上是需要盲打的,因為屏上看到的是亂碼,最終問題產生的原因是十六進制字元E產生的,解決也很簡單,十六進制字元F即可。
我在藍色理想里看到的 希望幫到你