『壹』 linux 系統下 生成的二進制文件總是亂碼是什麼原因
linux下經常遇到的編碼問題
如果你需要在Linux中操作windows下的文件,那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看編碼的方法
方法一:file
filename
方法二:在Vim中可以直接查看文件編碼
:set
fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc
文件中添加以下內容:
set
encoding=utf-8
fileencodings=ucs-bom,utf-8,cp936
這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開
文件編碼轉換
多平台方法:
iconv
提供標準的程序和API來進行編碼轉換;
convert_encoding.py
基於Python的文本文件轉換工具;
decodeh.py
提供演算法和模塊來談測字元的編碼;
linux下文件編碼轉換:
方法一:
在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
或者
11)設置文件集合,即要對哪些文件進行操作,可以使用通配符,比如我通常是對
C/C++
源程序進行編碼轉換
:args
*.h
*.cpp
2)給出要在每個文件上執行的命令,這里是轉換編碼:
:argdo
set
fenc=utf-8
|
update
方法二:
iconv
轉換
5.案例:
假如說我們將windows下的一個UTF-8的文件傳到linux環境下,linux環境下的系統編碼是GB18030,我們cat的時候就會出現亂碼,這個時候就應該想到轉碼了,下面我們來進行試驗:
我們將windows下一個名為UTF-8.sh的文件傳到linux系統中,其中UTF-8.sh的內容如下:
我是中文編碼UTF-8模式~
而linux系統的系統語言設置為:
[root@sor-sys
zy]#
cat
/etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼:
[root@sor-sys
zy]#
file
UTF-8.sh
UTF-8.sh:
UTF-8
Unicode
text,
with
no
line
terminators
[root@sor-sys
zy]#
cat
UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys
zy]#
[root@sor-sys
zy]#
這個時候我們就需要轉換編碼了,記得使用iconv
[root@sor-sys
zy]#
iconv
-f
UTF-8
-t
GB18030
UTF-8.sh
-o
GB18030.sh
[root@sor-sys
zy]#
cat
GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys
zy]#
[root@sor-sys
zy]#
file
GB18030.sh
GB18030.sh:
Non-ISO
extended-ASCII
text,
with
no
line
terminators
[root@sor-sys
zy]#
convmv就是更改文件名編碼方式的一個工具。
比如
sudo
convmv
-f
gbk
-t
utf-8
-r
–notest
/home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里
-f
後面為原來的編碼方式,-t
後面是要更改為的編碼方式,
-r
表示這個目錄下面的所有文件,
–notest
表示馬上執行,而不是僅僅測試而已。另外這命令好像要root才能執行,因此要加上
sudo。
『貳』 怎樣使用vi編輯器修改Linux中的二進制文件
使用過Linux的人基本上都對vi有些許了解,這是Linux各種發行版都會有的標准文本編輯器,功能很強大。他不但能編輯正常的ASCII/ASIN文本文檔,也可以編輯二進制文檔的,這里我們就以Fedora為例來看一下如何使用vi編輯二進制文檔。
工具/原料
安裝了Linux的計算機/筆記本電腦
vi編輯器和需要編輯的二進制文件
方法/步驟
在Fedora桌面打開「Applications」-「System Tools」-「Terminal」打開命令終端,為vi編輯做准備。
在終端切換到要編輯的二進制文件目錄,然後輸入「vi -b test.bin」,其中「test.bin」是我要編輯的二進制文件。當然也可以直接指定vi要打開編輯的文件路徑。「-b」參數,就是告訴vi編輯器,我是在用二進制模式打開文件的。
打開文件之後,我們是很難看到文件實際內容的,因為是二進制的,文件不是可讀的,因此也不能直接編輯和修改的。這時,我們可以使用命令「:%xxd」強制將其轉化為可讀的十六進制顯示,就可以使用正常的vi命令對文件進行編輯了。
轉化之後的文件內容以十六進製表示,左側是文件偏移值。我們計劃將文件編譯00000010開始的4個十六進制字元「FFFFFFFF」修改一下。
使用正常的vi編輯器命令將十六進制字元「FFFFFFFF」修改為「88888888」,修改完成後,使用esc命令返回到vi的命令模式,然後使用命令「:%xxd -r」就可以將其重新轉化為二進制模式了。
步驟閱讀
6
轉化完成後,就可以看到,二進制顯示的內容與沒修改之前的內容已經有所差異。這時使用命令「:wq」保存退出就可以了。
『叄』 linux 下如何命令寫二進制文件
用 xxd:
echoe799bee5baa653420a|xxd-r-ps>file
『肆』 Linux下有什麼好用的二進制文件編輯器
一、在Linux下查看二進制文件的軟體:
xxd (2進制)
hexmp (16進制)
二、編輯:
1、biew
2、hexedit
3、vim
Vim 來編輯二進制文件。Vim 本非為此而設計的,因而有若干局限。但你能讀
取一個文件,改動一個字元,然後把它存檔。結果是你的文件就只有那一個字元給改了,
其它的就跟原來那個一模一樣。
要保證 Vim 別把它那些聰明的竅門用錯地方,啟動 Vim 時加上 "-b" 參數:
vim -b datafile
這個參數設定了 'binary' 選項。其作用是排除所有的意外副作用。例如,'textwidth'
設為零,免得文本行給擅自排版了。並且,文件一律以 Unix 文件格式讀取。
二進制模式可以用來修改某程序的消息報文。小心別插入或刪除任何字元,那會讓程序運
行出問題。用 "R" 命令進入替換模式。
文件里的很多字元都是不可顯示的。用 Hex 格式來顯示它們的值:
:set display=uhex
另外,也可以用命令 "ga" 來顯示游標下的字元值。當游標位於一個 字元上時,
該命令的輸出看起來就像這樣:
27, Hex 1b, Octal 033
文件中也許沒那麼多換行符。你可以關閉 'wrap' 選項來獲得總覽的效果:
:set nowrap
字 節 位 置
要發現你在文件中的當前位元組位置,請用這個命令:
g CTRL-G
其輸出十分冗長:
Col 9-16 of 9-16; Line 277 of 330; Word 1806 of 2058; Byte 10580 of 12206
最後兩個數字就是文件中的當前位元組位置和文件位元組總數。這已經考慮了 'fileformat'
選項導致換行符位元組不同的影響。
要移到文件中某個指定的位元組,請用 "go" 命令。例如,要移到位元組 2345:
2345go
使 用 XXD
一個真正的二進制編輯器用兩種方式來顯示文本: 二進制和十六進制格式。你可以在 Vim
里通過轉換程序 "xxd" 來達到這效果。該程序是隨 Vim 一起發布的。
首先以二進制方式編輯這個文件:
vim -b datafile
現在用 xxd 把這個文件轉換成十六進制:
:%!xxd
文本看起來像這樣:
0000000: 1f8b 0808 39d7 173b 0203 7474 002b 4e49 ....9..;..tt.+NI
0000010: 4b2c 8660 eb9c ecac c462 eb94 345e 2e30 K,.`.....b..4^.0
0000020: 373b 2731 0b22 0ca6 c1a2 d669 1035 39d9 7;'1.".....i.59.
現在你可以隨心所欲地閱讀和編輯這些文本了。 Vim 把這些信息當作普通文本來對待。
修改了十六進制部分並不導致可顯示字元部分的改變,反之亦然。
最後,用下面的命令把它轉換回來:
:%!xxd -r
只有十六進制部分的修改才會被採用。右邊可顯示文本部分的修改忽略不計。
樓主如果對Linux感興趣,想學習更多Linux操作知識,可以網路《Linux就該這么學》,相信會有幫助的。