⑴ 在linux如何让更改文件的字符编码
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set
fileencoding=utf-8
2.
enconv
转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下
enconv
-L
zh_CN
-x
UTF-8
filename
3.
iconv
转换,iconv的命令格式如下:
iconv
-f
encoding
-t
encoding
inputfile
比如将一个UTF-8
编码的文件转换成GBK编码
iconv
-f
GBK
-t
UTF-8
file1
-o
file2
查看文件编码file命令
file
ip.txt
ip.txt:
UTF-8
Unicode
text,
with
escape
sequences
一、利用iconv命令进行编码转换文件内容编码转换
iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。
用法:
iconv
[选项...]
[文件...]
有如下选项可用:
输入/输出格式规范:
-f,
--from-code=名称
原始文本编码
-t,
--to-code=名称
输出编码
信息:
-l,
--list
列举所有已知的字符集
输出控制:
-c
从输出中忽略无效的字符
-o,
--output=FILE
输出文件
-s,
--silent
关闭警告
--verbose
打印进度信息
-?,
--help
给出该系统求助列表
--usage
给出简要的用法信息
-V,
--version
打印程序版本号
例子:
iconv
-f
utf-8
-t
gb2312
aaa.txt
>bbb.txt
这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。
⑵ Linux中如何查看文件编码及对文件进行编码转换
查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。
文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
2. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8
文件名编码转换:
从Linux 往 windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。
在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。
首先看一下你的系统上是否安装了convmv,如果没安装的话用:
yum -y install convmv
安装。
下面看一下convmv的具体用法:
convmv -f 源编码 -t 新编码 [选项] 文件名
常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
convmv -f UTF-8 -t GBK --notest utf8编码的文件名
这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)
⑶ 如何在 Linux 中将文件编码转换为 UTF-8
在Linux中转换文件的编码可以使用iconv命令,iconv命令很简单,记住它的三个参数就可以了,下面是它的三个参数:
-f参数:表示from,就是原本的编码格式
-t参数:表示to,就是后来的新编码
-o参数:表示输出文件,就是转换编码后的新文件的文件名,如果没有这个参数新文件会将原来的文件覆盖掉。
下面是将GB2312编码的文件转换成UTF-8编码的例子:
iconv -f gb2312 -t utf8 mygb2312.txt -o myutf8.txt
这个例子中mygb2412.txt就是要转换的文件,myutf8.txt就是转换后的新文件。
其实还有一个方法是用一个图形界面的Linux文本编辑器软件打开要转换的那个文件(比如用各发行版自带的gedit这个软件),然后选择另存为功能,在保存文件的对话框中选择需要的编码,比如选择UTF-8编码,然后输入一个新文件名再点击保存就转换成功了。
⑷ linux环境如何查看文件编码和如何实现编码转换
处于linux命令,想在linux系统中处理一些表格信息,但是在linux输入cat solr |head -2中文字符出现乱码,网络之后才知道linux下文件编码必须是utf-8中文字符才不会出现乱码。经过多方求助,才得知解决方法。
linux环境如何查看文件编码:
file filename
file是命令,filename是文件名
可以从上图看出solr.txt的编码是utf-16,所以要转换成utf-8。
linux环境如何实现编码转换:
iconv -f utf-8 -t utf-16 keyword -o keyword1
iconv -f 源文件格式 -t 想要转成的格式 文件名 -o 输出文件名
上图所示,中文字符乱码经过转换之后可以输出正常的中文字符。
⑸ 如何在 Linux 中将文件编码转换为 UTF-8
在Linux中转换文件的编码可以使用iconv命令,iconv命令很简单,记住它的三个参数就可以了,下面是它的三个参数:
-f参数:表示from,就是原本的编码格式
-t参数:表示to,就是后来的新编码
-o参数:表示输出文件,就是转换编码后的新文件的文件名,如果没有这个参数新文件会将原来的文件覆盖掉。
下面是将GB2312编码的文件转换成UTF-8编码的例子:
iconv -f gb2312 -t utf8 mygb2312.txt -o myutf8.txt
这个例子中mygb2412.txt就是要转换的文件,myutf8.txt就是转换后的新文件。
其实还有一个方法是用一个图形界面的Linux文本编辑器软件打开要转换的那个文件(比如用各发行版自带的gedit这个软件),然后选择另存为功能,在保存文件的对话框中选择需要的编码,比如选择UTF-8编码,然后输入一个新文件名再点击保存就转换成功了。
⑹ linux转换文件编码格式
在 Vim 中直接进行转换文件编码,比如将一个文件转换成 utf-8格式 :set fileencoding=utf-8;
iconv 转换,iconv 的命令格式如下:输入/输出格式规范:iconv -f, --from-code=名称 原始文本编码 -t, --to-code=名称 ,比如说将一个 UTF-8 编码的文件转换成 GBK 编码 iconv -f GBK -t UTF-8 file1 -o file2
enconv 转换文件编码 比如要将一个 GBK 编码的文件转换成 UTF-8编码,操作如下 enconv -L zh_CN -x UTF-8 filename
⑺ linux查看文件编码命令
1,使用file 命令查看文件的编码格式
[root@dep-184 /]# file 1.txt
1.txt: ISO-8859 text
2,vim 命令
使用vim命令进入文件 1.txt,然后在使用 “:set fileencoding” 查看文件当前展示的编码格式(这里必须确保展示内容无乱码,才可以得到内容真实的编码格式)
3,enca命令 《Linux就该这么学》
使用enca可以直接查看文件内容的编码格式,如下
[root@dep-184 /]# enca 1.txt
Simplified Chinese National Standard; GB2312
⑻ 如何在 Linux 中将文件编码转换为 UTF-8
1、iconv命令来转换文件的编码,格式:
iconv -f 原本的编码格式 -t 要转换成的编码 文件名 -o 新文件名
2、例如:
iconv -f gb2312 -t utf8 a.txt -o utf8.txt
3、vim 文件名.txt
:set fileencoding
:set fenc
查看现在文本的编码
:set fenc=编码
转换当前文本的编码为指定的编码
:set encoding=编码
:set enc=编码
以指定的编码显示文本,但不保存到文件中。
输入 :e ++enc=gbk 强制用gbk打开
输入 :w ++enc=utf8 转换到utf8保存。
4、可以使用 file 命令,并添加 -i 或 --mime 参数来查看一个文件的字符编码
file -i a.txt