1、这是zip格式的缺陷,zip文件格式中没有字段标志出文件名的编码格式。Windows下生成的zip文件中的编码是GBK/GB2312等,而linux下的默认编码格式为UTF-8,所以才会出现乱码。
2、解决方法
1、使用unzip解压的时候,指定字符集(需要unzip支持,有些unzip命令不支持大O选项,自己可以安装较新的unzip版本):
md5@crc4:~/$unzip-OCP936test.zip
2、借助于p7zip和convmv:
a、在Fedora下的命令是
su-c'yuminstallp7zipconvmv'
b、在ubuntu下的安装命令是
sudoapt-getinstallp7zipconvmv
安装完之后,就可以用7za和convmv两个命令完成解压缩任务。
LANG=C7zaxyour-zip-file.zip
convmv-fGBK-tutf8--notest-r.
说明:
1)、第一条命令用于解压缩,而LANG=C表示以US-ASCII这样的编码输出文件名,如果没有这个语言设置,它同样会输出乱码,只不过是UTF8格式的乱码(convmv会忽略这样的乱码)。
2)、第二条命令是将GBK编码的文件名转化为UTF8编码,-r表示递归访问目录,即对当前目录中所有文件进行转换。
⑵ linux文件在windows系统乱码
Linux系统下,备份文件到常常会出现中文乱码,特别是在CLI模式下。一般通过修改/etc/i18n文件,将系统的字符集修改正确即可。但是,有时还是会出现乱码,在这种情况下,如果你想备份文件就需要用打包的方法了,就有以下几种方法:
通过工具
这种方法适用于知道备份的字符集
1.1 convmv
convmv -f GBK -t utf-8 --notest filename
把gbk的编码转成utf-8
1.2 enca
enca -L zh_CN -x UTF-8 filename
将文件编码转换为UTF-8编码
1.3 iconv
iconv -f gbk -t utf-8 -o outfilename infilename
-f为原来的编码方式,-t 为输出文件的编码方式, -o表示输出文件名,这利用outfile表示,最后跟上要更改编码方式的文件名sourcefile
通过打包
这种方法适用于i18n 和 locale 不一致时。
⑶ Linux系统下文件名出现中文乱码如何重命名回来
一不小心在给文件重命名的时候输入了中文字符,结果导致文件名乱码,无法通过cat, less, rm 或者mv 之类的命令操作了。
如何重新命名它,使得其恢复正常呢?
据说linux下每个文件还有一个文件节点编号,对应于每个特定的文件。可以通过find 该节点编号来执行重命名操作。
ls -i res???_out.txt
144117972422752993 res???_out.txt
前面的数字串就是节点编号
find . -inum 144117972422752993 -exec mv {} res_out.txt \;
⑷ rar打开后乱码如何解决
经常有网络朋友可能会遇到这样的问题,当打开解压后的软件发现打开文件乱码的情况。我们多数电脑中一般安装都是WinRAR压缩解压软件,在默认情况下,是可以双击打开RAR压缩包里的文件的,一般遇到手腊液文件是乱码的情况可能是压缩文件本身的问题,也可能是我们解压不当造成的问题,下面我为大家介绍以下相关解决办法。
当我们双击打开压缩包里的压缩文件时,是操作系统系统调用相关的程序来打开压缩包里面的文件。
毕物具体情况:打开压缩包的文件,只能是先将压缩包解压,然后双击才能局链正常打开。如果是直接双击压缩包里的文件,不知是什么原因,双击压缩包里的文档、图片都不能正常打开,打开后全部显示是乱码。为什么双击压缩包里的文件,会是乱码呢?原因就在于误设置了使用WinRAR的查看器来打开压缩包里的文件。
要解决双击能正常打开压缩包里的文件,而不是乱码的问题,可以先启动WinRAR软件,然后单击上面的菜单“选项”→“设置”→“查看器”选项卡,在“查看器类型”栏目里选中“关联程序”选项即可解决双击打开压缩文件为乱码的问题。
如果以上方法都无法解决问题,那么可能是压缩文件本身压缩的时候出现故障导致的,我们可以寻找下其他文件打开试试。
⑸ linux中文文件显示乱码怎么解决
Linux文件名、文件内容乱码,主要原因是windows上的中文编码默认是GBK,而Linux默认中文编码为UTF-8,由于编码不一致,所以导致乱码问题。 为了解决这个乱码,需要对文件进行转码,具体如下: 1、前提保证已安装了convmv; 2、具体convmv的用法: Convmv –f 源编码 –t 新编码 [选项] 文件名 一般常用参数: -r 递归处理子目录 --notest 真正进行操作,默认情况下是不对文件进行真实操作的,只是一个预览 --list 显示所有支持的编码 --unescap 可以做一个转义 3、比如我们有一个utf8的文件名,要求转换成gbk编码,命令如下: Convmv –f utf-8 –t gbk –notest 文件名 也可以使用linux下最好用的编码转换工具iconv来进行转码操作。 例子:将GBK编码的文件转换成UTF-8 iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt
⑹ 如何解决linux上有中文命名的文件名压缩后下载到windows上再解压出来都是乱码
Linux系统默认的字符编码是 UTF-8 Windows 是 GBK 编码,不支持UTF8. 所以 Linux下 的中文文件名到 Windwos下就成了乱码。关于这个linux系统的学习,我一直看刘遄老师的书籍《linux就该这么学》,感兴趣的也可以去看看啊。
解决办法, 一个是 用英文文件名。 另一个,把Linux系统的文件名转成GBK编码的。 不过这种转换有可能造成信息丢失。 因为 UTF8 不能 100% 转换成GBK。 但GBK可以完全转换成UTF8.
相关转换命令是 convmv 可能需要安装。
网络一下这个命令的用法。 转换完了再打包, 到Window下应该就正常了。
还是建议你最好用英文名。
⑺ 文件在linux显示乱码怎么解决
linux下经常遇到的编码问题如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。
查看编码的方法
方法一:file filename
方法二:在Vim中可以直接查看文件编码
:set fileencoding
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开
文件编码转换
多方法:
iconv 提供标准的程序和API来进行编码转换;
convert_encoding.py 基于Python的文本文件转换工具;
decodeh.py 提供算法和模块来谈测字符的编码;
linux下文件编码转换:
方法一:
在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
或者
11)设置文件集合,即要对哪些文件进行操作,可以使用通配符,比如我通常是对 C/C++ 源程序进行编码转换
:args *.h *.cpp
2)给出要在每个文件上执行的命令,这里是转换编码:
:argdo set fenc=utf-8 | update
方法二:
iconv 转换
5.案例:
假如说我们将windows下的一个UTF-8的文件传到linux环境下,linux环境下的系统编码是GB18030,我们cat的时候就会出现乱码,这个时候就应该想到转码了,下面我们来进行试验:
我们将windows下一个名为UTF-8.sh的文件传到linux系统中,其中UTF-8.sh的内容如下:
我是中文编码UTF-8模式~
而linux系统的系统语言设置为:
[root@sor-sys zy]# cat /etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
这个时候查看一下文件的内容及编码:
[root@sor-sys zy]# file UTF-8.sh
UTF-8.sh: UTF-8 Unicode text, with no line terminators
[root@sor-sys zy]# cat UTF-8.sh
锘挎垜鏄?腑鏂囩紪镰乁TF-8妯″纺~[root@sor-sys zy]#
[root@sor-sys zy]#
这个时候我们就需要转换编码了,记得使用iconv
[root@sor-sys zy]# iconv -f UTF-8 -t GB18030 UTF-8.sh -o GB18030.sh
[root@sor-sys zy]# cat GB18030.sh
??我是中文编码UTF-8模式~[root@sor-sys zy]#
[root@sor-sys zy]# file GB18030.sh
GB18030.sh: Non-ISO extended-ASCII text, with no line terminators
[root@sor-sys zy]#
convmv就是更改文件名编码方式的一个工具。
比如
sudo convmv -f gbk -t utf-8 -r –notest /home
就是将/home目录下原来文件名是gbk编码方式的全部改为utf-8格式的。这里 -f 后面为原来的编码方式,-t 后面是要更改为的编码方式, -r 表示这个目录下面的所有文件, –notest 表示马上执行,而不是仅仅测试而已。另外这命令好像要root才能执行,因此要加上 sudo。