unicode命令_Python27 中文字符编码使用Unicode时选择什么编码格式

㈠ cmd命令怎样将Unicode字符转成文字

在中文Windows系统中，如果一个文本文件是UTF-8编码的，那么在CMD.exe命令行窗口（所谓的DOS窗口）中不能正确显示文件中的内容。在默认情况下，命令行窗口中使用的代码页是中文或者美国的，即编码是中文字符集或者西文字符集。

如果想正确显示UTF-8字符，可以按照以下步骤操作：

1、打开CMD.exe命令行窗口

2、通过
chcp命令改变代码页，UTF-8的代码页为65001

chcp
65001

执行该操作后，代码页就被变成UTF-8了。但是，在窗口中仍旧不能正确显示UTF-8字符。

3、修改窗口属性，改变字体

在命令行标题栏上点击右键，选择"属性"->"字体"，将字体修改为True
Type字体"Lucida Console"，然后点击确定将属性应用到当前窗口。

这时使用type命令就可以显示UTF-8文本文件的内容了：

type
filename.txt

4、通过以上操作并不能完全解决问题，因为显示出来的内容有可能不完全。可以先最小化，然后最大化命令行窗口，文件的内容就完整的显示出来了

㈡ python unicode编码

python unicode编码：

下面的代码创建了一个Unicode字符串，用UTF-8编码器将它编码，然后写入到一个文件中去，接着把数据从文件中读回来，解码成Unicode字符串对象，最后，打印出Unicode字符串，用以确认程序正确地运行。

在linux中编写，在VIM中输入如下代码，保存为uniFile.py

#/home/xiaopeng/python/code/uniFile.py
'''
:Writes
aUnicodestringtoafileinutf-8andreadsitbackin
'''
CODEC='utf-8'编码方式
FILE='unicode.txt'要存的文件名
hello_out=u"Helloworld
"创建了一个Unicode格式的字符串
bytes_out=hello_out.encode(CODEC)用UTF-8编码
f=open(FILE,'w')
f.write(bytes_out)写入指定文件中
f.close()
f=open(FILE,'r')
bytes_in=f.read()读取
f.close()
hello_in=bytes_in.decode(CODEC)解码
printhello_in打印

在终端中输入：python uniFile.py

结果打印出 Hello world

然后在python目录下会发现多了一个名为unicode.txt的文件，用cat命令查看一下，发现里面的内容和打印的结果一样.

把Unicode应用到实际中注意一下四点：

1程序中出现字符串时一定要加一个前缀u

2不要用str()函数，用Unicode()代替

3 不要用过时的string模块。如果传给它非ASCII码，它会把一切搞砸。

4 不到必须时不要在你的程序里编解码Unicode字符，只在你要写入文件或者数据库或者网络时，才调用encode()函数和decode()函数。

㈢ Python2.7 中文字符编码，使用Unicode时，选择什么编码格式

关于编码和乱码的问题，我简单讲一下。

通常问这类问题的人是混淆了若干个不同的概念，并且他们自己也没有意识到自己混淆了这些概念的。

终端显示字符的编码（windows下终端是cmd，linux下是各种terminal，远程登录是putty或者xshell）
shell环境的编码。比如中文版windows用的是gbk（向下兼容gb2312），大多数linux发行版使用的是utf-8（LANG=zh_CN.UTF-8）。
文本文件的编码。这个通常取决于你的编辑器，而且有的编辑器支持多种编码的话，你可以在文本开头位置指定编辑器使用特定编码。比如# -*- coding: utf8 -*-，vim看到这行会默认将这个脚本认定为utf-8兼容编码格式。
应用程序的内部编码。一个字符串，作为数据只是一个字节数组，但是作为字符的数组，就有一个解析方式。java和python的内部字符编码是utf-16，python和java都支持用不同的编码来对字节数组进行decode来得到字符数组。

拿题主的问题来解释一下。

我在ubuntu kylin中文环境下默认terminal中做了同样的实验，但是结果和题主恰好相反：

题主现在弄了一个文件，在开始加上了
# -*- coding: utf8 -*-
这下编辑器看到了，知道这文件是utf-8的了。所以编辑器对读入的一坨坨字节用utf-8来解码，对于输出到磁盘的汉字也用utf-8来编码。所以你在文件里面看到的看上去像“汉字”的东西，就和第一种情况下想同了，当然代码就跑得通。
顺便说一下，如果编辑器无视行首这行编码声明，或者编辑器无法支持utf-8格式，那么你弄好的文件在那个编辑器下就会显示乱码，多么简单的道理啊。

所以，要能够正常的显示中文（或者其他什么乱七八糟奇葩的多字节文字），以下条件缺一不可：

终端和环境的编码一致（本机通常是一致的，不一致常常出现在远程登录）；如果不一致就需要有编辑器或者文本阅读器做一个兼容两者的转换。
编辑器能够认识文本编码
系统拥有能显示这种字符的字体。

这也就是我为什么一直反对在程序文本中使用除ascii之外的所有编码字符的原因。环境太复杂了，绕开问题远比解决问题轻松。

热点内容

健身房压缩衣发布：2025-04-23 23:48:05 浏览：973

单片机太阳光追踪系统所需材料发布：2025-04-23 23:31:20 浏览：356

比泽尔压缩机型号规则发布：2025-04-23 23:22:22 浏览：85

华兴数控切断编程发布：2025-04-23 23:18:08 浏览：789

西安离心压缩机发布：2025-04-23 23:18:07 浏览：545

程序员需要优盘吗发布：2025-04-23 23:17:12 浏览：879

西藏掌上社保app在哪里下载发布：2025-04-23 23:16:10 浏览：599

怎么让服务器固定发布：2025-04-23 23:08:19 浏览：65

计数器定时器编程发布：2025-04-23 23:03:03 浏览：13

程序员网上投资平台发布：2025-04-23 22:59:56 浏览：878

用shell编程计算1加到100 发布：2025-04-23 22:38:54 浏览：233

外包公司的程序员一天写多少代码发布：2025-04-23 22:37:55 浏览：532

苹果手机主屏幕app如何移动发布：2025-04-23 22:17:18 浏览：567

服务器怎么连接远程密码发布：2025-04-23 22:16:14 浏览：431

linux娱乐命令发布：2025-04-23 22:13:58 浏览：368

单片机数码管循环显示9到0 发布：2025-04-23 22:02:15 浏览：494

程序员怼代码思路发布：2025-04-23 21:45:39 浏览：327

新能源码砖机产品介绍发布：2025-04-23 21:44:43 浏览：37

模拟器共享里的文件夹名称发布：2025-04-23 21:40:28 浏览：840

easypanel控制面板源码下载发布：2025-04-23 21:33:37 浏览：532

导航:首页 > 程序命令 > unicode命令

unicode命令

与unicode命令相关的资料