pythonunicode转gbk_python命令行输入中文乱码怎么办

Ⅰ python print出unicode码怎么办

defchar_ok_but_show_messy():
"""
,withsomeencoding,
"""
#此处，当前Python文件是UTF-8编码的，所以如下的字符串，是UTf-8编码的
cnUtf8Char="我是UTF-8的中文字符串";
#所以，将UTF-8编码的字滑樱符串，打印输出到GBK编码的命令行（Windows的cmd）中，就会显示出乱码
print"cnUtf8Char=",cnUtf8Char;#cnUtf8Char=鎴戞槸UTF-8镄勪腑鏂囧瓧绗︿覆
#如果想要正确显示出中文字符，不显示乱码的话，则有两种选择：
#1.把字信磨丛符串转换为Unicode编码，则输出到GBK的命令行时，Python会自动将Unicode的字符串，编码为GBK，然后正确显示字符
decodedUnicodeChar=cnUtf8Char.decode("UTF-8");
print"decodedUnicodeChar=",decodedUnicodeChar;#decodedUnicodeChar=我是UTF-8的中文字符串
#2.让字符串的编码和输入目标（windows的cmd）的编码一致：把当前的字符串(由上述解码后得到的Unicode再次去编码)也变成GBK，然后输出到GBK的命令行时，就可以正确游吵显示了
reEncodedToGbkChar=decodedUnicodeChar.encode("GBK");
print"reEncodedToGbkChar=",reEncodedToGbkChar;#reEncodedToGbkChar=我是UTF-8的中文字符串


###############################################################################
if__name__=="__main__":
char_ok_but_show_messy();

Ⅱ 用Python 将UCS2转成GBK的编码格式

直接支持全球所有语言，胡渗消每个国家都可以不喊亩用再使用自己之前的旧编码了，用unicode就可以了。(就跟英语是全球统一语言一样)
unicode包含了跟全球所有国裤知家编码的映射关系。

Ⅲ python 如何将乱码转成汉字

1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u'，表示unicode 编码
3、将unicode转换成中文，只需要用deconde解码就可以了
>>> u='欢迎'>>> e=u.encode()>>> eb'\xe6\xac\xa2\xe8\xbf\x8e'>>> e.decode()#python3中默认就是utf-8编码'欢迎'>>> e.decode('gbk')#如果解码为gbk就是乱码'娆四繋'

python2编码环境比较复杂，在这里不做详细说明

Ⅳ python命令行输入中文乱码怎么办

python2.X，代码中指定了UTF-8，但是在cmd命令行窗口时，打印的中文仍然会乱码。

在python3不存在该问题

运行结果：

原因

中文windows默认的输出编码为gbk ，与脚本中定义的UTF-8不一样，所以出现了解码失败的情况。

相关推荐：《Python基础教程》

解决方法

有如下两种方法可以解决这个问题

方法一

我们可以通过先把中文解码为unicode，然后再转化为gbk来解决这个问题：

修改后运行结果：

方法二

当然，我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题：

·chcp 65001 就是换成UTF-8代码页

·chcp 936 可以换回默认的GBK

但是这样就降低了脚本的兼容性，在其他环境运行的时候可能还会出现这样的错误，而且可能会影响其他脚本运行，所以推荐使用第一种方法。

Ⅳ python怎么知道一个字符串的编码方式

字符串的编码，有很多种如utf-8，gb2312，gbk，gb18030，bz2，zlib，big5，bzse64

python 对编码的处理有两个方法，decode()和 encode()方法

a='你好'
b='python'
printa.decode('utf-8').encode('gbk')##decode方法把字符串转换为unicode对象，然后通过encode方法转换为指定的编码字符串对象
printb.decode('utf-8')##decode方法把字符串转换为unicode对象

所以要让python（或者说机器）来识别字符串的编码，是一件很困难的事。编码就是汉字和整数之间的对应，同一个整数，可以在不同的编码中，都有对应的汉字。比如下面的例子，比特流'xe6xb0xb4xe5xa3xb6'在四种编码中都有对应的汉字，但只有在utf-8编码下，它对应的汉字才有意义。我们可以一眼看出这点，可是要让计算机做到这点，就很难了。

>>>s='水壶'
>>>s
18:'xe6xb0xb4xe5xa3xb6'
>>>printunicode(s,'big5')
瘗游ㄥ
>>>printunicode(s,'gbk')
姘村6
>>>printunicode(s,'gb2312')
姘村6
>>>printunicode(s,'utf-8')
水壶

Ⅵ python中怎样将unicode转换成原来的中文

python默认就是unicode存储。如果是从文件读取的，在open的参数中指定encoding关键字参数就行。如下：

#coding=utf-8/importjson /defLoadQuestion(): /f=open("test.json",'r') qas=json.load(f) question=qas['documents'] /returnquestion/t=LoadQuestion() /printstr(t).decode("unicode-escape")

拓展资料：

通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode

在python2里的确可以使用s.decode('gbk','ignore')之类的变成unicode。不过在python3里应该是这样子, s.encode('gbk','ignore')这样就变成了byte

如果你喜欢 utf-8，可以s.encode(‘utf-8','ignore')和s.decode(‘utf-8','ignore')

Ⅶ python 字符串格式的unicode编码转中文

python对于Unicode编码可以使用decode进行转换成中文：

>>> str = b'\xe8\xb4\xb9\xe8\x84\x91\xe5\xad\x90'

>>> str.decode('utf-8')

'费脑子'

如果是字符串类型的Unicode编码没办法直接用decode进行转换：

>>> str ="\\xe8\\xb4\\xb9\\xe8\\x84\\x91\\xe5\\xad\\x90"

>>> str.decode('utf-8')

Traceback (most recent call last):

File "<stdin>", line 1, in <mole>

AttributeError: 'str' object has no attribute 'decode'

处理方式：

>>> str = eval("b" + "\"" + str + "\"")

>>> str.decode('utf-8')

'费脑子'

Ⅷ python中 gbk字符串被识别为unicode（就是读取到的应该是'内容内容'变成了 u'内容内容',这样应该如何解码

你用的是哪个库 ,如果是pymssql 的态握歼话,我皮李建议换个库我测试末尾带b字样的版本没有这个问题

有些库是有这样的问题,所有编码自己加上U,尝试更换库试一下

刚才网络了一下,看到一个解决办法不错,考虑转载到我的空间,我确帆冲实遇到了这样的问题

方法如下:

python 提供了一个特殊的编码（raw_unicode_escape）用来处理这种情况：

In[4]:u'xe4xbdxa0xe5xa5xbd'.encode('raw_unicode_escape')
Out[4]:'xe4xbdxa0xe5xa5xbd'

In[5]:u'xe4xbdxa0xe5xa5xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]:u'u4f60u597d'

In[7]:printu'u4f60u597d'
你好

以前杂没发现这个方法呢...我遇到这个问题是找个关天,换了个库才搞定

Ⅸ Python 编码转换与中文处理

python 中的 unicode 是让人很困惑、比较难以理解的问题. 这篇文章写的比较好， utf-8是 unicode的一种实现方式，unicode、gbk、gb2312是编码字符集.

Python 默认脚本文件都是 ANSCII 编码的，当文件中有非 ANSCII 编码范围内的字符的时候就要使用" 编码指示 "来修正一个 mole 的定义中，如果.py文件中包含中文字符（严格的说是含有非anscii字符），则需要在第一行或第二行指定编码声明： # -*- coding=utf-8 -*- 或者 #coding=utf-8
其他的编码如：gbk、gb2312也可以；否则会出现:

先说一下python中的字符串类型，在python中有两种字符串类型，分别是 str 和 unicode ，他们都是basestring的派生类；

在str的文档中有这样的一句话：

也就是说在读取一个文件的内容，或者从网络上读取到内容时，保持的对象为str类型；如果想把一个str转换成特定编码类型，需要把str转为Unicode,然后从unicode转为特定的编码类型如：utf-8、gb2312等。

unicode 转为 gb2312,utf-8等,使用 encode(encoding)

utf-8,GBK转换为 unicode 使用 unicode(s,encoding) 或者 s.decode(encoding)

普通的 str 转为 unicode,

如果直接执行s.encode('gb2312')会发生什么？

这里会发生一个异常：Python 会自动的先将 s 解码为 unicode ，然后再编码成 gb2312。因为解码是python自动进行的，我们没有指明解码方式，python 就会使用 sys.defaultencoding 指明的方式来解码。很多情况下 sys.defaultencoding 是 ANSCII，如果 s 不是这个类型就会出错。
拿上面的情况来说，我的 sys.defaultencoding 是 anscii，而 s 的编码方式和文件的编码方式一致，是 utf8 的，所以出错了:

对于这种情况，我们有两种方法来改正错误：

s = '中文'
s.decode('utf-8').encode('gb2312') ```

import sys
reload(sys) # Python2.5 初始化后会删除 sys.setdefaultencoding 这个方法，我们需要重新载入
sys.setdefaultencoding('utf-8')
str = '中文'
str.encode('gb2312')

print open("Test.txt").read()

import codecs
print open("Test.txt").read().decode("utf-8")

Traceback (most recent call last):
File "ChineseTest.py", line 3, in <mole>
print open("Test.txt").read().decode("utf-8")
UnicodeEncodeError: 'gbk' codec can't encode character u'ufeff' in position 0: illegal multibyte sequence

import codecs
data = open("Test.txt").read()
if data[:3] == codecs.BOM_UTF8:
data = data[3:]
print data.decode("utf-8")

s = "中文"
print unicode(s, "utf-8")

Traceback (most recent call last):
File "ChineseTest.py", line 3, in <mole>
s = unicode(s, "utf-8")
UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-1: invalid data

s = "中文"
print unicode(s, "gbk")

s = "中文"
print unicode(s, "cp936")

Ⅹ Python json unicode转中文

importsys
reload(sys)
sys.setdefaultencoding("utf-8")

result=[[u'9.6',u'50'],1,True,u'1292052',[u'u72afu7f6a',u'u5267u60c5'],[u'u7f8eu56fd'],u'',u'1994-09-10',15,725531,u'9.6']

f=open('data.csv','w')

foriinresult:
	iftype(i)islist:
		forjini:
			iftype(j)==intortype(j)==floatortype(j)==bool:
				j=str(j)+','
			else:
				j=j.encode('gbk')+','
			printj,
			print>>f,j,
	else:
		iftype(i)==intortype(i)==floatortype(i)==bool:
			i=str(i)+','
		else:
			i=i.encode('gbk')+','
		printi,
		print>>f,i,

f.close()

导航:首页 > 编程语言 > pythonunicode转gbk

pythonunicode转gbk

拓展资料：

与pythonunicode转gbk相关的资料