① python怎么把ansi编码的文本转换为 unicode的文字
1.弄清楚,当前ansi的编码是啥,比如是gbk
2。然后通过
decodedUnicodeStr = ansiGbkStr.decode("GBK");
就可以把ansiGbkStr解码为对应的unicode字符了。
相关背景知识,可参考:
crifan 字符编码详解
(这里不给贴地址,所以请自己用google搜标题,即可找到帖子地址)
② 执行python脚本出现乱码怎么解决
执行python脚本出现乱码的解决方法:首先把中文解码为unicode,具体方法如:【decode('utf-8')】;然后再转化为gbk即可,具体方法如:【encode('gbk')】。
问题:
代码中指定了UTF-8编码,但是在cmd命令行窗口时打印的中文仍然会乱码。
(推荐教程:Python入门教程)
原因:
windows下中文默认的输出编码为gbk ,与脚本中定义的UTF-8不一样,所以出现了解码失败的情况。
解决方法:
可以先把中文解码为unicode,然后再转化为gbk来解决这个问题。
举例:
运行结果:
③ python中怎么将\u559c\u6b22\u4e00\u4e2a\u4eba 转换成“喜欢一个人”
使用以下方法即可完成转换:
yourSlushUStr = "\u559c\u6b22\u4e00\u4e2a\u4eba";
decodedUnicodeStr = yourSlushUStr.decode("unicode-escape")
就可以把u559cu6b22u4e00u4e2au4eba解码为:喜欢一个人。
(3)python变量转换为unicode扩展阅读:
以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象,表示转换的值。
int(x[,base])将x转换为一个整数。
long(x[,base])将x转换为一个长整数。
float(x)将x转换到一个浮点数。
complex(real[,imag])创建一个复数。
str(×)将对象X转换为字符串。
repr(x)将对象x转换为表达式字符串。
eval(str)用来计算在字符串中的有效Python表达式,并返回一个对象。
tuple(s)将序列s 转换为一个元组list(s)将序列s转换为一个列表。
set(s)转换为可变集合。
④ python怎么转换unicode编码
用decode()就行。decode()方法必须传入一个参数,这个参数就是当前待转码的编码,此函数方法的用意就是将当前编码为Unicode编码。
比如就你这提问的此页面:
#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult
方法是绝对可行的
此法对字符串和文档内容的解码一样有效。