导航:首页 > 编程语言 > python转为unicode

python转为unicode

发布时间:2024-09-20 21:56:16

1. python怎么将字符串转化为八位二进制

这是我写的一段程序,可以实现将字符串转为二进制。

基本思路:

1,将一个字符串转换为字符。这里采用了迭代器__iter__()内置函数,即可实现这个方法

2,将每一个字符转换为十进制,再转化为二进制。bin()函数只能将一个十进制函数转换为二进制,ord()函数可以将一个字符转换为十进制(实质就是这个字符的unicode编号),如此就实现了不同计数方法之间的转化

2. python怎么转换unicode编码

用decode()就行。decode()方法必须传入一个参数,这个参数就是当前待转码的编码,此函数方法的用意就是将当前编码为Unicode编码。

比如就你这提问的此页面:

#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult

方法是绝对可行的

此法对字符串和文档内容的解码一样有效。

3. 执行python脚本出现乱码怎么解决

执行python脚本出现乱码的解决方法:首先把中文解码为unicode,具体方法如:【decode('utf-8')】;然后再转化为gbk即可,具体方法如:【encode('gbk')】。
问题:
代码中指定了UTF-8编码,但是在cmd命令行窗口时打印的中文仍然会乱码。
(推荐教程:Python入门教程)
原因:
windows下中文默认的输出编码为gbk ,与脚本中定义的UTF-8不一样,所以出现了解码失败的情况。
解决方法:
可以先把中文解码为unicode,然后再转化为gbk来解决这个问题。
举例:
运行结果:

4. 关于python中字符编码的问题

你说的是,把字符串:
\u3232\u6674
本身,转换为unicode字符吧?

那么可以通过:
slashUStr = "\\u3232\\u6674";
decodedUniChars = slashUStr.decode("unicode-escape");
print "decodedUniChars=",decodedUniChars; #decodedUniChars= (有) 晴

注:(有) 是个特殊字符,如果想要在cmd(默认为gbk)中打印,会出错的。
UnicodeEncodeError: 'gbk' codec can't encode character u'\u3232' in position 0: illegal multibyte sequence

但是,本身的确已经是转换好了unicode字符串了。

详情可参考:
【整理】Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符

(此处不能贴地址,请用google搜标题,即可找到帖子地址)

5. Python如何将Unicode中文字符串转换成 string字符串

Unicode字符串可以用多种方式编码为普通字符串,假设unicodestring = u"Hello world",依照所选择的编码(encoding),如下:

1、#将Unicode转换成普通的Python字符串:"编码(encode)"。

(5)python转为unicode扩展阅读:

Python转换字符和字符串的原因:为了处理不适合用ASCII字符集表示的数据。

在以ASCII码为中心的语言和环境中,字节和字符被当做相同的事物。由于一个字节只能有256个值,这些环境就受限为只支持256个字符Unicode码,另一方面,有数万个字符,那意谓着每个Unicode字符占用多个字节,因此,你需要在字符和字节之间作出区别。

(1)UTF-8编码能处理任何的Unicode字符。它也是与ASCII码向后兼容的,因此一个纯粹的ASCII码文件也能被考虑为一个UTF-8文件,而且一个碰巧只使用ASCII码字符的 UTF-8文件和拥有同样字符的ASCII码文件是相同的。

这个特性使得UTF-8的向后兼容性非常好,尤其使用较旧的Unix工具时。UTF-8 无疑地是在 Unix上的占优势的编码。它主要的弱点是对东方文字是非常低效的。

(2)UTF-16编码在微软的操作系统和Java环境下受到偏爱。它对西方语言是比较低效,但对于东方语言是更有效率的。一个UTF-16 的变体有时叫作UCS-2 。

(3)ISO-8859编码系列是256个字符的ASCII码的超集。他们不能够支援所有的Unicode码字符;他们只能支援一些特别的语言或语言家族。

ISO-8859-1,也既Latin-1,包括大多数的西欧和非洲语言,但是不含阿拉伯语。ISO-8859-2,也既Latin-2,包括许多东欧的语言,像是匈牙利语和波兰语。

6. Python怎么把ansi编码的文本转换为 unicode的文字

1.弄清楚,当前ansi的编码是啥,比如是gbk
2。然后通过
decodedUnicodeStr = ansiGbkStr.decode("GBK");
就可以把ansiGbkStr解码为对应的unicode字符了。

相关背景知识,可参考:
crifan 字符编码详解

(这里不给贴地址,所以请自己用google搜标题,即可找到帖子地址)

阅读全文

与python转为unicode相关的资料

热点内容
阿里云研究生服务器 浏览:96
姐姐们的恋爱在哪个APP看 浏览:899
什么服务器可以连结埃及的 浏览:115
51单片机学多久 浏览:737
源码内存泄漏分析工具 浏览:796
次梁梁口可以不加密吗 浏览:506
数控车g71粗加工编程 浏览:849
有什么挣钱的app 浏览:523
欧姆龙人机界面编程软件 浏览:171
手机nfc可以刷加密门禁卡吗 浏览:80
上海坐地铁用什么app 浏览:344
win命令行编译qt应用 浏览:802
steam搜索文件夹 浏览:399
披荆斩棘的哥哥哪个app播放 浏览:791
java正则测试 浏览:493
如何查询软件服务器的ip 浏览:42
程序员学管理 浏览:34
android驱动开发权威指南pdf 浏览:39
9减7有几种算法 浏览:442
编程语言的就业前景 浏览:147