A. python3爆编码错误
python3默认内码是UTF-8,不能设置为其他默认格式,文件需要保存成UTF-8格式。
操作系统默认字符环境是GBK的话,就需要手动转换,输入需要str.encode('UTF-8')转换,输出需要str.encode('GBK')转换。主要是操作系统的问题,如果操作系统是采用UTF-8编码的,就没有这个问题。
B. python在print的时候出现编码错误
这个是由于ide(你的是pycharm?)的默认编码没对,修改为utf-8就可以了(自己找在哪改,不是代码里改)
C. linux python运行报编码错误
一次重启服务器后,supervisor接管的python脚本中的函数 open() 和 print() 都会报下面的编码错误:
UnicodeEncodeError: 'ascii' codec can't encode
使用的是python3,按理说编码都会默认utf-8,而且本地运行的python脚本并没有这个问题。
经大佬指点,增加环境变量 export LC_ALL="en_US.UTF-8" 后,再重启supervisor,问题解决
下面是复制的: https://www.cnblogs.com/badboy200800/p/11215981.html
Locale是一个软件在运行时的语言环境,。是根据计算机用户所使用的语言,所在国家或者地区,以及当地的文化传统所定义的。它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。
一个locale的书写格式为: 语言[ 地域[.字符集]]。完全的locale表达方式是 [语言[ 地域][.字符集] [@修正值]。例如:
zh_CN.GB2312 => 中文_中华人民共和国+国标2312字符集。
(1)locale把按照所涉及到的文化传统的各个方面分成12个大类
(2)查看标准字符集列表
常用字符集:en_US.utf8、zh_CN.gb2312、zh_CN.gbk、zh_CN.utf8等
3.Locale的设定
LC_ALL和LANG优先级的关系:LC_ALL > LC_* >LANG
(1)如果需要一个纯中文的系统的话,设定LC_ALL= zh_CN.XXXX即可。或者设定LANG=zh_CN.XXXX也可以,但是LC_ 不要有任何特殊设定才可以(因为LC_ 优先级高)。
(2)如果需要个性化的环境,例如只想要一个可以输入中文的环境,而保持菜单、标题,系统信息等等为英文界面,那么只需要设定LANG=en_US.XXXX,然后 LC_CTYPE=zh_CN.XXXX就可以了。
(3)假如什么也不做的话,也就是LC_ALL,LANG和LC_*均不指定特定值的话,系统将采用POSIX作为lcoale,也就是C locale。
4.查看与设定字符集实践
(1)查看当前系统字符集三种方式(LC_ALL、LC_CTYPE和LANG),以查看LANG为例:
(2)更改系统字符集
备注:直接执行上述命令,可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。
(3)取消当前系统字符集(设定为空)
备注:直接执行上述命令,可以临时修改系统字符集。如果写入环境变量可以永久改变字符集。
D. python输出到文件乱码如何解决
python代码文件的编码
py文件默认是ASCII编码,中文在显示时会做一个ASCII到系统默认编码的转换,这时就会出错:SyntaxError: Non-ASCII character。需要在代码文件的第一行或第二行添加编码指示:
1 # coding=utf-8 ##以utf-8编码储存中文字符
2 print '中文'
像上面那样直接输入的字符串是按照代码文件的编码来处理的,如果用unicode编码,有以下三种方式:
1 s1 = u'中文' #u表示用unicode编码方式储存信息
2 s2 = unicode('中文','gbk')
unicode是一个内置函数,第二个参数指示源字符串的编码格式。
decode是任何字符串具有的方法,将字符串转换成unicode格式,参数指示源字符串的编码格式。
encode也是任何字符串具有的方法,将字符串转换成参数指定的格式。
(2)、字符串的编码
用 u'汉字' 构造出来的是unicode类型,不用的话构造出来是str类型
str的编码是与系统环境相关的,一般就是sys.getfilesystemencoding()得到的值
所以从unicode转str,要用encode方法
从str转unicode,所以要用decode
例如:
# coding=utf-8 #默认编码格式为utf-8
s = u'中文' #unicode编码的文字
print s.encode('utf-8') #转换成utf-8格式输出
但当python中间处理非ASCII编码时,经常会出现如下错误:
UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)
0x??是超出128的数字,python在默认的情况下认为语言的编码是ascii编码,所以无法处理其他编码,需要设置python的默认编码为所需要的编码。
一个解决的方案是在代码中添加:
import sys
reload(sys)
sys.setdefaultencoding('utf-8') (其中utf-8为你想输出的字符编码)
解释:
sys.setdefaultencoding方法在python导入site.py后就删除了(具体代码查看site.py就可以看到)因此如果想用的话可以再重新load进入
总结:
u=u'unicode编码文字'
g=u.encode('gbk') #转换为gbk格式
print g #此时为乱码,因为当前环境为utf-8,gbk编码文字为乱码
str=g.decode('gbk').encode('utf-8') #以gbk编码格式读取g(因为他就是gbk编码的,需要事先知道它是GBK编码)并转换为utf-8格式输出
print str #正常显示中文(同文件输出)
安全的方法:
s.decode('gbk','ignore').encode('utf-8′) #以gbk编码读取(当然是读取gbk编码格式的文字了)并忽略错误的编码,转换成utf-8编码输出。
推荐学习《Python教程》!
E. python2错误怎么回事
代码的问题。
python异常,表示运行时出现了错误,图中的错误为:读取文件时,已经遇到了文件结尾而无法读取,这种情况需要程序编写额外的代码来处理。
代码:
python2要用raw_input()而不是input()
python Traceback (most recent call last) 错误信息
Traceback (most recent call last):
File "XXX.py", line 13, in <mole>
f3('0')
File "XXX.py", line 12, in f3
return f2(s)+1
File "XXX.py", line 8, in f2
return f1(s)+1
File "XXX.py", line 4, in f1
return 1 / int(s)
ZeroDivisionError: division by zero
解读错误信息就可以定位错误。
Traceback (most recent call last):
这是错误的跟踪信息。
File "XXX.py", line 13, in <mole>
f3('0')
调用f3()出错了,错误出现在文件XXX.py的第13行代码,错误来源第9行:
File "XXX.py", line 12, in f3
return f2(s)+1
调用f2()出错了,错误出现在文件XXX.py的第12行代码,错误来源第8行:
File "XXX.py", line 8, in f2
return f1(s)+1
调用f1()出错了,错误出现在文件XXX.py的第8行代码,错误来源第4行:
File "XXX.py", line 4, in f1
return 1 / int(s)
return 1 / int(s)出错了,找到了错误的源头。
ZeroDivisionError: division by zero
这是错误类型。
F. python3读文件编码错误怎么办
在python3中系统默认编码是unicode,读取文件经常会编码错误导致报错。
首先先确认要读取文件的编码,可这样操作:
记事本打开文本文件,点击“文件”-“另存为”查看编码:
importcodecs
f=codecs.open(r"test.txt","r","gbk")
print(f.read())
f.close()
(示例的文件是ANSI所以使用GBK读取)
以上就可以正确读取想要的文件了
G. python读取文件遇到编码错误
首先确定你的python版本是2 还是 3
然后把主要读文件和显示的代码贴一下