① python怎麼把ansi編碼的文本轉換為 unicode的文字
1.弄清楚,當前ansi的編碼是啥,比如是gbk
2。然後通過
decodedUnicodeStr = ansiGbkStr.decode("GBK");
就可以把ansiGbkStr解碼為對應的unicode字元了。
相關背景知識,可參考:
crifan 字元編碼詳解
(這里不給貼地址,所以請自己用google搜標題,即可找到帖子地址)
② 執行python腳本出現亂碼怎麼解決
執行python腳本出現亂碼的解決方法:首先把中文解碼為unicode,具體方法如:【decode('utf-8')】;然後再轉化為gbk即可,具體方法如:【encode('gbk')】。
問題:
代碼中指定了UTF-8編碼,但是在cmd命令行窗口時列印的中文仍然會亂碼。
(推薦教程:Python入門教程)
原因:
windows下中文默認的輸出編碼為gbk ,與腳本中定義的UTF-8不一樣,所以出現了解碼失敗的情況。
解決方法:
可以先把中文解碼為unicode,然後再轉化為gbk來解決這個問題。
舉例:
運行結果:
③ python中怎麼將\u559c\u6b22\u4e00\u4e2a\u4eba 轉換成「喜歡一個人」
使用以下方法即可完成轉換:
yourSlushUStr = "\u559c\u6b22\u4e00\u4e2a\u4eba";
decodedUnicodeStr = yourSlushUStr.decode("unicode-escape")
就可以把u559cu6b22u4e00u4e2au4eba解碼為:喜歡一個人。
(3)python變數轉換為unicode擴展閱讀:
以下幾個內置的函數可以執行數據類型之間的轉換。這些函數返回一個新的對象,表示轉換的值。
int(x[,base])將x轉換為一個整數。
long(x[,base])將x轉換為一個長整數。
float(x)將x轉換到一個浮點數。
complex(real[,imag])創建一個復數。
str(×)將對象X轉換為字元串。
repr(x)將對象x轉換為表達式字元串。
eval(str)用來計算在字元串中的有效Python表達式,並返回一個對象。
tuple(s)將序列s 轉換為一個元組list(s)將序列s轉換為一個列表。
set(s)轉換為可變集合。
④ python怎麼轉換unicode編碼
用decode()就行。decode()方法必須傳入一個參數,這個參數就是當前待轉碼的編碼,此函數方法的用意就是將當前編碼為Unicode編碼。
比如就你這提問的此頁面:
#使用版本是python2.
importurllib
url='https://..com/question/1499967322379602619.html?entry=qb_ihome_tag&hideOtherAnswer=true&newAnswer=1'
html=urllib.urlopen(url).read()
result=html.decode('gbk')
printresult
方法是絕對可行的
此法對字元串和文檔內容的解碼一樣有效。