❶ python 輸出中文問題,真是整瘋了。。。
選擇# -*- coding: utf-8-*-,因為你文件編碼是utf-8的。
也可以這樣,形式簡單一些:
#encoding:utf-8
python中有兩種類型的字元串:普通的str和unicode。一般情況下,處理中文數據推薦使用unicode類型,因為這樣就不用考慮編碼的問題。到了顯示或輸出時再轉換為存儲類型(utf-8、GBK)。但unicode本身是不能輸出的,它只是一種內部編碼。
看以下示例代碼:
#unicode轉str,utf-8編碼
u'哈哈哈哈'.encode('utf-8','ignore')
#unicode轉str,GBK編碼
u'哈哈哈哈'.encode('gbk','ignore')
#str轉unicode,其中str為utf-8編碼
'哈哈哈哈'.decode('utf-8','ignore')
❷ 如何使用python或R或c或dos命令,獲取docx或doc格式文檔的字數信息
在windows下你可以調用win32com.client來讀取doc文件,然後導出text到變數,用count來統計字數。但結果肯定跟Word統計的字數不一樣。
❸ python接收從鍵盤輸入的一串字元串,輸出其中不同的字元以及它們各自的字數
試試這個代碼python3.x
s=input('請輸入字元串:')
ms=set(s)
foriteminms:
print('字元:',item,'數量:',s.count(item))
❹ Python怎麼統計中文文本字數
【Python】統計字元串中英文、空格、數字、標點個數 - Alan Lee - CSDN博客
【Python】統計字元串中英文、空格、數字、標點個數 -
隨手網路就有,很懷疑這是網路知道機器人自己提問的問題。
網路知道自己也在瘋狂刷單。
❺ 如何用python計算文件的字數
#這邊的TXT需要改動
flies=open('MyFather.txt','r')
lines=flies.readlines()
lens=len(lines)
dicts={}
#定義一個方法,獲取單詞,去掉前後標點符號
defgetWord(str):
temp=list(str)
num=len(temp)
word=[]
foriinrange(num):
iftemp[i]!=','andtemp[i]!='.'andtemp[i]!='"':
word.append(temp[i])
else:
return''.join(word).lower()
foriinrange(lens):
word=lines[i].split()
len_num=len(word)
fortinrange(len_num):
words=GetWord(word[t])
ifnotdicts.has_key(words):
dicts=dicts.fromkeys([words],1)
dicts[words]=1
else:
dicts[words]+=1
flies.close()
dicts_list=dicts.items()
num=len(dicts_list)-1
forindinrange(num):
printdicts_list[ind]
這個一個自己寫的統計一個純英文TXT文檔中每個單詞出現的次數。你看著自己改下吧。