導航:首頁 > 源碼編譯 > 單詞出現頻率最高10個演算法

單詞出現頻率最高10個演算法

發布時間:2023-08-23 04:47:15

python統計字元串中單詞數量

使用比較基本的方法寫的參考代碼:

#!/usr/bin/envpython
#-*-coding:utf-8-*-
#python2.7
importre
printu'請輸入字元串:'
wz=raw_input()
s=wz.lower()
#小寫單詞的正則表達式
r='[a-z]+'
#找到所有單詞
ws=re.findall(r,s)
#定義一個字典來存儲單詞和次數
dt={}
forwinws:
dt[w]=dt.setdefault(w,0)+1
#wd來存儲單詞集合,可能有幾個,比如2個單詞,都出現30次
wd=[]
#max用來存儲單詞出現的最多的次數
max=0
forword,timesindt.items():
iftimes>max:
wd=[]
wd.append(word)
max=times
eliftimes==max:
wd.append(word)

printu'有%s個單詞,出現頻率最高:'%len(wd)
forxinwd:
print"%s %s"%(x,max)

測試

請輸入字元串:
!!!
有2個單詞,出現頻率最高:
a2
good2

㈡ 高頻詞問題,請教編程演算法(不一定要編程實現,演算法即可)

以下方法應該是最優了,關注高人的解答。。

1、先過濾不參與統計的符號,如單引號,逗號等
2、通過split分段函數將字元串以空格為界限分割,並將分割出來的每個單詞保存到數組中
3、使用最優排序演算法將單詞進行排序
4、聲明兩個變數str和n,分別用於記錄當前單詞和出現次數
5、開始遍歷,由於已經經過了排序,所以相同的單詞一定是排在一起的,因此,如果下一個單詞和當前相同就將計數加一,否則就和n比較,較大的保留在變數中。
6、遍歷完畢,保留在變數中的,就是頻率就高的單詞!

閱讀全文

與單詞出現頻率最高10個演算法相關的資料

熱點內容
伺服器上如何查看伺服器的埠 瀏覽:676
單片機伺服器編譯 瀏覽:768
單口usb列印機伺服器是什麼 瀏覽:859
戰地五開伺服器要什麼條件 瀏覽:954
在word中壓縮圖片大小 瀏覽:253
javatomcat圖片 瀏覽:417
程序員生產智能創意 瀏覽:65
匯和銀行app怎麼登錄 瀏覽:381
騰訊伺服器如何上傳源碼 瀏覽:745
單片機的原理概述 瀏覽:510
火控pdf 瀏覽:267
如何復制雲伺服器centos環境 瀏覽:984
債權pdf 瀏覽:303
紅色番字的app怎麼下載 瀏覽:876
雲伺服器流程教課 瀏覽:702
中國農業銀行app怎麼沒有網 瀏覽:997
幾率表演算法 瀏覽:902
程序員理工科 瀏覽:708
企業郵箱登錄收件伺服器地址 瀏覽:560
計算機思維與演算法設計的重要性 瀏覽:664