导航:首页 > 源码编译 > 单词出现频率最高10个算法

单词出现频率最高10个算法

发布时间:2023-08-23 04:47:15

python统计字符串中单词数量

使用比较基本的方法写的参考代码:

#!/usr/bin/envpython
#-*-coding:utf-8-*-
#python2.7
importre
printu'请输入字符串:'
wz=raw_input()
s=wz.lower()
#小写单词的正则表达式
r='[a-z]+'
#找到所有单词
ws=re.findall(r,s)
#定义一个字典来存储单词和次数
dt={}
forwinws:
dt[w]=dt.setdefault(w,0)+1
#wd来存储单词集合,可能有几个,比如2个单词,都出现30次
wd=[]
#max用来存储单词出现的最多的次数
max=0
forword,timesindt.items():
iftimes>max:
wd=[]
wd.append(word)
max=times
eliftimes==max:
wd.append(word)

printu'有%s个单词,出现频率最高:'%len(wd)
forxinwd:
print"%s %s"%(x,max)

测试

请输入字符串:
!!!
有2个单词,出现频率最高:
a2
good2

㈡ 高频词问题,请教编程算法(不一定要编程实现,算法即可)

以下方法应该是最优了,关注高人的解答。。

1、先过滤不参与统计的符号,如单引号,逗号等
2、通过split分段函数将字符串以空格为界限分割,并将分割出来的每个单词保存到数组中
3、使用最优排序算法将单词进行排序
4、声明两个变量str和n,分别用于记录当前单词和出现次数
5、开始遍历,由于已经经过了排序,所以相同的单词一定是排在一起的,因此,如果下一个单词和当前相同就将计数加一,否则就和n比较,较大的保留在变量中。
6、遍历完毕,保留在变量中的,就是频率就高的单词!

阅读全文

与单词出现频率最高10个算法相关的资料

热点内容
企业邮箱登录收件服务器地址 浏览:556
计算机思维与算法设计的重要性 浏览:664
linux刷新磁盘命令 浏览:74
我的世界如何查看服务器种子pc 浏览:284
linuxlamp编译安装 浏览:609
枚举算法ppt 浏览:184
cmd查看进程命令 浏览:956
手机内怎么删除APP 浏览:834
鱼群和鸟群算法区别 浏览:93
pdf尺寸设置 浏览:211
android访问本地服务器 浏览:512
程序员相亲被删除微信 浏览:790
centos命令窗口 浏览:596
编译器有几个好用的 浏览:500
数据库和网站如何搭载服务器 浏览:154
网络流理论算法与应用 浏览:795
java和matlab 浏览:388
钉钉苹果怎么下app软件 浏览:832
php网站验证码不显示 浏览:859
铝膜构造柱要设置加密区吗 浏览:344