1. 如何删除“使用NLTK或者python停用词"
Nltk是python下处理语言的主要工具包,可以实现去除停用词、词性标注以及分词和分句等。
安装nltk,写python一般使用的是集成环境EPD,其中有包管理,可以在线进行安装。如果不是集成环境,可以通过pip install nltk安装。
》pip install nltk #安装nltk
》nltk.download() #弹出一个选择框,可以按照自己需要的语义或者是功能进行安装
一般要实现分词,分句,以及词性标注和去除停用词的功能时,需要安装stopwords,punkt以及
当出现LookupError时一般就是由于缺少相关模块所导致的
则是需要安装punkt,这个模块主要负责的是分词功能。同stopwords一样有两种方式安装。
2. 我在Python 3.4.3 shell 中输入 from nltk.book import *后,出现以下内容;我该怎么设置扫描路径。
网上找的答案,和您分享:
Assuming you can import Tkinter, type
>>> import nltk
>>> nltk.download()
in the GUI which appears, select Everything from the nltk book and click download. Wait.
3. python在导入nupmy和matplotlib时遇到问题怎么办
1.最开始,在装完nltk,numpy和scipy以及matplotlib后,我直接在python交互式命令行中导入matplotlib模块,结果提示缺少模块six,如下图所示:
4. python3支持nltk吗
最近在通读Python自然语言这本书,尝试安装nltk及测试。
Windows平台:
以下操作前提,已经安装Python,只需要安装NLTK。
若没有安装Python,请按照官网或者点击按照下面的链接安装Python。
https://www.py.cn/faq/python/12604.html
win + R cmd 进入命令行,输入Python,输入:import nltk
执行nltk.download()
弹出以下窗口(刚打开的status应该是not installed):
双击all 即下载,过程中可能会出现下载失败的问题,只需要重新手动双击未下载成功的identifier即可。
推荐学习《Python教程》!
5. 如何使用python中的nltk对哈萨克语或阿拉伯语进行句法分析
如果是英语和西班牙语可以用Inflector。https://pypi.python.org/pypi/Inflector
使用这个模块可以对名词的单复数进行转换及字符操作。
哈萨克语或阿拉伯语,还要进行语法分析这个就没办法了。
如果你有语料库及语言知识的话,其实可以自己去做。
话说阿拉伯语的动词活用那不是一般的难,这个是我参与的项目
http://www.cjk.org/cjk/arabic/cave/cave.htm
6. Python 如何对输出的词频结果按字母顺序排序(NLTK)
importnltk
file_b=open('a.txt','r')
tokens=nltk.word_tokenize(file_b)
fdist1=nltk.FreqDist(tokens)
forkey,valinsorted(fdist1.iteritems())[:5]:
print("{1}:{0}".format(key,round(val/len(tokens),2)))