1. 如何刪除「使用NLTK或者python停用詞"
Nltk是python下處理語言的主要工具包,可以實現去除停用詞、詞性標注以及分詞和分句等。
安裝nltk,寫python一般使用的是集成環境EPD,其中有包管理,可以在線進行安裝。如果不是集成環境,可以通過pip install nltk安裝。
》pip install nltk #安裝nltk
》nltk.download() #彈出一個選擇框,可以按照自己需要的語義或者是功能進行安裝
一般要實現分詞,分句,以及詞性標注和去除停用詞的功能時,需要安裝stopwords,punkt以及
當出現LookupError時一般就是由於缺少相關模塊所導致的
則是需要安裝punkt,這個模塊主要負責的是分詞功能。同stopwords一樣有兩種方式安裝。
2. 我在Python 3.4.3 shell 中輸入 from nltk.book import *後,出現以下內容;我該怎麼設置掃描路徑。
網上找的答案,和您分享:
Assuming you can import Tkinter, type
>>> import nltk
>>> nltk.download()
in the GUI which appears, select Everything from the nltk book and click download. Wait.
3. python在導入nupmy和matplotlib時遇到問題怎麼辦
1.最開始,在裝完nltk,numpy和scipy以及matplotlib後,我直接在python互動式命令行中導入matplotlib模塊,結果提示缺少模塊six,如下圖所示:
4. python3支持nltk嗎
最近在通讀Python自然語言這本書,嘗試安裝nltk及測試。
Windows平台:
以下操作前提,已經安裝Python,只需要安裝NLTK。
若沒有安裝Python,請按照官網或者點擊按照下面的鏈接安裝Python。
https://www.py.cn/faq/python/12604.html
win + R cmd 進入命令行,輸入Python,輸入:import nltk
執行nltk.download()
彈出以下窗口(剛打開的status應該是not installed):
雙擊all 即下載,過程中可能會出現下載失敗的問題,只需要重新手動雙擊未下載成功的identifier即可。
推薦學習《Python教程》!
5. 如何使用python中的nltk對哈薩克語或阿拉伯語進行句法分析
如果是英語和西班牙語可以用Inflector。https://pypi.python.org/pypi/Inflector
使用這個模塊可以對名詞的單復數進行轉換及字元操作。
哈薩克語或阿拉伯語,還要進行語法分析這個就沒辦法了。
如果你有語料庫及語言知識的話,其實可以自己去做。
話說阿拉伯語的動詞活用那不是一般的難,這個是我參與的項目
http://www.cjk.org/cjk/arabic/cave/cave.htm
6. Python 如何對輸出的詞頻結果按字母順序排序(NLTK)
importnltk
file_b=open('a.txt','r')
tokens=nltk.word_tokenize(file_b)
fdist1=nltk.FreqDist(tokens)
forkey,valinsorted(fdist1.iteritems())[:5]:
print("{1}:{0}".format(key,round(val/len(tokens),2)))