㈠ 有誰用過crf++或crfsuite工具包嗎,python上用的,win7系統
文檔上不是有說明嗎?有SWIG interface的版本。在它的例子目錄里有chunking.py, pos.py, ner.py, template.py等。你自己挑一個試試不就成了。
在swig/python目錄里有一個readme,你參考著做一次編譯就可以成生。
#!/usr/bin/envpython
importcrfsuite
importsys
#Inheritcrfsuite.Trainertoimplementmessage()function,whichreceives
#.
classTrainer(crfsuite.Trainer):
defmessage(self,s):
#.
sys.stdout.write(s)
definstances(fi):
xseq=crfsuite.ItemSequence()
yseq=crfsuite.StringList()
forlineinfi:
line=line.strip(' ')
ifnotline:
#.
yieldxseq,tuple(yseq)
xseq=crfsuite.ItemSequence()
yseq=crfsuite.StringList()
continue
#SplitthelinewithTABcharacters.
fields=line.split(' ')
#Appendattributestotheitem.
item=crfsuite.Item()
forfieldinfields[1:]:
p=field.rfind(':')
ifp==-1:
#Unweighted(weight=1)attribute.
item.append(crfsuite.Attribute(field))
else:
#Weightedattribute
item.append(crfsuite.Attribute(field[:p],float(field[p+1:])))
#.
xseq.append(item)
#.
yseq.append(fields[0])
if__name__=='__main__':
#.
printcrfsuite.version()
#CreateaTrainerobject.
trainer=Trainer()
#,andsetthemtotrainer.
forxseq,yseqininstances(sys.stdin):
trainer.append(xseq,yseq,0)
#UseL2-regularizedSGDand1st-orderdyadfeatures.
trainer.select('l2sgd','crf1d')
#.
fornameintrainer.params():
printname,trainer.get(name),trainer.help(name)
#.1
trainer.set('c2','0.1')
#Starttraining;.message()
#toreporttheprogress.
trainer.train(sys.argv[1],-1)
㈡ NER----pythonNLP工具包
使用python進行自然語言處理,有一些第三方庫供大家使用:
·NLTK(Python自然語言工具包)用於諸如標記化、詞形還原、詞干化、解析、POS標注等任務。該庫具有幾乎所有NLP任務的工具。
·Spacy是NLTK的主要競爭對手。這兩個庫可用於相同的任務。
·Scikit-learn為機器學習提供了一個大型庫。此外還提供了用於文本預處理的工具。
·Gensim是一個主題和向量空間建模、文檔集合相似性的工具包。
·Pattern庫的一般任務是充當Web挖掘模塊。因此,它僅支持自然語言處理(NLP)作為輔助任務。
·Polyglot是自然語言處理(NLP)的另一個Python工具包。它不是很受歡迎,但也可以用於各種NLP任務。
參考: http://www.coderjie.com/blog/
把nltk的各種應用講的很全面
㈢ python里的dealgner怎麼下載不了
可以下載。
雙擊下載後得到的安裝文件python-3.8.2-amd64.exe,將顯示安裝向導對話框,選中AddPython3.8toPATH復選框,表示將自動配置環境變數,ython安裝向導單擊「Customizeinstallation」按鈕,進行自定義安裝,在彈出的安裝選項對話框中採用默認設置,設置要安裝選項對話框。
單擊Next按鈕,打開高級選項對話框,在該對話框中,除了默認設置外,還需要手動選中Installforallusers復選框(表示使用這台計算機的所有用戶都可以使用),然後單擊Browse按鈕設置Python的安裝路徑,高級選項對話框說明:在設置安裝路徑時,建議路徑中不要有中文或空格,以避免使用過程中出現一些莫名的錯誤單擊Install按鈕,開始安裝Python,並顯示安裝進度,Python的安裝進度安裝完成後將顯示如圖所示的對話框,單擊Close按鈕即可圖安裝完成對話框。
㈣ 新手Pythonner 應該學習哪些 Python 庫
習python幾面入手:
習基本語包括數據結構(數組字典等)解數據類型及類型轉換
流程式控制制---選擇循環
函數模塊熟練使用用內建函數
class類
線程