導航:首頁 > 源碼編譯 > 匹配分詞演算法

匹配分詞演算法

發布時間:2024-07-22 10:45:34

A. 有哪些比較好的中文分詞方案

1. 好詞典很重要m不論什麼樣的分詞方法, 優秀的詞典必不可少, 越拿老掉牙的詞典對越新的文本進行分詞, 就越會分成一團糟. 怎樣構建一個優秀的詞典, 快速發現新新詞彙.。可以看有幾篇文章,講的非常透徹明白 : 互聯網時代的社會語言學:基於SNS的文本數據挖掘。

2. 演算法跟著需求走,建議根據不同的需求選用不同的演算法, 例如, 類似知乎頭部搜索的 AutoComplete 部分, 講究的是速度快, 興趣相關( 優先找和你賬戶相關, 和可能感興趣的內容 ), 分詞演算法反而在其次了. 而像全文搜索這樣大段大段的長文字.。我覺得則更注重的是精準, 應該選一個像CRF這樣的演算法。

閱讀全文

與匹配分詞演算法相關的資料

熱點內容
zbrushpdf 瀏覽:897
met肌肉能量技術pdf 瀏覽:195
php面試重點 瀏覽:683
如何從管理員界面刪除文件夾 瀏覽:908
單片機三匯流排信息如何隔離 瀏覽:690
雲伺服器研發費用明細 瀏覽:957
unity3d手機游戲開發pdf 瀏覽:366
mysql重啟命令linux 瀏覽:876
程序員日常業余內容 瀏覽:363
steam如何更改吃雞伺服器 瀏覽:212
我的世界up主多人用什麼伺服器 瀏覽:161
縫紉機電腦機編程 瀏覽:59
autowired源碼深度解析 瀏覽:895
校園卡怎麼上app 瀏覽:743
pascal高精度演算法 瀏覽:870
阿里雲伺服器如何修改php 瀏覽:8
51單片機小項目 瀏覽:607
為什麼d盤e盤無法解壓 瀏覽:314
軟體放文件夾壓縮以後會變小嗎 瀏覽:669
文件夾中的圖片怎麼整體壓縮 瀏覽:579