導航:首頁 > 編程語言 > java提取文字

java提取文字

發布時間:2025-01-22 11:37:15

『壹』 java word中提取關鍵字

給個思路吧。
讀取word用doc4j,然後就是讀成字元串進行處理了。
提取關鍵字首先是中文分詞技術,就是把一段話劃分成多個組成的詞語,然後統計詞語的出現次數,這個是主要依據。這個是有實現的jar包的,可以去搜,搜java 中文分詞就行。
分詞之後,記錄詞語出現位置,這個是輔助的依據,記錄詞語一句話中的位置,越靠前越像關鍵字,權重越高。
甚至可能需要建立一個權重體系,次數設置一個權重,整體位置設置一個權重,不同位置權重也不同。不了解權重可以理解成系數(百分比的,然後計算那個詞是關鍵詞)。

同時需要注意,可能需要排除一些常用詞,哪些次需要排除,這個需要根據程序反復運行,讀取不同word文章的結果來定。
不明白的話在問吧。

『貳』 Java正則 提取指定字元串中的文字

用JSON來做,把上面的先轉化為JSON,然後獲取到URL的值在截取。
比如:String s = " "action": {
"action": "loadpage",
"list_name": "sale",
"pagetype": "childcate",
"showsift": true,
"title": "二手物品",
"showpub": true,
"url": "$rescachehelper.getResource(25)&topcate=sale"
}";
把裡面的雙引號先轉為單引號

JSONObject json = JSONObject.fromObject(s);
String value = json.get("action");
Stirng url = value.get("url");
然後對url的值進行截取:
String no = url.substring(url.indexOf("("),url.indexOf(")"));
....這里為你處理的方法,最後得到一個新的url為newUrl
然後設置到json裡面去
value.put("url",newUrl);
最後在把json變為字元串的話:
json.toString();

閱讀全文

與java提取文字相關的資料

熱點內容
陰陽師如何查看哪個伺服器有ID 瀏覽:305
公務員照片壓縮 瀏覽:447
編譯的時候怎麼找未定義的函數 瀏覽:341
有什麼我的世界伺服器 瀏覽:295
伺服器亮綠燈是什麼意思 瀏覽:626
python畫的圖如何保存高清版 瀏覽:488
10的搭接還用加密嗎 瀏覽:361
bytedance這個文件夾是什麼意思呢 瀏覽:585
演算法站的客體 瀏覽:73
src文件夾c語言怎麼運行 瀏覽:19
怎麼把已安裝的app放到桌面 瀏覽:943
如何查看蘋果手機app是否取消訂閱 瀏覽:769
u盤加密之後手機可以打開嗎 瀏覽:42
單片機串口發射怎麼回事 瀏覽:476
程序員假裝自己很忙 瀏覽:800
程序員能力關鍵詞 瀏覽:617
plc編程高級視頻教程 瀏覽:614
java遞歸求n 瀏覽:88
python絕對路徑導入 瀏覽:131
nex5g加密 瀏覽:979