導航:首頁 > 文檔加密 > pdf全文檢索

pdf全文檢索

發布時間:2023-02-10 06:43:54

『壹』 如何對大批量的pdf格式文件進行分類、加密、全文檢索這些PDF文件只對有授權的人開放閱讀檢索功能

這是一個比較實用,同時有比較難以解決的軟體問題,不過現在好在該問題已經被徹底解決掉了。由【QQ天才機器人1983579041】研發的PDF全文檢索系統,完全可以解決上述問題,而且可以實現『二次檢索』『N次檢索』的問題,這樣會大大方便用戶的分類檢索,實用性很強。這個系統還可以對其他的格式文件進行類似的全文檢索。

『貳』 PDF庫全文檢索

思路比較清晰,首先從pdf中提取文字,然後利用搜索引擎完成文字檢索,每一步都有現成的開源工具。

這里需要關注的系統架構的問題。如果pdf文件很大,那麼提取文字要耗費大量的時間,總不能讓用戶在那裡等待響應,畢竟提取文字並不需要那麼高的實時性,後台慢慢處理就行。

所以這里用Django+celery+redis實現非同步任務隊列。用戶上傳文檔後,Django把提取文字的任務通過celery發送給redis,然後就返回響應,用戶無需等待。

閱讀全文

與pdf全文檢索相關的資料

熱點內容
程序員可以轉行做運維嗎 瀏覽:323
如何檢測到伺服器埠是否通 瀏覽:851
linuxsed正則 瀏覽:109
linux安裝gz文件 瀏覽:357
linux如何卸載編譯的軟體 瀏覽:929
高三解壓活動視頻 瀏覽:780
如何把伺服器卡爆 瀏覽:949
餓了么java程序員 瀏覽:960
python編譯時找不到路徑 瀏覽:910
jpg轉換pdf軟體 瀏覽:103
php讀取json文件 瀏覽:866
螺桿壓縮機的功率計算 瀏覽:74
谷輪壓縮機c 瀏覽:338
蘋果app如何復制到另一個手機 瀏覽:834
javasession超時 瀏覽:831
易金通app怎麼更改手機號 瀏覽:493
plc數控編程的方法 瀏覽:989
android只能輸入數字和字母 瀏覽:120
文件夾如何刪除頁碼 瀏覽:993
伺服器被封了有什麼後果 瀏覽:980