㈠ linux上安裝tesseract時報錯找不到liblzma.la
看一下/usr/lib/liblzma.la 是什麼文件。ls -l /usr/lib/liblzma.la; file /usr/lib/liblzma.la
㈡ tesseract-ocr怎麼設置只匹配數字+大寫字母
C:Program Files (x86)Tesseract-OCR essdataconfigs文件夾目錄下,復制digits並命名為yours,用notepad++編輯
tessedit_char_
如果你是使用的3.04,按教程直接使用
tesseractC:1.jpgC:1yours
你會很輕松地得到想要的結果。
但是如果你使用的是4.00,耐殲你會發現白名單毫無作用。
奇怪,難道是配置環境出錯了?還是字母打錯了?都不是。
tesseract提供了OCR引擎模式。
0=僅限原始Tesseract
1=只有神經網路LSTM
2=Tesseract+LSTM
3=基於可用的默認值
目前LSTM是無法支持轎畝碧白名單的,並且似乎tesseract的團隊無意去解決閉舉這個問題。
選擇原始tesseract 即 --oem 0
tesseract--oem0C:1.jpgC:1yours
這樣你就能使用白名單了。但是識別正確率會比原先低。