㈠ linux上安装tesseract时报错找不到liblzma.la
看一下/usr/lib/liblzma.la 是什么文件。ls -l /usr/lib/liblzma.la; file /usr/lib/liblzma.la
㈡ tesseract-ocr怎么设置只匹配数字+大写字母
C:Program Files (x86)Tesseract-OCR essdataconfigs文件夹目录下,复制digits并命名为yours,用notepad++编辑
tessedit_char_
如果你是使用的3.04,按教程直接使用
tesseractC:1.jpgC:1yours
你会很轻松地得到想要的结果。
但是如果你使用的是4.00,耐歼你会发现白名单毫无作用。
奇怪,难道是配置环境出错了?还是字母打错了?都不是。
tesseract提供了OCR引擎模式。
0=仅限原始Tesseract
1=只有神经网络LSTM
2=Tesseract+LSTM
3=基于可用的默认值
目前LSTM是无法支持轿亩碧白名单的,并且似乎tesseract的团队无意去解决闭举这个问题。
选择原始tesseract 即 --oem 0
tesseract--oem0C:1.jpgC:1yours
这样你就能使用白名单了。但是识别正确率会比原先低。