Ⅰ tesseract ocr 3.04有沒有編譯好的庫
#include <iostream>
#include "allheaders.h"
#include "baseapi.h"
#include "basedir.h"
#include "renderer.h"
#include "strngs.h"
#include "tprintf.h"
#include "openclwrapper.h"
#include "osdetect.h"
void PrintVersionInfo() {
char *versionStrP;
printf("tesseract %s\n", tesseract::TessBaseAPI::Version());
versionStrP = getLeptonicaVersion();
printf(" %s\n", versionStrP);
lept_free(versionStrP);
versionStrP = getImagelibVersions();
printf(" %s\n", versionStrP);
Ⅱ 如何在windows上編譯Tesseract OCR
獲取Tesseract源碼的方式有很多。可以直接從repo獲取,也可以下載壓縮包。不過編譯的時候往往也會出現各種奇怪的問題。這里介紹如何簡單的配置和編譯源碼。
編譯Tesseract
下載
Windows installer of tesseract-ocr 3.02.02
安裝
安裝過程中勾選Tesseract development files:
編譯
在安裝目錄中找到vs2008到工程目錄:
找到所有編譯相關的庫:
打開Visual Studio 2008(沒有的可以去官網下載express版本),導入工程編譯。最後生成DEBUG和RELEASE兩個版本的DLL:libtesseract302d.dll ,libtesseract302.dll
在README中注意這段話:
Dependencies and Licenses
=========================
Leptonica is required. (www.leptonica.com). Tesseract no longer compiles
without Leptonica.
Libtiff is no longer required as a direct dependency.
Tesseract依賴Leptonica庫,所以再看下Leptonica是怎麼編譯的。
編譯Leptonica
Leptonica是C語言編寫的一個圖像處理庫,支持JPEG, PNG, TIFF,GIF。
下載
源碼:leptonica-1.68.tar.gz
VS工程:vs2008-1.68.zip
相關頭文件和庫:leptonica-1.68-win32-lib-include-dirs.zip
編譯
把三個包解壓,並按照下面的結構組建編譯環境:
BuildFolder\
include\
leptonica-1.68\
lib\
BuildFolder\leptonica-1.68 contents:
config\ Not used for Windows builds
prog\ Regression tests, examples, utilities
src\ Source files for liblept
vs2008\ Visual Studio 2008 specific files
DLL Debug\ liblept DLL Debug build output
DLL Release\ liblept DLL Release build output
LIB Debug\ liblept LIB Debug build output
LIB Release\ liblept LIB Release build output
prog_projects\ Projects for prog programs
ioformats_reg\ Sample project for prog\ioformats_reg.exe
DLL Debug\ DLL Debug build output for sample project
DLL Release\ DLL Release build output for sample project
LIB Debug\ LIB Debug build output for sample project
LIB Release\ LIB Release build output for sample project
ioformats_reg.vcproj The ioformats_reg project file
leptonica.sln The Leptonica solution file
leptonica.vcproj The Leptonica project file
打開Visual Studio 2008,導入工程編譯。最後生成DEBUG和RELEASE兩個版本的DLL:liblept168d.dll,liblept168.dll。
Ⅲ 如何在windows上編譯Tesseract OCR / quweiji
最近要用java實現一個驗證碼識別系統,選了半天之後最終決定用Tesseract-OCR作為識別引擎。既然是java+Tesseract-OCR,自然就首選Tess4J。由於Tess4J直接且僅提供了編譯成dll的3.02版本的Tesseract-OCR,而我的最終目標Linux下使用且想自己更換Tesseract-OCR的版本,就決定自己動手對Tesseract-OCR的代碼進行編譯。而這篇文章就是這次研究的中間產物。
雖然Tess4J目前支持的是Tesseract-OCR 3.02,但Tesseract-OCR無法在Tess4J中直接進行使用,還需要使用capi進行封裝,但這個就是後話了,本文僅介紹如何在windows環境下編譯Tesseract-OCR。
准備工作
根據GoogleCode上下載Tesseract-OCR的windows安裝版本測試的結果及官方說明文檔,Tesseract-OCR支持tiff、png、gif、bmp、jpeg等格式,所以首先就按照這個目標來收集所需的支持庫。由於最終目標是在Linux下編譯成功,所以我選擇了msys+tdm-gcc來模擬Linux下的編譯過程。
需要下載的庫有:
1) zlib-1.2.7
2) libpng-1.5.10
3) giflib-4.1.6
4) libungif-4.1.4(這個似乎在最終的編譯過程中沒有起作用)
5) jpeg-8d
6) jbigkit-2.0
7) tiff-3.9.5
8) libwebp-0.1.3 9) leptonica-1.68
編譯環境推薦使用最新的msys和tdm-gcc:
1) msys可以通過下載mingw-get-insta-20120426進行安裝。
Ⅳ TessBaseAPI在安卓上實現OCR文字識別時候,編譯沒錯誤,運行時會異常終止,可能是什麼原因急!!
之後,它被谷歌大幅改進,很可能是識別率最高的可用開源 OCR 引擎之一了。結合 ... 接下來需要對下載下來的 tess-two 進行編譯 如何用 android ndk 進行 so 的編譯我放在了... 包leptonica 的類我們不必使用,只要使用 tess 包的類就行了 下面是 tessBaseAPI 的主要...
Ⅳ 如何在windows上編譯Tesseract OCR
源碼: https://github.com/tesseract-ocr/tesseract
在github上有在不同系統中編譯教程, Url在這里
https://github.com/tesseract-ocr/tesseract/wiki/Compiling
Linux系統的編譯
Linux系統中編譯過程按照教程來就可以, 可能遇到的問題, 也是我遇到的問題就兩處
1. 編譯成功後, 使用LSTM識別時, 無法計算點積, 解決方法很簡單, 把
SIMDDetect::IsAVXAvailable()
SIMDDetect::IsSSEAvailable()
的返回值修改一下, 直接
return false;
2. 不停顯示ScrollView: Waiting for server…, 出現這個問題主要是由於exe無法找到ScrollView.jar, 只需要在出現此句上方不遠處, 將
scrollview_path = ".";
替換成你自己的路徑即可
Windows系統的編譯
windows系統編譯就比較坑了. 完全按照教程來理論上是可行的, 但是我不行…困擾許久.
其實思考清楚了也就那麼回事兒, 主要就是由於依賴庫: Leptonica
在使用Cmake將TesseractOCR編譯成vs工程時, 由於在CMakeLists.txt中沒有指定Leptonica庫的路徑, 所以CMake在將TesseractOCR編譯成vs工程時會報錯
於是, 在教程中, 需要大家安裝cppan, 並且在編譯TesseractOCR工程之前, 使用cppan安裝相關依賴. 這種方式確實簡便, 但是對於我天朝閉關鎖國來講, 什麼事兒都可能發生, 反正我是各種報錯…看到心碎… 搜了不少資料說, 可能需要一些科學技術才能夠成功(fanqiang), 我只能幫你們到這了.
當然對於我們這些良民來講, 怎麼能做這種事兒呢(主要是藍燈沒流量了..). 於是只好研究一下其他解決方法. 上面也說了, 問題主要就集中在Leptonica庫的尋找上, 那好, 我們自己加上不就得了…於是, 就是下面
Leptonica網站: http://www.leptonica.com/
Leptonica Github: https://github.com/danbloomberg/leptonica
把源碼下載下來, 自己手動編譯一下, 很簡單,源碼目錄下執行
cd build
cmake ..
1
2
1
2
即可在build目錄下生成對應sln, 打開編譯即可
- 在TesseractOCR工程目錄下找到CMakeLists.txt, 在
``` if(NOT EXISTS ${PROJECT_SOURCE_DIR}/.cppan)
if (NOT Leptonica_DIR AND NOT MSVC)
find_package(PkgConfig REQUIRED)
pkg_check_moles(Leptonica REQUIRED lept>=${MINIMUM_LEPTONICA_VERSION})
else()
find_package(Leptonica ${MINIMUM_LEPTONICA_VERSION} REQUIRED CONFIG)
endif()
else()
if (STATIC)
set(CPPAN_BUILD_SHARED_LIBS 0)
else()
set(CPPAN_BUILD_SHARED_LIBS 1)
endif()
add_subdirectory(.cppan)
endif()```
之前加上這么一句
set(Leptonica_DIR E:/dl/leptonica-master/build)
意思就是我們將我們的Leptonica_DIR路徑告訴編譯系統, 讓他不要亂找了
- OK, 到這里, Leptonica導致的問題就已經解決啦
- 還剩下的就是一些由於字元集導致的編譯問題, 就是下面這句
static const STRING kCharsToEx[] = {"'", "`", "\"", "\\", ",", ".",
"〈", "〉", "《", "》", "」", "「", ""};
有兩種解決方案:
一種是去vs的文件->高級保存選項, 將編碼修改為簡體中文(GB2312) - 代碼頁936
另一種是按照這個Url: http://blog.csdn.net/fengbingchun/article/details/51628957 修改, 諸位喜歡哪種方式就採用哪種方式即可.
- 到此結束…
Ⅵ 如何在windows上編譯Tesseract OCR
分別在LIB_Debug和LIB_Release下編譯libtesseract304工程,便能生成tesseract靜態庫。
仿照libtesseract304工程,編譯tesseract工程,將靜態庫zlib、tiff、lept和tesseract加入到工程屬性中即可。
新建Tesseract-OCR_Test控制台工程,將相應頭文件和靜態庫加入到此工程中,測試代碼來自於src/api/tesseractmain.cpp,如下:
[cpp] view plain
#include <iostream>
#include "allheaders.h"
#include "baseapi.h"
#include "basedir.h"
#include "renderer.h"
Ⅶ 如何在windows上編譯Tesseract OCR
最近要用java實現一個驗證碼識別系統,選了半天之後最終決定用Tesseract-OCR作為識別引擎。既然是java+Tesseract-OCR,自然就首選Tess4J。由於Tess4J直接且僅提供了編譯成dll的3.02版本的Tesseract-OCR,而我的最終目標Linux下使用且想自己更換Tesseract-OCR的版本,就決定自己動手對Tesseract-OCR的代碼進行編譯。而這篇文章就是這次研究的中間產物。雖然Tess4J目前支持的是Tesseract-OCR3.02,但Tesseract-OCR無法在Tess4J中直接進行使用,還需要使用capi進行封裝,但這個就是後話了,本文僅介紹如何在windows環境下編譯Tesseract-OCR。准備工作根據GoogleCode上下載Tesseract-OCR的windows安裝版本測試的結果及官方說明文檔,Tesseract-OCR支持tiff、png、gif、bmp、jpeg等格式,所以首先就按照這個目標來收集所需的支持庫。由於最終目標是在Linux下編譯成功,所以我選擇了msys+tdm-gcc來模擬Linux下的編譯過程。
Ⅷ 如何在windows上編譯Tesseract OCR
安裝 安裝過程中勾選Tesseract development files: 編譯 在安裝目錄中找到vs2008到工程目錄: 找到所有編譯相關的庫: 打開Visual Studio 2008(沒有的可以去官網下載express版本),導入工程編譯。最後生成DEBUG和RELEASE兩個版本的DLL
Ⅸ 如何用python 自己寫一個ocr
Tesseract其實對中文的識別很垃圾,下了最新版的編譯,從pdf第一頁識別,大的特別清晰的可以識別,其他的就慘了,有時候還能識別成錯別字。