❶ 如何通過Tesseract開源OCR引擎創建android OCR應用
Tesseract是遵守Apache License 2.0協議的開源OCR引擎。
如何在Android平台編譯Tesseract,以及如何快速創建一個簡單的OCR應用。
Tesseract Android Tools
要編譯Android平台的Tesseract,需要使用Google提供的tesseract-android-tools。
代碼獲取方式:
打開README,在命令行工具中執行下面的步驟:
cd<project-directory>
curl-O
curl-O
tar-zxvftesseract-ocr-3.02.02.tar.gz
tar-zxvfleptonica-1.69.tar.gz
rm-ftesseract-ocr-3.02.02.tar.gz
rm-fleptonica-1.69.tar.gz
mvtesseract-3.02.02jni/com_googlecode_tesseract_android/src
mvleptonica-1.69jni/com_googlecode_leptonica_android/src
ndk-build-j8
androipdateproject--target1--path.
antdebug(release)
注意:如果在使用NDK r9,編譯的時候會出現錯誤:
[-Werror=format-security]
解決的方法就是在Application.mk中加入一行:
APP_CFLAGS+=-Wno-error=format-security
編譯之後會生成class.jar和一些*.so。
Android OCR Application
創建一個Android應用,把生成的jar和so導入進來。
創建TessOCR:
publicclassTessOCR{
privateTessBaseAPImTess;
publicTessOCR(){
//TODOAuto-generatedconstructorstub
mTess=newTessBaseAPI();
Stringdatapath=Environment.getExternalStorageDirectory()+"/tesseract/";
Stringlanguage="eng";
Filedir=newFile(datapath+"tessdata/");
if(!dir.exists())
dir.mkdirs();
mTess.init(datapath,language);
}
publicStringgetOCRResult(Bitmapbitmap){
mTess.setImage(bitmap);
Stringresult=mTess.getUTF8Text();
returnresult;
}
publicvoidonDestroy(){
if(mTess!=null)
mTess.end();
}
}
構造函數中需要在存儲卡上創建一個目錄tessdata,如果不創建程序運行就會出錯。因為源碼中會檢測這個目錄,不存在就拋出異常:
publicbooleaninit(Stringdatapath,Stringlanguage){
if(datapath==null){
("Datapathmustnotbenull!");
}
if(!datapath.endsWith(File.separator)){
datapath+=File.separator;
}
Filetessdata=newFile(datapath+"tessdata");
if(!tessdata.exists()||!tessdata.isDirectory()){
("!");
}
returnnativeInit(datapath,language);
}
就這么簡單。現在通過三種方式獲取圖片做OCR:
在圖庫中選取一張圖,選擇發送或者分享,選擇OCR應用
在AndroidManifest.xml中加入IntentFilter,讓OCR應用出現在圖庫的分享列表中:
<intent-filter>
<actionandroid:name="android.intent.action.SEND"/>
<categoryandroid:name="android.intent.category.DEFAULT"/>
<dataandroid:mimeType="text/plain"/>
<dataandroid:mimeType="image/*"/>
</intent-filter>
獲得URI之後,對URI解碼,獲取bitmap:
if(Intent.ACTION_SEND.equals(intent.getAction())){
Uriuri=(Uri)intent.getParcelableExtra(Intent.EXTRA_STREAM);
uriOCR(uri);
}
privatevoiriOCR(Uriuri){
if(uri!=null){
InputStreamis=null;
try{
is=getContentResolver().openInputStream(uri);
Bitmapbitmap=BitmapFactory.decodeStream(is);
mImage.setImageBitmap(bitmap);
doOCR(bitmap);
}catch(FileNotFoundExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}finally{
if(is!=null){
try{
is.close();
}catch(IOExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
}
}
}
}
啟動OCR應用,從圖庫中選擇一張圖做OCR
發送Intent調用圖庫,在onActivityResult中獲取返回的URI做OCR:
Intentintent=newIntent(Intent.ACTION_PICK,android.provider.MediaStore.Images.Media.EXTERNAL_CONTENT_URI);
startActivityForResult(intent,REQUEST_PICK_PHOTO);
啟動OCR應用,拍照之後做OCR
為了獲取高質量的圖片,在Intent中加入圖片路徑。返回之後就可以直接使用這個圖片路徑解碼:
(){
IntenttakePictureIntent=newIntent(MediaStore.ACTION_IMAGE_CAPTURE);
//Ensurethatthere'
if(takePictureIntent.resolveActivity(getPackageManager())!=null){
//
FilephotoFile=null;
try{
photoFile=createImageFile();
}catch(IOExceptionex){
//
}
//
if(photoFile!=null){
takePictureIntent.putExtra(MediaStore.EXTRA_OUTPUT,
Uri.fromFile(photoFile));
startActivityForResult(takePictureIntent,REQUEST_TAKE_PHOTO);
}
}
}
不要忘記下載語言包,並push到存儲卡的tessdata目錄下。
❷ 如何通過Tesseract開源OCR引擎創建Android OCR應用
要編譯Android平台的Tesseract,需要使用Google提供的tesseract-android-tools。
代碼獲取方式:
git clone https //code google com/p/tesseract-android-tools/
打開README,在命令行工具中執行下面的步驟:
cd <project-directory>
curl -O https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
curl -O http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
tar -zxvf tesseract-ocr-3.02.02.tar.gz
tar -zxvf leptonica-1.69.tar.gz
rm -f tesseract-ocr-3.02.02.tar.gz
rm -f leptonica-1.69.tar.gz
mv tesseract-3.02.02 jni/com_googlecode_tesseract_android/src
mv leptonica-1.69 jni/com_googlecode_leptonica_android/src
ndk-build -j8
android update project --target 1 --path .
ant debug (release)
注意:如果在使用NDK r9,編譯的時候會出現錯誤:
format not a string literal and no format arguments [-Werror=format-security]
解決的方法就是在Application.mk中加入一行:
APP_CFLAGS += -Wno-error=format-security
編譯之後會生成class.jar和一些*.so。