導航:首頁 > 編程語言 > 微軟ocr編程

微軟ocr編程

發布時間:2022-07-30 01:54:42

㈠ 怎麼調用Microsoft Office Document Imaging的ocr

你確認 你的 電腦上 有Microsoft Office Document Imaging 列印嗎?
如果有的話,你點 開始 程序 microsoft office 2003 ……到那個 裡面 office 工具……然後找到了……運行 再打開你的圖片……
如果沒有,那麼就要有完整的安裝才行……

㈡ 有什麼免費的OCR軟體

ocr文字識別軟體操作步驟如下:

1、手機安裝掃描全能王軟體。

㈢ 如何利用微軟 Office Word 進行文字辨識﹝OCR﹞

3.點選[下一步]。 4.預設存成tif格式檔案。 以上就是要將圖片轉檔成 tif 或 tiff 格式,若使用掃描器掃描文件後,可將圖片存成該類格式,解析度越高,文字辨識率越正確。 5.在剛剛存檔的 tif 檔,滑鼠右鍵點擊,使用 Microsoft Office Document Imaging 開啟。 6.開啟後,點擊[工具] > [使用 OCR 辨識文字]。 7.辨識完成後,在左邊的預覽圖右下角就會出現已辨識的圖樣,,點擊[工具] > [傳送文字到 Word]。 8.以下是辨識的結果,接下來要做的就是修改未辨識好的文字修改。 雖然沒有完全辨識出來,但其結果是在可接受的范圍,至少不用從頭打字打到尾。

㈣ 有什麼免費好用的ocr軟體

可以在手機上安裝雲脈文檔識別APP,一款免費圖片轉文字App可將圖片上的文字識別提取出來,生成可編輯的Txt文本文件,也可以上傳至電腦進行進一步編輯。在進行同步後,還能實現手機、電腦等多終端操作。電腦上可以安裝雲脈OCR文字識別軟體,識別率高,識別速度快

㈤ 微軟的office庫 OCR如何實現識別中英文混合

使用WORD自帶的虛擬列印機Microsoft Office Document Image Writer將圖片列印後再用工具——使用OCR識別就能將圖片中的文字識別,不管是中文還是英文。
不過使用該功能的前提是WORD要安裝完整,精簡版的OFFICE可能是不帶虛擬列印機這一功能的,可以下載一個完整版的選擇完整安裝,完整版的有500多M

㈥ 微軟OCR哪種設置識別數字最好

ocr文字識別軟體,可以根據圖片識別文字。但是,必須要提醒你,圖形識別已經屬於一定的人工智慧范疇,目前的軟體技術還沒達到應對各種狀況的程度,所以前期的工作你要做好,比如圖片文字越清晰卻容易識別,圖片上顏色越少越容易識別,圖片文字與背景色對比越明顯越容易識別,圖片文字書寫越規范越容易識別,英文和數字比中文更容易識別等等。可以使用ABBYY FineReader這款老牌OCR識別軟體,個人認為識別率蠻高的,提供軟體下載網頁鏈接你試下,看看能不能行

㈦ OCR文字識別軟體哪個易用可網上下載

OCR文字識別軟體 Mini Ocr

xdowns.com/view_soft/3/7/OCRwenzishibieruanjian Mini Ocr.html



本軟體是飛濤軟體工作室開發的一款免費Ocr軟體,主要用於識別圖像文件之中,出現
的漢字顯示字體。Ocr的中文含意是光學字元識別。
為什麼叫Mini呢?因為現有的識別漢字的商業Ocr軟體,動輒二三十兆,而本軟體解
壓後,也不過三兆多,身材比較纖小,再加上本軟體主要用於識別字體比較小的漢字,所
以叫Mini,中文的發音是「迷你」,中文含義是超小型。

既然有了商業Ocr軟體,為什麼還要開發這個軟體?

不同於商業Ocr軟體,本軟體是免費的,可以自由使用。第二個不同之處,本軟體的
識別對象是屏幕出現的「顯示漢字」,而不是針對掃描儀掃出來的「列印漢字」。二者有什
么不同呢?最重要的一點: 掃描出來的列印漢字的高度和寬度一般都在30多個像素點之
上,這是我用畫圖軟體,打開某個商業Ocr的samples\sample1.tif,然後一點一點數出
來的。從文件名和目錄名的中文含意可以看出,這個點數應該是一個典型值。那麼,如果
用商業Ocr識別屏幕上出現的小五號字,漢字的高度是12個像素點,會出現什麼情況呢?
測試方法:用記事本隨便寫幾行漢字,設置字體為小五號字。這大概是看著還算舒服
的最小號的漢字字體了(高度是12個像素點),如果再小,字體就很難看了。然後,按拷
屏鍵PrtSc,把屏幕的圖像拷貝、粘貼到畫圖軟體中,修剪尺寸後,保存為bmp的格式。
然後,我找了兩個國內最著名的Ocr軟體進行測試,結果讓人大吃一驚,識別率幾乎為零。
把圖像放大兩倍,再測試,結果仍然很不理想,大概也只有百分之二三十的樣子。

開發Mini Ocr軟體的由來

我在開發護花使者反黃圖像識別軟體的時候,遇到有些圖像里,嵌有某些文字,如果能
把文字識別出來,圖像的含義就很容易讓計算機理解了。預算有限,我連掃描儀都捨不得
買,就更別想買商業Ocr的開發包了,大概幾十萬,或者更多,或者別人壓根就不賣。況且
它們的識別率對小字體幾乎為零,不符合我的要求。看來,只好自力更生,重新寫一個了。

開發Mini Ocr的歷程

經過三個多月的努力,終於誕生了這款Mini Ocr 軟體。第1個月做出了漢字識別的
核心模塊,第2個月做出了文章段落切分的演算法,並加入了對英文,數字,標點的支持,
第三個月繼續調整英漢混排和漢字切分的演算法,並用MFC 做了一個界面。

Mini Ocr的軟體架構

為了讓更多的人能使用到這個軟體,我在windows系統下,採用VC進行編程,界面當
然只好用MFC寫了。軟體架構是一個SDI框架下的多窗口切分界面,左上角的窗口是一個
CFormView,用來顯示常用的按鈕;左下角是一個CEditView,用來顯示幫助信息;右上角
是一個CView,用來顯示要識別的圖像;右下角是一個CEditView,用來存放識別出來的文
字。識別部分採用了工作者線程,以避免顯示界面的主線程僵掉。識別部分是整個軟體的
核心,與操作系統無關,可以單獨摘出來放在dos窗口裡跑,也可以移植到Linux系統中跑。

漢字識別軟體的難點所在:

英文識別有一些開放源碼的軟體,我看過的軟體,主要採取兩種識別方法:基於規則
的方法,和採用神經網路方法。而這兩種方法,在識別漢字時,都不宜採用。因為漢字數
目眾多,最常用的國標2312的一級漢字就有3755個。如果借用基於規則的方法,需要對
三千多個漢字,逐一人工寫出分類規則,工作量太大,我一個人無法完成;如果採用神經
網路的方法,這么多漢字,我不敢想像,需要多少層網路和神經節點呀!如果採用網格法,
抗位移的效果太差;而採用不變矩法,識別人和入,土和士,相似度又難於控制。除此之
外,漢字切分也是一大難題。英文寬度大概只有漢字一半,標點符號大概只有漢字三分之
一寬,數字大概只有四分之一的寬度。而漢字本身又有二分字,和三分字。某些字,如「啊」,
字體小時可能是獨體字,字體大些,變為二分字,字體再大,又變為三分字。加上漢字與
漢字之間的粘連、漢字與英文的混排,英文與英文的粘連,造成漢字切分模塊的演算法,甚
至比漢字識別模塊的演算法還要復雜得多。為了克服這些難點,並加快識別速度,我在演算法
設計時,採用了一些優化和簡化的策略。經過實踐檢驗,證明行之有效。

Mini Ocr進行漢字識別的策略:
1) 採用復合特徵的分類方法。
2) 字元集選擇3755個一級漢字。
3) 字體選擇最常用的宋體。
4) 字型大小選擇從小五號到一號漢字,主要針對20個點之內的小字體。
5) 英漢混排時,漢語優先。
6) 漢字粘連時,進行動態優化切分。

展望與下一步的開發計劃:
1) 重新優化英文識別的演算法;
2) 對英文粘連的切分演算法進行調整;
3) 移植進入Linux;

選擇Ocr軟體的建議:

如果您選擇Ocr軟體,目的是用來識別掃描儀出來列印字體,推薦還是選用知名的商業Ocr。
如果您要識別屏幕上顯示的漢字,Mini Ocr是一個比較不錯的選擇。真誠地希望您在使用
中,能喜歡上它

㈧ 如何使用 Office Lens OCR 光學字元識別功能

使用 Office Lens OCR 光學字元識別功能如下:

Office Lens應用被官方稱為「口袋中的掃描儀」,可以用來拍攝白板黑板、名片、菜單、書面筆記,將照片調整為方便閱讀的視圖,並同步到 OneNote 筆記中 – 從而可以將圖片中的文本提取出來方便編輯或發送,這就是所謂 OCR(光學字元識別)功能。

1、Office Lens 應用分為兩個功能,其一是拍攝,其二是同步至 OneNote,OCR(光學字元識別)功能其實是 OneNote 實現的。

㈨ c#如何調用微軟的ocr進行圖像識別

// 引用 Interop.MODI.dll
// 識別率不是很高
private string OcrFunc(string imgfileName) // 參數為包含文本的圖片文件名
{
var langs = MODI.MiLANGUAGES.miLANG_ENGLISH;
// MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED; 中文含英文
// MODI.MiLANGUAGES.miLANG_JAPANESE; 日文含英文

var doc = new MODI.Document();
var image = default(MODI.Image);
var layout = default(MODI.Layout);

try
{
doc.Create(imgfileName);
doc.OCR(langs, true, true);
var sb = new StringBuilder();

for (int i = 0; i < doc.Images.Count; i++)
{
image = (MODI.Image)doc.Images[i];
layout = image.Layout;
sb.AppendLine(string.Format("{0}, {1}", i, layout.Text));
}
doc.Close(false);
return sb.ToString();
}
catch (System.Exception ex)
{
MessageBox.Show(ex.Message);
return string.Empty;
}
finally
{
layout = null;
image = null;
doc = null;
}
}

閱讀全文

與微軟ocr編程相關的資料

熱點內容
戰地聯盟3解壓密碼 瀏覽:801
s型命令 瀏覽:23
php年薪5年 瀏覽:67
如何上網上設個人加密賬戶 瀏覽:44
linux打開ssh服務 瀏覽:78
微信位置可以加密嗎 瀏覽:470
演算法蠻力法 瀏覽:438
隨機排練命令 瀏覽:147
python多進程並發 瀏覽:41
安卓軟體安裝如何躲避安全檢測 瀏覽:647
奇幻潮翡翠台源碼百度雲盤 瀏覽:187
什麼軟體可以免費pdf轉word 瀏覽:15
php正則表達式大全 瀏覽:394
androidntp時間 瀏覽:299
輪機長命令簿英文 瀏覽:148
oppo鈴聲設置被加密怎麼處理 瀏覽:548
粵苗app圖形驗證碼怎麼填 瀏覽:899
管家婆架設雲伺服器 瀏覽:254
php的登錄界面代碼 瀏覽:997
php開發客戶端 瀏覽:998