微軟ocr編程_有什麼免費好用的ocr軟體

㈠怎麼調用Microsoft Office Document Imaging的ocr

你確認你的電腦上有Microsoft Office Document Imaging 列印嗎？
如果有的話，你點開始程序 microsoft office 2003 ……到那個裡面 office 工具……然後找到了……運行再打開你的圖片……
如果沒有，那麼就要有完整的安裝才行……

㈡有什麼免費的OCR軟體

ocr文字識別軟體操作步驟如下：

1、手機安裝掃描全能王軟體。

㈢如何利用微軟 Office Word 進行文字辨識﹝OCR﹞

3.點選[下一步]。 4.預設存成tif格式檔案。以上就是要將圖片轉檔成 tif 或 tiff 格式，若使用掃描器掃描文件後，可將圖片存成該類格式，解析度越高，文字辨識率越正確。 5.在剛剛存檔的 tif 檔，滑鼠右鍵點擊，使用 Microsoft Office Document Imaging 開啟。 6.開啟後，點擊[工具] > [使用 OCR 辨識文字]。 7.辨識完成後，在左邊的預覽圖右下角就會出現已辨識的圖樣，，點擊[工具] > [傳送文字到 Word]。 8.以下是辨識的結果，接下來要做的就是修改未辨識好的文字修改。雖然沒有完全辨識出來，但其結果是在可接受的范圍，至少不用從頭打字打到尾。

㈣有什麼免費好用的ocr軟體

可以在手機上安裝雲脈文檔識別APP,一款免費圖片轉文字App可將圖片上的文字識別提取出來，生成可編輯的Txt文本文件，也可以上傳至電腦進行進一步編輯。在進行同步後，還能實現手機、電腦等多終端操作。電腦上可以安裝雲脈OCR文字識別軟體，識別率高，識別速度快

㈤微軟的office庫 OCR如何實現識別中英文混合

使用WORD自帶的虛擬列印機Microsoft Office Document Image Writer將圖片列印後再用工具——使用OCR識別就能將圖片中的文字識別，不管是中文還是英文。
不過使用該功能的前提是WORD要安裝完整，精簡版的OFFICE可能是不帶虛擬列印機這一功能的，可以下載一個完整版的選擇完整安裝，完整版的有500多M

㈥微軟OCR哪種設置識別數字最好

ocr文字識別軟體，可以根據圖片識別文字。但是，必須要提醒你，圖形識別已經屬於一定的人工智慧范疇，目前的軟體技術還沒達到應對各種狀況的程度，所以前期的工作你要做好，比如圖片文字越清晰卻容易識別，圖片上顏色越少越容易識別，圖片文字與背景色對比越明顯越容易識別，圖片文字書寫越規范越容易識別，英文和數字比中文更容易識別等等。可以使用ABBYY FineReader這款老牌OCR識別軟體，個人認為識別率蠻高的，提供軟體下載網頁鏈接你試下，看看能不能行

㈦ OCR文字識別軟體哪個易用可網上下載

OCR文字識別軟體 Mini Ocr

xdowns.com/view_soft/3/7/OCRwenzishibieruanjian Mini Ocr.html

件

本軟體是飛濤軟體工作室開發的一款免費Ocr軟體,主要用於識別圖像文件之中，出現
的漢字顯示字體。Ocr的中文含意是光學字元識別。
為什麼叫Mini呢？因為現有的識別漢字的商業Ocr軟體，動輒二三十兆，而本軟體解
壓後，也不過三兆多，身材比較纖小，再加上本軟體主要用於識別字體比較小的漢字，所
以叫Mini，中文的發音是「迷你」，中文含義是超小型。

既然有了商業Ocr軟體，為什麼還要開發這個軟體？

不同於商業Ocr軟體，本軟體是免費的，可以自由使用。第二個不同之處，本軟體的
識別對象是屏幕出現的「顯示漢字」，而不是針對掃描儀掃出來的「列印漢字」。二者有什
么不同呢？最重要的一點：掃描出來的列印漢字的高度和寬度一般都在30多個像素點之
上，這是我用畫圖軟體，打開某個商業Ocr的samples\sample1.tif，然後一點一點數出
來的。從文件名和目錄名的中文含意可以看出，這個點數應該是一個典型值。那麼，如果
用商業Ocr識別屏幕上出現的小五號字，漢字的高度是12個像素點，會出現什麼情況呢？
測試方法：用記事本隨便寫幾行漢字，設置字體為小五號字。這大概是看著還算舒服
的最小號的漢字字體了（高度是12個像素點），如果再小，字體就很難看了。然後，按拷
屏鍵PrtSc，把屏幕的圖像拷貝、粘貼到畫圖軟體中，修剪尺寸後，保存為bmp的格式。
然後，我找了兩個國內最著名的Ocr軟體進行測試，結果讓人大吃一驚，識別率幾乎為零。
把圖像放大兩倍，再測試，結果仍然很不理想，大概也只有百分之二三十的樣子。

開發Mini Ocr軟體的由來

我在開發護花使者反黃圖像識別軟體的時候，遇到有些圖像里,嵌有某些文字，如果能
把文字識別出來，圖像的含義就很容易讓計算機理解了。預算有限，我連掃描儀都捨不得
買，就更別想買商業Ocr的開發包了，大概幾十萬,或者更多，或者別人壓根就不賣。況且
它們的識別率對小字體幾乎為零，不符合我的要求。看來，只好自力更生，重新寫一個了。

開發Mini Ocr的歷程

經過三個多月的努力，終於誕生了這款Mini Ocr 軟體。第1個月做出了漢字識別的
核心模塊，第2個月做出了文章段落切分的演算法，並加入了對英文，數字，標點的支持，
第三個月繼續調整英漢混排和漢字切分的演算法，並用MFC 做了一個界面。

Mini Ocr的軟體架構

為了讓更多的人能使用到這個軟體，我在windows系統下，採用VC進行編程，界面當
然只好用MFC寫了。軟體架構是一個SDI框架下的多窗口切分界面，左上角的窗口是一個
CFormView，用來顯示常用的按鈕；左下角是一個CEditView,用來顯示幫助信息；右上角
是一個CView,用來顯示要識別的圖像；右下角是一個CEditView,用來存放識別出來的文
字。識別部分採用了工作者線程，以避免顯示界面的主線程僵掉。識別部分是整個軟體的
核心，與操作系統無關，可以單獨摘出來放在dos窗口裡跑，也可以移植到Linux系統中跑。

漢字識別軟體的難點所在：

英文識別有一些開放源碼的軟體，我看過的軟體，主要採取兩種識別方法：基於規則
的方法，和採用神經網路方法。而這兩種方法，在識別漢字時，都不宜採用。因為漢字數
目眾多，最常用的國標2312的一級漢字就有3755個。如果借用基於規則的方法，需要對
三千多個漢字，逐一人工寫出分類規則，工作量太大，我一個人無法完成；如果採用神經
網路的方法，這么多漢字，我不敢想像，需要多少層網路和神經節點呀！如果採用網格法，
抗位移的效果太差；而採用不變矩法，識別人和入，土和士，相似度又難於控制。除此之
外，漢字切分也是一大難題。英文寬度大概只有漢字一半，標點符號大概只有漢字三分之
一寬，數字大概只有四分之一的寬度。而漢字本身又有二分字，和三分字。某些字，如「啊」，
字體小時可能是獨體字，字體大些，變為二分字，字體再大，又變為三分字。加上漢字與
漢字之間的粘連、漢字與英文的混排，英文與英文的粘連，造成漢字切分模塊的演算法，甚
至比漢字識別模塊的演算法還要復雜得多。為了克服這些難點，並加快識別速度，我在演算法
設計時，採用了一些優化和簡化的策略。經過實踐檢驗，證明行之有效。

Mini Ocr進行漢字識別的策略：
1) 採用復合特徵的分類方法。
2) 字元集選擇3755個一級漢字。
3) 字體選擇最常用的宋體。
4) 字型大小選擇從小五號到一號漢字，主要針對20個點之內的小字體。
5) 英漢混排時，漢語優先。
6) 漢字粘連時，進行動態優化切分。

展望與下一步的開發計劃：
1) 重新優化英文識別的演算法；
2) 對英文粘連的切分演算法進行調整；
3) 移植進入Linux；

選擇Ocr軟體的建議：

如果您選擇Ocr軟體，目的是用來識別掃描儀出來列印字體，推薦還是選用知名的商業Ocr。
如果您要識別屏幕上顯示的漢字，Mini Ocr是一個比較不錯的選擇。真誠地希望您在使用
中，能喜歡上它

㈧如何使用 Office Lens OCR 光學字元識別功能

使用 Office Lens OCR 光學字元識別功能如下：

Office Lens應用被官方稱為「口袋中的掃描儀」，可以用來拍攝白板黑板、名片、菜單、書面筆記，將照片調整為方便閱讀的視圖，並同步到 OneNote 筆記中 – 從而可以將圖片中的文本提取出來方便編輯或發送，這就是所謂 OCR（光學字元識別）功能。

1、Office Lens 應用分為兩個功能，其一是拍攝，其二是同步至 OneNote，OCR（光學字元識別）功能其實是 OneNote 實現的。

㈨ c#如何調用微軟的ocr進行圖像識別

// 引用 Interop.MODI.dll
// 識別率不是很高
private string OcrFunc(string imgfileName) // 參數為包含文本的圖片文件名
{
var langs = MODI.MiLANGUAGES.miLANG_ENGLISH;
// MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED; 中文含英文
// MODI.MiLANGUAGES.miLANG_JAPANESE; 日文含英文

var doc = new MODI.Document();
var image = default(MODI.Image);
var layout = default(MODI.Layout);

try
{
doc.Create(imgfileName);
doc.OCR(langs, true, true);
var sb = new StringBuilder();

for (int i = 0; i < doc.Images.Count; i++)
{
image = (MODI.Image)doc.Images[i];
layout = image.Layout;
sb.AppendLine(string.Format("{0}, {1}", i, layout.Text));
}
doc.Close(false);
return sb.ToString();
}
catch (System.Exception ex)
{
MessageBox.Show(ex.Message);
return string.Empty;
}
finally
{
layout = null;
image = null;
doc = null;
}
}

導航:首頁 > 編程語言 > 微軟ocr編程

微軟ocr編程

與微軟ocr編程相關的資料