python圖像識別圖形字母_Python如何圖像識別

『壹』 python如何圖像識別

pillow包可以處理圖像
pillow：（了解）（python image library）是一個有關圖像圖片處理的包，這個包底層用的C C++,但PIL包是python2下使用。所以又更新了一個適合python3版本的、基於PIL包的新包pillow。
安裝pillow：
pip install pillow
至於識別，那就可能是文字識別或人臉識別。這需要學習很多東西，建議小白還是先把基礎學好吧。

『貳』如何學習python 圖像識別

圖像識別技術可以用來解決人臉識別或字元識別等多種問題。在本文中，我將對演算法進行實際編碼來演示識別手寫字，特別是手寫的數字。我將會使用Python以及Python的許多模塊，比如numpy、PIL等。 1 #從PIL庫中導入Image

『叄』 Python如何圖像識別

Python圖片文本識別使用的工具是PIL和pytesser。因為他們使用到很多的python庫文件，為了避免一個個工具的安裝，建議使用pythonxy
pytesser是OCR開源項目的一個模塊，在Python中導入這個模塊即可將圖片中的文字轉換成文本。pytesser調用了tesseract。當在Python中調用pytesser模塊時，pytesser又用tesseract識別圖片中的文字。pytesser的使用步驟如下：

首先，安裝Python2.7版本，這個版本比較穩定，建議使用這個版本。
其次，安裝pythoncv。
然後，安裝PIL工具，pytesser的使用需要PIL庫的支持。
接著下載pytesser
最後，將pytesser解壓，這個是免安裝的，可以將解壓後的文件cut到Python安裝目錄的Lib\site-packages下直接使用，比如我的安裝目錄是：C:\Python27\Lib\site-packages，同時把這個目錄添加到環境變數之中。
完成以上步驟之後，就可以編寫圖片文本識別的Python腳本了。參考腳本如下：
from pytesser import *
import ImageEnhance
image = Image.open('D:\\workspace\\python\\5.png')
#使用ImageEnhance可以增強圖片的識別率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

tesseract是谷歌的一個對圖片進行識別的開源框架，免費使用，現在已經支持中文，而且識別率非常高，這里簡要來個helloworld級別的認識
下載之後進行安裝，不再演示。
在tesseract目錄下，有個tesseract.exe文件，主要調用這個執行文件，用cmd運行到這個目錄下，在這個目錄下同時放置一張需要識別的圖片，這里是123.jpg
然後運行:tesseract 123.jpg result
會把123.jpg自動識別並轉換為txt文件到result.txt
但是此時中文識別不好
然後找到tessdata目錄，把eng.traineddata替換為chi_sim.traineddata,並且把chi_sim.traineddata重命名為eng.traineddata
ok,現在中文識別基本達到90%以上了

『肆』如何python pil開發圖像識別

1. 簡介。

圖像處理是一門應用非常廣的技術，而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL （Python Imaging Library）是 Python 中最常用的圖像處理庫，目前版本為 1.1.7，我們可以在這里下載學習和查找資料。

Image 類是 PIL 庫中一個非常重要的類，通過這個類來創建實例可以有直接載入圖像文件，讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。

2. 使用。

導入 Image 模塊。然後通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗，則會引起一個 IOError ；若無返回錯誤，則 open 函數返回一個 Image 對象。現在，我們可以通過一些對象屬性來檢查文件內容，即：

1 >>> import Image
2 >>> im = Image.open("j.jpg")
3 >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

這里有三個屬性，我們逐一了解。

format : 識別圖像的源格式，如果該文件不是從文件中讀取的，則被置為 None 值。

size : 返回的一個元組，有兩個元素，其值為象素意義上的寬和高。

mode : RGB（true color image），此外還有，L（luminance），CMTK（pre-press image）。

現在，我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如，顯示最新載入的圖像：

1 >>>im.show()
2 >>>

輸出原圖：

3.5 更多關於圖像文件的讀取。

最基本的方式：im = Image.open("filename")

類文件讀取：fp = open("filename", "rb"); im = Image.open(fp)

字元串數據讀取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

從歸檔文件讀取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就練習到這里。其他函數的功能可點擊這里進一步閱讀。

『伍』 Python如何圖像識別

1.提取待檢索電影的每一幀圖像的局部敏感哈希 (Locality Sensitive Hashing; LSH) 特徵, 並保存下來, 不妨稱為庫 (gallery). LSH 特徵可以用整型來表示, 一般是6...
2.來了一張查詢圖像 (query), 也計算它的 LSH 特徵. 然後與預先保存下來的庫中的每個 LSH 特徵都計算 Hamming 距離, 返回庫中與查詢圖像 LSH 特徵距離最小 (或距離小於指定閾值) ...

『陸』 Python如何圖像識別

首先，先定位好問題是屬於圖像識別任務中的哪一類，最好上傳一張植物葉子的圖片。因為目前基於深度學習的卷積神經網路（CNN）確實在圖像識別任務中取得很好的效果，深度學習屬於機器學習，其研究的範式，或者說處理圖像的步驟大體上是一致的。

1、第一步，准備好數據集，這里是指，需要知道輸入、輸出（視任務而定，針對你這個問題，建議使用有監督模型）是什麼。你可以准備一個文件夾，裡面存放好植物葉子的圖像，而每張圖像對應一個標簽（有病/沒病，或者是多類別標簽，可能具體到哪一種病）。
具體實現中，會將數據集分為三個：訓練集（計算模型參數）、驗證集（調參，這個經常可以不需要實現劃分，在python中可以用scikit-learn中的函數解決。測試集用於驗證模型的效果，與前面兩個的區別是，模型使用訓練集和驗證集時，是同時使用了輸入數據和標簽，而在測試階段，模型是用輸入+模型參數，得到的預測與真實標簽進行對比，進而評估效果。
2、確定圖像識別的任務是什麼？

圖像識別的任務可以分為四個：圖像分類、目標檢測、語義分割、實例分割，有時候是幾個任務的結合。
圖像分類是指以圖像為輸入，輸出對該圖像內容分類的描述，可以是多分類問題，比如貓狗識別。通過足夠的訓練數據（貓和狗的照片-標簽，當然現在也有一系列的方法可以做小樣本訓練，這是細節了，這里並不敞開講），讓計算機/模型輸出這張圖片是貓或者狗，及其概率。當然，如果你的訓練數據還有其它動物，也是可以的，那就是圖像多分類問題。
目標檢測指將圖像或者視頻中的目標與不感興趣的部分區分開，判斷是否存在目標，並確定目標的具體位置。比如，想要確定這只狗所佩戴的眼睛的位置，輸入一張圖片，輸出眼睛的位置（可視化後可以講目標區域框出來）。

看到這里，應該想想植物葉子診斷疾病的問題，只需要輸入一整張植物葉子的圖片，輸出是哪種疾病，還是需要先提取葉子上某些感興趣區域（可能是病變區域），在用病變區域的特徵，對應到具體的疾病？
語義分割是當今計算機視覺領域的關鍵問題之一，宏觀上看，語義分割是一項高層次的任務。其目的是以一些原始圖像作為輸入，輸出具有突出顯示的感興趣的掩膜，其實質上是實現了像素級分類。對於輸入圖片，輸出其舌頭區域（注意可以是不規則的，甚至不連續的）。

而實例分割，可以說是在語義分割的基礎上，在像素層面給出屬於每個實例的像素。

看到這里，可以具體思考下自己的問題是對應其中的哪一類問題，或者是需要幾種任務的結合。

3、實際操作
可以先通過一個簡單的例子入手，先了解構建這一個框架需要准備什麼。手寫數字識別可以說是深度學習的入門數據集，其任務也經常作為該領域入門的案例，也可以自己在網上尋找。

『柒』 python opencv查找某圖片是否包含字母a

能查找圖片中是否包含字母A，就能查找圖片中是否包含B。
能查找圖片中是否包含A、B，就能查找圖片中都包含哪些字母。
能查找圖片中都包含哪些字母，就能做一個驗證碼識別或者車牌識別的程序出來。

所以，你可以去查一下驗證碼識別或者車牌識別的源碼。問題就搞定了。
就說到這了。

『捌』 python3.5能用的圖片識別庫，可以識別圖片上的英文數字和漢字

先看看你的Visual Studio 14 運行庫（64位的系統X86/X64的最好都裝上）是不是沒有裝，如果沒有安裝的話先裝上；如果已經安裝了的話，修復一下看看。如果還不行的話那就意味著這些庫暫時還不支持Python 3.5.2，還得耐心等待或者使用其他能實現所需要功能的庫。你可以試試下載EXE文件自己安裝，或者下載源碼自己編譯。
我在我的電腦（XP/Python3.4.4）上用pip安裝試了一下，tesseract-ocr安裝不上，其他兩個沒有問題，估計暫時還不支持Python3.X吧。
tesseract-ocr的EXE安裝包下載地址：https://sourceforge.net/projects/tesseract-ocr-alt/files/?source=navbar
我沒有嘗試使用EXE安裝包安裝樓主可以自己嘗試一下。
希望對樓主有幫助。

『玖』 (源碼分享)利用Python識別提取圖像文字（中文英文都可以）

你想了解怎麼利用程序自動識別網站驗證碼嗎？識別提取圖像文字（中文英文都可以）

分享一點簡單有用的小項目：python

源碼分享如下：

看視頻教程鏈接：（點擊識別圖像文字視頻教程鏈接）

一、首先需要安裝 Tesseract模塊及 語言包

Tesseract OCR光學字元識別

Windows系統：

安裝網站（放在不需要許可權的純英文路徑下）：
： https://digi.bib.uni-mannheim.de/tesseract/

可以下載一些語言包：

https://github.com/tesseract-ocr/

安裝完成後，如果想要在命令行中使用Tesseract，那麼應該設置環境變數。

還有一個環境變數需要設置的是，要把訓練的數據文件路徑也放到環境變數中。
在環境變數中，添加一個TESSDATA_PREFIX=C:path_to_tesseractdata eseractdata。

在Python代碼中操作tesseract。需要安裝一個庫，叫做pytesseract。通過pip的方式即可安裝：

pip install pytesseract

並且，需要讀取圖片，需要藉助一個第三方庫叫做PIL。通過pip list看下是否安裝。如果沒有安裝，通過pip的方式安裝：

pip install PIL

使用pytesseract將圖片上的文字轉換為文本文字的示例代碼如下：

『拾』 Python如何圖像識別

提取待檢索電影的每一幀圖像的局部敏感哈希 (Locality Sensitive Hashing; LSH) 特徵, 並保存下來, 不妨稱為庫 (gallery). LSH 特徵可以用整型來表示, 一般是6...
2.來了一張查詢圖像 (query), 也計算它的 LSH 特徵. 然後與預先保存下來的庫中的每個 LSH 特徵都計算 Hamming 距離, 返回庫中與查詢圖像 LSH 特徵距離最小 (或距離小於指定閾值) ...

導航:首頁 > 編程語言 > python圖像識別圖形字母

python圖像識別圖形字母

與python圖像識別圖形字母相關的資料