python图像识别图形字母_Python如何图像识别

‘壹’ python如何图像识别

pillow包可以处理图像
pillow：（了解）（python image library）是一个有关图像图片处理的包，这个包底层用的C C++,但PIL包是python2下使用。所以又更新了一个适合python3版本的、基于PIL包的新包pillow。
安装pillow：
pip install pillow
至于识别，那就可能是文字识别或人脸识别。这需要学习很多东西，建议小白还是先把基础学好吧。

‘贰’ 如何学习python 图像识别

图像识别技术可以用来解决人脸识别或字符识别等多种问题。在本文中，我将对算法进行实际编码来演示识别手写字，特别是手写的数字。我将会使用Python以及Python的许多模块，比如numpy、PIL等。 1 #从PIL库中导入Image

‘叁’ Python如何图像识别

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件，为了避免一个个工具的安装，建议使用pythonxy
pytesser是OCR开源项目的一个模块，在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时，pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下：

首先，安装Python2.7版本，这个版本比较稳定，建议使用这个版本。
其次，安装pythoncv。
然后，安装PIL工具，pytesser的使用需要PIL库的支持。
接着下载pytesser
最后，将pytesser解压，这个是免安装的，可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用，比如我的安装目录是：C:\Python27\Lib\site-packages，同时把这个目录添加到环境变量之中。
完成以上步骤之后，就可以编写图片文本识别的Python脚本了。参考脚本如下：
from pytesser import *
import ImageEnhance
image = Image.open('D:\\workspace\\python\\5.png')
#使用ImageEnhance可以增强图片的识别率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架，免费使用，现在已经支持中文，而且识别率非常高，这里简要来个helloworld级别的认识
下载之后进行安装，不再演示。
在tesseract目录下，有个tesseract.exe文件，主要调用这个执行文件，用cmd运行到这个目录下，在这个目录下同时放置一张需要识别的图片，这里是123.jpg
然后运行:tesseract 123.jpg result
会把123.jpg自动识别并转换为txt文件到result.txt
但是此时中文识别不好
然后找到tessdata目录，把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
ok,现在中文识别基本达到90%以上了

‘肆’ 如何python pil开发图像识别

1. 简介。

图像处理是一门应用非常广的技术，而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL （Python Imaging Library）是 Python 中最常用的图像处理库，目前版本为 1.1.7，我们可以在这里下载学习和查找资料。

Image 类是 PIL 库中一个非常重要的类，通过这个类来创建实例可以有直接载入图像文件，读取处理过的图像和通过抓取的方法得到的图像这三种方法。

2. 使用。

导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败，则会引起一个 IOError ；若无返回错误，则 open 函数返回一个 Image 对象。现在，我们可以通过一些对象属性来检查文件内容，即：

1 >>> import Image
2 >>> im = Image.open("j.jpg")
3 >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

这里有三个属性，我们逐一了解。

format : 识别图像的源格式，如果该文件不是从文件中读取的，则被置为 None 值。

size : 返回的一个元组，有两个元素，其值为象素意义上的宽和高。

mode : RGB（true color image），此外还有，L（luminance），CMTK（pre-press image）。

现在，我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如，显示最新载入的图像：

1 >>>im.show()
2 >>>

输出原图：

3.5 更多关于图像文件的读取。

最基本的方式：im = Image.open("filename")

类文件读取：fp = open("filename", "rb"); im = Image.open(fp)

字符串数据读取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

从归档文件读取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就练习到这里。其他函数的功能可点击这里进一步阅读。

‘伍’ Python如何图像识别

1.提取待检索电影的每一帧图像的局部敏感哈希 (Locality Sensitive Hashing; LSH) 特征, 并保存下来, 不妨称为库 (gallery). LSH 特征可以用整型来表示, 一般是6...
2.来了一张查询图像 (query), 也计算它的 LSH 特征. 然后与预先保存下来的库中的每个 LSH 特征都计算 Hamming 距离, 返回库中与查询图像 LSH 特征距离最小 (或距离小于指定阈值) ...

‘陆’ Python如何图像识别

首先，先定位好问题是属于图像识别任务中的哪一类，最好上传一张植物叶子的图片。因为目前基于深度学习的卷积神经网络（CNN）确实在图像识别任务中取得很好的效果，深度学习属于机器学习，其研究的范式，或者说处理图像的步骤大体上是一致的。

1、第一步，准备好数据集，这里是指，需要知道输入、输出（视任务而定，针对你这个问题，建议使用有监督模型）是什么。你可以准备一个文件夹，里面存放好植物叶子的图像，而每张图像对应一个标签（有病/没病，或者是多类别标签，可能具体到哪一种病）。
具体实现中，会将数据集分为三个：训练集（计算模型参数）、验证集（调参，这个经常可以不需要实现划分，在python中可以用scikit-learn中的函数解决。测试集用于验证模型的效果，与前面两个的区别是，模型使用训练集和验证集时，是同时使用了输入数据和标签，而在测试阶段，模型是用输入+模型参数，得到的预测与真实标签进行对比，进而评估效果。
2、确定图像识别的任务是什么？

图像识别的任务可以分为四个：图像分类、目标检测、语义分割、实例分割，有时候是几个任务的结合。
图像分类是指以图像为输入，输出对该图像内容分类的描述，可以是多分类问题，比如猫狗识别。通过足够的训练数据（猫和狗的照片-标签，当然现在也有一系列的方法可以做小样本训练，这是细节了，这里并不敞开讲），让计算机/模型输出这张图片是猫或者狗，及其概率。当然，如果你的训练数据还有其它动物，也是可以的，那就是图像多分类问题。
目标检测指将图像或者视频中的目标与不感兴趣的部分区分开，判断是否存在目标，并确定目标的具体位置。比如，想要确定这只狗所佩戴的眼睛的位置，输入一张图片，输出眼睛的位置（可视化后可以讲目标区域框出来）。

看到这里，应该想想植物叶子诊断疾病的问题，只需要输入一整张植物叶子的图片，输出是哪种疾病，还是需要先提取叶子上某些感兴趣区域（可能是病变区域），在用病变区域的特征，对应到具体的疾病？
语义分割是当今计算机视觉领域的关键问题之一，宏观上看，语义分割是一项高层次的任务。其目的是以一些原始图像作为输入，输出具有突出显示的感兴趣的掩膜，其实质上是实现了像素级分类。对于输入图片，输出其舌头区域（注意可以是不规则的，甚至不连续的）。

而实例分割，可以说是在语义分割的基础上，在像素层面给出属于每个实例的像素。

看到这里，可以具体思考下自己的问题是对应其中的哪一类问题，或者是需要几种任务的结合。

3、实际操作
可以先通过一个简单的例子入手，先了解构建这一个框架需要准备什么。手写数字识别可以说是深度学习的入门数据集，其任务也经常作为该领域入门的案例，也可以自己在网上寻找。

‘柒’ python opencv查找某图片是否包含字母a

能查找图片中是否包含字母A，就能查找图片中是否包含B。
能查找图片中是否包含A、B，就能查找图片中都包含哪些字母。
能查找图片中都包含哪些字母，就能做一个验证码识别或者车牌识别的程序出来。

所以，你可以去查一下验证码识别或者车牌识别的源码。问题就搞定了。
就说到这了。

‘捌’ python3.5能用的图片识别库，可以识别图片上的英文数字和汉字

先看看你的Visual Studio 14 运行库（64位的系统X86/X64的最好都装上）是不是没有装，如果没有安装的话先装上；如果已经安装了的话，修复一下看看。如果还不行的话那就意味着这些库暂时还不支持Python 3.5.2，还得耐心等待或者使用其他能实现所需要功能的库。你可以试试下载EXE文件自己安装，或者下载源码自己编译。
我在我的电脑（XP/Python3.4.4）上用pip安装试了一下，tesseract-ocr安装不上，其他两个没有问题，估计暂时还不支持Python3.X吧。
tesseract-ocr的EXE安装包下载地址：https://sourceforge.net/projects/tesseract-ocr-alt/files/?source=navbar
我没有尝试使用EXE安装包安装楼主可以自己尝试一下。
希望对楼主有帮助。

‘玖’ (源码分享)利用Python识别提取图像文字（中文英文都可以）

你想了解怎么利用程序自动识别网站验证码吗？识别提取图像文字（中文英文都可以）

分享一点简单有用的小项目：python

源码分享如下：

看视频教程链接：（点击识别图像文字视频教程链接）

一、首先需要安装 Tesseract模块及 语言包

Tesseract OCR光学字符识别

Windows系统：

安装网站（放在不需要权限的纯英文路径下）：
： https://digi.bib.uni-mannheim.de/tesseract/

可以下载一些语言包：

https://github.com/tesseract-ocr/

安装完成后，如果想要在命令行中使用Tesseract，那么应该设置环境变量。

还有一个环境变量需要设置的是，要把训练的数据文件路径也放到环境变量中。
在环境变量中，添加一个TESSDATA_PREFIX=C:path_to_tesseractdata eseractdata。

在Python代码中操作tesseract。需要安装一个库，叫做pytesseract。通过pip的方式即可安装：

pip install pytesseract

并且，需要读取图片，需要借助一个第三方库叫做PIL。通过pip list看下是否安装。如果没有安装，通过pip的方式安装：

pip install PIL

使用pytesseract将图片上的文字转换为文本文字的示例代码如下：

‘拾’ Python如何图像识别

提取待检索电影的每一帧图像的局部敏感哈希 (Locality Sensitive Hashing; LSH) 特征, 并保存下来, 不妨称为库 (gallery). LSH 特征可以用整型来表示, 一般是6...
2.来了一张查询图像 (query), 也计算它的 LSH 特征. 然后与预先保存下来的库中的每个 LSH 特征都计算 Hamming 距离, 返回库中与查询图像 LSH 特征距离最小 (或距离小于指定阈值) ...

导航:首页 > 编程语言 > python图像识别图形字母

python图像识别图形字母

与python图像识别图形字母相关的资料