导航:首页 > 编程语言 > python屏幕找图开源

python屏幕找图开源

发布时间:2022-07-27 20:47:28

python 区域找图是什么思路

可以参考如下代码:

importos
fromtimeimportsleep
frommyopencvimportImage
importX
importgdkutils
classXAuto:
_screensize=None
def__init__(self,tmp_img='/tmp/tmp%d.png'%os.getpid(),
default_threshold=0.7,default_rect=None):
self.d=X.Display()
self.tmp_img=tmp_img
self.default_threshold=default_threshold
self.default_rect=default_rect
deffind_and_click(self,*args,back=False,**kwargs):
pos=self.find(*args,**kwargs)
ifpos:
ifback:
self.click_and_back(pos)
else:
self.click(pos)
returnpos
deffind_and_moveto(self,*args,**kwargs):
pos=self.find(*args,**kwargs)
ifpos:
self.moveto(pos)
returnpos
defclick(self,pos=None,button=X.LEFT_BUTTON):
d=self.d
ifposisnotNone:
d.motion(pos)
d.button(button)
d.flush()
defwait(self,seconds):
sleep(seconds)
defclick_and_back(self,pos,button=X.LEFT_BUTTON):
d=self.d
old_pos=d.getpos()
d.motion(pos)
d.button(button)
d.motion(old_pos)
d.flush()
defmoveto(self,pos):
d=self.d
d.motion(pos)
d.flush()
defkey(self,keyname):
d=self.d
d.key(keyname)
d.flush()
deffind(self,img,threshold=None,rect=None,repeat=1,interval=0.2):
ifisinstance(img,str):
img=Image(img)
ifrectisNone:
rect=self.default_rector(0,0)+self.screensize
ifthresholdisNone:
threshold=self.default_threshold
tmp_img=self.tmp_img
for_inrange(repeat):
gdkutils.screenshot(tmp_img,rect)
sc=Image(tmp_img)
(x,y),similarity=sc.match(img)
ifsimilarity>threshold:
x+=rect[0]
y+=rect[1]
x+=img.width//2
y+=img.height//2
returnx,y
sleep(interval)
returnFalse
@property
defscreensize(self):
returnself._screensizeorgdkutils.get_screen_size()
def__del__(self):
try:
os.unlink(self.tmp_img)
exceptOSError:
pass
defmonitor_size(self,*args,**kwargs):
returngdkutils.get_monitor_size(*args,**kwargs)

❷ python如何进行多图查找匹配

不直达

❸ python有没有类似vb那种可视化编辑工具

没有,python不适合开发窗口程序。效率太太低了!建议用c系列

❹ Python如何图像识别

Python图片文本识别使用的工具是PIL和pytesser。因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy
pytesser是OCR开源项目的一个模块,在Python中导入这个模块即可将图片中的文字转换成文本。pytesser调用了tesseract。当在Python中调用pytesser模块时,pytesser又用tesseract识别图片中的文字。pytesser的使用步骤如下:

首先,安装Python2.7版本,这个版本比较稳定,建议使用这个版本。
其次,安装pythoncv。
然后,安装PIL工具,pytesser的使用需要PIL库的支持。
接着下载pytesser
最后,将pytesser解压,这个是免安装的,可以将解压后的文件cut到Python安装目录的Lib\site-packages下直接使用,比如我的安装目录是:C:\Python27\Lib\site-packages,同时把这个目录添加到环境变量之中。
完成以上步骤之后,就可以编写图片文本识别的Python脚本了。参考脚本如下:
from pytesser import *
import ImageEnhance
image = Image.open('D:\\workspace\\python\\5.png')
#使用ImageEnhance可以增强图片的识别率
enhancer = ImageEnhance.Contrast(image)
image_enhancer = enhancer.enhance(4)
print image_to_string(image_enhancer)

tesseract是谷歌的一个对图片进行识别的开源框架,免费使用,现在已经支持中文,而且识别率非常高,这里简要来个helloworld级别的认识
下载之后进行安装,不再演示。
在tesseract目录下,有个tesseract.exe文件,主要调用这个执行文件,用cmd运行到这个目录下,在这个目录下同时放置一张需要识别的图片,这里是123.jpg
然后运行:tesseract 123.jpg result
会把123.jpg自动识别并转换为txt文件到result.txt
但是此时中文识别不好
然后找到tessdata目录,把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
ok,现在中文识别基本达到90%以上了

❺ python图形化界面设计tkinter

python提供了多个图形开发界面的库,几个常用Python GUI库如下:

❻ 去哪里找python的开源项目

GitHub是一个面向开源及私有软件项目的托管平台,因为只支持git 作为唯一的版本库格式进行托管,故名GitHub。作为开源代码库以及版本控制系统,Github拥有超过900万开发者用户。随着越来越多的应用程序转移到了云上,Github已经成为了管理软件开发以及发现已有代码的首选方法。在GitHub,用户可以十分轻易地找到海量的开源代码。

下面给大家介绍一些GitHub上25个开源项目:

(1)TensorFlow Models

如果你对机器学习和深度学习感兴趣,一定听说过TensorFlow。TensorFlow Models是一个开源存储库,可以找到许多与深度学习相关的库和模型。

(GitHub: https://github.com/tensorflow/models )

(2)Keras

Keras是一个高级神经网络API,用Python编写,能够在TensorFlow,CNTK或Theano之上运行。旨在完成深度学习的快速开发(GitHub: https://github.com/keras-team/keras )

(3)Flask

Flask 是一个微型的 Python 开发的 Web 框架,基于Werkzeug WSGI工具箱和Jinja2 模板引擎,使用BSD授权。

(GitHub: https://github.com/pallets/flask )

(4)scikit-learn

scikit-learn是一个用于机器学习的Python模块,基于 NumPy、SciPy 和 matplotlib 构建。,并遵循 BSD 许可协议。

(GitHub: https://github.com/scikit-learn )

(5)Zulip

Zulip是一款功能强大的开源群聊应用程序,它结合了实时聊天的即时性和线程对话的生产力优势。Zulip作为一个开源项目,被许多世界500强企业,大型组织以及其他需要实时聊天系统的用户选择使用,该系统允许用户每天轻松处理数百或数千条消息。Zulip拥有超过300名贡献者,每月合并超过500次提交,也是规模最大,发展最快的开源群聊项目。

(GitHub: https://github.com/zulip/zulip )

相关推荐:《Python入门教程》

(6)Django

Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC)风格的 Web 应用程序框架,旨在快速开发出清晰,实用的设计。使用 Django,我们在几分钟之内就可以创建高品质、易维护、数据库驱动的应用程序。

(GitHub: https://github.com/django/django )

(7)Rebound

Rebound 是一个当你得到编译错误时即时获取 Stack Overflow 结果的命令行工具。 就用 rebound 命令执行你的文件。这对程序员来说方便了不少。

(GitHub: https://github.com/shobrook/rebound )

(8)Google Images Download

这是一个命令行python程序,用于搜索Google Images上的关键字/关键短语,并可选择将图像下载到您的计算机。你也可以从另一个python文件调用此脚本。

(GitHub: https://github.com/hardikvasa/google-images-download )

(9)YouTube-dl

youtube-dl 是基于 Python 的命令行媒体文件下载工具,完全开源免费跨平台。用户只需使用简单命令并提供在线视频的网页地址即可让程序自动进行嗅探、下载、合并、命名和清理,最终得到已经命名的完整视频文件。

(GitHub: htt ps://github.com/rg3/youtube-dl )

(10)System Design Primer

此repo是一个系统的资源集合,可帮助你了解如何大规模构建系统。

(GitHub: https://github.com/donnemartin/system-design-primer )

(11)Mask R-CNN

Mask R-CNN用于对象检测和分割。这是对Python 3,Keras和TensorFlow的Mask R-CNN实现。该模型为图像中对象的每个实例生成边界框和分割蒙版。它基于特Feature Pyramid Network(FPN)和 ResNet101 backbone。

(GitHub: https://github.com/matterport/Mask_RCNN )

(12)Face Recognition

Face Recognition 是一个基于 Python 的人脸识别库,使用十分简便。这还提供了一个简单的face_recognition命令行工具,可以让您从命令行对图像文件夹进行人脸识别!

(GitHub: https://github.com/ageitgey/face_recognition )

(13)snallygaster

用于扫描HTTP服务器上的机密文件的工具。

(GitHub: https://github.com/hannob/snallygaster )

(14)Ansible

Ansible是一个极其简单的IT自动化系统。它可用于配置管理,应用程序部署,云配置,支持远程任务执行和多节点发布 - 包括通过负载平衡器轻松实现零停机滚动更新等操作。

(GitHub: https://github.com/ansible/ansible )

(15)Detectron

Detectron是Facebook AI 研究院开源的的软件系统,它实现了最先进的目标检测算法,包括Mask R-CNN。它是用Python编写的,由Caffe2深度学习框架提供支持。

(16)asciinema

终端会话记录器和asciinema.org的最佳搭档。

(GitHub: https://github.com/asciinema/asciinema )

(17)HTTPie

HTTPie 是一个开源的命令行的 HTTP 工具包,其目标是使与Web服务的CLI交互尽可能人性化。它提供了一个简单的http命令,允许使用简单自然的语法发送任意HTTP请求,并显示彩色输出。HTTPie可用于测试,调试以及通常与HTTP服务器交互。

(GitHub: https://github.com/jakubroztocil/httpie )

(18)You-Get

You-Get是一个小型命令行实用程序,用于从Web下载媒体内容(视频,音频,图像),支持国内外常用的视频网站。

(GitHub: https://github.com/soimort/you-get )

(19)Sentry

Sentry从根本上讲是一项服务,可以帮助用户实时监控和修复崩溃。基于Django构建,它包含一个完整的API,用于从任何语言、任何应用程序中发送事件。

(GitHub: https://github.com/getsentry/sentry )

(20)Tornado

Tornado是使用Python开发的全栈式(full-stack)Web框架和异步网络库,,最初是由FriendFeed上开发的。通过使用非阻塞网络I / O,Tornado可以扩展到数万个开放连接,是long polling、WebSockets和其他需要为用户维护长连接应用的理想选择。

(GitHub: https://github.com/tornadoweb/tornado )

(21)Magenta

Magenta是一个探索机器学习在创造艺术和音乐过程中的作用的研究项目。这主要涉及开发新的深度学习和强化学习算法,用于生成歌曲,图像,绘图等。但它也是构建智能工具和界面的探索,它允许艺术家和音乐家使用这些模型。

(GitHub: https://github.com/tensorflow/magenta )

(22)ZeroNet

ZeroNet是一个利用比特币的加密算法和BitTorrent技术提供的不受审查的网络,完全开源。

(GitHub: https://github.com/HelloZeroNet/ZeroNet )

(23)Gym

OpenAI Gym是一个用于开发和比较强化学习算法的工具包。这是Gym的开源库,可让让你访问标准化的环境。

(GitHub: https://github.com/openai/gym )

(24)Pandas

Pandas是一个Python包,提供快速,灵活和富有表现力的数据结构,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。此外,它还有更广泛的目标,即成为所有语言中最强大,最灵活的开源数据分析/操作工具。它目前已经朝着这个目标迈进。

(GitHub: https://github.com/pandas-dev/pandas )

(25)Luigi

Luigi 是一个 Python 模块,可以帮你构建复杂的批量作业管道。处理依赖决议、工作流管理、可视化展示等等,内建 Hadoop 支持。(GitHub: https://github.com/spotify/luigi )

❼ python怎么在屏幕上画图

首先说你的要求有些不明确的部分
比如说你在所有窗体上写
那是否画图的同时还要拖动其他窗体?
这个要求的话
目前的python各种gui库貌似还没有支持到这么个绘画不规则窗体而不会挡住其他窗体还又在其上的;

如果只是在他们上面你可以画图而不用一定要拖动其他窗体的话
可以设计窗体为全屏大小,背景透明,不显示标题栏,然后用普通的画图函数就可以了
对了
推荐使用wxpython

❽ 最受欢迎的 15 大 Python 库有哪些

1、Pandas:是一个Python包,旨在通过“标记”和“关系”数据进行工作,简单直观。它设计用于快速简单的数据操作、聚合和可视化,是数据整理的完美工具。
2、Numpy:是专门为Python中科学计算而设计的软件集合,它为Python中的n维数组和矩阵的操作提供了大量有用的功能。该库提供了NumPy数组类型的数学运算向量化,可以改善性能,从而加快执行速度。
3、SciPy:是一个工程和科学软件库,包含线性代数,优化,集成和统计的模块。SciPy库的主要功能是建立在NumPy上,通过其特定子模块提供有效的数值例程,并作为数字积分、优化和其他例程。
4、Matplotlib:为轻松生成简单而强大的可视化而量身定制,它使Python成为像MatLab或Mathematica这样的科学工具的竞争对手。
5、Seaborn:主要关注统计模型的可视化(包括热图),Seaborn高度依赖于Matplotlib。
6、Bokeh:独立于Matplotlib,主要焦点是交互性,它通过现代浏览器以数据驱动文档的风格呈现。
7、Plotly:是一个基于Web用于构建可视化的工具箱,提供API给一些编程语言(Python在内)。
8、Scikits:是Scikits
Stack额外的软件包,专为像图像处理和机器学习辅助等特定功能而设计。它建立在SciPy之上,中集成了有质量的代码和良好的文档、简单易用并且十分高效,是使用Python进行机器学习的实际行业标准。
9、Theano:是一个Python软件包,它定义了与NumPy类似的多维数组,以及数学运算和表达式。此库是被编译的,可实现在所有架构上的高效运行。
10、TensorFlow:是数据流图计算的开源库,旨在满足谷歌对训练神经网络的高需求,并且是基于神经网络的机器学习系统DistBelief的继任者,可以在大型数据集上快速训练神经网络。
11、Keras:是一个用Python编写的开源的库,用于在高层的接口上构建神经网络。它简单易懂,具有高级可扩展性。
12、NLTK:主要用于符号学和统计学自然语言处理(NLP) 的常见任务,旨在促进NLP及相关领域(语言学,认知科学人工智能等)的教学和研究。
13、Gensim:是一个用于Python的开源库,为有向量空间模型和主题模型的工作提供了使用工具。这个库是为了高效处理大量文本而设计,不仅可以进行内存处理,还可以通过广泛使用NumPy数据结构和SciPy操作来获得更高的效率。

阅读全文

与python屏幕找图开源相关的资料

热点内容
wpsppt怎么转pdf格式 浏览:86
腾讯文档在线编辑怎么添加密码 浏览:868
本地不能访问服务器地址 浏览:865
访问服务器命令 浏览:835
华为云服务器分销商 浏览:954
Linux定位内存泄露 浏览:198
工程加密狗视频 浏览:720
不在内网怎么连接服务器 浏览:664
云服务器app安卓下载 浏览:966
如何查看linux服务器的核心数 浏览:137
交易平台小程序源码下载 浏览:148
程序员记笔记用什么app免费的 浏览:646
java与单片机 浏览:897
服务器内网如何通过公网映射 浏览:478
程序员穿越到宋代 浏览:624
怎么使用云服务器挂游戏 浏览:618
真实的幸福pdf 浏览:344
d盘php调用c盘的mysql 浏览:266
怎么样搭建源码网站 浏览:429
新概念四册pdf 浏览:364