Ⅰ [python练手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云
这个项目的github地址。 https://github.com/susususuhanmo/QQChatLogWordCloud
最近准备开始学习python,写一个综合一点的小demo练练手~
读取文件
编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词:
分词,分词结果如果出现一些特有的词语截了一半或者截多了几个字符的情况,可以手动添加分词词库。
根据关键词数据,建立pandas的DataFrame,通过停词词库过滤掉一些中文中不适合做关键词的词语,进行关键词数统计并根据次数排序。
词云属性解释
调整成120之后就好看很多,有很明显的差别。
设置图片为可爱的莫古力
根据这个莫古力的颜色分布,生成的词云如下,我这个不是特别好看,大家可以选择轮廓明显一点的图片来生成。
相比默认的模式,
关于更详细的词云配置可以看这篇文章,这个作者对wordcloud的配置讲解的十分详细。
https://blog.csdn.net/heyuexianzi/article/details/76851377
在你想导出的人或群处右键,点导出消息记录,
然后选择txt格式
Ⅱ 想要用python3做个软件对网页自动化操作,需要搭建什么环境,如何实现
只用python就行了啊。vs和pycharm都算是编辑器没什么关系啊,就是用记事本编辑也行哦。那就用pycharm吧,大家都吹嘘它好用。
就是用python的urllib模块请求网页就可以了。
登录就是post数据,然后获得cookie(可能还有一下其他的东西),带着它就可以做一些评论。
评论就是根据按钮找到相关的网页链接,向它post/get数据。
评论采集就是请求相关的网页,获得评论的数据,可能是html或者json之类的,然后用beautifulsoup或者json分析,获得格式化后的数据。
以前用Python做过一个空间的自动点赞、自动回复说说留言、获取留言的程序。
只要就是分析链接和js脚本费点时间。其他地方都简单。
Ⅲ python自动化工具:pywinauto
Pywinauto是完全由Python构建的一个模块,可以用于自动化 Windows 上的 GUI 应用程序。同时,它支持鼠标、键盘操作,在元素控件树较复杂的界面,可以辅助我们完成自动化操作。
我在工作中,主要是使用pywinauto来辅助做一些操作,来完成自动化测试。
先要确认本地有python环境,然后可以通过命令行安装pywinauto:
如果你是使用ide,可以通过ide安装,比如我习惯使用pycharm,就可以在Project Interpreter中添加pywinauto:
还有一些手动安装的方法,但是有点繁琐,不是很推荐,这里就不介绍了。
Pywinauto要操作应用,首先需要访问应用,主要有两种访问技术。WIN32访问技术支持MFC、VB6、VCL、简单WinForms控件开发的应用,MS UI Automation访问技术支持WinForms、WPS、QT5、WPF、Store apps、browsers等开发的应用。
win32 API的backend为“ win32 ”,MS UI Automation的backend为“ uia ”。
Pywinauto中使用的backend默认为win32。可使用spy++或者Inspect工具判断backend适合选哪种。例如:如果使用py_inspect的uia模式,可见的控件和属性更多的话,backend可选uia,反之,backend可选win32。
这里提一下常用的分析工具:
我个人常用的是py_inspect和spy++。
多数情况下都是需要打开应用的,实现方式也很简单:
backend参数根据实际情况选择传uia还是win32。
start方法其实可以传两个参数,除了目标应用的启动程序地址,还可以传一个timeout,如果不传,默认是5s。如果你的目标程序启动、运行都很慢,可以将timeout设置久一点。
如果要操控的应用已经处于启动状态,可以直接进行连接,而连接方式有多种可以选择:
其中Windows的pid可以通过任务管理器进行查看:
但是我在实际操作的时候使用窗口句柄没有成功过,可能是我使用姿势不对,不过还是不推荐使用窗口句柄。
title_re参数传递的是应用的部分名称,class_name可以通过py_inspect查询到。
前面获取的对象都是应用,但是我们实际操作的是应用窗口,这里就来介绍怎么获取窗口和对话框。
最常用的是通过 title定位:
如果不清楚定位工具中的title在哪个位置,显示的是什么,可以通过print_control_identifiers()方法将所有的title都打印出来:
通过title定位的时候需要注意一下中英文的影响,如果是中文,可能会有编码问题,需要转码。
title其实只是window()方法中的一种关键字参数,window()方法可以接收很多中的关键字参数,且这些参数可以组合使用,例如这样:
主要参数有这些:
通过top_window()也能比较容易地获取到窗口,但是这个方法获取的是 程序的顶级窗口,但可能不是Z-Order中的顶级窗口。所以这个方法使用的时候多调试几次。
窗口的操作主要有最小化、最大化、恢复、关闭窗口:
控件的定位其实和窗口的定位基本一致,不太清楚为什么pywinauto在设计的时候会将窗口和控件作为一类东西。
相对于前面定位窗口的window()方法,定位控件的时候推荐使用child_window(),因为直接使用windows()的话,如果控件不是在当前窗口的子控件,是子子控件,就会定位不到,而child_window()方法就不会有这个问题,当然相对的缺点就是当控件深度太深的时候,执行这个方法会比较耗时。
child_window()方法传递的参数和window()是一样的。
控件自带了一些操作方法:
当这些不好用的时候,比如你的控件不支持点击,但是你又想点击一下,可以使用鼠标操作的一些方法:
测试过程中可能会需要截图作为证据,截图的方法也比较简单:
pywinauto也提供了键盘操作的方法:
pywinauto有几个设置等待时间的方式,这里介绍一个:
这里简单的演示一下用Wireshark自动抓包并保存:
PC端自动化测试使用到的python模块主要有pywinauto、win32gui、pyautogui。这里介绍的p ywinauto主要使用到Application类,用于应用程序管理(打开与关闭应用等)、窗口管理(最小化、最大化、关闭窗口)、控件操作。
pywinauto的功能其实挺丰富的,但是真正用到的其实只是其中很小的一块,感兴趣的同学可以多去官网翻一翻。
Ⅳ 如何用python登陆qq读取信息
一次偶然的机会我看见了一个群里的一个QQ号总是根据你所发的消息自动回复,当时很感觉到神奇,我知道可以模拟登录网站,没想到竟然也能模拟登录QQ,首先自己想到的就是如何实现模拟登录PC端的QQ, 开始研究了下,发现QQ所发送的包都很难理解。
于是就转到了网页版的QQ,因为在网页里可以捕获所有的请求从而更好的实现模拟功能!
首先第一步就是打开网页版的qq,打开浏览器的开发者模式 这里可以监控所有的请求!
打开登录界面的的时候
会捕捉到一个GET请求
其中uin是你的QQ号
返回值是 ptui_checkVC('1','','x00x00x00x00x00xa1x92x12');
其中1表示需要验证码 还有一种返回值 ptui_checkVC('0','!LJV','x00x00x00x00x00xa1x92x12') 这种表示是不需要的验证码的
[python]view plain
defCheckVerify(self,uin):
check="h"
check=check.replace('{uin}',uin)
pattern=re.compile("ptui_checkVC′(.∗)′,′(.∗)′,′(.∗)′;")
result=self.Get(check)
checked=pattern.search(result).groups()
print'Step1:CheckVerify'
returnchecked
获取验证码的方法
defGetVerify(self):
#url='hage?&uin='+str(self.QQ)+'&aid=1002101&0.45644426648505'+str(random.randint(10,99))
verify="htqq.com/getimage?aid=1003903&r=0.6472875226754695&uin={QQ}&cap_cd=aSD-ZVcNEcozlZUurhNYhp-MBHf4hjbJ"
verify=verify.replace('{QQ}',self.QQ)
path=r"c:/verify/1.jpg"
#data=urllib.urlretrieve(url,path)
data=urllib2.urlopen(verify)
localPic=open(r"c:/verify/1.jpg",'wb')
localPic.write(data.read())
localPic.close()
data.close()
输入用户名和密码 还有验证码后发送一个GET请求
这里面u代表账号 p代表密码 密码是经过一定算法加密的 verify是验证码
加密算法如下
defPasswordSecret(self,password,v1,v2,md5=True):
ifmd5==True:
password=self.PCMd5(password).upper()
length=len(password)
temp=''
foriinrange(0,length,2):
temp+=r'x'+password[i:i+2]
returnself.PCMd5(self.PCMd5(self.hex2asc(temp)+self.hex2asc(v2)).upper()+v1).upper()
#md5加密函数
defPCMd5(self,s):
h=hashlib.md5()
h.update(s)
returnh.hexdigest()
#16进制转字符
defhex2asc(self,s):
_str="".join(s.split(r'x'))
length=len(_str)
data=''
foriinrange(0,length,2):
data+=chr(int(_str[i:i+2],16))
returndata
然后是登录部分代码
defLogin(self,uin,pwd):
#获取参数
cheked=self.CheckVerify(uin)
#加密密码
#pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
#pwd=self.PasswordSecret(pwd,r'AAST',r'x00x00x00x00x00xa1x92x12')
loginurl="h&t=1&g=1&js_type=0&js_ver=10080&login_sig=YPD0P*&pt_uistyle=5"
loginurl=loginurl.replace('{uin}',uin)
#loginurl=loginurl.replace('{pwd}',pwd)
#loginurl=loginurl.replace('{verify}',cheked[1])
#result=Get(loginurl)
if(cheked[0]=="1"):
#下载验证码
self.GetVerify()
image=Image.open(r"c:/verify/1.jpg")
image.show()
code=raw_input("verifycode:").strip()
loginurl=loginurl.replace('{verify}',code.upper())
pwd=self.PasswordSecret(pwd,r''+code.upper(),cheked[2])
#pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
else:
loginurl=loginurl.replace('{verify}',cheked[1])
pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
loginurl=loginurl.replace('{pwd}',pwd)
result=self.Get(loginurl,'ssl.ptlogin2.qq.com','hin2.qq.com/cgi-bin/login?daid=164&target=self&style=5&mibao_css=m_webqq&appid=1003903&enable_qlogin=0&no_verifyimg=1&s_urlm%2Floginproxy.html&f_url=loginerroralert&strong_login=1&login_state=10&t=20140514001',None)
print'Step2:Login'
pattern=re.compile("ptuiCB′(.∗)′,′(.∗)′,′(.∗)′,′(.∗)′,′(.∗)′,s′(.∗)′;")
ret=pattern.search(result).groups()
#获取必要的cookie否则第二次登陆会出错
self.Get(ret[2])
print'Step3:GetCookie'
forcinself.cj:
ifc.name=="ptwebqq":
self.ptwebqq=c.value
returnresult
登录成功后服务器会返回一串json数据
ptuiCB('0','0','ebqq_type%3D10&f_url=&ptlang=2052&ptredirect=100&aid=1003903&daid=164&j_later=0&low_login_hour=0®master=0&pt_login_type=1&pt_aid=0&pt_aaid=0&pt_light=0','0','登录成功!', '小竹');
第一个为0 就表示登录成功了 ,但是这并没有真正的登录成功
上面的返回值中的url是用来获取一个关键cookie的 那就是ptwebqq
然后进行第二次登录,这次才是真正的登录
请求如下
Accept:*/*
Accept-Encoding:gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8
Connection:keep-alive
Content-Length:244
Content-Type:application/x-www-form-urlencoded
Cookie:o_cookie=455910092; RK=fMEaWEZ0Qc; ts_last=web2.qq.com/; ts_refer=www..com/; ts_uid=4588821804; pgv_pvid=914251705; pgv_info=ssid=s3525422600&pgvReferrer=; verifysession=h02LeYrtarkWBZeSu_czkiczeNSNlDm7V1mCm-**; ptui_loginuin=10588690; ptisp=cnc; ptcz=; ptwebqq=; pt2gguin=o0010588690; uin=o0010588690; skey=@gmEO6N2JD; p_uin=o0010588690; p_skey=cZ5*kS-_; pt4_token=1SyuJ39Eq6oKEwEhGIizeg__
Host:d.web2.qq.com
Origin:h
Referer:htttml?v=20110331002&callback=1&id=2
User-Agent:Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36
Form Dataview sourceview URL encoded
r:{"status":"online","ptwebqq":"","passwd_sig":"","clientid":"7963288","psessionid":null}
clientid:7963288
psessionid:null
其中的ptwebqq就是刚才我们从cookie中获取的
这部分代码是
defLogin2(self):
try:
url="htel/login2"
postdata="r=%7B%22status%22%3A%22online%22%2C%22ptwebqq%22%3A%22{$ptwebqq}%22%2C%22passwd_sig%22%3A%22%22%2C%22clientid%22%3A%22{$clientid}%22%2C%22psessionid%22%3Anull%7D&clientid={$clientid}&psessionid=null"
postdata=postdata.replace("{$ptwebqq}",self.ptwebqq)
postdata=postdata.replace("{$clientid}",str(self.clientid))
print'Step4:Login2'
result=self.Post(url,postdata,QQRobot.HOST[0],QQRobot.REFERER[0],QQRobot.ORIGIN[0])
retjson=json.loads(result)
retjson=retjson["result"]
returnretjson
exceptException,e:
print"Login2error"+str(e)
第二次登陆成功后会返回一个
'''{"retcode":0,
"result":{
"uin":10588690,
"cip":1707901841,
"index":1075,
"port":59571,
"status":"online",
"vfwebqq":"85c31018d2",
"psessionid":"85c31018d2",
"user_state":0,
"f":0
}
}'''
这样的数据结构 其中0表示登陆成功
需要把这写数据保存下来 后面进行操作需要
登陆成功后我们就可以拉去群列表了
#获取群列表信息
defGetGroupNameList(self,vfwebqq):
try:
url="h/get_group_name_list_mask2"
postdata="r=%7B%22vfwebqq%22%3A%22{$vfwebqq}%22%7D"
postdata=postdata.replace("{$vfwebqq}",vfwebqq)
ret=self.Post(url,postdata,QQRobot.HOST[1],QQRobot.REFERER[1],QQRobot.ORIGIN[1])
print'Step5:GetGroupList'
retjson=json.loads(ret)
retjson=retjson["result"]
self.grouplist=retjson
forgroupinself.grouplist['gnamelist']:
printgroup["code"],group["name"]
exceptException,e:
Ⅳ Python如何实现定时发送qq消息
因为生活中老是忘记各种事情,刚好又在学python,便突发奇想通过python实现提醒任务的功能(尽管TIM有定时功能),也可定时给好友、群、讨论组发送qq消息。其工作流程是:访问数据库提取最近计划——>根据数据内容(提醒时间、提醒对象、提醒内容)设置定时任务——>给特定qq好友发送消息。
1.软件版本:
2.安装依赖环境
pymysql安装:pip install pymysql
qqbot安装:pip install qqbot
3.数据库操作
数据库操作非常简单,跟Java类似,自己去菜鸟教程看一下基础语法就好了。
4.配置qqbot登陆信息
也可以不配置,不配置的话就是每次扫码登陆,但这在linux系统下不好用,我按说明将配置改成了每次将登陆二维码发到固定qq邮箱。qqbot模块在GitHub上,大家可以去看一下模块说明:qqbot
配置文件默认在用户目录下的.qqbot-tmp/v2.3.conf,linux下类似
相关推荐:《Python视频教程》
5. 自定义功能
6.入口主程序
7.其它
数据库结构:
dropdatabaseif exists info_db;
createdatabaseinfo_db defaultcharactersetutf8;
use info_db;
createtabletyschele_tb(
id int(11) auto_increment primarykey,
worktime timestampnotnull,
namevarchar(10) notnull,
content varchar(100) notnull
)engine=InnoDB auto_increment=1 defaultcharset=utf8;
以上就是循环发送qq消息的代码,以下是项目目录结构,其中一些没有出现的文件是自己测试所用,可以不用关心:
效果图:
Ⅵ PYTHON怎样编写自动化
python 有一个很优秀的自动化框架叫做selenium
但是在写程序之前,需要明确所操作的步骤是否是可重复性
然后定制流程计划
然后通过代码实现
python自动是一个十分强大的功能
如果想要了解更详细的内容可以搜索python selenium
获得更多更详细的内容
Ⅶ 有Python玩得好的大神吗,写个安卓程序,自动抓取微信,钉钉,QQ里面某人。的消息
先在群里申请“群机器人”,得到access_token 然后调用接口: #!/usr/bin/python ... 从而快速解决问题,将线上问题尽早解决,那钉钉推送消息,它有什么好处呢?手机钉钉... 消息可以第一时间查看,报警消息的即时性要求比较高,所以适合用钉钉通知。 本文介绍...
先在群里申请“群机器人”,得到access_token 然后调用接口: #!/usr/bin/python ... 从而快速解决问题,将线上问题尽早解决,那钉钉推送消息,它有什么好处呢?手机钉钉... 消息可以第一时间查看,报警消息的即时性要求比较高,
所以适合用钉钉通知。 本文介绍...