Ⅰ [python練手]使用WordCloud模塊將qq聊天記錄生成炫酷的關鍵詞雲
這個項目的github地址。 https://github.com/susususuhanmo/QQChatLogWordCloud
最近准備開始學習python,寫一個綜合一點的小demo練練手~
讀取文件
編寫清洗函數,清洗聊天數據。主要是需要清洗掉一些無用的關鍵詞:
分詞,分詞結果如果出現一些特有的詞語截了一半或者截多了幾個字元的情況,可以手動添加分詞詞庫。
根據關鍵詞數據,建立pandas的DataFrame,通過停詞詞庫過濾掉一些中文中不適合做關鍵詞的詞語,進行關鍵詞數統計並根據次數排序。
詞雲屬性解釋
調整成120之後就好看很多,有很明顯的差別。
設置圖片為可愛的莫古力
根據這個莫古力的顏色分布,生成的詞雲如下,我這個不是特別好看,大家可以選擇輪廓明顯一點的圖片來生成。
相比默認的模式,
關於更詳細的詞雲配置可以看這篇文章,這個作者對wordcloud的配置講解的十分詳細。
https://blog.csdn.net/heyuexianzi/article/details/76851377
在你想導出的人或群處右鍵,點導出消息記錄,
然後選擇txt格式
Ⅱ 想要用python3做個軟體對網頁自動化操作,需要搭建什麼環境,如何實現
只用python就行了啊。vs和pycharm都算是編輯器沒什麼關系啊,就是用記事本編輯也行哦。那就用pycharm吧,大家都吹噓它好用。
就是用python的urllib模塊請求網頁就可以了。
登錄就是post數據,然後獲得cookie(可能還有一下其他的東西),帶著它就可以做一些評論。
評論就是根據按鈕找到相關的網頁鏈接,向它post/get數據。
評論採集就是請求相關的網頁,獲得評論的數據,可能是html或者json之類的,然後用beautifulsoup或者json分析,獲得格式化後的數據。
以前用Python做過一個空間的自動點贊、自動回復說說留言、獲取留言的程序。
只要就是分析鏈接和js腳本費點時間。其他地方都簡單。
Ⅲ python自動化工具:pywinauto
Pywinauto是完全由Python構建的一個模塊,可以用於自動化 Windows 上的 GUI 應用程序。同時,它支持滑鼠、鍵盤操作,在元素控制項樹較復雜的界面,可以輔助我們完成自動化操作。
我在工作中,主要是使用pywinauto來輔助做一些操作,來完成自動化測試。
先要確認本地有python環境,然後可以通過命令行安裝pywinauto:
如果你是使用ide,可以通過ide安裝,比如我習慣使用pycharm,就可以在Project Interpreter中添加pywinauto:
還有一些手動安裝的方法,但是有點繁瑣,不是很推薦,這里就不介紹了。
Pywinauto要操作應用,首先需要訪問應用,主要有兩種訪問技術。WIN32訪問技術支持MFC、VB6、VCL、簡單WinForms控制項開發的應用,MS UI Automation訪問技術支持WinForms、WPS、QT5、WPF、Store apps、browsers等開發的應用。
win32 API的backend為「 win32 」,MS UI Automation的backend為「 uia 」。
Pywinauto中使用的backend默認為win32。可使用spy++或者Inspect工具判斷backend適合選哪種。例如:如果使用py_inspect的uia模式,可見的控制項和屬性更多的話,backend可選uia,反之,backend可選win32。
這里提一下常用的分析工具:
我個人常用的是py_inspect和spy++。
多數情況下都是需要打開應用的,實現方式也很簡單:
backend參數根據實際情況選擇傳uia還是win32。
start方法其實可以傳兩個參數,除了目標應用的啟動程序地址,還可以傳一個timeout,如果不傳,默認是5s。如果你的目標程序啟動、運行都很慢,可以將timeout設置久一點。
如果要操控的應用已經處於啟動狀態,可以直接進行連接,而連接方式有多種可以選擇:
其中Windows的pid可以通過任務管理器進行查看:
但是我在實際操作的時候使用窗口句柄沒有成功過,可能是我使用姿勢不對,不過還是不推薦使用窗口句柄。
title_re參數傳遞的是應用的部分名稱,class_name可以通過py_inspect查詢到。
前面獲取的對象都是應用,但是我們實際操作的是應用窗口,這里就來介紹怎麼獲取窗口和對話框。
最常用的是通過 title定位:
如果不清楚定位工具中的title在哪個位置,顯示的是什麼,可以通過print_control_identifiers()方法將所有的title都列印出來:
通過title定位的時候需要注意一下中英文的影響,如果是中文,可能會有編碼問題,需要轉碼。
title其實只是window()方法中的一種關鍵字參數,window()方法可以接收很多中的關鍵字參數,且這些參數可以組合使用,例如這樣:
主要參數有這些:
通過top_window()也能比較容易地獲取到窗口,但是這個方法獲取的是 程序的頂級窗口,但可能不是Z-Order中的頂級窗口。所以這個方法使用的時候多調試幾次。
窗口的操作主要有最小化、最大化、恢復、關閉窗口:
控制項的定位其實和窗口的定位基本一致,不太清楚為什麼pywinauto在設計的時候會將窗口和控制項作為一類東西。
相對於前面定位窗口的window()方法,定位控制項的時候推薦使用child_window(),因為直接使用windows()的話,如果控制項不是在當前窗口的子控制項,是子子控制項,就會定位不到,而child_window()方法就不會有這個問題,當然相對的缺點就是當控制項深度太深的時候,執行這個方法會比較耗時。
child_window()方法傳遞的參數和window()是一樣的。
控制項自帶了一些操作方法:
當這些不好用的時候,比如你的控制項不支持點擊,但是你又想點擊一下,可以使用滑鼠操作的一些方法:
測試過程中可能會需要截圖作為證據,截圖的方法也比較簡單:
pywinauto也提供了鍵盤操作的方法:
pywinauto有幾個設置等待時間的方式,這里介紹一個:
這里簡單的演示一下用Wireshark自動抓包並保存:
PC端自動化測試使用到的python模塊主要有pywinauto、win32gui、pyautogui。這里介紹的p ywinauto主要使用到Application類,用於應用程序管理(打開與關閉應用等)、窗口管理(最小化、最大化、關閉窗口)、控制項操作。
pywinauto的功能其實挺豐富的,但是真正用到的其實只是其中很小的一塊,感興趣的同學可以多去官網翻一翻。
Ⅳ 如何用python登陸qq讀取信息
一次偶然的機會我看見了一個群里的一個QQ號總是根據你所發的消息自動回復,當時很感覺到神奇,我知道可以模擬登錄網站,沒想到竟然也能模擬登錄QQ,首先自己想到的就是如何實現模擬登錄PC端的QQ, 開始研究了下,發現QQ所發送的包都很難理解。
於是就轉到了網頁版的QQ,因為在網頁里可以捕獲所有的請求從而更好的實現模擬功能!
首先第一步就是打開網頁版的qq,打開瀏覽器的開發者模式 這里可以監控所有的請求!
打開登錄界面的的時候
會捕捉到一個GET請求
其中uin是你的QQ號
返回值是 ptui_checkVC('1','','x00x00x00x00x00xa1x92x12');
其中1表示需要驗證碼 還有一種返回值 ptui_checkVC('0','!LJV','x00x00x00x00x00xa1x92x12') 這種表示是不需要的驗證碼的
[python]view plain
defCheckVerify(self,uin):
check="h"
check=check.replace('{uin}',uin)
pattern=re.compile("ptui_checkVC′(.∗)′,′(.∗)′,′(.∗)′;")
result=self.Get(check)
checked=pattern.search(result).groups()
print'Step1:CheckVerify'
returnchecked
獲取驗證碼的方法
defGetVerify(self):
#url='hage?&uin='+str(self.QQ)+'&aid=1002101&0.45644426648505'+str(random.randint(10,99))
verify="htqq.com/getimage?aid=1003903&r=0.6472875226754695&uin={QQ}&cap_cd=aSD-ZVcNEcozlZUurhNYhp-MBHf4hjbJ"
verify=verify.replace('{QQ}',self.QQ)
path=r"c:/verify/1.jpg"
#data=urllib.urlretrieve(url,path)
data=urllib2.urlopen(verify)
localPic=open(r"c:/verify/1.jpg",'wb')
localPic.write(data.read())
localPic.close()
data.close()
輸入用戶名和密碼 還有驗證碼後發送一個GET請求
這裡面u代表賬號 p代表密碼 密碼是經過一定演算法加密的 verify是驗證碼
加密演算法如下
defPasswordSecret(self,password,v1,v2,md5=True):
ifmd5==True:
password=self.PCMd5(password).upper()
length=len(password)
temp=''
foriinrange(0,length,2):
temp+=r'x'+password[i:i+2]
returnself.PCMd5(self.PCMd5(self.hex2asc(temp)+self.hex2asc(v2)).upper()+v1).upper()
#md5加密函數
defPCMd5(self,s):
h=hashlib.md5()
h.update(s)
returnh.hexdigest()
#16進制轉字元
defhex2asc(self,s):
_str="".join(s.split(r'x'))
length=len(_str)
data=''
foriinrange(0,length,2):
data+=chr(int(_str[i:i+2],16))
returndata
然後是登錄部分代碼
defLogin(self,uin,pwd):
#獲取參數
cheked=self.CheckVerify(uin)
#加密密碼
#pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
#pwd=self.PasswordSecret(pwd,r'AAST',r'x00x00x00x00x00xa1x92x12')
loginurl="h&t=1&g=1&js_type=0&js_ver=10080&login_sig=YPD0P*&pt_uistyle=5"
loginurl=loginurl.replace('{uin}',uin)
#loginurl=loginurl.replace('{pwd}',pwd)
#loginurl=loginurl.replace('{verify}',cheked[1])
#result=Get(loginurl)
if(cheked[0]=="1"):
#下載驗證碼
self.GetVerify()
image=Image.open(r"c:/verify/1.jpg")
image.show()
code=raw_input("verifycode:").strip()
loginurl=loginurl.replace('{verify}',code.upper())
pwd=self.PasswordSecret(pwd,r''+code.upper(),cheked[2])
#pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
else:
loginurl=loginurl.replace('{verify}',cheked[1])
pwd=self.PasswordSecret(pwd,cheked[1],cheked[2])
loginurl=loginurl.replace('{pwd}',pwd)
result=self.Get(loginurl,'ssl.ptlogin2.qq.com','hin2.qq.com/cgi-bin/login?daid=164&target=self&style=5&mibao_css=m_webqq&appid=1003903&enable_qlogin=0&no_verifyimg=1&s_urlm%2Floginproxy.html&f_url=loginerroralert&strong_login=1&login_state=10&t=20140514001',None)
print'Step2:Login'
pattern=re.compile("ptuiCB′(.∗)′,′(.∗)′,′(.∗)′,′(.∗)′,′(.∗)′,s′(.∗)′;")
ret=pattern.search(result).groups()
#獲取必要的cookie否則第二次登陸會出錯
self.Get(ret[2])
print'Step3:GetCookie'
forcinself.cj:
ifc.name=="ptwebqq":
self.ptwebqq=c.value
returnresult
登錄成功後伺服器會返回一串json數據
ptuiCB('0','0','ebqq_type%3D10&f_url=&ptlang=2052&ptredirect=100&aid=1003903&daid=164&j_later=0&low_login_hour=0®master=0&pt_login_type=1&pt_aid=0&pt_aaid=0&pt_light=0','0','登錄成功!', '小竹');
第一個為0 就表示登錄成功了 ,但是這並沒有真正的登錄成功
上面的返回值中的url是用來獲取一個關鍵cookie的 那就是ptwebqq
然後進行第二次登錄,這次才是真正的登錄
請求如下
Accept:*/*
Accept-Encoding:gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8
Connection:keep-alive
Content-Length:244
Content-Type:application/x-www-form-urlencoded
Cookie:o_cookie=455910092; RK=fMEaWEZ0Qc; ts_last=web2.qq.com/; ts_refer=www..com/; ts_uid=4588821804; pgv_pvid=914251705; pgv_info=ssid=s3525422600&pgvReferrer=; verifysession=h02LeYrtarkWBZeSu_czkiczeNSNlDm7V1mCm-**; ptui_loginuin=10588690; ptisp=cnc; ptcz=; ptwebqq=; pt2gguin=o0010588690; uin=o0010588690; skey=@gmEO6N2JD; p_uin=o0010588690; p_skey=cZ5*kS-_; pt4_token=1SyuJ39Eq6oKEwEhGIizeg__
Host:d.web2.qq.com
Origin:h
Referer:htttml?v=20110331002&callback=1&id=2
User-Agent:Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36
Form Dataview sourceview URL encoded
r:{"status":"online","ptwebqq":"","passwd_sig":"","clientid":"7963288","psessionid":null}
clientid:7963288
psessionid:null
其中的ptwebqq就是剛才我們從cookie中獲取的
這部分代碼是
defLogin2(self):
try:
url="htel/login2"
postdata="r=%7B%22status%22%3A%22online%22%2C%22ptwebqq%22%3A%22{$ptwebqq}%22%2C%22passwd_sig%22%3A%22%22%2C%22clientid%22%3A%22{$clientid}%22%2C%22psessionid%22%3Anull%7D&clientid={$clientid}&psessionid=null"
postdata=postdata.replace("{$ptwebqq}",self.ptwebqq)
postdata=postdata.replace("{$clientid}",str(self.clientid))
print'Step4:Login2'
result=self.Post(url,postdata,QQRobot.HOST[0],QQRobot.REFERER[0],QQRobot.ORIGIN[0])
retjson=json.loads(result)
retjson=retjson["result"]
returnretjson
exceptException,e:
print"Login2error"+str(e)
第二次登陸成功後會返回一個
'''{"retcode":0,
"result":{
"uin":10588690,
"cip":1707901841,
"index":1075,
"port":59571,
"status":"online",
"vfwebqq":"85c31018d2",
"psessionid":"85c31018d2",
"user_state":0,
"f":0
}
}'''
這樣的數據結構 其中0表示登陸成功
需要把這寫數據保存下來 後面進行操作需要
登陸成功後我們就可以拉去群列表了
#獲取群列表信息
defGetGroupNameList(self,vfwebqq):
try:
url="h/get_group_name_list_mask2"
postdata="r=%7B%22vfwebqq%22%3A%22{$vfwebqq}%22%7D"
postdata=postdata.replace("{$vfwebqq}",vfwebqq)
ret=self.Post(url,postdata,QQRobot.HOST[1],QQRobot.REFERER[1],QQRobot.ORIGIN[1])
print'Step5:GetGroupList'
retjson=json.loads(ret)
retjson=retjson["result"]
self.grouplist=retjson
forgroupinself.grouplist['gnamelist']:
printgroup["code"],group["name"]
exceptException,e:
Ⅳ Python如何實現定時發送qq消息
因為生活中老是忘記各種事情,剛好又在學python,便突發奇想通過python實現提醒任務的功能(盡管TIM有定時功能),也可定時給好友、群、討論組發送qq消息。其工作流程是:訪問資料庫提取最近計劃——>根據數據內容(提醒時間、提醒對象、提醒內容)設置定時任務——>給特定qq好友發送消息。
1.軟體版本:
2.安裝依賴環境
pymysql安裝:pip install pymysql
qqbot安裝:pip install qqbot
3.資料庫操作
資料庫操作非常簡單,跟Java類似,自己去菜鳥教程看一下基礎語法就好了。
4.配置qqbot登陸信息
也可以不配置,不配置的話就是每次掃碼登陸,但這在linux系統下不好用,我按說明將配置改成了每次將登陸二維碼發到固定qq郵箱。qqbot模塊在GitHub上,大家可以去看一下模塊說明:qqbot
配置文件默認在用戶目錄下的.qqbot-tmp/v2.3.conf,linux下類似
相關推薦:《Python視頻教程》
5. 自定義功能
6.入口主程序
7.其它
資料庫結構:
dropdatabaseif exists info_db;
createdatabaseinfo_db defaultcharactersetutf8;
use info_db;
createtabletyschele_tb(
id int(11) auto_increment primarykey,
worktime timestampnotnull,
namevarchar(10) notnull,
content varchar(100) notnull
)engine=InnoDB auto_increment=1 defaultcharset=utf8;
以上就是循環發送qq消息的代碼,以下是項目目錄結構,其中一些沒有出現的文件是自己測試所用,可以不用關心:
效果圖:
Ⅵ PYTHON怎樣編寫自動化
python 有一個很優秀的自動化框架叫做selenium
但是在寫程序之前,需要明確所操作的步驟是否是可重復性
然後定製流程計劃
然後通過代碼實現
python自動是一個十分強大的功能
如果想要了解更詳細的內容可以搜索python selenium
獲得更多更詳細的內容
Ⅶ 有Python玩得好的大神嗎,寫個安卓程序,自動抓取微信,釘釘,QQ裡面某人。的消息
先在群里申請「群機器人」,得到access_token 然後調用介面: #!/usr/bin/python ... 從而快速解決問題,將線上問題盡早解決,那釘釘推送消息,它有什麼好處呢?手機釘釘... 消息可以第一時間查看,報警消息的即時性要求比較高,所以適合用釘釘通知。 本文介紹...
先在群里申請「群機器人」,得到access_token 然後調用介面: #!/usr/bin/python ... 從而快速解決問題,將線上問題盡早解決,那釘釘推送消息,它有什麼好處呢?手機釘釘... 消息可以第一時間查看,報警消息的即時性要求比較高,
所以適合用釘釘通知。 本文介紹...