1. python使用unquote解碼問題
不需要三種解法,兩種就夠了,用try except
s='%ce%de%b5'
s=str(s)
try:
s=unquote(s).decode('gb18030').encode('utf-8')
except:
s=unquote(s).decode('utf-8').encode('utf-8')
prints
2. 用python怎麼解析'%3cp%3e%e5%'
import urllib
rawurl=xxx
url=urllib.unquote(rawurl)
所用模塊:urllib
所用函數:urllib.unquote()
案例
import urllib
rawurl = "%E6%B2%B3%E6%BA%90"url = urllib.unquote(rawurl)print url
輸出
河源
問題擴展
urllib.unquote()目的是對url編碼進行解碼,與該函數對應的是編碼函數urllib.quote()
123
>>> import urllib>>> urllib.quote("河源")'%E6%B2%B3%E6%BA%90
URL為何要編碼、解碼?
通常如果一樣東西需要編碼,說明這樣東西並不適合傳輸。原因多種多樣,如Size過大,包含隱私數據。對於Url來說,之所以要進行編碼,是因為Url中有些字元會引起歧義。
例如,Url參數字元串中使用key=value鍵值對這樣的形式來傳參,鍵值對之間以&符號分隔,如/s?q=abc&ie=utf-8。如果你的value字元串中包含了=或者&,那麼勢必會造成接收Url的伺服器解析錯誤,因此必須將引起歧義的&和=符號進行轉義,也就是對其進行編碼。
又如,Url的編碼格式採用的是ASCII碼,而不是Unicode,這也就是說你不能在Url中包含任何非ASCII字元,例如中文。否則如果客戶端瀏覽器和服務端瀏覽器支持的字元集不同的情況下,中文可能會造成問題。
3. 基於Python快速整理微信視頻與圖片
作為超級APP,微信已經成了移動互聯網的入口。而我們也早已習慣通過微信收發圖片與視頻等多媒體文件。身為一名屌絲通信狗,經常出差海外,跟家人的溝通方式主要就靠微信了,每當累了或抑鬱了,銀早打開微信看看媳婦兒和孩子的視頻照片,就覺得開心多了。最終,微信變得越來越臃腫,視頻與圖片也必須早點保存到手機或鋒亮雀者電腦。但是最終導出的文件命名是讓人相當崩潰的。。。
是能忍 孰不能忍 ,作為一名有(xia)抱(zhe)負(teng)的屌絲,是絕不能容忍這么雜亂的文件命名的,也絕不可能因此就對這些文件逐一手動重命名的。
作為批量處理文件的利器,當然非Python莫屬了,而且有一堆優質庫可供調用,基本搜索一下能解決90%需求。對於這個需求初始想法是直接通過os庫獲取文件的創始時間,依此來重新命名文件,可是最終發現os庫獲取的是文件第一次拷貝到系統的時間,並非文件的初始創建時間。比如,2016-09-10日19:00:23拷貝2016-06-16日10:00:00拍攝的視頻文件到系統硬碟,系鍵拆統就記錄其時間為2016-09-10日19:00:23,並非6月16日。
上網搜了很久,發現使用exif與ffmpeg可以分別對照片與視頻提取初始創建時間:
Exif是用來存儲數碼照片的屬性信息與拍攝數據的,可以附加於JPEG、TIFF、RIFF等文件之中,為其增加有關數碼相機拍攝信息的內容和索引圖或圖像處理軟體的版本信息 。
使用exif工具查詢當前目錄下的pic1.png文件可以得到如下信息:
MacBook:BaiYun meixuhong$ exif -i pic1.png
顯然獲取到照片拍攝時間為2016:03:08 21:22:46。
ffmpeg自然不用多說,一款開源的牛逼哄哄的絕大多數開發者與公司都在用的音頻解碼軟體。使用它解析視頻文件自然也不在話下。如使用它解析1.mov文件,則會輸出如下信息:
MacBook:BaiYun meixuhong$ ffmpeg -i 1.mov
獲取到視頻文件拍攝於2016-07-10 09:36:54。
這倆工具當然無懈可擊,可是要想用python解析的話就得使用進程調用它們,而且只能將輸出結果保存在文本中,那如果有300個文件就得要輸出300個文本文件,很復雜,顯然不是我要的結果,需要換思路。
Hachoir is a Python library to view and edit a binary stream field by field. In other words, Hachoir allows you to 「browse」 any binary stream just like you browse directories and files.
即是說使用Hachoir可以直接查看文件的二進制文件,提取文件的 metadata 即可獲取到數碼照片與視頻的初始創建時間了。
實現過程到還是到我的項目主頁 Github 一覽吧。
執行完Python腳本,再來看各個文件名,以具體拍照時間格式嚴格命名並排序,感覺整個世界瞬間變得美好了。