導航:首頁 > 編程語言 > python下載網頁文件

python下載網頁文件

發布時間:2022-09-26 12:28:12

python 怎麼網頁下載文件.

這個需要你分析網頁,提取其中的鏈接,然後下載鏈接
python自帶的urllib2, urllib可以用來處理網頁,不過比較麻煩,需要自記寫很多代碼
或者用beautiful soap之類的庫,處理html就比較輕鬆了;可以自己看Beautiful Soap的文檔,有中文版本的,鏈接我就不貼了,網路老會發神經屏蔽;按文檔寫幾個例子,就能處理你自己的事情了,很容易的

Ⅱ python 怎麼下載網站文件夾下的所有文件

第一步:
必須知道有哪些文件。
第二步:
知道路徑就可以使用urlretrieve函數保存了。

但是第一步你不說背景很難啊。
是網頁的話,可能那個需要簡單解析一下網頁就行了,有list dir許可權更方便,直接ls就行,窮舉是估計不行的,誰知道文件路徑長度?

Ⅲ python爬蟲 將在線html網頁中的圖片鏈接替換成本地鏈接並將html文件下載到本地

import os,re
def check_flag(flag):
regex = re.compile(r'images\/')
result = True if regex.match(flag) else False
return result

#soup = BeautifulSoup(open('index.html'))
from bs4 import BeautifulSoup
html_content = '''
<a href="https://xxx.com">測試01</a>
<a href="https://yyy.com/123">測試02</a>
<a href="https://xxx.com">測試01</a>
<a href="https://xxx.com">測試01</a>
'''
file = open(r'favour-en.html','r',encoding="UTF-8")
soup = BeautifulSoup(file, 'html.parser')
for element in soup.find_all('img'):
if 'src' in element.attrs:
print(element.attrs['src'])
if check_flag(element.attrs['src']):
#if element.attrs['src'].find("png"):
element.attrs['src'] = "michenxxxxxxxxxxxx" +'/'+ element.attrs['src']

print("##################################")
with open('index.html', 'w',encoding="UTF-8") as fp:
fp.write(soup.prettify()) # prettify()的作⽤是將sp美化⼀下,有可讀性

閱讀全文

與python下載網頁文件相關的資料

熱點內容
哪個app可以教新爸爸 瀏覽:206
如何查看伺服器系統版本信息 瀏覽:518
成都市土地出讓金演算法 瀏覽:702
鋼筋加密標記 瀏覽:575
ps中擴展功能在文件夾的什麼位置 瀏覽:903
雙極壓縮機為什麼要先高壓 瀏覽:527
蘋果手機伺服器填什麼 瀏覽:832
android移動動畫效果 瀏覽:691
電子和伺服器是什麼意思 瀏覽:691
phpurl中文亂碼問題 瀏覽:893
程序員那麼可愛大結局陸漓產子 瀏覽:538
java如何從雲伺服器讀取本地文件 瀏覽:923
壓縮空氣軟管製作方法 瀏覽:911
天河三號演算法 瀏覽:924
php隊列教程 瀏覽:632
洪水命令 瀏覽:529
安卓怎麼弄成蘋果在線 瀏覽:435
谷歌web伺服器地址 瀏覽:900
安卓鎖屏圖片如何刪除 瀏覽:721
python3多進程編程 瀏覽:716