導航:首頁 > 文件處理 > 爬蟲怎麼下載圖片到指定文件夾

爬蟲怎麼下載圖片到指定文件夾

發布時間:2023-07-10 16:27:54

A. python爬蟲 將在線html網頁中的圖片鏈接替換成本地鏈接並將html文件下載到本地

import os,re
def check_flag(flag):
regex = re.compile(r'images\/')
result = True if regex.match(flag) else False
return result

#soup = BeautifulSoup(open('index.html'))
from bs4 import BeautifulSoup
html_content = '''
<a href="https://xxx.com">測試01</a>
<a href="https://yyy.com/123">測試02</a>
<a href="https://xxx.com">測試01</a>
<a href="https://xxx.com">測試01</a>
'''
file = open(r'favour-en.html','r',encoding="UTF-8")
soup = BeautifulSoup(file, 'html.parser')
for element in soup.find_all('img'):
if 'src' in element.attrs:
print(element.attrs['src'])
if check_flag(element.attrs['src']):
#if element.attrs['src'].find("png"):
element.attrs['src'] = "michenxxxxxxxxxxxx" +'/'+ element.attrs['src']

print("##################################")
with open('index.html', 'w',encoding="UTF-8") as fp:
fp.write(soup.prettify()) # prettify()的作⽤是將sp美化⼀下,有可讀性

B. 如何用Python做爬蟲

在我們日常上網瀏覽網頁的時候,經常會看到一些好看的圖片,我們就希望把這些圖片保存下載,或者用戶用來做桌面壁紙,或者用來做設計的素材。

我們最常規的做法就是通過滑鼠右鍵,選擇另存為。但有些圖片滑鼠右鍵的時候並沒有另存為選項,還有辦法就通過就是通過截圖工具截取下來,但這樣就降低圖片的清晰度。好吧其實你很厲害的,右鍵查看頁面源代碼。

我們可以通過python來實現這樣一個簡單的爬蟲功能,把我們想要的代碼爬取到本地。下面就看看如何使用python來實現這樣一個功能。

C. java爬蟲讀取某一張指定圖片的url,求解答

使用jsoup解析到這個url就行,dom結構如下:

D. linux下python怎麼寫爬蟲獲取圖片

跟linux有什麼關系,python是跨平台的,爬取圖片的代碼如下:

import urllib.requestimport osimport randomdef url_open(url):
req=urllib.request.Request(url) #為請求設置user-agent,使得程序看起來更像一個人類
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0') #代理IP,使用戶能以不同IP訪問,從而防止被伺服器發現
'''iplist=['1.193.162.123:8000','1.193.162.91:8000','1.193.163.32:8000']
proxy_support=urllib.request.ProxyHandler({'http':random.choice(iplist)})
opener=urllib.request.build_opener(proxy_support)
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.154 Safari/537.36 LBBROWSER')]

urllib.request.install_opener(opener)'''

response=urllib.request.urlopen(req)
html=response.read() return htmldef get_page(url):

html=url_open(url).decode('utf-8')
a=html.find('current-comment-page')+23
b=html.find(']',a) #print(html[a:b])
return html[a:b]def find_imgs(url):
html=url_open(url).decode('utf-8')
img_addrs=[]

a=html.find('img src=') while a!=-1:
b=html.find('.jpg',a,a+140) if b!=-1: if html[a+9]!='h':
img_addrs.append('http:'+html[a+9:b+4]) else:
img_addrs.append(html[a+9:b+4]) else:
b=a+9

a=html.find('img src=',b) for each in img_addrs:
print(each+'我的列印') return img_addrsdef save_imgs(folder,img_addrs):
for each in img_addrs: #print('one was saved')
filename=each.split('/')[-1] with open(filename,'wb') as f:
img=url_open(each)
f.write(img)def download_mm(folder='ooxx',pages=10):
os.mkdir(folder)
os.chdir(folder)

url=""
page_num=int(get_page(url)) for i in range(pages):
page_num=page_num-1
page_url=url+'page-'+str(page_num)+'#comments'
img_addrs=find_imgs(page_url)
save_imgs(folder,img_addrs)if __name__=='__main__':
download_mm()

完成

運行結果

E. python爬蟲如何創建image文件夾

有自動創建功能,也可以使用代碼。1.觀察網頁,找到img標簽;2.通過requests和BS庫來提取網頁中的img標簽;3.抓取

_mg標簽後,再把裡面的src給提取出來,接下來就可以下載圖片了;

?

?4.通過urllib的urllib.urlretrieve來下載圖片並且放進文件夾裡面(第一之前的准備工作就是獲取當前路徑然後新建一個文件夾);

?5.如果有多張圖片,不斷的重復3-4。

F. python 網路爬蟲,怎麼自動保存圖片

defdownload_poster_image(movie):#定義一個下載圖片函數
src=movie#取出它的url
r=requests.get(src)#去獲取這個url
fname=url.split('/')[-1]#從url裡面獲取這個文件名
withopen(fname,'wb')asf:#應答的內容寫進去並且使用二進制
f.write(s.content)
movie['poster-path']=fname
res=requests.get(url)
img_url=res.xpath('//img[@class="q-img-item"]/@src')

movie=img_url
download_poster_image(movie)#執行函數

G. python 下載文件到文件夾下的問題

open文件的時候就可以設置文件的路徑,比如,這里改成
open(r'd:\download\google.gif', 'wb').write(rs)
就保存到那個文件夾下了。

閱讀全文

與爬蟲怎麼下載圖片到指定文件夾相關的資料

熱點內容
什麼型號的板子能上伺服器內存 瀏覽:397
androidapk圖標設置 瀏覽:42
最早提出分數運演算法的著作 瀏覽:922
安卓郵箱怎麼保存照片 瀏覽:269
hdfspythonapi 瀏覽:851
qt如何搭建web伺服器 瀏覽:58
程序員紅包演算法 瀏覽:792
亞馬遜安全的更換雲伺服器 瀏覽:728
伺服器線程數怎麼設置 瀏覽:605
考研詞彙紅寶書2019pdf 瀏覽:981
如何利用安卓手機wifi修改密碼 瀏覽:373
辭海分冊pdf 瀏覽:935
安卓系統頁面怎麼調 瀏覽:775
壓縮文件的用法 瀏覽:34
如何用瀏覽器訪問伺服器地址 瀏覽:207
soft編譯器 瀏覽:113
三軸車床的編程指令 瀏覽:71
天生敏感pdf 瀏覽:565
西瓜星球伺服器怎麼刷鑽石 瀏覽:838
php生成chm 瀏覽:658