爬虫怎么下载图片到指定文件夹_python 下载文件到文件夹下的问题

A. python爬虫将在线html网页中的图片链接替换成本地链接并将html文件下载到本地

import os,re
def check_flag(flag):
regex = re.compile(r'images\/')
result = True if regex.match(flag) else False
return result

#soup = BeautifulSoup(open('index.html'))
from bs4 import BeautifulSoup
html_content = '''
<a href="https://xxx.com">测试01</a>
<a href="https://yyy.com/123">测试02</a>
<a href="https://xxx.com">测试01</a>
<a href="https://xxx.com">测试01</a>
'''
file = open(r'favour-en.html','r',encoding="UTF-8")
soup = BeautifulSoup(file, 'html.parser')
for element in soup.find_all('img'):
if 'src' in element.attrs:
print(element.attrs['src'])
if check_flag(element.attrs['src']):
#if element.attrs['src'].find("png"):
element.attrs['src'] = "michenxxxxxxxxxxxx" +'/'+ element.attrs['src']

print("##################################")
with open('index.html', 'w',encoding="UTF-8") as fp:
fp.write(soup.prettify()) # prettify()的作⽤是将sp美化⼀下，有可读性

B. 如何用Python做爬虫

在我们日常上网浏览网页的时候，经常会看到一些好看的图片，我们就希望把这些图片保存下载，或者用户用来做桌面壁纸，或者用来做设计的素材。

我们最常规的做法就是通过鼠标右键，选择另存为。但有些图片鼠标右键的时候并没有另存为选项，还有办法就通过就是通过截图工具截取下来，但这样就降低图片的清晰度。好吧其实你很厉害的，右键查看页面源代码。

我们可以通过python来实现这样一个简单的爬虫功能，把我们想要的代码爬取到本地。下面就看看如何使用python来实现这样一个功能。

C. java爬虫读取某一张指定图片的url，求解答

使用jsoup解析到这个url就行，dom结构如下:

D. linux下python怎么写爬虫获取图片

跟linux有什么关系，python是跨平台的，爬取图片的代码如下：

import urllib.requestimport osimport randomdef url_open(url):
req=urllib.request.Request(url) #为请求设置user-agent,使得程序看起来更像一个人类
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0') #代理IP，使用户能以不同IP访问，从而防止被服务器发现
'''iplist=['1.193.162.123:8000','1.193.162.91:8000','1.193.163.32:8000']
proxy_support=urllib.request.ProxyHandler({'http':random.choice(iplist)})
opener=urllib.request.build_opener(proxy_support)
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.154 Safari/537.36 LBBROWSER')]

urllib.request.install_opener(opener)'''

response=urllib.request.urlopen(req)
html=response.read() return htmldef get_page(url):

html=url_open(url).decode('utf-8')
a=html.find('current-comment-page')+23
b=html.find(']',a) #print(html[a:b])
return html[a:b]def find_imgs(url):
html=url_open(url).decode('utf-8')
img_addrs=[]

a=html.find('img src=') while a!=-1:
b=html.find('.jpg',a,a+140) if b!=-1: if html[a+9]!='h':
img_addrs.append('http:'+html[a+9:b+4]) else:
img_addrs.append(html[a+9:b+4]) else:
b=a+9

a=html.find('img src=',b) for each in img_addrs:
print(each+'我的打印') return img_addrsdef save_imgs(folder,img_addrs):
for each in img_addrs: #print('one was saved')
filename=each.split('/')[-1] with open(filename,'wb') as f:
img=url_open(each)
f.write(img)def download_mm(folder='ooxx',pages=10):
os.mkdir(folder)
os.chdir(folder)

url=""
page_num=int(get_page(url)) for i in range(pages):
page_num=page_num-1
page_url=url+'page-'+str(page_num)+'#comments'
img_addrs=find_imgs(page_url)
save_imgs(folder,img_addrs)if __name__=='__main__':
download_mm()

完成

运行结果

E. python爬虫如何创建image文件夹

有自动创建功能，也可以使用代码。1.观察网页，找到img标签；2.通过requests和BS库来提取网页中的img标签；3.抓取

_mg标签后，再把里面的src给提取出来，接下来就可以下载图片了；

?

?4.通过urllib的urllib.urlretrieve来下载图片并且放进文件夹里面（第一之前的准备工作就是获取当前路径然后新建一个文件夹）；

?5.如果有多张图片，不断的重复3-4。

F. python 网络爬虫，怎么自动保存图片

defdownload_poster_image(movie):#定义一个下载图片函数
src=movie#取出它的url
r=requests.get(src)#去获取这个url
fname=url.split('/')[-1]#从url里面获取这个文件名
withopen(fname,'wb')asf:#应答的内容写进去并且使用二进制
f.write(s.content)
movie['poster-path']=fname

res=requests.get(url)
img_url=res.xpath('//img[@class="q-img-item"]/@src')

movie=img_url
download_poster_image(movie)#执行函数

G. python 下载文件到文件夹下的问题

open文件的时候就可以设置文件的路径，比如，这里改成
open(r'd:\download\google.gif', 'wb').write(rs)
就保存到那个文件夹下了。

热点内容

怎样把文件夹排列成一列发布：2025-03-22 06:08:58 浏览：860

n厂积家压缩大师发布：2025-03-22 06:08:51 浏览：968

新加坡使用加密货币发布：2025-03-22 06:08:50 浏览：331

我身边那些资深程序员发布：2025-03-22 05:53:34 浏览：229

红绿线源码副图通达信发布：2025-03-22 05:39:14 浏览：509

三对角压缩矩阵发布：2025-03-22 05:36:43 浏览：402

安卓手机为什么那么抗摔发布：2025-03-22 05:36:42 浏览：371

step7os编译不了发布：2025-03-22 05:24:14 浏览：697

程序员为什么会说谎发布：2025-03-22 05:22:48 浏览：81

内核编译问题及答案发布：2025-03-22 05:17:04 浏览：647

dbo怎么用命令修改发布：2025-03-22 05:12:12 浏览：786

手机捉妖怎么在安卓手机上下载发布：2025-03-22 05:09:36 浏览：195

java指定字符编码发布：2025-03-22 04:55:08 浏览：323

数据库加密md5怎么解除发布：2025-03-22 04:53:46 浏览：917

python换行写代码发布：2025-03-22 04:26:14 浏览：721

phpselect语句发布：2025-03-22 04:14:45 浏览：272

2016图形界限命令发布：2025-03-22 04:10:12 浏览：524

phprsa签名发布：2025-03-22 03:56:29 浏览：149

ftp后台下载命令发布：2025-03-22 03:42:43 浏览：338

qstat命令发布：2025-03-22 03:41:27 浏览：731

导航:首页 > 文件处理 > 爬虫怎么下载图片到指定文件夹

爬虫怎么下载图片到指定文件夹

与爬虫怎么下载图片到指定文件夹相关的资料