美文网首页
正则表达式批量爬取图片

正则表达式批量爬取图片

作者: haokeed | 来源:发表于2019-05-13 16:37 被阅读0次
# 批量爬取图片
import requests
import re

# 获取页面内容
url="https://list.jd.com/list.html?cat=9987,653,655"
res=requests.get(url)

# 获取图片数组
imgpat='<img width="220" height="220" data-img="1" (?:data-lazy-img|src)="//(.*?)">'
imagelist=re.findall(imgpat,res.text)

for i in range(0,len(imagelist)):
    # 保存图片到本地
    imgobj=requests.get('http://'+imagelist[i]) #获取的图片都是没有http:// 所以要加上去再获取
    with open('./data/idpics/'+str(i)+'.jpg',"wb") as picobject: # wb表示以二进制方式写入文件
        picobject.write(imgobj.content)  # 对于非文本请求,用res content
image.png

相关文章

网友评论

      本文标题:正则表达式批量爬取图片

      本文链接:https://www.haomeiwen.com/subject/vwrraqtx.html