美文网首页
正则表达式批量爬取图片

正则表达式批量爬取图片

作者: haokeed | 来源:发表于2019-05-13 16:37 被阅读0次
    # 批量爬取图片
    import requests
    import re
    
    # 获取页面内容
    url="https://list.jd.com/list.html?cat=9987,653,655"
    res=requests.get(url)
    
    # 获取图片数组
    imgpat='<img width="220" height="220" data-img="1" (?:data-lazy-img|src)="//(.*?)">'
    imagelist=re.findall(imgpat,res.text)
    
    for i in range(0,len(imagelist)):
        # 保存图片到本地
        imgobj=requests.get('http://'+imagelist[i]) #获取的图片都是没有http:// 所以要加上去再获取
        with open('./data/idpics/'+str(i)+'.jpg',"wb") as picobject: # wb表示以二进制方式写入文件
            picobject.write(imgobj.content)  # 对于非文本请求,用res content
    
    image.png

    相关文章

      网友评论

          本文标题:正则表达式批量爬取图片

          本文链接:https://www.haomeiwen.com/subject/vwrraqtx.html