美文网首页
Python爬取picjumbo网站图片

Python爬取picjumbo网站图片

作者: 风的低语 | 来源:发表于2019-02-15 15:52 被阅读0次

    首先,下载urllib3(我是用Anaconda下载的)


    urllib3

    查看网页结构,并下载图片

    from urllib.request import urlopen
    from urllib.request import urlretrieve
    import re
    import os
    import uuid
    
    def getHtml(url):
        page = urlopen(url)
        html = page.read()
        return html.decode('UTF-8')
    
    def getImg(html):
        reg = r'src="(.+?\.jpg)"'
        imgre = re.compile(reg)
        imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址,放在imglist中
        print(imglist)
        path = 'D:\\test'
       # 将图片保存到D:\\test文件夹中,如果没有test文件夹则创建
        if not os.path.isdir(path):
            os.makedirs(path)
        paths = path+'\\'      #保存在test路径下
    
        for imgurl in imglist:
            urlretrieve(imgurl,'{}{}.jpg'.format(paths,uuid.uuid1()))  #打开imglist中保存的图片网址,并下载图片保存在本地,format格式化字符串
        return imglist
    
    for sender in range(2, 25):
     strPic = "https://picjumbo.com/free-stock-photos/people/page/"+str(sender)+"/"
     print(strPic)
     html = getHtml("https://picjumbo.com/free-stock-photos/people/page/"+str(sender)+"/")#获取该网址网页详细信息,得到的html就是网页的源代码
     print (getImg(html)) #从网页源代码中分析并下载保存图片
    
    
    效果展示
    爬取的图片

    相关文章

      网友评论

          本文标题:Python爬取picjumbo网站图片

          本文链接:https://www.haomeiwen.com/subject/uuqmeqtx.html