Python爬取picjumbo网站图片

作者: 风的低语 | 来源:发表于2019-02-15 15:52 被阅读0次

首先，下载urllib3(我是用Anaconda下载的)

urllib3

查看网页结构，并下载图片

from urllib.request import urlopen
from urllib.request import urlretrieve
import re
import os
import uuid

def getHtml(url):
    page = urlopen(url)
    html = page.read()
    return html.decode('UTF-8')

def getImg(html):
    reg = r'src="(.+?\.jpg)"'
    imgre = re.compile(reg)
    imglist = imgre.findall(html)#表示在整个网页中过滤出所有图片的地址，放在imglist中
    print(imglist)
    path = 'D:\\test'
   # 将图片保存到D:\\test文件夹中，如果没有test文件夹则创建
    if not os.path.isdir(path):
        os.makedirs(path)
    paths = path+'\\'      #保存在test路径下

    for imgurl in imglist:
        urlretrieve(imgurl,'{}{}.jpg'.format(paths,uuid.uuid1()))  #打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串
    return imglist

for sender in range(2, 25):
 strPic = "https://picjumbo.com/free-stock-photos/people/page/"+str(sender)+"/"
 print(strPic)
 html = getHtml("https://picjumbo.com/free-stock-photos/people/page/"+str(sender)+"/")#获取该网址网页详细信息，得到的html就是网页的源代码
 print (getImg(html)) #从网页源代码中分析并下载保存图片

效果展示

爬取的图片

网友评论

本文标题：Python爬取picjumbo网站图片

本文链接：https://www.haomeiwen.com/subject/uuqmeqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python爬取picjumbo网站图片

效果展示

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读