美文网首页
python爬虫-抓取网站的图片

python爬虫-抓取网站的图片

作者: 莫先生_eb95 | 来源:发表于2019-01-01 15:58 被阅读0次

    ####第一步

    找一个图片比较多的网站,比如http://www.daimg.com

    ####第二步

    打开这个 URL ,获取网页数据

    ···

    from urllib import request

    import re

    def getReq(url):

        url_req = request.urlopen(url) # 打开一个url

        return url_req # 返回这个对象

    http_req = getReq("http://www.daimg.com/") # 拿到http 请求

    后的上下文对象(HTTPResponse object)

    data = http_req.read().decode('GB2312') # 获取网页数据

    print(data)

    ···

    ####第三步

    获取图像链接

    ···

    def getJpg(data):

        jpglist = re.findall(r'src="http.+?.jpg"',data)

        return jpglist

    http_req = getReq("http://www.daimg.com/") # 拿到http 请求

    后的上下文对象(HTTPResponse object)

    data = http_req.read().decode(‘GB2312’) # 获取网页数据

    Link = getJpg(data)

    print(Link)

    ···

    ####第四步

    下载图像文件

    ···

    def downLoad(jpgUrl,n):

        try:

            request.urlretrieve(jpgUrl,'%s.jpg' %n)

        except Exception as e:

            print(e)

        finally:

            print(' 图片%s 下载操作完成' % n)

    n=1

    for jpgurl in Link:

        s = re.findall(r'http.+?.jpg',jpgurl)

        downLoad(s[0],n)

        n= n +1

    ···

    这样就完成了抓取网站中的图片了

    相关文章

      网友评论

          本文标题:python爬虫-抓取网站的图片

          本文链接:https://www.haomeiwen.com/subject/tnvnlqtx.html