美文网首页
例1.python抓取图片

例1.python抓取图片

作者: Dabbie | 来源:发表于2018-08-31 17:28 被阅读0次

import urllib.request

import re

# py抓取页面图片并保存到本地

# 获取页面信息

def getHtml(url):

    html = urllib.request.urlopen(url).read()

    return html

# 通过正则获取图片

def getImg(html):

    reg = r'src="(.+?\.jpg)" pic_ext'

    # 括号表示分组,将括号的内容捕获到分组当中

    # .+表示匹配至少一个任意字符,问号?表示懒惰匹配,也就是匹配尽可能少的字符串。

    # .+?\.jpg合起来表示尽可能少匹配字符的匹配到.jpg,避免匹配范围超出src的范围

    # 这个括号也就可以匹配网页中图片的url了

    # " pic_ext #匹配" pic_ext

    imgre = re.compile(reg)

    imglist = re.findall(imgre, html)

    # 正则 re.findall的简单用法(返回string中所有与pattern相匹配的全部字串,返回形式为数组)

    # findall(pattern, string, flags=0)

    print(imglist)

    return imglist

html = getHtml("http://tieba.baidu.com/p/2460150866")

list = getImg(html.decode())

# 循环把图片存到本地

x = 0

for imgurl in list:

    print(x)

    urllib.request.urlretrieve(imgurl, r'%s.jpg' % x)

# %s意思是字符串参数,就是将变量的值传入到字符串里面,字符串后的'%'后就是写要传入的参数

    x += 1

# for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1

# urllib.urlretrieve()方法,直接将远程数据下载到本地,保存的位置默认为程序的存放目录

print(getImg(html))

相关文章

  • 例1.python抓取图片

    import urllib.requestimport re# py抓取页面图片并保存到本地# 获取页面信息def...

  • Python学习笔记(16) 采集指定网页区域内的图片

    本文讲解如何便捷的把网页上某块区域的图片或者视频都抓取下来,保存在本地。我们以图片抓取为例,来讲解操作过程。视频抓...

  • scrapy抓取百度图片-写给自己看爬虫系列1

    前言 需求:用scrapy抓取图片思路:scrapy抓取图片的逻辑是,用爬虫抓取图片url输出到pipeline中...

  • CSS抓取图片

    先用CSS提取数据学习章节方法定位文章位置: 下面图片为要抓取的文章对应图片样例: html源码分析:从代码中可以...

  • 爬虫(文字+图片)

    图片抓取案例 文字抓取案例

  • 2022-11-13

    图片抓取

  • python库学习之Requests

    基本使用 抓取网页(文本) 抓取二进制数据(图片,音频,视频) 如果要保存图片

  • 爬取微信好友男女比例

    环境:win10+python3.6 1.python抓取微信好友数量及好友比例 使用itchat库对微信进行操作...

  • Python网络爬虫四

    前言 我们爬虫过文本,图片,接下来应该是视频了。 例子 抓取视频资源 以头条视频为例 爬取思路 分析网页源码,查找...

  • Hive调优

    1、Fetch 抓取 Fetch 抓取是指,Hive 中对某些情况的查询可以不必使用 MapReduce 计算。例...

网友评论

      本文标题:例1.python抓取图片

      本文链接:https://www.haomeiwen.com/subject/tllewftx.html