美文网首页Python爬虫
爬虫入门:爬取百度贴吧图片

爬虫入门:爬取百度贴吧图片

作者: 捉虫__羊羊 | 来源:发表于2017-07-28 17:37 被阅读0次

    #coding = utf-8

    importre

    importurllib

    def getHtml(url):

    page = urllib.urlopen(url)

    html = page.read()

    return html

    def getImg(html):

    reg =r'src="(.+?\.jpg)" pic_ext'

    #reg = r'src="(.+?\.jpg)" alt'

    imgre = re.compile(reg)

    imglist = re.findall(imgre,html)

    x=1

    for imgurl in imglist:

    urllib.urlretrieve(imgurl,'C:\\img\\%s.jpg'% x)

    x+=1

    return x

    html = getHtml("https://tieba.baidu.com/p/2460150866")

    print getImg(html)

    执行结果一共69张图片:

    相关文章

      网友评论

        本文标题:爬虫入门:爬取百度贴吧图片

        本文链接:https://www.haomeiwen.com/subject/nusflxtx.html