美文网首页
鸟与虫(一)图片,让我爬一下,就一下

鸟与虫(一)图片,让我爬一下,就一下

作者: loser_ren | 来源:发表于2018-05-25 16:27 被阅读0次
  • 分享一下我爬千图网的步骤,加深影响,如果能帮助大家的我也很开心,有什么不足的请提提意见,谢谢。

  • 就是一个简简单单的爬虫,比如什么十行做爬虫,什么最简单的爬虫实例……

  • emmm我会用到requests库,和BeautifulSoup,(正则表达式我还没有用熟(ૢ˃ꌂ˂ૢ)。)
    这两库教程也挺多,挺全,我不太熟呢还,就不多说了。

开始:

'''
    根据知乎大神

    代码作者:高佳乐

'''

import requests           ##导入requests库
from bs4 import BeautifulSoup   ##导入BeautifulSoup
qiantu = requests.get('http://www.58pic.com/')  ##requests.get是向服务器发出请求,就是,hi 服务器,我要千图网的源码
html = qiantu.content        ##把获取的内容输出一下,不过使用content是二进制
soup = BeautifulSoup(html,'html.parser')  ##用BeautifulSoup对HTML解析,html.parser就是解析格式是html
print(soup.prettify())##这个是规范输出一下
imgs = soup.select('img[class="scrollLoading"]',limit=10)##上边输出后会发现图片都在img中,然后用BeautifulSoup里的select找到img标签class是scrollLoading属性的,然后获取10个
num = 0 #利于下边的数,我喜欢0开始,都懂得。
for i in imgs:    ##因为上边img获取的是列表,要用遍历
  chun = i.get('data-url')##这个get(data-url)是只要属性是data-url属性的值
  print('这是%d张:%s'%(num,chun))##方便计数,i.get('data-url')是因为上边获取的是带标签的节点,
  qingqiu = requests.get(chun)##因为上边只是获取了路径,所以要向服务器请求图片的内容。
   try:                                                    ##异常处理
        fp = open('pic\\'+str(num)+'.jpg','wb')              ##fp打开一个文件,我这里没有文件就是会创建一个文件,pic\路径+num.jpg名字+wb可写模式
        fp.write(qingqiu.content)                            ##在fp里边写入qingqiu的二进制因为一张图片是由二进制组成
        fp.close()                                           ##关闭fp文件
        print('第%d张图片下载完成'%num)                         ##输出第--张图片下载完毕
        num+=1                                               ##num+1 以便记录
    except:                                                 ##异常处理
        print("这张图片不让下载")                               ##如果错误就是这张图片不让下载
print('下载完成')                                         ##完成后是下载完毕


好了我的第一个小爬虫就到这里了,有什么不足的或者错误的地方请指出。emmm下一次见

相关文章

  • 鸟与虫(一)图片,让我爬一下,就一下

    分享一下我爬千图网的步骤,加深影响,如果能帮助大家的我也很开心,有什么不足的请提提意见,谢谢。 就是一个简简单单的...

  • 何字何认,风言风语:第四期《为》

    关键词: 范字, 书法字辨识,“为”字形态与文化, 先来认一下字。 金文-鸟虫篆 “国之大事,在祀与戎”。对于古代...

  • 使用Scrapy爬取百度图片

    最近在做毕业设计,需要从网上下载图片,就研究了一下怎么使用Scrapy来爬取百度图片。任务很简单,拿到图片的url...

  • python之高清图片爬取了解一下

    高清图片爬取了解一下 前段时间在知乎看到一篇文章,关于视觉中国如何从腾讯身上扒一层皮的事情。大意就是互联网巨头在没...

  • 等一下,就一下

    用十根手指数时间,发现还有十二个小时 加上脚趾,时间又变长了 加上20根香烟,还是不能让时间缩短 没办法,只能用手...

  • Python 简单爬百度图片

    今天项目需要爬点图片资源,so,接触了一下现在火热的 Python 。 本例子适合 Python 新手 尝试一下 ...

  • 你的虚荣,干嘛让孩子背锅?

    刚刚下过雨的地上有很多西瓜虫, 贝贝捡了地上的小树枝轻轻地碰一下西瓜虫 正在爬的西瓜虫马上缩成一个小球 贝贝对着“...

  • 就,一下

    《就,一下》 午夜时分 灯光下 无数双眼皮 正浩浩荡荡的 排起长队 等待落下 聪明如我 截获了 这一重要规律 挺住...

  • 鸟与虫

    睡得晚的、起得早的 其实是失眠、多虑 的人 沾沾自喜的口头禅: 早起的鸟儿有虫吃! 我常悚然: 倘使究其实为: 早...

  • 鸟与虫

    薄曦催鸟醒, 懒虫觉露冷。 振翅寻暖处, 不知鸟在等。

网友评论

      本文标题:鸟与虫(一)图片,让我爬一下,就一下

      本文链接:https://www.haomeiwen.com/subject/hmoljftx.html