如何快速爬取大量软妹图

如何快速爬取大量软妹图

作者: 麻瓜编程 | 来源:发表于2016-03-04 10:45 被阅读824次

如何快速爬取大量软妹图
第六章 spider批量爬取伯乐在线所有文章
爬取干货集中营数据（2）
数据保护和数据爬取
爬取干货集中营数据（1）
记一次BUG
Python 爬虫-Beautifulsoup库select的用
21 python多线程-线程进程协程并发,锁,死锁[pytho
爬煎蛋网妹子图
爬妹子图

在逛网站的时候，总有一些图片让我们感到心旷神怡。这时候一个个下载的话，右手容易酸，也比较费右键……

所以，在这里教你一个偷懒的方法，只需要十几行 Python 代码，就能快速爬取大量的妹子图啦~！

先来展示一下，这是最终成果，只需要几秒钟，妹纸图就都能下载到本地了😳

考虑到这可能是你写的第一个爬虫，我们来分解一下实现步骤：

Step 1：模拟浏览器请求

在你打开一个网页的时候，你的电脑就向服务器发起了一个 Request 请求，就像是寄了一封信，服务器为了回应你，给你返回一个 Response 请求，就像是回给你一封信。

那么，为了用程序模拟人类的浏览器向服务器发起请求，就要用程序发起 Request。这一步我们使用一个很好用的库，叫做 Requests，其中有一些具体的使用规则，我们只要在写代码的时候遵循这些规则就可以了。

Step 2：解析网页

BeautifulSoup 是一个用来解析网页的库，什么是解析网页呢，这个过程可以理解成是做汤。

我们要爬取的网页，就像是需要处理的汤料，也就是那根胡萝卜；

而 lxml 是一种解析网页的方法，相当于是一种食谱，还有其他4种不太常用的食谱，包括上面列举的 html.parser 等等；

Soup 是解析好的网页，相当于是用汤料和食谱做好的汤。

Step 3：获取想要的信息

解析后的网页会有一大堆内容，我们只需要妹纸图片，其他的都不要。所以需要从中筛选出来，并下载。

这部分涉及到一些 Python 基础知识，在这里简单讲解一下：

▋什么是 Print ？

▋什么是 for 循环？

▋什么是字符串切片？

name[-10:]就代表着从倒数第10个字符开始，一直数到最后。

在这里也就是对应着：me is Mike

代码及说明

学习了上面的基础知识之后，我们就能读懂这十几行代码代表着什么了。快来试试爬取妹子图吧😍

获取 User-Agent 的方法是：Chrome 浏览器中点击右键-检查-Network（再刷新一次网页）-在 Name 栏任选一个文件点进去-Requests Headers 里面就能看到你的 User-Agent了。

乔布斯曾经在《遗失的访谈》中说：

所有人都应该学习编程，学习编程教你如何思考，就像学习法律一样。学法律的人未必都成为律师，但法律教你一种思考方式。

有些人以为学编程是一件枯燥、漫长、无趣的事情，而我们希望用这个小项目告诉你，学习编程也可以是生动、有趣、容易上手的事情。

以上内容均节选/改编自网易云课堂的课程——Python实战：四周学会爬虫系统

加入课程后，可以看到完整四周课程，获赠零基础预习教程魔力手册，并得到班级老师的辅导与答疑。

欢迎加入预备班 QQ 群和大家讨论 Python 课程问题，参加每周的老学员分享，QQ 群号是：454652648，加群回复：实战计划

相关文章

如何快速爬取大量软妹图
在逛网站的时候，总有一些图片让我们感到心旷神怡。这时候一个个下载的话，右手容易酸，也比较费右键…… 所以，在这里教...
第六章 spider批量爬取伯乐在线所有文章
如何通过spider完成伯乐在线上大量文章的批量爬取首先，我们需要通过列表页爬取所有文章的url，前面部分只爬取...
爬取干货集中营数据（2）
爬取干货集中营数据（2） http://gank.io/ 得到更多妹纸图 ಠ౪ಠ 还记得上一次抓住的妹子吗。爬取干...
数据保护和数据爬取
数据的保护和爬取好比是矛和盾。数据需要保护，但是数据产生之后会有大量的爬取需求。如何实现数据的保护和爬取值得我们思...
爬取干货集中营数据（1）
爬取干货集中营数据（1） http://gank.io/ 得到妹纸图 ಠ౪ಠ 新建Scrapy项目：在你的scra...
记一次BUG
一、如何快速的给大量轨迹点打上区划代码？1、高德爬取街道中心点，行政区划中心点和边界。2、精度要求较高的，将边界加...
Python 爬虫-Beautifulsoup库select的用
录了个视频，如何使用Beautifulsoup中的select方法快速定位到你想爬取的数据。链接: http:/...
21 python多线程-线程进程协程并发,锁,死锁[pytho
为什么要学习多线程同一时间做了很多事情。使用场景 1，快速高效的爬虫程序一个爬虫同时解析连接、爬取文字、爬取图...
爬煎蛋网妹子图
利用 BeautifulSoup + Requests 爬取煎蛋网妹子图一、爬煎蛋网一页图片此爬虫只能爬取...
爬妹子图
利用 BeautifulSoup + Requests 爬取妹子图

网友评论

本文标题：如何快速爬取大量软妹图

本文链接：https://www.haomeiwen.com/subject/mfjokttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|如何快速爬取大量软妹图|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！