虽然说Python可以爬取小说,但是咱们还是得支持作者的辛苦写作的结果,支持正版!
本篇文章虽然是爬取网络小说,主要还是学习交流为主嘛!
什么是网络爬虫
百度百科解释:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
个人看法:当你需要获取大量数据或者批量处理的时候,Python爬虫可以快速做到这些,从而节省你重复劳动时间。比如:微博私信机器人、批量下载美剧、爬取天猫京东网站获取折扣、刷折扣机票、爬取适合的房源、系统管理员的脚本任务等等。
在这里还是要推荐下我自己建的群:483546416,群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴
其实这个案例很简单!
就用到了两个模块
requests和re
完整代码
运行结果
关注微信公众号:程序员大牛。每天分享干货
网友评论