2018-11-03 -1- scrapy - 「前言」

作者: Python岳 | 来源:发表于2018-11-03 09:25 被阅读0次

2018-11-03 -1- scrapy - 「前言」
2018-11-03 -2- scrapy - 爬虫准备 - 虾米音乐网内容分析
 2018-11-03 -3- scrapy新建项目，以及编写目标内容爬虫代码
 2018-11-05 -4- scrapy - settings.py相关修改调整
 2018-11-08 -5- scrapy - 爬虫主代码文件编写

学习Python的时候，总感觉自己需要学的东西太多了：《Python核心编程》、《简明Python》、《用Python写爬虫》等等书籍……的PDF，而且多数是看到函数、类相关的知识，就直接迷糊，没有看了。特别是新版的《Python核心编程》的内容排版，更加接近手册，不像循循善诱的知识科普，对新人已经不再友好。

自学Python的方向，和多数人一样，是学爬虫，哪想到学爬虫还得学很多乱七八糟的东西。得学CSS(xpath-css选择器)，还得学数据库相关，还得学登陆，学post/get，学验证码，学MD5相关(非框架爬虫，数据md5，后续查询效率高)等等，感觉技能树分支太多，技能点都不够了。

于是在浪费了大量的时间后，决定还是学习爬虫框架（scrapy）来的快，到真正上手的时候，确实比自己用BS4、urllib、requests来的要快的多。

本系列以虾米网(xiami.com)为目标网站，不讲解登陆（直接使用登陆后的cookie，丢给scrapy直接使用），不讲解反爬虫，只讲解采集歌手专辑中，单曲页面中各种信息。这中间会包含讲解如何采集数据来源的问题。

网友评论

本文标题：2018-11-03 -1- scrapy - 「前言」

本文链接：https://www.haomeiwen.com/subject/iczhxqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2018-11-03 -1- scrapy - 「前言」

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读