首先明确你学爬虫是为了什么。
为了好玩,那就Python3,妥妥的。
image话说Python2.7到2020年就停止维护了,并且Python3现在有很多新特性,至于学爬虫需要的第三方库比如Requests、BeautifulSoup也都支持Python3了,这点不用担心。话说现在连Scrapy这个写爬虫的大杀器也支持Python3了吧。
为了工作,那还是Python2.7吧。
之前有位网易的工程师统计过身边各大互联网公司使用Python版本的情况,70%的人都用的是Python2.7。所以找工作的话,最好还是先学Python2。
至于咋学呢?
基础语法的话,
廖雪峰的教程就挺好 2.7和3都有。
image实在想看书,那就Python学习手册(第4版)
image(豆瓣)和Python基础教程 (豆瓣)二选一。
image你要是觉得这两本书太旧,并且都是讲python2的,那你就看这本,Python编程:从入门到实践 (豆瓣),
image最新的python3,很新很良心的一本书,16年出版,内容详实,布置合理,绝对是初学者入门的首选。
爬虫部分的学习,想看书的话,
Python2.7的话,看这本,用Python写网络爬虫 (豆瓣),
image16年8月出版的,不用担心过时,很良心的一本书。由浅入深,一步步地带你实现并完善一个爬虫。
imagePython3的话,看这本,Python网络数据采集 (豆瓣),
image也是16年出版,同样也是介绍的很全面的一本书,urllib,正则,BeautifulSoup,Requests,正则,Scrapy,数据库等等你日后能用到的东西都讲到了,还有数据清洗和自然语言处理等比较高级的知识。
image好了,小编先说这么多,有关Python相关的事情都可以在后台私信我!
网友评论