美文网首页
爬虫技术选型

爬虫技术选型

作者: 贾梦阳 | 来源:发表于2017-05-27 15:35 被阅读90次

1.requests和beautifulsoup都是库,scrapy是框架

2.scrapy中可以加入requests和beautifulsoup等库

3.scrapy基于twisted,性能比较好,twisted是异步io框架

4.scrapy方便扩展,内置了很多功能

5.scrapy内置的css和xpath选择器很方便,beautifulsoup最大的缺点就是慢

6.网页的分类:静态网页,动态网页,webservices(restapi)

7.爬虫作用:搜索引擎,推荐引擎,机器学习的数据样本,数据分析,金融分析,舆论分析,

相关文章

网友评论

      本文标题:爬虫技术选型

      本文链接:https://www.haomeiwen.com/subject/qtyqfxtx.html