爬取python书籍一百页

作者: 小新你蜡笔呢 | 来源:发表于2018-07-29 19:00 被阅读3次

概要：利用selenium库爬取京东python书籍一百页存入csv

如果不知道selenium的基本操作，这里献上链接：selenium的使用（有点意思）

1、分析页面。

我们以前利用requests库等获取获取很麻烦。

利用selenium库可以省很多事情，我们只需要获取点击到下一页，

爬取我们需要的商品信息，存入csv。

所以我们要写三个方法来实现。

2、实现获取商品信息get_products方法。

我们需要抓取，编号，书名，价格，评价数量，出版社，

我们打开京东页面，切换到开发者模式，如图：

所有的商品都有一个类名：gl-item

data-sku为一个编号，后面的class名需要用到。

价格的class是J_加上编号

评价数的id是J_comment_加上编号

书名的class是p-name

出版社的class是curr-shop

于是乎我们可以实现get_products获取商品的信息：

3、实现点击下一页

4、存入csv

存数据链接：数据的存储（一）

5、完咯

网友评论

本文标题：爬取python书籍一百页

本文链接：https://www.haomeiwen.com/subject/hiltvftx.html

爬取python书籍一百页