爬取python书籍一百页

作者: 小新你蜡笔呢 | 来源:发表于2018-07-29 19:00 被阅读3次

    概要:利用selenium库爬取京东python书籍一百页存入csv

    如果不知道selenium的基本操作,这里献上链接:selenium的使用(有点意思)

    1、分析页面。

    我们以前利用requests库等获取获取很麻烦。

    利用selenium库可以省很多事情,我们只需要获取点击到下一页,

    爬取我们需要的商品信息,存入csv。

    所以我们要写三个方法来实现。

    2、实现获取商品信息get_products方法。

    我们需要抓取,编号,书名,价格,评价数量,出版社,

    我们打开京东页面,切换到开发者模式,如图:

    所有的商品都有一个类名:gl-item

    data-sku为一个编号,后面的class名需要用到。

    价格的class是J_加上编号

    评价数的id是J_comment_加上编号

    书名的class是p-name

    出版社的class是curr-shop

    于是乎我们可以实现get_products获取商品的信息:

    3、实现点击下一页

    4、存入csv

    存数据链接:数据的存储(一)

    5、完咯

    相关文章

      网友评论

        本文标题:爬取python书籍一百页

        本文链接:https://www.haomeiwen.com/subject/hiltvftx.html