美文网首页
python爬取豆瓣两千万图书简介信息:(一)目标API分析

python爬取豆瓣两千万图书简介信息:(一)目标API分析

作者: 曹波波 | 来源:发表于2017-07-10 09:13 被阅读207次

    python爬取豆瓣两千万图书简介信息:(一)目标API分析

    这是全部的调试过程,我已经整理成为笔记,这里分享给大家:

    目标API分析

    前一阵一直在看python,偶尔也写一写demo,但一直想写一个大一些的练手项目,偶尔看到豆瓣提供了一个图书简介信息的API:https://api.douban.com/v2/book/1220562
    最后一位即 图书的id
    稍微测试了一下,1000001 和 21220562 都有相应的图书简介信息:
    而且 1000001 的API返回结果如下:

    屏幕快照 2017-07-10 上午9.01.43.png

    在标记红框的位置出现了“第一”,“豆瓣的第一个条目”,“一本见证了豆瓣诞生的书”等字段。这说明id为1000001的《十一位牺牲在建国前的中共无衔军事家》 即为豆瓣的书id 的第一条。
    把id依次递增,即可得到对应id的图书信息。
    21220562 这个两千万级别的id ,是随手测试到的,测了31220562 ,返回值为:

    {"msg":"book_not_found","code":6000,"request":"GET \/v2\/book\/31220562"}
    

    再随意测试几个,21220562 以下的有图书简介信息的情况较多,21220562以上的几乎没有。

    那,这一次我们爬取的目标就很明确了,就是爬取豆瓣API的所能提供的 两千万图书简介信息。

    计划是用python发起网络请求,然后解析数据,并将数据放到mysql数据库中。具体的实现步骤,将在后面的文章中发布。

    相关文章

      网友评论

          本文标题:python爬取豆瓣两千万图书简介信息:(一)目标API分析

          本文链接:https://www.haomeiwen.com/subject/lehyhxtx.html