美文网首页玩转大数据Excel 加油站
惊叹!还可以这样爬取豆瓣电影

惊叹!还可以这样爬取豆瓣电影

作者: 幸福的耗子 | 来源:发表于2017-06-10 18:45 被阅读71次

上一篇写了使用excel爬取足彩赔率数据,用到的公式=Web.Page(Web.Contents(URL))。现在大多数网站是Javascript进行数据传递,这里教大家如何抓取豆瓣电影的数据,这次用到的公式是=Json.Document(Web.Contents(URL))

首先获取数据源的网址

Step1:你先使用谷歌浏览器(或者使用谷歌内核的浏览器也可以),进入豆瓣网站,用f12呼出开发者工具,进入network选择XHR标签。

Step2:显示一些网址,点击查看每个网址,看里面的数据哪个是展示我们想要的

Step3:点击页面加载更多,寻找加载数据的网址并发现规律

接下来我们对数据抓取并处理:

Step1:我们打开一个excel,在excel里面创建列,然后建立查询数据表。

Step2:把查询表中的列设置为文本格式

Step3:添加列选项卡中自定义列,并添加相关公式

这次使用到的公式:=Json.Document(Web.Contents(URL))

Step4:勾选需要展示的数据

Step5:选择关闭并上传数据上传完成了,就这么简单。

整个豆瓣电影数据抓取导入完成,如果教程中哪些不懂欢迎在评论进行回复。


                   

相关文章

网友评论

    本文标题:惊叹!还可以这样爬取豆瓣电影

    本文链接:https://www.haomeiwen.com/subject/rnlcqxtx.html