作者:猿教授
提起爬取数据,我们一般想到的是编程,其实不然,有些时候Excel就可以,不过Excel对网站的数据有要求,对,必须是Table结构!
本次实战课题:用Excel爬取全国空气质量数据
1. 找到数据入口
如图1,在Excel中依次选择菜单「数据」→「获取外部数据」→「自网站」,弹出「新建Web查询」页面。
图1 数据自网站
如图2,新建Web查询页面相当于一个Excel内嵌的浏览器。
图2 Excel内嵌浏览器
2. 加载目标页面
拷贝站点地址http://www.86pm25.com/paiming.htm
内嵌浏览器「地址栏」,点击「转到」,等待页面加载。
注意地址栏下方的提示:单击(C)→,然后单击“导入”(C)
。
如图3,加载完成后,页面上每个表的左上角都有一个黄色箭头,鼠标悬停在箭头上方,提示单击可选定此表
。
图3 载入目标页
3. 导入目标数据
如图4,找到《全国空气质量实时排名》表,点击表左上角黄色箭头选中。
选中后黄色箭头→变成蓝色对钩 ✔,整个表格呈现浅蓝色背景填充,此时点击「导入」,可能有弹窗提示,也可能没有,确定后数据已经在Excel表格中了。
图4 选中目标数据表
看吧,用Excel爬取数据是不如编程有乐趣,但是绝对够直接了当、高效实用。
4. 作业
跟完实战,自己练习爬取以下数据:
- 全球500强企业排行榜
- 中国大学排行榜
- 列车时刻表
恭喜你!获得一项元技能!!!
网友评论