美文网首页python爬虫日记本技能学习爬虫专题
爬虫实战01:用Excel爬取全国空气质量数据

爬虫实战01:用Excel爬取全国空气质量数据

作者: 大苍狗 | 来源:发表于2018-03-20 16:08 被阅读195次

    作者:猿教授

    提起爬取数据,我们一般想到的是编程,其实不然,有些时候Excel就可以,不过Excel对网站的数据有要求,对,必须是Table结构!

    本次实战课题:用Excel爬取全国空气质量数据

    1. 找到数据入口

    图1,在Excel中依次选择菜单「数据」「获取外部数据」「自网站」,弹出「新建Web查询」页面。

    图1 数据自网站

    图2,新建Web查询页面相当于一个Excel内嵌的浏览器。

    图2 Excel内嵌浏览器

    2. 加载目标页面

    拷贝站点地址http://www.86pm25.com/paiming.htm内嵌浏览器「地址栏」,点击「转到」,等待页面加载。

    注意地址栏下方的提示:单击(C)→,然后单击“导入”(C)

    图3,加载完成后,页面上每个表的左上角都有一个黄色箭头,鼠标悬停在箭头上方,提示单击可选定此表

    图3 载入目标页

    3. 导入目标数据

    图4,找到《全国空气质量实时排名》表,点击表左上角黄色箭头选中。

    选中后黄色箭头→变成蓝色对钩 ✔,整个表格呈现浅蓝色背景填充,此时点击「导入」,可能有弹窗提示,也可能没有,确定后数据已经在Excel表格中了。

    图4 选中目标数据表

    看吧,用Excel爬取数据是不如编程有乐趣,但是绝对够直接了当、高效实用。


    4. 作业

    跟完实战,自己练习爬取以下数据:

    • 全球500强企业排行榜
    • 中国大学排行榜
    • 列车时刻表

    恭喜你!获得一项元技能!!!

    相关文章

      网友评论

      本文标题:爬虫实战01:用Excel爬取全国空气质量数据

      本文链接:https://www.haomeiwen.com/subject/nubvqftx.html