如何用 Python 自动爬取全国 30+ 城市地铁图数据？

如何用 Python 自动爬取全国 30+ 城市地铁图数据？

作者: b4a0155c6514 | 来源:发表于2019-01-18 10:46 被阅读15次

如何用 Python 自动爬取全国 30+ 城市地铁图数据？
我教学弟用Python自动爬取全国 30+ 城市地铁图数据！不再
【二】PYTHON爬取全国新房房价与浅析
使用python爬取抖音app视频（appium可以操控手机）
爬虫douyin相关
Python用Mitmproxy+Appium实现APP抓取
Python商品数据预处理与K-Means聚类可视化分析
Python代写商品数据预处理与K-Means聚类可视化分析
使用Python爬取网站数据分析
手把手用Python网络爬虫带你爬取全国著名高校附近酒店评论

最近两天工作之余，开始涉猎python，自动爬取了全国30+城市地铁图数据，这里分享下整个爬虫过程

学习Python中有不明白推荐加入交流群

            号：960410445
            群里有志同道合的小伙伴，互帮互助，
            群里有不错的视频学习教程和PDF！

image

数据来源

首先分析全国各个城市地铁图的数据来源，无非就是百度或者高德，这次选择用高德作为数据来源。打开高德地铁图PC端官网 http://map.amap.com/subway/index.html?&1100，点击每个城市可以看到当前城市的地铁图，打开浏览器F12一下，可以很容易看到Ajax请求接口后，地铁图才绘制出来的。

分析得知，xhr请求的接口数据便是我们需要的一部分数据（包含线路名称、线路名称坐标、线路轨迹、站点名称、站点定位坐标等），另一部分数据则是直接在Dom节点中（包含站点名称坐标），所以我们要爬取的数据便是 Ajax接口数据 + Dom节点数据 ，如图所示：

image

image

爬虫过程

了解清楚数据来源后，就开始进行python准备工作，记住万能公式 : 程序 = 『数据结构』 +『算法』

你要做的准备工作便是本次学习后收获的知识点：

**2.1 ** 用到哪些python库：

接口请求：采用requests库；

dom解析：采用lxml库；

浏览器自动化操作：采用selenium以及chrome浏览器驱动；

json操作：采用json库

*2.2 *用到哪些python数据结构：

list: 存储线路列表

dict：存储线路和站点信息

string: 存储各字段信息

这里不再讲述各个依赖库的安装，有针对性学习python相关知识点，就可以愉快地编码了，运行写好的爬虫脚本，不用任何手动操作，就可得到30+城市的json格式地铁图数据文件了

源码

https://github.com/caijinlin/python-spider （内附抓取视频）

总结

编码的过程中，遇到这样一个问题，有些城市的菜单在页面的『更多』里面，加载完页面后是隐藏的，python打开浏览器模拟点击的时候，会报一个找不到该元素的错误，经过google一番，总结了两个解决方案，亲测可用

https://github.com/caijinlin/dev-solutions/issues/14

相关文章

如何用 Python 自动爬取全国 30+ 城市地铁图数据？
最近两天工作之余，开始涉猎python，自动爬取了全国30+城市地铁图数据，这里分享下整个爬虫过程学习Pytho...
我教学弟用Python自动爬取全国 30+ 城市地铁图数据！不再
现在城市是飞速发展！各种城市都是拓展地铁线，我很久没有回长沙了，听说现在修到6.7号线了。我还真怕我回去都不会做地...
【二】PYTHON爬取全国新房房价与浅析
【一】学PYTHON及爬虫的一些总结【二】PYTHON爬取全国新房房价与浅析 PART ONE:【数据采集】爬取...
使用python爬取抖音app视频（appium可以操控手机）
记录一下如何用python爬取app数据，本文以爬取抖音视频app为例。编程工具：pycharm app抓包工具...
爬虫douyin相关
记录一下如何用python爬取app数据，本文以爬取抖音视频app为例。编程工具：pycharm app抓包工具...
Python用Mitmproxy+Appium实现APP抓取
记录一下如何用python爬取app数据，本文以爬取抖音视频app为例！转载请说明出处。编程工具：pycharm...
Python商品数据预处理与K-Means聚类可视化分析
数据提取在我之前的文章Scrapy自动爬取商品数据爬虫里实现了爬虫爬取商品网站搜索关键词为python的书籍商品...
Python代写商品数据预处理与K-Means聚类可视化分析
数据提取在我之前的文章Scrapy自动爬取商品数据爬虫里实现了爬虫爬取商品网站搜索关键词为python的书籍商品...
使用Python爬取网站数据分析
玩Chat分享有一段时间了，回过头来看看从数据爬取（如何用 Python 爬取网页制作电子书）、前后端（用 Kot...
手把手用Python网络爬虫带你爬取全国著名高校附近酒店评论
/1 前言/ 简介：本文介绍如何用python爬取全国著名高校附近的酒店点评，并进行分析，带大家看看著名高校附近的...

网友评论

本文标题：如何用 Python 自动爬取全国 30+ 城市地铁图数据？

本文链接：https://www.haomeiwen.com/subject/muggdqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

码农的世界

热点阅读

码农的世界

程序员

爬虫

关于我们|服务条款|联系我们|如何用 Python 自动爬取全国 30+ 城市地铁图数据？|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！