美文网首页
用python对全国火车站数量进行分析,发现东北三省竟然占了2成

用python对全国火车站数量进行分析,发现东北三省竟然占了2成

作者: 小笨鸟_1d2f | 来源:发表于2020-03-31 19:02 被阅读0次

    “学习python数据分析,并带你感受东北充满文艺气息的火车站”

    大家好,帅鸟今天给大家分享一篇有意思的文章——给全国各省火车站数量来个排名,这也是我老早之前就想做的,但是之前思路有点偏,好在迷途知返,今天终于能给大家见面了。下面一起来看看排名情况吧。

    第一步:给各个火车站按省归类

    走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。

    直到前几天,我遇到了下面这个网站:

    真是踏破铁鞋无觅处,得来全不费功夫

    所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春

    简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。

    第二步:数据可视化

    由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。

    2.画出排名前二十的柱状图

    排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。

    3.画出东北三省火车站数量占比饼状图

    三个省占了全国21%的比重,这个比例还是相当大的,

    4.画出黑龙江省内火车站位置散点图

    大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。

    由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。

    03

    那么为什么东北会有这么多火车站呢?

    这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。 

    但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!

    (亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)

    (横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)

    (吉林西站,过去叫做黄旗屯站)

    (旅顺站 国内保存最完整的欧式站台)

    虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。

    本文代码已上传,请在公众号“

    python的爬虫与数据分析之路”后台输入:火车站获取

    精彩回顾:

    用python制作全国身份证号验证及查询系统

    盘点pyhton常见的黑客技术(一)  超简单

    12行python代码实现员工智能签到

    北京的房价到底有多贵?我爬取了3万多条数据得出分析结果

    相关文章

      网友评论

          本文标题:用python对全国火车站数量进行分析,发现东北三省竟然占了2成

          本文链接:https://www.haomeiwen.com/subject/oosguhtx.html