“学习python数据分析,并带你感受东北充满文艺气息的火车站”
大家好,帅鸟今天给大家分享一篇有意思的文章——给全国各省火车站数量来个排名,这也是我老早之前就想做的,但是之前思路有点偏,好在迷途知返,今天终于能给大家见面了。下面一起来看看排名情况吧。
第一步:给各个火车站按省归类
走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。
直到前几天,我遇到了下面这个网站:
真是踏破铁鞋无觅处,得来全不费功夫
所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春
简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。
第二步:数据可视化
由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。
2.画出排名前二十的柱状图
排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。
3.画出东北三省火车站数量占比饼状图
三个省占了全国21%的比重,这个比例还是相当大的,
4.画出黑龙江省内火车站位置散点图
大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。
由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。
03
—
那么为什么东北会有这么多火车站呢?
这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。
但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!
(亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)
(横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)
(吉林西站,过去叫做黄旗屯站)
(旅顺站 国内保存最完整的欧式站台)
虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。
本文代码已上传,请在公众号“
python的爬虫与数据分析之路”后台输入:火车站获取
精彩回顾:
网友评论