本篇文章的灵感主要来源2017武汉市共享单车出行报告内容解读的炫目的展示。诸位想观看该报告的话可以点击上述链接。
其实我不是故意鸽了那么久的。这距离我上次的简书文章已经快一年了。但是我不是故意的。。。主要是由于我最近要学习很多黑科技所以就把简书都给忘了。。以后争取做到两周一更新。好了好了。言归正传。接下来就步入正题。
老套路。我们先分析一下原始数据集。
看到这些数据集是不是感觉一脸懵逼。。那么我先解读一下这些数据集的列名。‘from_station_id’和‘to_station_id’:表示用户骑车的起点和终点。‘from_longitude’,‘from_laitude’,'end_latitude',‘end_longitude’:表示用户的起点和终点的经纬度。参照2017武汉市共享单车出行报告内容解读 我们可以做一下自己想要的需要展示。
首先现在总共有五年的历史数据。那么我想看一下Divvy单车在这五年中的站点(不知道怎么说能懂。。emm....就是类似巴士站之类的站点)。那么通过编程和分析可以做出如下的图表。 stations描述.jpg
这些密密麻麻的点就是所谓的站点。那么我们可以得知绝大多数站点都是在2013年建立的。而且2017年几乎没有新的站点兴建。
有个问题大家应该想知道。譬如如果我们身处北京三里屯站。那么我们是否想知道有多少人从北京三里屯站骑单车跑路了。还有他们都跑到哪里去了。甚至想知道他们之中有多少人去往相同的地方。那么这个问题就有点像百度曾经展示的牛逼哄哄的人口迁移问题。那么接下来我们还是利用编程,但是此处利用echarts模板制作一个站点的迁移图: 站点迁移.gif
可以看到站点名为177的具有很大的权重这也表示很多人从三里屯站骑车跑到了这里。具体该名字叫什么可以看一下原始数据集,在原始数据集中都有其描述。
其实呢由于这是芝加哥的地图显示,我也不太清楚其城市的流行度。但是从分布可知。该城市的单车分布是集中式分布。也就是说越红的区域范围表示该地区的单车分布约集中。
晚高峰.gif
接下来就是晚高峰时期的热力图分布。仔细看一下其实分布差别并不是很大。这也说明一个情况,就是共享单车的活动范围比较集中,而且该集中范围的地区应该也是该城市的有名的地区。。。这点应该很容易理解。
由于小编太懒。也是有一部分数据量太大的缘故(搞起来太费时)所以我只统计了2017年第一季度的数据。从图中可以看出来2017-02-20至2017-03-06是Divvy单车高峰时期。有可能说明其在该时段成长成为了巨头。。。。。!!!!但是接下来的时间段又恢复了平均状态。。那么这也有可能说明这家公司有可能干了什么惹人怒的事情了。。。纯属猜测。。。(如有雷同纯属巧合。)
那么再统计一下一周中周几被骑的次数最多呢?好的。接着画图。。 每周出行.png
从图中显示周一到周五单车的出行量很大。而周六周日的出行量相对较少。。不难理解吧各位。。。工作日呀。。。得工作呀。。周末呀。。。得睡觉呀。 能睡觉谁想去骑车。。。这肯定是为什么周末单车量较少的原因。。(by the way 我觉得。。是)。
接下来再看一下骑行60分钟以内的人的统计。其实再原始数据集中也不乏很多人连续骑了1天一夜的。但是毕竟少数。更何况我就是只想统计60分钟以内的人。。(就是那么傲娇)。。。 骑行统计.png
从图中可以看出骑行5-13分钟的人居多。。这很符合国家以前的号召“解决人们最后一公里的路程”。。所以这也是很容易理解的。一公里撑死5分钟也骑到了。。如果13分钟还不能骑到的话。。那么你可以去医院检查检查了。。。
好了好了。今天就先分析到这里吧。。其实还有很多点可以分析。譬如骑行公里数的分析。和目的地的分析。但是由于时间仓促。就没弄太多。。。祝大家看的愉快。。。由于代码量比较大这次就没有同往常一样边写代码边写图了。如果各位想要代码和数据的话可以联系我。。我看到的话就会发。如果单纯想要数据的话。那就直接点击Divvy共享单车数据集就可以了。
最后一句:祝各位周一快乐。。(阴险脸。。。)
网友评论