美文网首页产品互联网科技@IT·互联网
2015年市区公共自行车出行分析(一)

2015年市区公共自行车出行分析(一)

作者: 旅行家John | 来源:发表于2017-01-02 12:04 被阅读771次

            哪里有公共自行车站点可以骑吗?他们什么时候骑?他们走了多远?骑了多久?哪些路线是热门骑行路线?哪些租赁点最受欢迎?周一到周末的使用量会有怎么样具体的变化呢?天气变化对骑行量是否会造成影响?自行车的使用能否得到用户行为习惯?我们已经听到了所有这些问题和反馈信息,根据我们用户的骑行数据,来帮助我们发现这些问题的答案和更多的信息。对提供的数据进行分析,开发,可视化和其他任何预测。感谢蓝鲸大神的帮助,接下来说下具体的实现方式。以下的数据有一定偏差,这里只讨论分析过程。

    三:分析和处理数据

    我们已2015年的数据为例,按月来存储数据

           公共自行车用户的骑行数据是按月存储的,因此我们需要逐月读取并将各个月份的数据进行拼接。

    生成一张总表。

    2015年自行车骑行数据共包含8516060次,16列数据。其中每一行数据都代表一次用户的租借和骑行记录。稍微初看的话,你会发现某些异常值出生年是6510,性别是NaN,这是由于本身的身份证数据就是错的.

    出生年错的原因是给我们的身份证信息就是错的,还有就是出生年带未知字母的,比如X,

    性别是身份证号码里面的第17位,由于录入的时候身份证少于17位,也就是空了。

    我们先处理这些空值,至于年龄问题,后面在对错的信息处理吧,可以取平均值,或是剔除这些数据,还有就是把错的数据筛选出来。

    惊人的852万次骑行

    我们首先对2015年公共自行车站点的数据中的几个关键指标进行统计,在一年中共有500个租赁点,9136辆自行车被使用。自行车的使用次数更是高达852万次,平均算下来每辆自行车每天被租借2.55次。可见人们对金华公共自行车的热情。而每次的骑行时间平均为17.75分钟。

    统计结果:

    统计每个月的租还数量

    2015年各月份统计数据

    2015年的公共自行车的总体使用量整体趋势由低到高,2月份自行车的使用量最低,接下来一季度使用量逐月增长,到了6月份的时候,使用量降低,然后7月使用量又增加。一直到10月份出现峰值,11月使用量开始下降。这可能是由于季节和气温因素导致的。我们下面按季度对骑行数据进行汇总并进行对比。

    计算方式:

    2015年6月份的天气(雨天居多),导致骑行量下降

    我们下面按季度对骑行数据进行汇总并进行对比。

    计算方式:

    从2015年四个季度的数据来看,用户对公共自行车的使用受季节因素的影响,第一季度气温最低,公共自行车的使用量也较低。第二季度第三季度为夏秋交替,使用量最高。

    哪些人使用公共自行车

    我们很好奇852万次骑行这个庞大的数据后面是哪些人在使用公共自行车。由于获得的数据中用户性别的数据有些错误,我们进行筛选。

    首先,我们计算性别比例,其中男性50.75%,女性44.49%,还有4.8%就是未知性别(这些数据就是错的)。

    以下是计算用户性别占比和绘制饼图的代码

    哪个年龄段使用公共自行车的人最多

    我们将公共自行车的用户年龄分为四组,-7975-18岁为少年组(这里有返老还童),18-30岁为青年组,30-50岁为中年组,50-75岁以上为老年组,还有50-2015(这里千年老妖)其中少年组的租借和骑行次数最少,中年组的租借和骑行次数最高,其次为青年组。50岁以上的老年组也有相当数量的记录。少年组的数据有一定的误差。

    骑行组计算方式:

    都有哪些卡数据(这里应该有公交卡,市民卡,银行卡,异形卡等等)在使用

    由于原先数据渡没有区别开来,这里就讲计算方式了。

    计算方式:

    哪个时间段的骑行量最大

    在852万次骑行的数据背后,是否存在一些规律?我们选择了10月(秋季)的数据对用户使用公共自行车的行为进行了统计和分析,这里既包括使用公共自行车的时间,也包括骑行速度,热门租赁站点和骑行线路。

    24小时骑行分布图

    公共自行车的使用者大部分为城市居民,少部分为游客。在一天中的上午7点—9点和下午的4点—6点是公共自行车的使用高峰。这两个时间正好是上下班的高峰时间。除此之外中午12点—下午4点也有较高的使用量。

    计算方式:

    各个时段的骑行时间

    用户的骑行时间和速度是怎样

            在骑行时间方面,按照公共自行车的骑行时间有不同的限制,每次免费的骑行的限制时间为1小时,超过1小时每增加1元。公共自行车鼓励用户短途使用并且在接近限制时间时重新租赁新的自行车,避免产生超时费用,并且提高自行车的周转率。我们对10月份用户的骑行时间进行处理和分组,通过下面的图表可以看出大部分用户的使用时间为10-20分,5分到10分的骑行时间也比较多。

    平均骑行速度4.54公里/小时,(这部分结果算算有出入)有空再仔细算算。

    计算方式与过程


    结束语

    我们使用科学计算方式对市区公共自行车系统852万次骑行数据的简单分析,可见用户对公共自行车系统的热爱和使用频率的同时,也学习到很多用户骑行的信息。使用公共自行车的用户以的中年妇女为主,在每天的早晨的8点和傍晚6点是公共自行车的使用高峰。由于对公共自行车超时单独收取费用,用户的骑行时间多数在20分钟以内。夏秋两季租赁量最大,平均骑行速度为4.54公里/小时。

    后续问题

    1:季节性和气温对公共自行车使用的影响?

    2:公共自行车对节假日出行的影响?

    3:用户的年龄与骑行速度是否有关联?

    4:用户在每周的骑行趋势是什么样的?工作日和休息日公共自行车的使用率是否不同?

    5:一辆自行车在一天中的路径是什么样的?

    6:根据最受欢迎的租赁点来判断城市热点位置?

    7:根据骑行路线能否对用户行为进行分析?

    相关文章

      网友评论

      • 雪飞鸿:请问,楼主的数据从哪里获取的?
        旅行家John: @雪飞鸿 自己公司的数据,做了一些修改!你可以参照花旗银行的共享单车数据!
      • 40岁前的凯撒:同问,数据源哪里的?
        40岁前的凯撒: @二元一次函数 @40岁前的凯撒 有链接吗?非常好奇这块
        旅行家John: @40岁前的凯撒 可以去参照花旗银行的共享单车数据!我用的是自己的
      • 向右奔跑:数据源是如何获取的?
        旅行家John: @向右奔跑 可以用其他城市数据的代替,我用的是自己公司的一些数据,有偏差!

      本文标题:2015年市区公共自行车出行分析(一)

      本文链接:https://www.haomeiwen.com/subject/xsjwvttx.html