摩拜单车非官方大数据分析

作者: 我是思聪 | 来源:发表于2017-02-05 22:20 被阅读24366次

    2017-7-19:想查看当前单车实时位置?请看 http://www.jianshu.com/p/058d847ba297

    趁着过年的清闲时光,我抓取了摩拜单车的数据并进行了大数据分析。以下数据分析自1月19日整日的数据,范围成都绕城区域以及至华阳附近(天府新区)内。成都的摩拜单车的整体情况如下:

    标准车型和Lite车型数量相当

    摩拜单车在成都大约已经有6万多辆车,两种类型的车分别占有率为55%和44%,可见更为好骑的Lite版本的占有率在提高。(1为标准车,2为Lite车型)

    单车类型

    三成左右的车没有移动过

    数据分析显示,有三成的单车并没有任何移动,这说明这些单车有可能被放在不可获取或者偏僻地方。市民的素质还有待提高啊。

    出行距离以3公里以下为主

    数据分析显示3公里以下的出行距离占据了87.2%,这也十分符合共享单车的定位。100米以下的距离也占据了大量的数据,但认为100米以下的数据为GPS的波动,所以予以排除。

    出行距离分布

    单车骑行次数以5次以下居多

    单车的使用频率越高共享的效果越好。从摩拜单车的数据看,在流动的单车中,5次以下占据了60%左右的出行。但1次、2次的也占据了30%左右的份额,说明摩拜单车的利用率也不是很高。

    单车骑行次数 单车骑行次数

    从单车看城市发展

    从摩拜单车的热图分布来看,成都已经逐步呈现“双核”发展的态势,城市的新中心天府新区正在聚集更多的人和机会。

    双核发展

    原来的老城区占有大量的单车,在老城区,热图显示在东城区占有更多的单车,可能和这里的商业(春熙路、太古里、万达)及人口密集的小区有直接的联系。

    老城区

    而在成都的南部天府新区越来越多也茁壮的发展起来,商业区域和住宅区域区分明显。在晚上,大量的单车聚集在华阳、世纪城、中和,而在上班时间,则大量聚集在软件园附近。

    软件园夜间 软件园白天

    在线网站

    如果你对数据感兴趣,我已经创建了一个网站供大家使用,请用电脑访问:http://www.april1985.com/mobike/
    (为节省开支,后端服务器已经关闭)

    相关文章

      网友评论

      • 神秘的尹先生:眼前一亮
      • 鬼宇书生:大神,厉害
      • 1491c042578b:您能不能分享一些数据呢?我的邮箱joule@tju.edu.cn
        我是思聪: @唐吉诃德215 请联系微信bcdata
      • 9e08ae5ebefd:能给个web目录的使用说明吗?react文档有点难看。
      • 9f80f433791f:我要加你 好友 怎么办:relaxed:
      • Ruining101:?反编译😅
      • 我是思聪:需要数据的请见最新的文章
      • fd79fc7157a7:感觉作者真是大神!请问能分享一下数据吗?本人是在校研究生,想做做相关研究,就是数据来源非常难搞
        9e08ae5ebefd:能给个web目录的使用说明吗?
        8d62498d2272:可是大二学生看不懂啊
        我是思聪: @Usar 请看我最新文章
      • Sharymo:厉害👍
      • Cloba:请问您建的数据摩拜网站要怎么用呢?上面会显示实时数据吗
        我是思聪: @Cloba 之前会的,现在关了,一个月支出有点大,就关了
      • 3bc2ebf14952:很想知道获取到对应的Api的过程
        我是思聪:请见新文章:http://www.jianshu.com/p/07225f301fc4
        我是思聪: @00舟州 后续会放出方法
      • 罗罗攀:厉害,赞一个
      • 杂家大兵:很赞,请教下,怎么做出来的?
        我是思聪:请见新文章:http://www.jianshu.com/p/07225f301fc4
        我是思聪: @杂家大兵 后续有文章分析,请关注
      • leeyis:能透露下是如何爬取数据的吗?
        我是思聪:请见新文章:http://www.jianshu.com/p/07225f301fc4
        我是思聪:找到他们的api就可以下手了,下文分解:)
      • 浮云匿晨晖:厉害,摩拜单车好像只有手机端的应用,你是如何爬他们的数据的呢?
        我是思聪:请见新文章:http://www.jianshu.com/p/07225f301fc4
        浮云匿晨晖:@贺思聪_TW 期待下文:smile:
        我是思聪:找到他们的api就可以下手了,下文分解:)
      • 呆萌的加菲小喵:猴厉害👍
      • 5c5bc78a5f85:作者的分析虽然对于大数据来说基础了些 不过还是看的出来抓出来的数据比价关键 相对于有限的资源 爬虫能力更让人眼前一亮
        我是思聪:@HOHOOO 在后端我用Python写了一个服务端用来实时展示数据。
        对于两点建议,请问应用的场景是什么?分析的意义是什么?
        HOHOOO:@贺思聪_思特沃克 同感,想问下您处理完数据后怎么接到前端展示的,感觉很厉害啊。另外提点不成型的建议:
        1.引近区域网格分析(geohash等算法),对区域进行精确的计算。
        2.针对特定的地点(热点区域),进行OD分析。
        我是思聪:是的,目前数据分析还在进行中,都是一些基础的数据分析。我还想做一些车的流动的分析,看能不能以可视化的方式展现更多。

        其实更重要的还是数据,我的爬虫架设在一个5美元的服务器上面,用Python写的。这个爬虫大约15分钟可以采集所有单车的位置数据数据一次,每日产生接近1G的压缩数据,这样量级的数据有更高的价值。
      • 斑马个斑马:感谢作者分享,非常合理的分析,专业水平好硬。
        本人不是搞计算机技术的,所以不知道作者的数据权威性和时效性如何?
        另外想问一下,作者的数据可以作为社科研究的依据么?
        斑马个斑马: @贺思聪_TW 多谢回复,费心了!
        我是思聪:数据来源于摩拜单车的接口,时效是20分钟爬成都的数据一次。
        作为研究数据可能比较欠妥,还是找摩拜单车他们合作比较好的。
      • 向右奔跑:好棒~
      • pei_jane_book:好奇,数据怎么来的
        我是思聪:请见新文章:http://www.jianshu.com/p/07225f301fc4
        我是思聪:自己写的爬虫爬的
      • 我是思聪:欢迎评论:)
        我是思聪: @在哪儿去哪儿 www.github.com/derekhe
        在哪儿去哪儿:楼主,您好!您能不能分享一下python的源代码给我呢?我正在学习中。。。谢谢大神!还有Python的数据可视化是怎么做到的呢?

      本文标题:摩拜单车非官方大数据分析

      本文链接:https://www.haomeiwen.com/subject/hrfyittx.html