今天给大家分享的是一个大数据分析实战案例,让我们乘坐时光机回到2018年10月1号,
image.png
早在前几天里,小伙伴们就已无心工作了,纷纷表示想要尽快为祖国母亲庆生~
image这不,盼望已久的国庆7天假期终于来了~
image在莎士比亚眼里,一百个哈姆雷特,就有一百种活法。
image对于国庆,小伙们也有各自的想法。有的小伙伴喜欢出去看看境外的世界,有的小伙伴热衷于调酒料理,有的小伙伴想去蹦极,也有的小伙伴喜欢感受不同地方的风俗文化。
image大家对国庆出行的一致看法就是,人真T喵滴多~无论到哪儿,就一个字,人!
印象中,课本上美如画的磅礴故宫
image 实际中,我莫不是读了假书 image image广告中的,上海摩登外滩
image 现实中,分分钟怀疑,这是世界是不是假的 image image去之前,
image去之后,
image国庆出去玩一趟,也可真是“人满为患”呀!该怎么办才好?
莫慌,和小叮当一起从大数据的角度来解读2018国庆出行~
image 我们先来看看,哪些旅游网站比较优秀 image image小叮当根据专业朋友的推荐,采用了“十大品牌网”的数据做为参考。
image小叮当选取了Top1---携程和Top2--去哪儿进行分析,
携程网:
image去哪儿网:
image分析后,小叮当个人感觉“去哪儿”网提供的景点信息还是比较丰富的。
再加上著名演员韩雪曾曝光过某程网“大数据杀熟”事件,
image最终,小叮当决定采用去哪儿网的数据进行分析。
本次一共采集了6631个景点数据。
image选取了“景点名称”、“景点等级”、“景点人气”、“景点地址”、“景点国庆销量”等指标来作为参考。
image 由于今年是2018年,所以我们就取18个热门景点 image来进行景区可视化。
image 可以看到2018国庆期间,截至10月2日19:25(数据在此时采集完毕),通过“去哪儿网”进行出游的国民,最喜欢成都大熊猫其次是故宫,接着是郑州动物园 image image 西安兵马俑的受欢迎程度,竟然还不如郑州动物园 image image这可能是,河南人口基数大,到郑州比较方便。再者也可能是,我们的数据只采集了国庆两天的数据,或许几天后会有所变化吧~
image经过对国庆这两天的各省份旅游人数分析,我们发现北京、四川是国民旅游人数最多的两个省份,果然还是帝都和国宝熊猫最受欢迎啊~
image但是"湖北"为啥能够为啥排到第三???有知道的小伙伴,可以在公众号里可以告诉下小叮当~
image下面,小叮当就综合人气、景点热度、景点销量等因素,为大家推荐几个那些不是那么拥挤的而又不失特色的5A、4A、3A级景点。
国庆旅游5A景区推荐:
image国庆旅游4A景区推荐:
image国庆旅游3A景区推荐:
image由于篇幅限制,部分数据可视化代码如下:
1#!/usr/bin/env python 2# -*- coding:utf-8 -*- 3__author__ = 'IT小叮当' 4date: 2018 / 10 / 2 5import matplotlib.pyplot as plt 6k=['携程', '去哪儿', '途牛', '同程旅游', '艺龙','马蜂窝','驴妈妈','猫途鹰','穷游','小猪短租'] 7v=[13345,6609,5023,4693,3935,3714,3669,3328,2763,1940] 8x=range(0,3*len(v),3) 9rects=plt.bar(x, v, color='rgby')10index=[i for i in range(len(v))]11plt.xticks(x,k,rotation=0)12for rect in rects:13 height = rect.get_height()14 plt.text(rect.get_x() + rect.get_width() / 2, height, str(height), ha='center', va='bottom')15plt.xlabel("名称") #设置X轴Y轴名称16plt.ylabel("点赞数")17plt.tight_layout()18plt.rcParams['font.sans-serif']=['SimHei']19plt.rcParams['axes.unicode_minus'] = False20plt.show()
更多精彩,敬请关注“IT小叮当”~
网友评论