美文网首页
食在广州 | 爬取分析广州6万+餐饮门店数据

食在广州 | 爬取分析广州6万+餐饮门店数据

作者: 迷途小球迷 | 来源:发表于2020-07-04 17:21 被阅读0次

    继前两期分别爬取了海珠某区域和海珠区美食餐厅数据进行分析,应读者要求,本期更进一步,获取了全广州60000+个餐饮门店数据进行分析。不少读者对全广州的各种餐厅数据非常感兴趣。好了,马上安排。

    错过前两期的请查看下面链接或者查看美食餐厅类专辑:

    技术吃货用Python爬取广州海珠区1845个中式餐厅数据

    疫情过后重新开店,如何参考商业数据(数据干货)

    一、广州11区餐厅门店数量和人均消费



    image

    天河、白云的人口商业都是全广州最繁华的,门店数量果然也是遥遥领先,天河作为商业中心,人均消费也是最高的。但总体来看,人均消费差别不大,价格上都比较适中。

    二、不同餐厅门店数量和人均消费

    我们选取了其中五个数量最多的分类:中餐厅、外国餐厅、快餐厅、咖啡厅、茶艺馆|冷饮店|蛋糕店|甜品店|休闲餐厅。各种餐厅门店数量和人均消费:

    image.png

    注:这里的快餐厅是指连锁品牌:如麦当劳肯德基、品牌茶餐厅和连锁快餐大家乐等,外卖门店并不在此次的统计中,所以可能会有所遗漏

    由此可见还是中餐厅是主流。分析餐厅门店很重要的指标是地理位置,所以对比了一下中餐和外国餐厅门店的地理分布图,(红:中餐厅,绿:外国餐厅)。外国餐厅数量较少,但是主要分布在天河珠江新城CBD和海珠越秀等商业区。

    image

    单纯以区和餐饮门店类型做维度,很难直观查看到区和餐厅类型的关系,所以把这两个维度结合起来,做了一个矩形树图,让我们来看看不同区不同餐厅类型的数量分布:

    image

    矩形树图在数据分析中实现层次结构可视化的图表结构。柱形图不适合表达过多类目(比如上百)的数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值,以颜色表示类目,初次接触时都感觉到非常惊艳。Python pyecharts制作比较复杂,需要将数据放在特定格式的json格式,如果使用Tableau等可视化工具则使用拖拽方式即可。

    #做一个所有分类的树形图
    final_list = []
    cate_list = data_unique.groupby(by='adname').count()
    #第一层
    for i in range(len(cate_list)):
        cateName = cate_list.index[i] #区名   
        #第二层
        sub_list = data_unique[data_unique.adname==cateName].groupby(by='newType').count()
        two_list = []
        for j in range(len(sub_list)):
            temp_dict = {'value':sub_list.iloc[j]['name'], 'name':sub_list.index[j]}
            two_list.append(temp_dict)        
        temp_dict = {'value':category_rank.iloc[i]['name'], 'name':category_rank.index[i], 'children':two_list}
        print(temp_dict)
        final_list.append(temp_dict)
    

    天河果然是上班族的天地,快餐厅的门店数量是最多的。

    image.png

    海珠区的美食大排档是出了名的,所以特色地方风味餐厅数量是最多的,其次是快餐厅和冷饮店,果然是逛街吃饭的好去处。

    image

    好了,关于不同类型门店数量的分析就到这里,想更进一步了解,只需要下载html自己查看即可,无需编程开发。

    三、细分类型门店数量和人均消费

    前面做的餐厅分类是以中西餐大类作为分析对象,其实很多人关注的是更加细分领域,比如火锅店、川菜店、日本料理或者韩国料理等等,让我们来看看什么样的餐厅最贵吧:

    image

    法国餐厅人均293元一枝独秀,看来法国菜一顿饭吃3个小时是有原因的。其他类型的都没有超过人均100元的,其中的烧烤店是应做烧烤店的朋友要求,专门做一次烧烤店的分析,所以选取了店面包含“烧烤”的门店进行统计,数量上仅有839家,肯定有所遗漏,人均消费上,62元表示还能接受。当然也可以做其店面周边的门店类型数量和人均消费,下一期我们再做其他类型的分析。

    如果你想知道其他城市的数据或者其他类型门店的数据,请留言告诉我,下一期说不定就是你想知道的内容。

    如果对代码和矩形树图的html文件感兴趣,可以在公众号(迷途小球迷)后台回复:餐厅 即可。

    数据来源:高德地图API

    相关文章

      网友评论

          本文标题:食在广州 | 爬取分析广州6万+餐饮门店数据

          本文链接:https://www.haomeiwen.com/subject/qwnuqktx.html