最近工作中,接手了一些商圈选址的项目。从和客户或者公司内部讨论中,发现不同背景,不同角色、不同部门的人,对于同一个项目的分析的方法,存在很大的区别。
今天,选取其中一个点,谈谈其中的一个不同。
01 我们拿上海举一个例子。
上海徐汇区有个A购物中心,浦东新区有个B购物中心。我们采集了过去一个月去过这两个购物中心的客人,并且我们通过GPS定位,获得了这些人的居住经纬度。
这个项目的第一步,是分析这2个地区的客源。为了了解不同人,分析时使用的方法,我们邀请了来自不同部门的佳佳和喔喔,来完成这个小任务。
佳佳的分析:
喔喔的分析:
02 谁的分析好?
我们首先来说一下佳佳的, 从她的分析来看,她是把不同的人的居住经纬度划分到了对应的行政区域。
通过柱状图,我们看出,徐汇区的A Mall,来自徐汇居民最多,其次是西南角的闵行,然后是上海的中心区域黄浦。
同样的,我们发现,开在浦东新区的B Mall,来自浦东的居民最多,黄浦第二,闵行第三。
客源占比 | A Mall | B Mall |
---|---|---|
第一 | 徐汇 | 浦东新区 |
第二 | 闵行 | 黄浦 |
第三 | 黄浦 | 闵行 |
你们有没有感觉,在看佳佳这张分析的时候,如果你熟悉上海地形,你会下意识的在脑中画一张上海地图,边看边想。不熟悉的上海的,会想方设法找出一张上海地图看。
嗯,对,闵行离开徐汇区的A Mall近,排第二,有道理。然后,看到B Mall的时候,嗯,闵行的东南面靠近浦东,去那里也方便。现在问题来了,如果我既想吸引闵行,又想吸引黄浦的客源,我该在哪里开店呢?
让我们再看看喔喔的分析,
喔喔把Mall的经纬度和客源的居住地算了一个距离,然后根据到Mall的距离,划分了0-5公里,5-15公里,15-25公里等。
我们从喔喔的分析,我们很清楚地看出,差不多接近一半的客源都是来自于5公里之内,5公里之外,客源数急剧下降。而佳佳的的分析图,很难一眼看出这些信息。并且,我们还可以看出,去徐汇区A Mall的客人,比起B Mall的客人,更能承受远距离。
在喔喔的分析中,他撇除了行政区的概念,把距离算做了分析的聚合维度。这种情况下,那怕不了解上海的地形的人,也能马上形成概念,这两个Mall客户的共同点和差异性。
03 你喜欢谁的分析呢?
1 分析的时候,看目的。不同的目的,我们用不同的方法。
2 从数据分析的角度,我会倾向喔喔的分析。简单的来说,原数据提供的是客源的经纬度,这是非常好的细颗粒数据,喔喔完整的保留了这些信息,而佳佳却把这部分数据上浮到了区县位置。
3 我们有时候分析的时候会借助其他外部数据。比如,我们会用到国家公开的统计数据。一般这种数据,往往都是在区县或更高的层面。所以,我们分析数据的时候,会和国家公开数据数据的颗粒度保持一致。这样通过一个参照物,我们能发现更多的差异现象。
4 如果将来需要建模选址,你是将区域作为变量放入模型,还是将距离放入模型呢。这些变量的选取都要去仔细分析的,而不是随便选个变量,然后变不同的模型方法看结果,分析和模型千万不能本末倒置。
5 最后,还有些常识性、政策性问题。比如,在有些区域,同样地图距离上的5公里,有些可能是平地,有些实际路线距离可能需要10公里或者更多。
04 如果是你,你会怎么分析呢?
如果我的文章能带给你一点点启发,还请动动你的手指,点赞、收藏、关注吧!
你的点赞和关注,是我一直写下去的动力!
如果你还想看我的其他文章,请戳
你被广告盯住了吗?广告的渠道和频度
先别急着分析竞争格局,谁是你的竞争对手还没弄明白呢
从做蛋糕到多重共线性(Multicollinearity)
消费者、用户和产品的关系思考
结合日常生活的例子,了解什么是卡方检验
一步一步教你分析消费者大数据
从优惠券的投放人群,教你看分类模型的评判标准
数据分析师,少一点套路,多一点思路
关于数据建模变量标准化,你想知道的都在这里了
运营经理,你真的知道模型里的R平方吗?
从可视化角度浅谈如何做一份优秀的咨询PPT(一)
用可视化思维解读统计自由度
孰好孰坏?第一方数据与第三方数据
读完这篇,连小学生都看的懂什么是机器学习里的boosting
教你炼就火眼金睛,识别会说谎的数据分析
网友评论