一、数据背景
最近一直在接触销量预测,为了能够更好的理解数据,更好的利用算法去支撑起业务需求,就尝试性的去为业务部门分析一下数据里出现的几个噪声的原因。具体业务场景:某电商的某商品A在前后三天售价都基本平稳的情况下,突然在时间a销量暴增。
灵魂画手了解一下:
二、分析过程
1、售价分析
商品A在a日的售价有十几个,但主要销量来自于6.1元这个售价。基于商品A的不同售价分析得知:商品的售价会受到区域不同的影响有出现差异。在几个省份中,商品A均已6.1元的售价出售,但是a日的主要销量都集中在025区域。
2、区域分析
查看了商品A当日的的购买ID分别是460个不同ID,但是大部分的收货地址均指向一个区域025XXXX,并且每一单的购买数量都是5(可能是限购每人5件),但是该促销活动是买两件以上五折。综上我得出了两个初步结论:
- 黄牛扫货
- 该区域线下门店推广,在电商渠道购买商品A,满5件参与线下某个活动(返利、返券等)
3、访问渠道分析
商品A在a日的大部分订单数均是通过WAP访问,符合黄牛脚本扫货的逻辑。若是结论(2),访问渠道应该是手机端更加合理。
4、前后几天订单数分析
前后几天有效订单数平稳无太大波动,但是在(a-1)日,多了大量的取消订单数,即无效订单数,并且无效订单数的数量基本等于a日的有效订单数。且在(a-1)日取消订单的这些用户,大部分在a日又重新购买了商品A,但a日和(a-1)日A商品的售价并无变化。出现这种情况的具体缘由不得而知,但是在逻辑上并不符合结论(2)。
5、时间分析
a日处于工作日,若是结论(2)似乎在休息日推广线下更加合理。
6、流量、点击相关的分析
这部分数据采集的不是很完善,但是若是结论(1),点击顺序应该是固定的,这也是一个分析路径。但是由于某些数据采集原因并没有利用该部分。
7、用户信息分析
查询在a日购买商品A的用户的注册信息,以及购买历史行为。但是未取得该表的权限,故无法查询。
三、分析结果
从以上几点基本可以得到初步结果,基本可判断为本次销量暴增来源于黄牛扫货,其中还有很多信息值得挖掘,可以用来丰富一下自己的结果。
四、总结
分析的过程很简单,但是重要的是分析的思路,对数据的感觉,多维度思考的习惯。所以决定还是把这个简单的过程写下来,说不定以后遇到复杂的问题也能从中获得灵感。分析过程中还有许多更深层次的挖掘,产出了一些有意思的结果,也体验了一把初级“数据分析师”,锻炼了自己Hive Sql 的水平,希望自己能不忘初心,保持饥饿感,不断进步。
网友评论