对本阶段进行总结
第五阶段学习的内容已经是业务知识,业务知识个人认为需要通过多看书、多做项目和参与实际的工作才会更加熟练。
利用第五阶段的BlackFriday案例,在工具应用方面,再次加深了匿名函数、apply函数和seaborn模块的理解,明白了实际运用的意义和使用方法。工具应用方面也在做案例的同时不断熟悉,感觉提升了一定的独立分析的能力(工具应用+业务知识);
在业务知识方面,对电商简单宏观指标熟悉了,也熟悉了数据背后的含义,以及得出结论的思路。
分析框架:
1.整体简要的销售情况;
2.用户画像描绘与分析(分析最高价值的消费者群体,从年龄、性别、婚姻状况、职业、以及由性别、婚姻状况和年龄组成的维度,共五个维度进行分析)
3.对产品进行销售情况的分析(总体:高价值产品;细化:销售额Top10,销售量Top10,产品的类别;)
4.从城市的维度对销售情况进行分析
分析工具:
主体:python;模块:pandas、numpy、seaborn、matplotlib;可视化:python
一、整体简要的销售情况
1.数据导入与简要探索
(1)引入本次分析所需要的用的模块。为了方便后面的分析,利用魔法函数matplotlib inline让图表直接渲染;利用rcParms函数增加图表的可读性;
(2)读取数据,并查看表基本情况,如:查看表、字段类型、了解字段含义、表的大小,数据缺失情况。
该表由537577行数据和12列的字段构成,产品二级分类和三级分类出现数据缺失情况。
2.整体简要的销售情况
1.查看相关指标:总销售额、总销量、总购买(消费)人数、人均消费、所有产品平均客单价
描述型统计:1.该电商此次黑色星期五促销活动的销售额达到了50亿美元;
2.人均消费85万美元,购买人数为5891人,客单价在9333美元
分析:不到6000人的消费者,人均消费达到了85万美元,说明参与本次促销活动的消费者都是拥有高消费能力的大客户。该平台需要把握好其中的忠实用户,并引导消费。
二、用户画像描绘与分析
1.年龄维度
按年龄分组,通过聚合函数和匿名函数()对各指标进行运算。其中,消费人数的计算需要定义一个函数进行运算,通过运用drop_duplicates()函数对User_ID进行去重,从而得出整体人数,通过for循环对不同年龄层的群体进行区分。其他指标计算都运用匿名函数lambda(),通过apply()函数进行映射,提高数据提取的效率
分析:由上述数据可知:1.总体来说,18-45岁的消费者贡献了最多的消费额,为39亿美元,占比超过76%;同时,该年龄层的消费者人数达到了4289人,占比超过71%。从数据上来看,该年龄层的消费者是本次促销活动的主要消费者!2.其中,26-35的消费者尤为突出,消费额贡献将近40%,消费人数占比34%。在消费人数排在第一位的情况下,客单价也排在了第一位,达到了97万美元,是拥有高消费能力和高消费意愿的群体,可以考虑向该群体精准推送高价值的产品。
2.性别维度
按性别对数据进行分组,指标计算
方法同上
分析:男性消费者为本次促销活动的主要消费用户,消费额占比达到76%,是女性消费额的2.5倍,消费人数占比也达到71%,是女性消费人数的2倍左右;同样地,高消费人数情况下,客单价远高于女性消费者,达到了91万美元。男性消费者消费能力和消费意愿都明显高于女性消费者,可以考虑向男性消费者进行个性化推广,选择高价值的产品进行促销。
3.婚姻状况维度
按婚姻状况对数据进行分组,指标计算方法同上
分析:从得出的数据可知,已婚消费者和未婚消费者在消费额和客单价的差异并不明显,已婚消费者的消费人数相差1000左右,可能是消费人数的差异使消费额和客单价出现差距。总的来说,已婚消费者和未婚消费者在各指标的差异并不大,说明单靠婚姻状况维度可能对分析的帮助并不大
4.职业维度
按职业列对数据进行分组,指标计算方法同上
分析:职业为4、0、7的消费群体在销售额和消费人数都位列前三位,三者的差异并不大,共贡献了35%的销售额,以及占消费人数的34%。这些职业的消费者应该属于高价值消费者,应该加大关注。
5.性别、年龄、婚姻状态组成的维度
新增数据列gender_mstatus,用于合并性别与婚姻状况,按gender_mstatus和年龄对数据进行分组,指标计算方法同上
可视化展示:利用seaborn模块,快速创建直方图,对数据进行可视化,更加直观地呈现数据
(1)查看消费额
分析:1.总体来说,男性是本次促销活动的主要消费者,贡献了绝大部分的销售额。其中,18-45岁的消费者是消费的主体;2.在年龄在18-45岁的消费者中,未婚男性消费者是消费的主体;3.26-35岁的未婚男性消费者在本次促销活动贡献销售额方面尤其突出;
(2)查看消费人数
分析:1.未婚男性是消费人数最多的消费群体,已婚男性排在第二位;2.大多数消费者的年龄层都集中在18-46岁,以未婚男性为主;3.26-35岁的未婚男性是参与本次促销活动最多的消费群体,应该是该电商的忠实用户;
三、产品销售情况
1.产品维度
按产品进行分组,利用聚合函数计算销售额、销售额占比、销量、销量占比、客单价;找出销售额Top10、销量Top10,以及销售额和销量都为Top10的产品
分析:1.销售额Top10的产品为热销商品,销量Top10的商品的最受欢迎商品;2.销售额和销量同时为Top10的商品需要好好关注,监控库存情况,防止断货;
2.产品分类维度
由于二级分类和三级分类的数据存在缺失情况,只有一级分类为完整数据,所以在这里仅对一级分类进行分析。
按一级分类分组,利用聚合函数计算销售额、销售额占比、销量、销量占比、客单价;找出销售额前三和倒数前三的商品类别。
分析:1.在本次促销活动中,商品一级分类的1、5、8类商品的销售额位于前三位,销售额超过了36.5亿美金,三者一共贡献了超过71%的消费额;同时,三者一共贡献了39.9万的销量,共占比72%,属于热销商品和最受欢迎商品类别;
2.商品一级分类中13、12、17商品的销售额分别位于尾三位,在400万-570万美金之间,三者一共仅贡献了0.2%的消费额;
四、城市销售情况
按城市进行分组,利用聚合函数计算销售额、销售额占比、销量、销量占比、客单价
分析:1.B城市的销售额最高,达到了20亿美元,占比40%;
2.C城市的消费人数最多,为3139人,占比53%,但销售额和客单价却并没有高于B城市,说明该城市的消费者购买的产品的价格相对较低;
3.另外A城市的消费人数虽为最低,但客单价高于B城市,说明了A城市拥有较高的消费能力;
4.综上所述,A、B城市消费者的消费能力应该是最高的,可以考虑向该城市的消费者推销价格较高的产品;C城市的消费能力可能较弱,考虑向该城市推销单价较低的产品,争取增加销量
总结
从用户的角度,由消费者画像的方面进行分析:
1.由上述数据和可视化图表可得,26-35岁,职业分别为4、0、7、1的未婚男性为本次促销活动的主要消费群体,是拥有高消费能力和高消费意愿的高消费群体,是该电商的超级忠实用户;
建议:需要对这部分用户更加精准的个性化营销,留存好这类客户,在销售中为其提供高价值的产品;
2.对于其他用户来说,依然需要做好运营,引导其购买热销产品;
从产品的角度分析:
描述型统计:
1.在本次促销活动中,商品一级分类的1、5、8类商品的销售额位于前三位,销售额超过了36.5亿美金,三者一共贡献了超过71%的消费额;同时,三者一共贡献了39.9万的销量,共占比72%,属于热销商品和最受欢迎商品类别;
2.商品一级分类中13、12、17商品的销售额分别位于尾三位,在400万-570万美金之间,三者一共仅贡献了0.2%的消费额;
建议:
(1)1、5、8类商品的陈列位置从数据上来看应该是拥有最多流量的,可以通过这些位置对其他商品进行引流;
(2)需要查明排在尾三位的商品类别,即13、12、17类商品销售额占比过低的原因,若没有合适的解决方案,可以考虑商品下架或者减少关于这些类别的商品的陈列面积和降低引流(广告)费用;
(3)可以把其他商品的销售与1、5、8类别的商品捆绑起来销售,皆在以热销、受欢迎商品带动其他商品的流量和销售;
3.从城市的维度进行分析:
1.B城市作为消费能力最强的城市,需要在该城市提前准备足够的产品库存。
2.商品类别1、5、7作为最受欢迎的热销产品,需要在各城市的准备足够的产品库存,尤其在B城市;
3.监控库存情况,预防热销产品断货
网友评论