第二遍,敲完七周七代码无成就感一股失落感,因为差距不会而失落。当然自己也学习到了关于消费分析非常重要的指标。也了解新的分析思路
《CD消费分析》
销量、消费金额、购买时间
1、 清洗数据,将文本型的时间格式转化为时间类型
时间转换2、 分析字段:user_id,查看每位用户平均消费金额、购买数量
3、 字段order_amount销量:绘制每月销量折线图、销量的直方图
4、 order_products销售额:绘制每月销售额折线图、销售的直方图
5、 每月销售金额和销售数量的相关图
6、 用户CD购买数量与消费金额相关性
7、 消费时间order_dt:第一次消费时间、最后一次消费时间
df.groupby('user_id').month.min().value_counts()
df.groupby('user_id').month.max().value_counts().plot.barh()
时间数据透视表:用户每月的消费次数
df.pivot_table(index = 'user_id',columns = 'month',values = 'order_dt',aggfunc = 'count').fillna(0)
复购率:某时间窗口内消费两次以上用户在总有消费用户中占比
回流率:
8、 分析用户质量:order_amount消费金额。排序——用户累计消费金额占总消费金额百分比
排序:用户累计销量占总销量百分比cumsum
分析用户质量9、 用户的生命周期order_dt:统计出用户第一次消费时间和最后一次消费时间的差值。查看生命周期的五位数(分布)
用户生命周期的直方图
生命周期大于0天的直方图。根据生命周期将客户分为:一般用户、普通用户、高质量用户
生命周期2次以上的五位数图、平均值
生命周期2次以上的用户10、留存率:留存率也是消费分析领域的经典应用。它指用户在第一次消费后,有多少比率进行第二次消费。和回流率的区别是留存率倾向于计算第一次消费,并且有多个时间
用户每次消费距第一次时间的距离
每次消费距第一消费时间差值 每次消费距第一次消费时间差值将时间差值分层
各时间段内的消费人数,数据透视表各时间段内的消费金额
各时间段消费人数消费金额 20181219CD项目思路分析12-用户的平均购买周期
20181219CD项目思路分析 20181219CD项目思路分析虽然学习统计学时给我们提供了分析思路,但真正的业务分析思路需要在实战中练习。以后上班,以及项目分析中要多练习实战项目多看案例。了解业务指标和思路。
回家补充思维导图
《美丽着努力着》
20181219CD项目思路分析 20181219CD项目思路分析
网友评论