一、背景介绍
Olist Store是巴西最大的一家在线百货公司,各个商家可以通过 Olist Store 来售卖他们的产品,并通过 Olist Store 的合作物流伙伴来将产品送到顾客家里。
数据集包含了 9 个数据文件,主要包括从 2016年 到 2018年 的10万多条订单记录。文件中的字段覆盖了从产品、订单、物流、商家以及客户的多维度信息。
数据链接:https://www.kaggle.com/jainaashish/orders-merged
二、分析工具及基本流程
项目采用 Excel 进行数据分析,其中使用到 Excel 的 Power Pivot 插件工具。
分析基本流程主要分为以下几点:
1)数据集背景
2)数据字段的理解及预处理
3)Power Pivot 建模及表关联
4)销售分析
5)产品分析
6)物流分析
7)支付情况分析
8)商家情况分析
9)消费者情况分析
三、数据建模
将数据集的 9 个数据文件导入 Excel 里的 Power Pivot
通过连接各表建立关系,新增度量值,最终成功建立模型。
四、分析结果
1)销售分析
数据集的时间跨度是从2016年9月至2018年9月,所以2016年与2018年的订单记录是不完整的。但仍可从图中发现,该电商平台在2017年突然出现爆发式增长,2018年在2017年的基础上进一步稳定增长。
再细化到月份,平台销售额在2017年11月突然爆发式增长。原因上看,Olist Store 所在国——巴西是一个由移民组成的国家,集中了从西方到东方的多种宗教信仰,88%以上的巴西人信奉天主教。因此推测可能是由于感恩节、圣诞节等民俗节日的推动,促进了巴西人们的消费欲望,或是Olist平台开展了有力的宣传活动,导致了平台销售额出现爆发式增长。
总体来说,2017年订单数及销售额整体呈上升趋势,11月销量和销售额达到顶峰,且远高于其他月份;1月销售额最低,3、5月达到了阶段性的小高峰;另外,后半年的表现远好于前半年。
从产品类目上看,22%的产品类目实现了80%的销售额,符合二八原理,头部效应明显,订单数呈严重的两极分化;极大部分的类目产品订单数基本趋近于0,TOP10类目产品订单数遥遥领先。其中,health_beauty的销售额最高,bed_bath_table的订单数最多,说明美妆健康类产品与家具用品更受巴西用户的青睐。
2)时间序列分析
从时间序列上看,大部分时间内 Olist Store 的订单都在稳步增长,但2017年11月24日出现爆发式增长,订单量甚至快达到了1400,11月的销售额之所以很高,很大程度得益于24日这天完成的大量订单。
3)物流分析
上图横坐标为时间天数,纵坐标为订单数。从图中可以看出,订单运输完成时间天数依次为7、6、8天时,完成的订单数最多:7天完成运输的订单有7715单,6天完成运输的订单有7580单,8天完成运输的订单有6389单。另外存在个别异常订单运输时间过长,甚至达到了208天,这可能是距离过远跨国运输或其他原因导致的。
4)支付分析
通过观察上面饼状图可知,巴西用户首选信用卡支付的比例最高占到75%左右,其次分别是beleto、代金券voucher、借记卡debit_card等支付方式。
该图的横坐标为订单数,纵坐标为分期付款期数。通过统计分析,相比分期付款,巴西用户更倾向于一次性支付缴清购买产品的费用,分期付款方式处于发展阶段。
5)评价分析
总所周知,用户在收到货后能够对本次服务进行评价打分,那么评价等级与物流运输是否准时相关呢?
从上图对比可以看出,当物流运输能够准时将货品送到用户手中时,用户打5分的订单数远远高于打其他分数的订单数;而当物流运输迟到时,打1分的订单数却大于其他分数的订单数。因此能够判断,物流运输能否及时送达是影响用户评价的重要因素之一,提高物流运输效率能够有效帮助商家提高评价。
以上是我从销售、物流、支付、评价等几个角度进行的浅层分析,该数据集仍有更深层次的知识内容价值等待挖掘,希望这篇文章能对大家学习数据分析有所帮助。
网友评论