本系列的第一篇文章已对商业数据分析的四个层次做了整体介绍,其中描述性分析做为商业数据分析的第一个层次,主要回答『发生了什么』的问题,本篇文章将对如何通过数据发现、描述和回答『发生了什么』的方法和工具进行介绍。
方法
了解业务场景
如果想通过数据发现和回答『发生了什么』的问题,第一步并不是急急忙忙的直接去分析数据,而是首先要了解和还原数据产生的业务场景,包括:数据涉及到的部门和岗位有哪些,这些部门和岗位之间的业务流程是怎么样的,在不同业务流程中有哪些输入,对数据做了什么处理,又是如何输出和传递给下游部门的。如果不了解业务场景就去做数据分析,就如同盲人摸象,因此这一步至关重要。
探索性分析
探索性分析又细分为以下三个步骤:
-
提问,理顺初步分析思路和目标
在了解清楚数据产生的业务场景后,可试着问自己一些what happened的问题。比如,本月销售额是多少?环比和同比变化分别是多少?本财年销售的变化趋势是怎么样的?通过相应问题,可以理顺初步的分析思路和分析目标。另外,在上一步了解业务背景的时候,也要注意和相关业务的关键干系人沟通,获取他们想知道的what happened的问题有哪些。
需要注意的是,这里说的是初步的分析思路和目标,因为在随后做分析的时候,新的灵感可能会被不断激发,分析的思路和目标也在不断调整,这是一个循环往复的过程。 -
收集数据
有了初步的分析思路和目标以后,就可以确定需要收集哪些数据了。比如上文提到的销售额分析可能用到的数据为销售订单数据、销售开票数据。 -
选择相应分析方法
根据分析的思路和目标,就可以对收集到的数据选择相应的分析方法了。具体的方法包括:
- 对数据位置的探索,包括:最大值、最小值、均值、中位数、分位数等
- 对数据分布的探索,包括:偏差、方差、标准差、茎叶图、直方图、箱形图(也叫盒须图)、密度图等
- 对数据趋势的探索,包括:同比、环比、趋势图、条形图等
- 对数据聚合的探索,包括:排序、筛选、计数、重复项、分组、求和、比例、条形图、饼图等
提炼指标
对数据做探索性分析后,可对数据反映的事实有一个直观的感受,比如,通过分析一个仓库的月度收发存数据,可以大概知道这个仓库的货物周转情况。但是要想更准确、简洁地描述发生了什么,还应该提出更高的要求:即总结和提炼出相应指标。比如描述库存周转的整体情况,库存周转率、库存周转天数等指标更有效。这些指标可以做为企业日常经营管理的KPI,让相关人员快速、准确地了解到企业当前的经营情况。
工具
个人使用
描述性分析中最常用的工具就是Excel,但是随着商业环境中产生数据的增多,Excel的运行效率变得相对低下,并且Excel主要侧重于表格中的数字分析,但是因为人类对图形的敏感度和理解力天生就比数字高,正所谓一图胜千言,因此近年来可视化分析工具逐渐流行起来,此类工具主要是通过图形去对数据产生洞见,发现其中的规律,而不仅仅是用做结果的展示。Tableau就是其中的佼佼者。其上手比较容易,很多功能设计的也比较便捷和人性化,运行效率较高(10万行以上的数据Tableau较Excel有明显优势),输出的可视化图表也很美观,可直接用在数据分析报告里(Excel默认输出的图表都很丑,后期还需要做不少调整和美化,才能放到数据分析报告里)
Tableau是商业软件,不过提供免费版本Tableau Public使用,但是此版本存在诸多限制。大家可用邮箱免费注册旁听Coursera上的这门课程:《使用 Tableau 展示可视化数据》,注册以后会收到有效期半年的Tableau Desktop的序列号。
企业使用
对企业来说,描述性分析的工具主要是报表和BI。
报表一般是嵌入至各专业系统中,如CRM、SRM、ERP、WMS、MES等。
BI一般是单独的系统,其从各专业系统中抽取数据,经过处理后,通过表格或图形展示出来。Gartner 2017年企业级BI系统的魔力象限如下图所示,大家可以看到Tableau也是这一市场的领导者(产品为Tableau Server、Tableau Online、Tableau Mobile),Tableau之所以能超越一众传统强大的BI产品(如Oracle的BIEE,IBM的Cognos,SAP的BO)成为市场的领导者,主要原因是,商业智能分析平台市场的主流已经从IT部门主导的静态展示分析转向业务部门主导的动态探索分析,这样才能激发员工的主动性和创造力。
在报表和BI的基础之上,可增加预警系统,如对异常的指标进行邮件或微信预警,让领导仅对这些指标进行关注,而无需把所有的指标都看一遍,以节省时间,提高效率,有必要时再查看相应报表或BI展示,这也是企业描述性分析的应用方式之一。
本篇向大家简要介绍了描述性分析的方法和工具,涉及到的知识主要是统计学的内容,这部分知识需要大家自行找相关书籍进行补充阅读,下一篇将向大家介绍诊断性分析和预测性分析。
———————————
李应龙(微信公众号:leeyinglong),8年供应链管理相关工作经验,现在杭州一家通过机器学习和数据分析的方法解决企业供应链问题的创业公司负责产品设计的工作。
网友评论