看了很多BI数据分析相关的文章,但没有一篇是站在全局来讲解什么是BI数据分析的。本文不涉及到数学和编程知识,力求用最简单的话语阐述清楚数据分析的全貌,让想入门和刚入门的新手对其有一个认知框架,可以更好地发展自身职业道路;同时也可以抛砖引玉,和专业人士进行思想的碰撞与交流。
BI数据分析背景
意大利哲学家、天文学家伽利略曾说过:“数学是上帝用来书写宇宙的文字。” 他摒弃了神学传统的宇宙观,认为世界是一个有秩序的服从简单规律的整体,要了解大自然,就必须进行系统的实验定量观测,找出它精确的数量关系。基于新的思想,他倡导了新的方法——数学实验方法。
如果宇宙运转是数学的体现,那企业的运转也毫无疑问是数学的体现。在20世纪,美国企业将数据方法引进到了企业管理之中,创造了量化管理理论。所谓企业量化管理,又称管理的数量统计法,是指以数字为基础,用数学的方法来考察和研究事物的运动状态和性能,对关键的决策点和操作流程,以及事物存在和发展的规模、程度等做出精确的数字描述和科学控制,从而实行标准化操作的管理模式。
数据分析是量化管理的一种体现或是实现方法,它既作为一个单独的岗位存在,同时也作为一项工作能力渗透进各个岗位。
由此可知,一个企业若是不具备良好的数据分析能力,是很难实现量化管理的,也就很难引导企业取得良好的发展。
BI数据分析本质
管理学大师彼得德鲁克说过,“无法度量,便无法管理”。所以量化管理的第一步是需要将企业业务数据化。可简单地将企业量化的数据理解为数据库中各种表的字段,这些字段记录了企业对内对外的所有信息。通过这些字段,可以构建指标体系、报表体系、机器学习模型等等,它们是进行数据分析的基础。接下来,我们将采用点线面体的方式来理解数据分析的本质。
每一个指标可看成是一个点,两点通过业务逻辑连接组成线段,所有的点组成一个平面,平面是立体在某一时间的截面,立体是由企业从成立到现在所有的指标构成。点线面体均是数据分析的对象,数据分析的本质就是研究这些对象之间的规律。
BI数据分析目的
数据分析的目的有三种:描述现状、寻找原因,预测未来。我们经常谈到的利用数据分析辅助管理者作出决策,是建立在这三个目的基础之上的。
描述现状可理解为通过指标体系和报表体系来表达企业当前业务运行的情况。这就要求数据分析师根据业务模式建立详细的指标体系,以及关键业务逻辑的报表体系。
寻找原因需要清楚业务逻辑,也就是指标之间的关联性。以需要分析的指标出发,找到所有可以连接到它的指标,去分析这些指标的异常,从而找到原因。我们知道,指标之间的联系是非常复杂的,可以影响到某一指标的指标有成千上万种,我们不可能面面俱到,这时就要求采用关键路径法。
预测未来就是根据当前的面预测下一个面,这个难度是非常大的。但往往我们需要预测的并不是一个完整的面,而是下一时间段的某个点,这相对来说就要简单多了。
BI数据分析流程与方法
数据分析的流程并不复杂,可抽象归纳成以下五个步骤:
(1) 确定目标。
如果没有分析目标,就犹如在数据海洋里茫然行走,最终会让每个分析师筋疲力尽、毫无成果。那如何确定目标呢?
我们可以采用关键指标法,简单来说就是通过分析需求,寻找需求的本质,这最终会体现在某一关键指标上。例如,如果我们接到的需求是分析为什么成交额会下降,那关键指标就是成交额。
(2) 分析目标
清楚目标后,不要急于去寻找数据,否则又会迷失在数据海洋里。正如前文所说,影响某一指标的相关指标有无数种,我们必须要寻找相关性大的指标。
我们可以采取第一性原理来分析目标。第一性原理由亚里士多德提出,它的核心就是要从回归事物的本质,去思考最基础的要素。
同样是以成交额分析为例,成交额的本质是用户购买产品,我们的底层数据就是用户和产品的排列组合,这是一个稀疏矩阵。通过这个矩阵,可以知道是哪几类组合的成交额下降了。同时,用户和产品自身也具备诸多属性,如姓名、性别、渠道、产品大类、产品小类等等。这些属性是影响因素,我们要做的就是看看哪些属性在成交额下降中起了较大作用。
(3) 准备数据
在分析目标的过程中,基本已经缕清了分析逻辑,对于需要的数据也都清楚了,这时要做的就是在数据库中取数了,不会取数的也可以找相应部门提出数据需求。
(4) 分析数据
这一步是数据分析工作中的重点,价值能否得到体现在于我们能否好好分析数据,这一步也是方法论最多的一步。
一提到数据分析,诸多文章就会列举一堆的方法,诸如PEST、SWOT、象限法等等。方法是层出不穷的,不用追求高大上,适合分析目标的方法才是好方法。
本文推荐5W2H和对比法的综合使用,这种结合可用于绝大部分的分析工作。
WHAT——分析的是什么
WHY——为什么会发生
WHO——对象是谁
WHEN——什么时间段
WHERE——哪类属性
HOW ——业务路径
HOW MUCH——影响多少
通过5W2H法可以将我们确定好的分析目标进一步整理得更有逻辑;对比法则可以让我们找到具体的问题所在。
但是对比法只是用来分析数据的常规方法,对于涉及到需要建模的分析工作,就需要采用机器学习方法了。本文暂时不涉及这些,在后续的文章中将依次介绍主流的机器学习模型。
(5) 结果呈现
怎样呈现结果也是非常有学问的一件事,结果呈现的不好,前期做的再好也没用。
可以借鉴如下方法:结果的整体结构采用金字塔原理,结论先行,自上而下进行表达;同时细节层面也要注意图表结合,格式统一等等。
BI数据分析要求
做数据分析一定要具备两样能力:兴趣和逻辑思维能力,这两样具备了,是一定可以成为一名优秀的数据分析师的。
俗话说,兴趣是最好的老师。有了兴趣,才会让自身有动力去学习各种业务知识和分析工具及理论。而且,没有兴趣的话,是很容易在日复一日和一堆繁杂紊乱的数据打交道的过程中丧失自信和工作激情的。
同时,逻辑思维能力也是必不可少的。因为没有一项业务的逻辑是非常简单的,而且,业务指标相互之间的联系也是纷繁复杂,捋不清逻辑就无法去做分析,从众多逻辑中找不出关键的业务逻辑就无法做出有价值的分析。
可以举一个简单的例子。签到表中有日期、人员编号、是否签到三个字段,如果我们想知道每个人的最大连续签到天数,该如何统计?
如果不具备良好的逻辑思维能力,可能都无从下手,或者找到的方式也是最低效的循环手段。
BI数据分析痛点
相信每个数据分析师都在苦恼如何让自己的工作变得有价值,而不仅仅只是表哥表姐或是取数狗。其实这个苦恼也就是数据分析的最大痛点——如何体现自身价值。
会取数、会做表固然也是一种工作价值的体现,但这门槛极低、天花板也极低。在人工智能的趋势下,这样的工作会逐渐被机器取代。
解决痛点的方法有三种:一是建立符合业务逻辑、满足绝大部分管理人员数据需求的报表体系。报表体系的建立是有很多要求的,它要保证报表数量不是特别多、能涵盖绝大部分业务指标、表设计具备逻辑性、非常利于管理层观看、美观等等。有了如此一套报表体系,既可以直接体现自己的工作成果,也可以让其他人员以此做基本的数据分析,从而减少一些常规的数据分析需求。
二是培养强大的逻辑思维能力,这种能力能够让我们的分析工作更加全面,分析过程更加合理,同时也能发现其它人没分析到的点。
三是培养数据挖掘能力。在大数据浪潮下,依靠自身去厘清逻辑,然后对每种逻辑进行分析的过程将变得不可取。我们需要采用相应的模型和算法(黑箱子)来完成我们的工作,即使我们并不清楚结果的原因,毕竟结果更为重要。举例来说,如果我们要进行用户分群,那相应的聚类和分类算法就会变得非常有用,结果如果有效的话也更能体现我们的价值和不可替代性。
具备数据挖掘能力的分析师的不可替代性要远大于普通的数据分析师,因为数据挖掘的门槛非常之高,没有强大的数学理论和编码能力,是无法胜任数据挖掘工作的。
BI数据分析工具
工欲善其事必先利其器,在数据分析中,掌握几款工具是可以极大提升自身的工作效率的。常用的工具主要也就是那几种:EXCEL、SQL、Python、SAS、R语言等等。
这些工具没必要做到精通,毕竟80%的工作都只会用到20%的功能。当然了,有余力也是可以把自身常用的软件学到精通的,多学几种也可以,毕竟技多不压身。
但总而言之,软件只是实现分析逻辑的工具,切记舍本逐末了。
总结
///
NOCITCE
路漫漫其修远兮,吾将上下而求索。数据分析之路是一条学习之路,需要我们始终保持对业务、对数学、对工具的学习。
行走在这条路上的同时,别忘了从思想层面去思考何为数据分析。也许,经常的思考就会让你有一天发现,原来自己已经成长为了一个数据分析大牛,走上了企业高层管理的位置,将数据分析思维贯彻到了企业管理之中。
END
网友评论