如何从事物认知的基本方法构建数据思维?
1.1 描述事物的基本方法:要素、属性和方法(行为)
用数据描述事物时需要有个方法对事物进行记录,并能够回溯回去,还原事物,且能够结构化相关的数据,以方便我们对数据进行处理。现在经常采用的方法是要素+属性+方法的模型。
① 要素
所谓的要素,就是事物的构成部分,可以是可见的,即显性的,也可以是不可见的隐性组建。一个企业组织有员工、资金、生产材料、土地、厂房、设备等可见的要素,也有隐性的要素,如制度、流程、员工关系、岗位、架构、管理诀窍、技术、专利等。
梳理事物显性的要素比较容易,直接拆分即可,但梳理隐性要素则需要对存在的隐性要素进行分类。比如制度和流程本身就是对公司管理方法的分类,制度和流程之间并没有明显的界限,在某些企业,制度是用流程的方式来限定的,把制度也看做是流程的一部分,而有些企业则把流程看做是制度的一部分,其实具体的分类名称并不重要,重要的是企业在经营和管理过程中能够很好地处理好资源的配置和资源转换的推动力。
② 属性
所谓的属性,就是描述要素特征的维度。比如对企业的“员工”这个要素进行描述,“员工”有如下几个属性:姓名、性别、年龄(出生日期)、入职日期、学历、工作背景、专业背景、民族、身高、血型、体重等,根据具体的管理需求,可以对要素进行各种描述。
显性要素的属性比较容易描述,数据也比较容易采集,但对隐性要素的属性描述将有较大的难度。
③ 方法
所谓方法,就是基于要素和属性的行为、或者产生的结果。就像灯泡有灯丝、电极等要素,灯丝有耐高温、导电(有一定的电阻)等属性,而这些要素和属性决定了灯泡通电即亮的行为即为方法。
要素、属性和方法的模型框架是人类数据化描述事物时使用的一种有效的方法。在计算机程序编写中描述外界事物,通过设定“类”,实现了面向对象的编程方法的设计,面向对象的程序设计思想让软件产业得到快速发展,从而实现了软件的并行和并发,一改过去面向流程和过程的程序设计,最终成就了现在软件市场的繁荣。
要素是事物的构成部分,而属性是对要素的特征描述,方法是因为事物具有此要素和属性之后必然具备的行为能力、行为特征或者状态特征。软件是对现实事物运行的描述,可以用要素、属性和方法的模型来开发,企业大数据体系的构建也可以使用这个方法模型。在实际的大数据构建过程中,其实要素和属性不需要划分得很清楚,甚至可以归为一类。要素和属性是静态,而方法是描述动态。
1.2 认知事物的五个基本方法
① 对比法
对比是我们认知事物的基本方法,在大数据应用中,我们也用对比法作为所有数据分析与挖掘的基础。对比的结果是描述两个事物的差异。对比必须要有对比的标准,把这个标准叫作对比维度,从不同的维度对比,得出的结论就会不同。
首先,对比要有公认的对比基础,不能以个人的偏好作为基础。就像我们无法对比苹果和李子谁好谁坏一样,不同的人会有不同的喜好。
类似的,在企业管理中,对比两个员工的业绩,也需要从员工实际的业绩出发进行对比,但也要考虑到两个员工所处的环境、进入公司的时间长短、耗用公司的资源不同等来比较。
其次,对比要在相似的对象之间进行,可以是完全并列的两个对象,也可以是同一个对象在不同的历史时期进行对比,这涉及对比主体的可比性问题。错误对比对象的选择会导致错误的对比结果。
经常用到的对比是同比与环比。同比能够消除季节性的影响,但同比的周期很长,在中国经济快速发展、市场快速变化的环境下,因为同比时间跨度大,往往并不能反映当期的实际变化情况,所以会用前x月累计同比来看两年间的变化。如果一个行业或者市场有较强的季节性,使用环比就容易导致结论偏颇。在进行同比时,用季节性指数1消除季节性规律后再比较增减趋势。
② 类比法
类比是人类认知新事物的第一反应。当我们碰到新鲜事物时,第一反应就是这个像什么,我们在脑海中寻找曾经经历过、看到过、学到过、读到过、听说过的事物,然后对比特征,找到相似点和差异点,然后分析相似点和差异点,以及对是否给我们带来威胁,做出本能的判断。这是人类在征服大自然的过程中形成的本能。
类比的方法也是进行数据分析和挖掘时经常用到的方法。当我们面对一大堆新的数据集时,需要寻找之前类似的或者相似的数据集,然后拆解开来,寻找新的数据集与之前数据集或者分析方法的雷同之处,这样可以大大加快了解一个新数据集。
比如我们在研究智能汽车行业的时候,会类比到智能手机。智能手机行业在发展的时候经历了一个S曲线,这与其他新兴的市场类似,那么智能汽车也会经历这样一个发展周期,这就是类比的方法。
当然,我们在做类比分析的时候,需要在分析相同点、相似点的同时也要关注不同点。比如,智能手机与智能汽车行业的分析,手机价值较低,使用周期较短,相关技术发展较快,而智能汽车作为大件,置换速度慢,投资大,使用周期长,在其替代常规的功能汽车时,必然有更长的周期。
类比的方法还可以给我们带来新的想象空间。对客户的分析可以使用客户地图,而对于供应商的分析,也可以把供应商放到地图上,只要是有地理位置信息的资源及资源活动,都可以放到地图上去看看会发生什么,有什么地理分布的特征,基于地理位置的地图分析法就可以延展到其他的方面,这就是利用类比的方法来延展的分析方法。
类比是一种思维方法,在一个方面积累了经验,在碰到类似的事情时,利用所积累的经验;针对一种事物用了一种分析方法,同理类比,可以用这些分析方法做针对其他对象的分析。
③ 分类法
分类法也是我们认知事物的基本方法,与类比法相似,当把很多事物归到一个类别的时候,就容易处理或者对待这些事物,这样处理事物就变得简单了。我们把人归为好人和坏人,在日常相处的时候,对好人就不那么防备,对坏人则时刻提防,这是一种人类的本能。
用到数据分析领域,我们会对客户进行细分,将客户分成不同类型后,可以针对同一类客户采取同一类的服务方式,大幅度降低服务成本,能够对客户的需求把握得更加精准,在产品设计上也可以针对不同的用户研发更有针对性的产品。
我们用类比的方法来延展分类的思维方法。比如可以对客户进行分类,也可以对产品进行分类,可以对供应商进行分类,还可以对合作伙伴进行分类等。只要是公司内部的资源,就可以用分类的思路考量,通过分类之后,管理起来更容易,寻找突破点和机会点也更容易。
分类不仅仅是数据分析和挖掘的方法,更是一种思维模式。
分类有分类标准,所谓的标准,是描述资源的属性或者构成要素。对事物进行分类的标准可以是一个或多个。
用一个分类标准来分类的,叫作单维度分类法。用两个分类标准来分类的,叫作矩阵分类法。把两个标准分别放到纵横两个坐标轴上,就可以做出一个散点图。可以在两个维度上分别用高和低来评价,这样就有了四个象限,叫作象限分析法;如果在每个轴上再分成高、中、低档,则有了3×3的九宫格,如下图所示。
象限分析法和九宫格
著名的波士顿矩阵就是将业务的相对市场占有率和市场需求增长情况放到两个坐标轴上,形成业务选择矩阵,两个坐标轴:横坐标代表业务在市场上的竞争力——相对的占有率;纵坐标代表该业务未来的发展潜力。如下图所示。
波士顿矩阵
三个维度或以上的分类,就是多维度分类。多维度分类可以用扇形图或者其他更加具有创意的信息图表来表达。
多维度分析法重点在于维度选择的合理性上,维度的选择决定着分类的结果。维度可以是事物的属性、构成要素,也可以是事物的发展变化。
④ 聚类法
分类法是先把事物看做整体,再细看各个事物的不同特征,然后寻找事物特征间的差异,按照一定的标准将事物区分成不同的类;而聚类法则是先把事物都看做个体,然后按照个体的特征进行分析,按照事物间的差异的大小,将事物聚集成不同的类。
聚类分析法在大数据挖掘中应用很广泛,其本身就是用来处理大量数据集的。针对存在的大量的“对象”,根据对象的多维度特征描述,寻找对象间的相似性。
使用聚类法时要注意:
1)选择正确的聚类变量,即聚类的维度,不同的分类维度决定了分类的数量,不同的聚类维度会有不同的分类,这种分类是否能够帮助我们实现商业目的,关键在于对聚类的维度标准的选择;
2)聚类有很多种算法,常见是K-Means法,但并不是所有的聚类方法都适合用K-means法,在实践中可以多尝试,然后再验证哪种聚类方法更适合;
3)关注奇异点。在统计学的一般方法中都对奇异点进行特殊处理,往往过程中会忽略奇异点,而在大数据模式下,对奇异点有更多的关注。根据我们的经验,越是奇异点,越能找到更多可以创新的地方;
4)在过程中不断修订模型。在大数据应用中,不仅追求快速,更追求快速的迭代,完善数学模型和分析方法,并在过程中追踪数据的变化。大数据时代,数据集更加动态,在动态数据集上进行的分析方法也要与时俱进,跟着变化来调整聚类,让聚类更好的满足产品开发、客户服务、资源配置等,形成良性的动态反馈机制。
⑤ 树形法
分类法是人类认知世界的基本方法,在分类的时候会有大类、小类、细类,我们对分类会有不同的层级。组织也一样,随着组织的扩大,需要设计更细的组织架构才能把团队管理起来。这种层级分类会形成各种层级,从最高层级到最低层级形成一个倒立的“树”,这种从上到下的分类方法叫作“树形法”。
下面看看常规的倒立的树形组织架构,如下图所示。
树形组织架构
树形结构的分析思路是对事物先总后分的思路。生产制造类企业在查找品质问题或者寻找品质提升解决方案的时候,也是按照总→分的树形结构来研讨的,首先把工厂里影响品质的要素分成四大类:人、机、料、法(方法),然后再在这四大类要素中拆解影响质量提升的要素,如下图所示。
树形结构分类
思维导图是一种先总后分,对问题或者事物进行不断拆解的过程,在数据分析和挖掘领域有很广泛的应用,能够很好地帮助我们梳理分析问题的思路。
全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著
该文转载已取得作者认可
版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】
下期内容更实战!
网友评论