美文网首页大数据大数据 爬虫Python AI Sql玩转大数据
证析思维——用数据说话的系统思考

证析思维——用数据说话的系统思考

作者: keeya | 来源:发表于2017-02-01 23:39 被阅读0次

数据分析从最开始的图表分析出发,到更有技术含量的数据挖掘,其目的都是在让数据更好地指导在各行各业中更好地指导业务应用。前面的每种思维就像不同角度的工具一样,在不同方向上让数据发挥作用。在最后讲到的证析思维,就将像一串项链一样,把前面的珍珠都穿起来,从源头出来,来说明数据分析是如何从问题到数据,再从数据到答案的。

证析——用数据说话的艺术

证析思维其实就是用数据说话的思维,通过数据来描述问题,同时也通过数据来解答问题。数据能够发挥作用的地方很多,从商业领域到生产领域,从科学研究领域再到体育文艺领域。

下面的这个就是在2016年巴西里约奥运会,是数据在体育领域大发光彩的一年,运动员的每个动作都能够被采集成数据,然后加以分析,给出应该调整方向的例子:

从世界冠军见证析魅力

从奥运的例子能够看出,通过量化运动员的在出手速度和角度上的数据,并且再进行过对比,发现了应该调整的方向,进一步做出整改,于是得到了满意的结果。这一套流程下来,让数据发挥了闭环反馈的作用。这个正是证析思维的应用。

证析,是验证和分析两个词的组合,其含义是量化证据进行分析以影响决策的具体实践,这个概念出自郑毅的.《证析:大数据与基于证据的决策》。

证析——用数据说话的艺术

看起来这个概念,比较晦涩,其实就是讲的是在决策过程中让数据来说话。通过用数据说明问题,是理性思考,具有科学性,同时也有依据。

证析看待问题的思路

证析的目的是解决问题,因此在开展证析以前,需要正确的理解问题。在生产生活中,随着情况和条件的不同,会有多种多样的问题存在,然而按照5W1H逻辑,可以将问题分为WHAT、WHEN、WHO、WHERE,WHY和HOW六类。

看待问题

首先是对象问题,即WHAT,问题是要明确如选择的对象,比如采购什么产品、投资什么标的等。第二是时间问题,即WHEN,这个问题需要明确一个具体的时间,比如什么时间下单,工作的工序安排等。第三是人选问题,即WHO,这里是要确定人员,比如选谁出场,多少个人的成本最低。第三是地址问题,即WHERE,这里是需要确定具体的地址,比如怎么选址的路径才最短,成本才最低等。再下面是原因激吻,即WHY,这里需要找到时间发生的原因,明白为什么会产生,并对相关对象进行分解和剖析。最后是方法问题,即HOW,这里是要明确一套做事的做法,比如制定最优的解决方案。

问题验证的方式

在证析的过程中,当明确了问题的归属后,就需要对问题进行验证。不论哪种问题的类别,可以将所需的答案,把问题分成定性和定量两类。

问题验证的方式

定性问题是是否属实的问题,即有或者没有。在比如有没有咳嗽症状、是否有出口资格,是否能够得奖等等。尽管定性问题是聚焦在一个具体的事件上,看似与数字无关,但是可以将有无的情况有个0-1变量来体现,有是1,无则是0。

在定量问题中,就需要了解问题的具体的数据,问题从有没有进一步到了有多少。比如血液的指标是多少,销售额是多少钱,得奖的概率是多少等等。

对问题可以分为定性和定量两类,同样要来解释和验证问题所需的证据,也可以分成定性和定量两类。

验证的流程

证析的目的是解决问题,因此整个证析的流程,也是围绕如何解释问题,如何发现解决方案而进行。

验证的流程

首先是界定问题,即明确问题是什么5W1H中哪一类的,以及问题是定性还是定量的。当明确以后,将问题进行数字化转化,对定量问题,需要知道得出答案的数据,还需要哪些数据,同样作为定性问题,除了明确证据数据来源外,还需要把定性问题进行定量化转化,如把是否的问题转成0-1变量。

完成问题后,就需要去收集证据,这里既包含了定性的证据,也包含了定量的证据,证据来源也是丰富多彩的,可以说收集证据是在证析过程中最花时间和精力的,获取了证据后还要进一步整理。

当完成了证据的收集和整理,就是对证据进行分析,通过对比和拆分,去得出问题的结果。

当产生问题的结果后,还需要将结果放到实际的情况中去应用返回。同时有的时候,还要不断重复这个过程,此时问题的验证是一个PDCA循环问题,在反复的过程中,不断寻求更好的答案。

界定问题

在界定问题环节中,当明确了5W1H和是定性定量的性质后,接下来就是要将现实中的问题转换成数学问题,问题可以是逻辑关系也可以是数据。

界定问题的思路

比如对房价是否下降而言,其背后就是一个对比的式子,即未来房价<现在房价的假设是否成立,进一步地量化则可以转成未来房价低于现在房价的概率。

界定房价是否下降问题

当明确了问题以后,就是要知道影响问题的因素,这些因素会在后面的证据收集环节去获取,比如对房价而言,就涉及到了人口变化,人力资源价格,货币,土地价格,建筑材料价格等等,这些都需要在后面去进行收集。

证据收集

在界定问题中明确了需要收集的证据后,就开始了相关证据的收集。由于证析是属于定量分析,因此证据都将以数据的形式被收集,在应用的过程中也是以数据的形式而存在的。

对证据而言,首先是明确相关证据;及影响的因素的指标。以房价是否上涨的问题为例,设计到的方面有:人口、货币、土地、刚才、水泥,以及人力资本等要素。对这些要素而言,人口包括,人口数量,人口流入流出情况,人口未来预测;货币包括,货币数量,M2增速,未来存量货币预测;土地包括,土地供应量,土地供应量预测;钢材包括,钢材价格,钢材产量,钢铁产能,钢铁价格预测;水泥包括:水泥价格,水泥产量,水泥产能,水泥价格预测;人力资本包括:人口结构,消费水平,工资水平,人力资本价格预测。

获取指标数据进行处理

当明确了相关的指标后,就要到不同的渠道上去获取这些数据,这里包括了国家数据库,上市公司财报,资本市场数据,公开信息,以及专业的数据库等等。当完成证据的收集后,就将这些数据按照相应的标准格式整合在一起,并进行数据处理,为后续的对证据的分析做准备。

证据分析

完成了证据收集后,就要着手对证据进行分析,这里需要根据问题本身,找到合适的方式分析证据,从而对问题本身进行证实或证伪。

证据分析

这里有三种方式用于分析证据,分别是经验判断,即把每个证据加起来进行综合判定,第二是统计推断,用统计的方式来发现问题成立时的指标数据的分布,如果达到了阈值就可以认为数据是成立的。第三是用数据挖掘的方式,通过分类或者预估模型进行判断。

证据分析模式

对房价问题而言,经验判断就是用户支撑房价上涨的证据条数对比支撑房价下跌的证据条数,看那个占上风。统计推断就是,根据过去条件的满足情况,来看房价上涨时间的占比,同时再根据当前的条件满足情况,来推测上涨可能性。而数据挖掘则是直接从历史数据中,得到一个关于求未来房价低于现在房价的概率公式,这个公式可以表示为:未来房价低于现在房价的概率=f(人口)+f(土地)+f(货币)+f(钢材)+f(水泥)+f(人力资本)+f(其他)。当输入相关的数据后,就能知道概率大小。

得出结果

获取了证据的相关数据后,就将通过分析模型得出的问题的结果,问题结果可以有两种呈现方式,第一是定性的方式,即是否,是什么的具体答案,另外一种方式是定量,即呈现出具体的数据。

在房价问题中,定性的结果就是下降还是上升。定量的结果就是未来房价低于当前房价的概率,如果概率大于50%对应的就是下降,而小于等于50%对应的就是上涨。

结果依据

应用反馈

当得到证析的结果后,就要将结果在实际场合中应用,以来确定证析的结果是否有效。

对于结果的判断,首先是在是时间上进行对比,时间上的结果对比可以把证析结果与当前情况进行对比,以判断是否有效。同时针对预测性的结果,也要放在未来进行对比。

应用反馈

在空间维度上,还需要进行对比。通常一组数据不能够完全说明证析的结果就是有效的。需要分次分组进行多轮的对比,以确定证析的有效。同时,在这个重复验证的过程中,也有通过假设检验来说明结果具有统计意义的情况,这样可以排除证析的结果是属于小概率事件。

当完成对比和验证后,还可以将证析的过程和证据的选取过程不断重复进行,通过这个PDCA的循环,不断来优化证析的逻辑和方法,以提升结果的准确性。

证析思维总结

证析思维是对数据分析整个逻辑的梳理和总结,即应该如何让数据分析的思维落地,并且发生作用。证析思维中,包括了从问题到答案的全部流程,也包括了从方案到落地的所有过程,并以解答问题,获取证据为主线,将其余五种思维互相穿插,大家共同的探求问题的答案。

证析思维总结

证析思维不仅仅可以用于数据分析的问题,对于解释其他的问题也同样适用,在其他资料中出现的解决问题的七步法和麦肯锡方法都有体现到证析思维的整体逻辑,可以说证析思维是一种通用的解决问题的方式。

证析思维首先是界定问题,要明确解决什么问题,其中要将现实问题转换成数学模型,明确是求绝对值还是相对值,与此同时还需要知道影响问题的因素。第二步是收集证据,即根据前面找出的影响问题的因素去获取相关数据,并且对数据处理为可以进行分析的形式。第三步是分析证据,其实就是用拆分和对比的方式,并借助相关的模型来对问题的进行证实或者证伪。第四步是得出结果,即根据对证据的分析,来得到问题的结果。其实很多时候对数据分析的问题要求不高的话,到第四步就可以结束了。有时为了提高对问题解答的可靠性和科学性,还需要进行应用反馈,即将结果和实际情况进行对比,进一步地还可以对分析过程进行调整和优化。

房价问题就是一个典型证析思维的应用,股票涨不涨就是在界定问题,然后收集历史价格,财务数据以及其他经济数据就是收集数据。分析数据就是用前面收集的一系列数据来证明股票价格和影响因素的关系。最后在得出结果中,用当前的关系来推断未来股价是否上涨,最后再在未来将实际值和预测值进行对比较,并且重新调整分析步骤,这就应用反馈。

原文转发,功德无量!

相关文章

  • 证析思维——用数据说话的系统思考

    数据分析从最开始的图表分析出发,到更有技术含量的数据挖掘,其目的都是在让数据更好地指导在各行各业中更好地指导业务应...

  • 思维力:高效的系统思维2019-05-16

    系统思维它是一种包含和超越了整体观、机械套用结构(结构思考所在层次)和辩证思维的思维模式。就是用“框架”来系统思考...

  • 产品经理的数据思维

    除了产品思维和工程思维,数据思维也成为产品越来越需要关注的。 数据思维是什么? 我总结为两方面:用数据说话和数据驱...

  • 用框架帮助思考,高效分析并得出结论

    学习资料:《有效训练你的结构化思维》《思维力,高效的系统思维》 WHAT 结构化思维:用“框架”来系统思考和表达的...

  • 当你用系统思维思考

    读了大学,知道系统思维的重要性。 比如一个国家就是一个系统,由领导人,机构,家庭,法律组成。最上面就是最高领导人,...

  • 系统思维与常见思维

    系统思维是用框架来系统思考与表达的思维方式 一、关键词:系统、系统论、框架、系统规律 系统:反映了人们对事物的一种...

  • 相辅与相成——《思维力高效的系统思维》读书笔记(2)

    系统思维和常见思维的区别是什么?有什么关系? 系统思维是用“框架”来系统思考与表达的思维方式,主要特点是整体性、结...

  • 数据思维

    前言 我认为数据思维是一种对数据双向的思考: 从正向理解数据思维是以数据为基础, 用数据描述事实 从反方向说数据思...

  • 《思考,快与慢》

    作者对快思考,与慢思考的区别研究,用两个因素来描述人的思维活动,系统1和系统2分别产生快思考与慢思考。系统1要比我...

  • 思维力第二章,系统思维

    1.系统思维的定义 万事万物的本质是系统 系统框架是用框架来系统思考与表达的思维方式:一,从已有框架中选择;二,基...

网友评论

    本文标题:证析思维——用数据说话的系统思考

    本文链接:https://www.haomeiwen.com/subject/enotittx.html