术数也好,大数据也罢,其实,都是基于生活运动所产生的数据衍生而来的思维逻辑框架。但是,出于任何思维逻辑框架都有其适用性和局限性,因此,才出现了很多的争议。
首先说一下大数据,大数据在近几年受到了很多人的关注,因为,很多人很喜欢大数据预测。有关大数据预测的丰功伟绩这里就不多说了,只举一个例子。
美国总统大选,在特朗普票数远远低于希拉里之时,出现一个机构,该机构断定特朗普会胜出,而该机构并非刚刚出现,在过往的数次总统当选者预测中,次次言中。果然,没过多久,特朗普胜出。
在日常生活中,其实,我们也会经常遇到这种情况,比如,大数据显示,某个地方的人容易得某一种疾病,喜欢吃某一种食物,长相有什么特点。多数人看见之后,会有一个相对理性的态度,因为,大数据表明的是大部分的人如此,但是,我并不一定会如此。而且,出于数据可能有造假的成分,所以,每一个人都可以把自己和大数据联系起来,哪怕有造假,经过与周围的人对比一下,在一个核心的问题上,也是不容易让大家对大数据产生盲目痴迷的。
➀
在这里,我们举一个例子。
假如,一个地方有20万人,这个地方大部分的女孩子容易在18岁的时候死去,于是,为了调查这中间的关系,就需要通过大量的观察,而通过大量的观察就会得到大量的数据,通过分析数据和数据之间的关系,有可能会知道答案。
大数据的思维逻辑框架是这样的
一:制作1万份的表单,随机分发下去。(数据采集)
二:表单有几个核心问题:年龄、书籍、娱乐、家庭饮食、受教育程度等等(数据模型)
三:将分发下去的表单回收,做成数据报表,通过看数据报表,找到规律。(数据分析)
四:通过对数据的对比,发现家庭饮食这一个变量很突出,而家庭饮食中对盐分的摄入普遍超标(数据关联)
五:得出食盐过量是导致少女死亡的根本原因(数据结论)
六:食盐导致死亡(制造恐慌)
七:今后所有的人都不吃盐了(行为盲目)
八:人需要食用适当的盐(消解恐慌)
九:大数据专家什么的都是扯淡或者那些女孩一定不是因为吃盐很多死的,一定是命不好死的。(猜测四起)
因为知道这个思维逻辑框架,因此,只要分析思维逻辑框架,基本就可以知道预测出现偏差的原因所在了,同时,纵使被预测了,也不会觉得害怕,因为,通过思维路径,我们可以跟踪到某一步,然后改变自己的思维和行为模式,从而规避一些不好的状况发生。
❷
这个思维逻辑框架,从第一步开始,其实,已经出现了偏差。
思维逻辑框架偏差是这样的
一:用1万人代表20万人,虽然我们可以一叶知秋,但同时,我们也有可能一叶障目。所以,这种类似抽样调查,也就是,从一个大整体中随机选一些个体来代表整体的做法是否会影响最终的结果?
二:数据模型的制作,需要找几个核心问题作为数据模型的参考项,可是,在这里找到的参考项是否就能代表所有的参考项,我们不得而知。说白了,就是,你可能找了100个参考项,但不巧的是,最核心的参考项是第101个,所以,这第101个参考项并不在这个数据模型里,也就是,如果影响结果最核心的参考项都不在数据模型里,那么,后面分析看起来再精妙那也无济于事。
三:导致一个结果的不一定是一个原因,但的确有可能是主要原因,但是,如果其他原因都不存在了,那么,这个所谓的主要原因也毫无意义。比如,一个人生病是因为情绪、环境、遗传、饮食习惯、伤口感染等多种原因共同作用的,正因为是共同作用的,因此,我们不能把因果关系只局限在一条上,比如食盐过量导致死亡。因为,食盐过量的人很多,但是,并不是所有食盐过量的人都会死亡,而且,食盐过量和死亡之间是否是直接关系,我们不得而知。我们不找综合的原因,却找一个单一的原因,而单一原因起作用有一个先决条件,那就是,综合原因都存在的情况下,所以,粗暴地用单一原因代替综合原因的做法是否合适?单一原因在没有综合原因的联合作用下是否会导致同样的结果?
四:一个人阅历不同,专业素养不同,那么,数据分析的能力也不同,同样的一份数据报表,不同的人看,会出来不同的结论,这在根本上也会造成最终论点的偏移。
五:人为造假成分。大家都知道,我们现在的数据可以造假。第一种:直接修改数据报表的数字。第二种:从源头入手,那就是,那1万随机的人中,可以随机地安排自己要安排进的人,这些人,按照自己的想法去做表单,那么,出来的数据当然会按照自己的想法呈现。第三种:是从分析入手,把最重要的参考项去掉,只看无关紧要的一些参考项。这都有可能造成最终论点的偏移。
➂
那么,最终的真相是什么呢?原来,这一个地区的人,家长希望女孩子更加好看,因此,不知道从什么时候开始,有一个看似很厉害的人带来了一个消息,那就是,吃某种植物可以美容养颜,但只限于18岁之下的女孩子,于是,好多女孩子就吃了,但是,因为这种植物原本就不是长在此处的,生活在此处的人不能很好地代谢这种植物,而盐分的过多摄入,更加导致这种情况的恶化,因此,体质弱的就会死去。
而依据大数据思维逻辑框架,的确发现了盐分过多摄入对一个人身体的影响,但是,却因为没有考虑爱美之心,也就没有发现由爱美之心导致的对某种食物的独特偏好。也就是说,大数据思维逻辑框架里,其参考项根本就没有把地域气候、情绪偏好、体质差异等因素纳入其内,因此,纵使根据大数据思维逻辑框架模式找到了食用过多盐分这一个原因,也只能说是找到了一个差强人意的不是原因的原因,减少盐的摄入并不能从根本上改变问题,因为,这植物起了主要的作用。
❹
综上,大数据思维逻辑框架的适用性和局限性很明显,当然,这个适用性和局限性原本也没有什么差别,都属于大数据思维逻辑框架的属性范畴,但因为,不同的人有不同的需求,因此,才产生适用性和局限性。
适用性和局限性是这样的
适用性:在该逻辑的适用性之内,我们可以短时间内把控一件事,可以在完全不了解一件事儿的情况下,根据大数据做一个大致的了解推测,数据越多,推测也就越精确。同时,旁观者因了解大数据思维逻辑框架的原理,相较于术数,大部分人比较不容易陷入迷信状态,也因为比较不容易陷入迷信状态而能够相对客观地接受其适用性。
局限性:大数据思维逻辑框架在当前,没办法将群体的情绪道德纳入其中作为参考项,而且,预测集中于某项具体的事,这导致很多论点容易出现以偏概全的情况。
运用建议:日常生活中,经常出现披着大数据的伪科学论点,比如,吃什么就死,某一地区的人天生品质不好,做某件事容易如何如何等,请一定明确,这个论点是怎么来的?核心的影响因素是什么?有没有时间、地点、剂量的要求?一般,这些论点有一点生活依据,但是,这个生活依据不足以支撑这个论点。举个例子,某种食物有毒性,这种毒性会导致人的死亡,但是,我们无需因为这个论点而惶恐不安,因为,日常生活中,我们吃的食物有很多都具有一定毒素,而很多毒性都是相对而言,我们活着,是一种平衡状态,所谓的平衡,是指体内各种要素同时具备毒性和解毒性,因为某一种食物有毒性,于是,不吃某一种食物,但也许,这种食物中有一种物质可以制衡另一种病毒。因此,度的概念需要纳入其中作为重要的参考值。
但,为什么现在有很多文章老喜欢说这些吓人的东西呢?而且还统一用所谓注意点总没错的语言?
其实,这又涉及到另一个思维逻辑框架,以后会具体展开。但不能否认的是,采用这种恐吓式思维逻辑框架的人,其实利用的是人不能在短时间内处理所有信息的盲点。尽管“注意点总没错”看似是一个善意的建议,但是,通常,我们是不需要恐惧情绪的,我们需要的是客观的认知和有效的应对策略。当然,如果有喜欢恐惧的,那自然另当别论。
网友评论