写在前面:大学毕业后,我的第一个岗位就是仪器分析,即产生数据。刚入职,领导提醒“数据是会骗人的”。为了保证数据的准确性,需要在数据产生的过程中控制诸多可能会干扰准确性的因素。尽管是控制,但仍会有误差。增加不确定度部分,以判断最终结果是否在可接受的范围内。因此,在看到他人引用数据时,时常也会自问“这个数据是怎么来的?”
职业后期转到业务岗,常利用统计进行数据分析。相比产生数据,统计有更明确的方向性、目的性。统计唯度、呈现形式,均会干扰受众对统计数据信息的接收。
一、识别数据欺骗的小技巧
仍以问题启动思考:作者是怎么得出这个数据的?
1、大量的数据堆砌
如同利用数据进行华丽包装。数据给你更加确定的感觉,因为它需要通过测量、调查获得。如果数据的产生途径就大打折扣,这种感觉就只能是错觉。
2、统计术语
谨慎对待平均值。常见的包括平均值、中位数、众数。如深圳每年发布的平均工资,身边人都在表达“又给深圳人民丢脸了”。为什么“丢脸的人”那么多,平均数还是那么高呢?行业差距的悬殊,是无法在平均值中呈现的。或放改成中位数或众数,你的自信心就会增强好多。
3、数据引用
引用的数据是否有价值?价值有多少?如书中第七、八章关于论据有效性的阐述,理由的引用“越近越好“。
对于数据的引用,也是如此。因为在引用的过程中,原始信息逐渐衰减,最终可能会让受众有多重解读。
4、数据模糊性
谨慎对待模糊数据。
小学算术题应试技巧:a比b多了几个百分点?以b为参比,除以b。我们都会。以下换个场景,试试:
想象一个65岁的女性,刚患中风,和他的医生一起商量治疗方法。医生引用了三种治疗方法的相关统计数据:
甲的疗法可以减少33%未来再次患中风的可能。
乙疗法可以减少3%的绝对风险,从6%降低到3%。
丙疗法,有94%女性在十年内不会再换第二次中风,而没有接受这种疗法的病人,有91%的女性十年不再患中风。
你觉得她应该选哪一种?第一种如何?可以降低了33%?
细细研究一下:
降低33%,是相对绝。原来的绝对值是多少?如果以100例为调查,原来是发病9例,治疗后只有6例,是不是也是降低33%?(9-6/9)这种情况,绝对风险由9%下降至6%。是不是跟乙、丙疗法的说法一样呢?
二、作为倾听者的启示
1、除了数据,你还有哪些相关的信息吗?越多越好。
2、对比。先不看表达者使用的数据,选择自己觉得所需的数据证据,与实际提供的数据比较。(同论据的有效性)
3、推理。先不看表达者提出的结论,尝试推理自己的结论,与表达者的结论比较。如不一致,哪些地方出错了?(同论据的有效性)
(4-5两种方式,是切断表达者对数据和结论之间的关系,运用自己的思考进行推理。)
三、作为表达者的启示
1、 心存理念:数据是可以被操纵的。
以互联网常见一些用户调查、读者投票、产品等级评价,通常只通过网络进行。因为网络获得的样本是方便样本,调查成本低。但这些网络的调查结果极可能排除了年长的、不懂电脑技术的受众。因此在调查时,会同步收集被试者的一般性资料,如性别、学历、年收入等等,以期评价样本的代表性。
网友评论