数据是最能引起人们关注的东西。
一些文章的标题,为了吸引人们点进去阅读,常常会使用一些数据,从而让人产生好奇心。还有一些文章的内容中,为了佐证自己的观点,让自己的结论显得更有说服力,也常常会引用一些数据。
这些数据会加深阅读者的印象,让他们惊讶,赞叹,并且牢牢记住。
或许一些人们在得知这些数据后,会把它们当成炫耀知识的资本,不断向他人传播。
但在这之前,我们是否应该更谨慎一些,想一想,数据就是可靠的吗?
向别人说出一串数字很简单,但我们如果只是做了一个数据的传声筒并以此为傲,没有任何自己的判断在里面,可能会渐渐失去信任。
那么,如何判断数据的可靠性,识别数据下隐藏的欺骗?
有以下几个小技巧。
问一问数据是怎么来的
这是最简单的一个小方法,也是更深入的评判数据的第一步。
我们唯一需要注意的就是不要盲目相信你看到的数据,不要在看到数据的第一眼,就深信不疑,而是应该停下来,问一问自己,这个数据是怎么来的。
平均值的问题
很多数据报告中都会出现平均值的表述,诸如某行业的平均年薪,大学应届生的平均工资,学生每周的平均学习时间,民众每年的平均阅读时间,某癌症剩余的平均寿命等等。
这些例子中都用到了平均值。我们看着这些平均数据,总会感到疑惑,似乎这些数据和我们自己的亲身感受相去甚远。
什么原因呢?这可能是因为计算平均值的方法不同。
一般来说,平均值有三种计算方式。
第一种,将所有数值加起来,再除以数值的个数,得出最终平均数;第二种,将所有数值从高到低排列,取最中间的数,这个数就是中位数,有一半数值在中位数之上,有一半在中位数之下;第三种,将数值排列好,取某个出现频率最高的数或数值范围,这个叫做众数。
平均值采用哪种方式,其展现的效果会大大不同。
比如:金融行业的报告中说到,金融从业者的平均年薪是100万元。
事实上,金融从业者的大部分普通从业人员,年薪远远达不到这个数值,但是一些极少数的顶尖从业者,他们的年薪则远远高于100万,如果按照平均数计算,极少数的高薪从业者就会大幅拉高这个数值。
这能体现这个行业的普遍薪资水平吗?明显不行。
被大大拉高的平均薪资,是明显高于中位数和众数的,而中位数代表了行业的一般薪资水平,众数则代表了行业的普遍水平。
三种数值对同一行业展示的面貌大不相同。如果一个行业想要让自己的平均薪资看上去很高,那他就会采用平均数。
被省略的数据
有些文章里给我们展现了一些数据,我们稍不注意就会被欺骗,脑海里只记着那些展现给我们的数字。
我们要注意,眼前的这些数据,很可能不是完整的数据,还有一些数据可能被省略了。
比如:A国每年读五本书的人数有20%,B国则高达30%
初看这个数据,我们可能觉得B国读书的人更多。但它却忽略了各国的人口基数,如果A过有五千万人口,而B国仅有两千万人口,那么这个数据展示的效果是否有不同?
在一些广告里,也会经常省略数据。
比如一个护肤品广告,讲到自己产品的清洁皮肤功能,说清洁效果提升30%。
这个30%是相对什么来说的?是其他护肤产品?还是公司以前的护肤产品?对照产品的护肤效果又是怎样的呢?
如果我们知道这些被隐藏的数据,是否又会有不一样的判断?
结论替换
一家市场调研公司为甲公司即将上市的饮品做盲测,他们找来了一百个人,让他们分别饮用甲公司和乙公司的产品,然后提出了一个问题:“你讨厌哪一杯?”有95个人都选择了乙公司。
然后,这家调研公司提交给甲公司的报告中说:“有95%的人更喜爱甲公司产品”。
看到了吗?在调研中,有95人表示更讨厌乙公司的饮品,但这不代表这95人就喜欢甲公司的产品。
调研公司假定了,如果这些人讨厌乙公司产品,那他们就是喜欢甲公司产品,他们在拿一件事的结论当做另一件事情的结论。
面对这种情况,我们要思考,是否得出数据的过程中出现了纰漏,就如以上这个例子一样,他们在调研中提出的问题不够严谨,如果排除了这种情况,那我们就要警惕,是否提出数据的人在有意欺骗。
相对值与绝对值
我们经常看到类似这样的数据描述:
经常吃油炸食品会使人们得胃病的概率增加20%。(此数据仅为举例而做的假设,不是真实数据)
看到这样的表述,你会感觉到概率很高,甚至觉得每100个胃病患者中,就有20个是由油炸食物引起的。
但这个数据表现的是一种相对数值,比起不吃油炸食物的人,吃油炸食物的人得胃病的风险提高了20%,是一种可能性表述。
还有一种确定性表述,是绝对数值。
比如:人们经常吃油炸食品,使得胃病患者增加了2%,从1%增加到了3%。
面对这些数据的表现形式,我们要分析它展现的是相对值还是绝对值,不同的数值对我们想要了解的具体问题都会产生不同的影响。
以上是一些面对数据时如何具体分析的一些小技巧。
掌握这些技巧,可以让你面对那些令人印象深刻的数据时,学会抽丝剥茧,抵达隐藏在数据下的真相。
网友评论