美文网首页
平均值不能代表整体水平

平均值不能代表整体水平

作者: 自天佑之吉无不利 | 来源:发表于2023-11-21 20:55 被阅读0次

    从概念上看,平均值有很多种。单从数学上来说,就有算术平均值、几何平均值、平方平均值、调和平均值、加权平均值等等。
    当然,我们日常生活中提到的平均值都默认是“算术平均值”,也就是“一组数据中所有数据之和再除以数据的个数”。

    但是评价值是使用所有样本计算的,容易受到极端值的影响,所以在很多情况下,平均值是没有价值的,无法客观准确反映数据的整体情况。

    整体平均值是在数据呈均匀分布或者正态分布的情况下才会有意义,如果忽略整个数据的分布情况,只提平均值,其实是没有意义的。这也就是为什么你会在读一些统计分析报告时觉得自己不是“被加薪了”,就是“被幸福了”。

    那怎么才能反映真实情况呢?
    一种方案是进行分组统计。
    整体平均值不能代表各分组情况,分组结论和整体平均值结论可能会大相径庭。

    辛普森悖论的启示
    辛普森悖论是 1951 年由 E.H. 辛普森提出的,简单来讲就是在分组比较中都占优势的一方,有的时候在总评中反而是失势的一方。

    看到一个平均值的时候,你一定要留个心眼,看看它的数据构成情况,而不是简单地用平均值去代表所有的整体。生活是具体的,如果你想看到更为准确的数据,你应该分组拆开来看。因为辛普森悖论告诉我们,有的时候,在分组比较中占优势的一方,在总评中反而可能是失势的一方。但你要注意,只是“有的时候”。

    辛普森悖论也给我们一个启示,就是:每次小范围内的输赢,其实和你在整体上的输赢没有太大直接的关系。这也是为什么在打麻将或者打德扑真正赢的那些人,不是那些小牌把把赢的人,而往往是赢一把大的人。
    这也是这个辛普森悖论衍生出来的一个推论,将来你要用数据分析做决策的时候,小到打牌、大到做投资,不要过于计较局部的得失,而是要在关键时刻对大概率有把握的事情放手一搏。

    在我们的生活里,我们总提“质量”这个词,但是拆开来看,“质”与“量”是不等价的。所以当你不被大部分人所理解时,有可能是因为你选的路是一条少数人走的路。平均值和辛普森悖论告诉我们要抓大放小,不要因为某一个单项优势就洋洋得意,也不要因为局部失败就一蹶不振。生活,要有一颗平常心,我们的目标是让我们这一生的“人生平均值”逐步提高。

    此文章为11月Day13学习笔记,内容来源于极客时间《数据分析思维课》,强烈推荐该课程

    相关文章

      网友评论

          本文标题:平均值不能代表整体水平

          本文链接:https://www.haomeiwen.com/subject/xhhiwdtx.html