这本书在谈论什么
本书的主要内容在于介绍统计学中关键的七个概念:
- Aggregation
- Information
- Likelihood
- Intercomparison
- Regression
- Design
- Residual
作者认为,这七个关键概念支撑起了整个统计学——统计学七支柱。因此作者对这七个概念做了详细的介绍,阐述了概念的意义,形成和发展,很好地帮助了不了解统计学的人理解、入门统计学。
支柱一:Aggregation
Aggregation,可以翻译为聚集、聚合。其主要思想是:把数据集中的个体值进行统计汇总,概括出的信息可以超越个体。统计学的整体概括大于各部分的加总。
用简单的说法来理解Aggregation,就是“平均数”。对事物进行观测,往往会因为环境、测量人员等因素,产生完全不同的结果。但是这种差异,又不能通过人力完全消除。这时候该怎么去使用测量数据,就是一个见仁见智的问题了。
作者举例说明了这个情况:16世纪人们发现了指南针的指向的“南极”与真实的南极有差异(磁偏角),而这个差异,在不同的地方测量会有不同的结果。那么,该用什么值来代表自己的测量结果呢?有的人选择“中间的值”,有的人选择“最大值和最小值的一半”。
当需要对观测数据进行概括,就必须对原始信息做取舍,这就是“平均值”的价值所在。而“平均人”的概念,更是应用了aggregation的概念。通过调查某一地区所有人的身高、体重,求得平均值后,可以与其他地区进行比较。而这些平均值,很可能根本不能对应一个真实存在的人,只是一个“平均人”,但是正是走了平均的概念,很多社会科学才能进一步发展。
网友评论