【随机模拟小试验】有偏分布下的均值、中位数、众数之间的关系

作者: 郭飞 | 来源:发表于2016-02-09 11:32 被阅读0次

【随机模拟小试验】有偏分布下的均值、中位数、众数之间的关系
python第三课进阶作业
描述统计学相关概念笔记整理
统计学
集中趋势与分散趋势
机器学习基础--统计学入门--基本概念
数据挖掘课后习题第2章
三、数据分布特征
Python入门：数值分析
mysql中位数、众数计算

在《统计数字会撒谎》里，有这样一个案例：

我相信你不是一个势利小人，而我也并不做房地产生意。但请让我们作这样的假定，并且假设，此刻你正在一条我所住的加利福尼亚山谷不远处寻找想买的房子。对你的情况进行了初步判断后，我巧舌如簧、费尽心思地让你相信附近居民的平均年收入大约有15000美元。也许这坚定了你要在此居住的信心，不管怎样，买卖最终成交了，那美妙的数字也被牢记在你的脑海。而且，既然你已经买下了房子--你有那么一点势利，当与朋友聊天时，你就会不经意地流露出你居住的地点：我住在一个相当棒的高收入小区。

一年左右过后，我们又见面了。作为某纳税者委员会的成员，我正在四处奔走，为降低税率、降低财产估价，或降低公共交通费用而呼吁。我的理由很简单，我们支付不起各种上涨的费用，毕竟，附近居民的平均年收入只有3500美元。也许你会加入到我们委员会的工作中来--你不仅势利，而且还挺吝啬。但是，当听到那可怜的2000英镑时，你也禁不住大吃一惊。到底是我现在撒谎了呢？还是一年前撒了谎？

其实这两次你都无法怪罪于我，利用统计撒谎的妙处被展现得淋漓尽致。无论是15000美元，还是3500美元，它们都是合法的平均数，计算方法也完全正确。两个数字都基于相同的数据，来自相同的居民，根据相同的收入。所有都是相同的，但显然其中有一个数据令人误解，足以与弥天大谎相媲美。

我的花招就是两次分别使用了不同的平均数“平均数”这个词宽泛的涵义帮了大忙。当一个家伙希望用数据影响公众观点，或者向其他人推销广告版面，平均数便是一个经常被使用的伎俩。