如果有一个事件A发生的概率非常大,等于或者接近1/2,同时实验次数n也非常大,会是什么结果?
正太?哦不,正态分布,对啦!也叫高斯分布。
大家还记得我上次取的抛银币例子,给你们看看它的分布图(p=1/2),经过n次实验它(比如正面朝上)发生了k次。
适用于某一种随机变量的高斯分布高斯是如何定义正太分布的呢?
他发现这种概率分布的随机变量取值在某一个范围内的概率和这个随机变量的方差有关。之前我只是笼统的讲了均值与方差的关系,高斯把平均值miu和方差sekamafan联系起来并写成了式子:
某一种随机变量的概率分布,比如人的身高,体重,居民的收入,一个班级学生的成绩都和正态分布近似,你问为什么,我也不知道,这就是大自然的语言吧。就算不是严格意义上的正态,我们也可以用高斯分布线性组合来拟合。
有人会疑问我的主题,大概率体现在哪呢?
3segama原则,大家都学了喵。也被称为68-95-99.7 原则,请看下图喵。
这个原则适用于任何高斯分布,甚至是一些近似于高斯分布的随机事件。也叫有多少概率的置信度,这就是大概率事件。
在有关高斯分布的规律中,我们最需要了解的是均值,标准差,概率三者之间的关系。
取个例子:假如在某次期末考试中,一班的均值80,二班的均值85,两个班的标准差都是5,那就能说明二班比一班好吗?
阴影区为确定的二班比一班好,占两条曲线覆盖面积的35%,也就是说我们只有35%的信心证明二班比一班好,被称为置信度。
但是如果两个班平均分差异很大,标准差segama很小,(它们的比值小,就表示随机性更小,规律性更强)我们就有更大的信心。比如两个班平均成绩还是一样,标准差降到1,我们就有95%的信心说2班比1班好。
那怎样才能减小标准差?
还记得我们之前说的如何减少随机性吗?增加统计的人数。如果能把人次数提高到先前的25倍,这里就让学生考25次,标准差就会从5降到1左右。(具体计算可用正态分布验算)
在生活中,临床试验需要大样本;标普500指数年增长率大约7%~8%,但它的标准差高达16%左右(涨跌视为风险)。
股市的风险远远高于大部分人的想象,标普500指数号称世界风险最低,回报最高的投资工具尚且如此,其他就更高了。
再次,如果一只股票连续三年回报10%,另一只5%,我们就能说第一只更好吗?
不能,因为5%差异要远比16%的标准差小,换句话说,5%差异更可能是市场浮动的随机性造成的。
有了置信度的概念,我们会想,如果概率真实存在(到目前为止还没能极为准确的定义概率本身),是否重复实验的次数越多,就能够获得100%的置信度?这需要在理论上有更好的认识以及让各种实验能够与之吻合。
网友评论