数据分析|正态分布

作者: 雷克斯 | 来源:发表于2021-07-14 13:41 被阅读0次

正态分布在日常生活中频繁出现。

例如,一个国家或地区全部人口的身高、体重情况都很好地符合正态分布。

实际上很多由一连串随机事件构成的变量都会呈现出正态分布的形态,例如在连续生产中用于向标准容器中灌1加仑(1加仑=3.78立方米)液体的机器每次的灌装误差。

同样的逻辑,如果投资者对收益的期望是理性预期,那么实际收益率应该是服从以此期望为均值的正态分布。

如果收益率的分布可以用正态分布来近似拟合的话,投资管理将变得更加有理有据。

第一,正态分布是左右对称的,也就是说,均值左右程度一样的偏离其发生的概率也一样。没有对称性的话,用收益的标准差来衡量风险显然是不合适的。

第二,正态分布具有稳定性,意味着对于具有正态性的不同资产,其构成组合的收益同样服从正态分布。

第三,当资产或资产组合收益分布只有两个变量时,对其未来的情境分析因为需要考虑的变量很少而会变得简单许多。

第四,当构造证券组合时,我们必须考虑证券收益的相关性。

总体来说,这种相关性是多层面的。但是如果收益是正态分布、收益之间统计相关性可以以相关系数来表达。这样我们在描述任何两个证券的相关性时只需估计一个参数。

实际的收益分布需要与正态分布相似到什么程度时我们才可以使用正态分布代替收益的实际分布呢?显而易见,收益的分布是无法用正态分布完美代替的。比如,与正态分布不同的是,实际收益率并不会低于100%,但这并不是说正态分布就一无是处。在其他环境中类似的问题同样存在。

比如,一个新生儿的体重会去跟所有新生儿体重的分布做对比而显然新生儿的体重并不存在零或负值。

但是在这种情况下,仍然使用正态分布来表示新生几群体的体重分布情况,因为体重的标准差和体重的均值相比起来较小,问题中出现负值的概率基本可以忽略不计(注:实际上,均值为3958克,标准差为511克。

一个负的体重的概率要在离均值774个标准差以外,在正态分布的假下,这一情况发生的概率为4.97×10^{15},于是负的出生体重在实际研究中可以不用考虑。

所以类似地,我们必须给出一定的标准来决定收益率的正态假设的合理性。

相关文章

网友评论

    本文标题:数据分析|正态分布

    本文链接:https://www.haomeiwen.com/subject/sndypltx.html