美文网首页
图解统计学 01 | 神奇的正态分布

图解统计学 01 | 神奇的正态分布

作者: 白墨石 | 来源:发表于2020-10-25 21:59 被阅读0次

正态分布介绍

这是在统计学中大名鼎鼎的一种分布,最早由德国的天文学家Moivre提出。

后来,德国数学家高斯(Gauss)首先将其应用于天文学研究,故正态分布也叫“高斯分布”。

高斯的这项工作对后世的科学研究影响极大,以至于德国10马克的钞票上印的是高斯头像和正态分布。

image

正态分布在这个世界很常见,这会在后面的文章中谈到。

举个栗子

下图展示了婴儿和成人身高分布曲线。

image

曲线形状的不同代表,成年人的身高差异的可能性比婴儿更多。

可以直观的看到:不管曲线长相如何,正态分布总是集中在平均值区域,也就是数值几种在在中间。

而且有两种形状:曲线越宽越低(矮胖型),越窄越高(高瘦型)。

所以,根据这个形状,在正态曲线的绘制时,需要知道两个值:

  • 告诉曲线的中心在哪:测量值的均值

  • 告诉曲线有多宽:测量值的标准差

有意思的是,95% 的测量值介于均值±两个标准差。比如,婴儿的95%在20±1.2英寸,成人的介于70±8英寸。

也就是说,只要符合正态分布,未来的测量值,极大的概率(95%)会出现在均值±两个标准差这个区间内。

这个值决定着我们常常听到的置信区间和P值。

数学表示

现在看下,正态分布的函数表达式:

image

可以描述为,随机变量X服从一个位置参数μ,尺度参数σ的概率分布,记做

image

,或X服从正态分布。一般,μ和σ都是常数,μ代表数据的均值,σ代表数据的标准差。

R语言绘制

image

我们可以从图中看到,均值μ决定正态分布的峰值位置,标准差σ决定分布的矮胖,σ越大越胖。

R代码:

    x <- seq(-10,15,length.out = 1000)
    # 计算N~(-2,1)
    y1 <- dnorm(x, -2,1)
    # 计算N~(2,1)
    y2 <- dnorm(x, 2, 1)
    # 计算N~(2,4)
    y3 <- dnorm(x, 2, 2)
    # 绘图
    plot(x, y1, type = "l", col="#f0932b", ylab = "Density", lwd=2, xlim = c(-8,10))
    lines(x, y2, lwd=2, col="#4834d4")
    lines(x, y3, lwd=2, col="#95afc0")
    legend("topright", c("X~N(-2,1)", "X~N(2,1)", "X~N(2,4)"), col = c("#f0932b", "#4834d4", "#95afc0"), lty = c(1),text.font = 12)

致谢:

https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw

相关文章

  • 图解统计学 01 | 神奇的正态分布

    正态分布介绍 这是在统计学中大名鼎鼎的一种分布,最早由德国的天文学家Moivre提出。 后来,德国数学家高斯(Ga...

  • 正态分布

    参考书: 《白话统计学》 正态分布(normal distribution) 也叫钟形曲线 正态分布的性质 正态分...

  • 正态分布在统计学里是怎样的存在?

    正态分布(Normal distribution)是统计学里最常见的分布之一。 In probability th...

  • 别再和我说你不了解六西格玛!

    西格玛的定义 西格玛的最初定义,是统计学中的概念,来自于正态分布。而正态分布,在数学、物理及工程等领域,均是一个非...

  • R检验数据是否符合正态分布

    正态分布又叫高斯分布,很多统计学的理论都是假设所用的数据符合正态分布。所以在研究数据时,首先要看数据是否符合正态分...

  • 外国统计学优秀著作译丛 统计学

    01外国统计学优秀著作译丛 统计学.pdf: 在线阅读: 01外国统计学优秀著作译丛 统计学.pdf:

  • 机器学习中正态分布为什么常见?

    统计学里面,正态分布(normal distribution)最常见。男女身高、寿命、血压、考试成绩、测量误差等等...

  • 七月书单

    本月推荐两本线上课程。 统计学 统计学入门课程,内容包括:随机变量,均值方差标准差,概率密度,二项分布,正态分布,...

  • 二项分布——正态分布——马克思矛盾论

    今天学统计学时,联想到,马克思的矛盾论很可能是统计学的由二项分布转为正态分布的一个表现:从有限的数量来看,事物以二...

  • 统计学笔记3 - 正态分布

    正态分布公式 Z 值 表示离均值有多少个标准差的距离 Z 值只代表离均值有多少个标准差,所以其不只限于正态分布 ...

网友评论

      本文标题:图解统计学 01 | 神奇的正态分布

      本文链接:https://www.haomeiwen.com/subject/lffbpktx.html