美文网首页
从正态分布到假设检验

从正态分布到假设检验

作者: JudeArcturus | 来源:发表于2020-07-29 17:46 被阅读0次

正态分布

一维正态分布的概率密度函数为:
f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^2}}
即随机变量X服从均值为\mu,方差为\sigma^2的正态分布,记作X \sim N(\mu,\sigma^2)。特别的,当\mu=0\sigma=1时成为标准正态分布。其函数图像如下所示:

正态分布函数

正态分布的性质

  • 曲线关于x=\mu对称:均值、众数、中位数相同。
  • x=\muf(x)取最大值。
  • x=\mu\pm\sigma处有拐点。
  • X\sim N(\mu,\sigma^2),则Z=\frac{X-\mu}{\sigma}\sim N(0,1)
  • X落在(\mu-3\sigma,\mu+3\sigma)区间内的概率是99.7%(可用作异常值检测)。
  • 不相关性等价于独立性

当我们由于缺乏关于某个实数上分布的先验知识而不知道该选择怎样的形式时,正态分布是默认的比较好的选择,其中有两个原因:

  1. 想要建模的很多分布的真实情况是比较接近正态分布的。中心极限定理说明很多独立随机变量的和近似服从正态分布。这意味着在实际中,很多复杂系统都可以被成功地建模成正态分布的噪声,即使系统可以被分解成一些更结构化的部分。
  2. 在具有相同方差的所有可能的概率分布中,正态分布在实数上具有最大的不确定性。因此,可认为正态分布是对模型加入的先验知识量最小的分布。

分位数

设随机变量X的累积分布函数为F(x),对于任意0<\alpha<1,称F(x)=P(X<x_{\alpha})=\alphax_{\alpha}为此分布的分位数。根据实际需要和表示的不同,分位数可进一步细'分为以下几种:

  • 上侧\alpha分位数:使P(X>x_{\alpha})=1-F(x)=\alphax_{\alpha}
  • 下侧\alpha分位数:使P(X>x_{1-\alpha})=1-F(x)=1-\alphax_{1-\alpha}
  • 双侧\alpha分位数:使P(X<x_{1-0.5\alpha})=F(x_{1-0.5\alpha})=0.5\alphax_{1-0.5\alpha}以及使P(X>x_{\alpha})=1-F(x_{\alpha})=0.5\alphax_{0.5\alpha}

假设检验里的p值与这一概念紧密相关。

中心极限定理

设随机变量X_1,X_2,...,X_n,...独立同分布,具有相同的数学期望和分布,E(X_n)=\mu,D(X_n)=\sigma^2,n=1,2,...,则对于任意实数x,有
\lim_{n\rightarrow \infty}P\{\frac{\sum^{n}_{i=1}X_i - n\mu}{\sqrt{n}\sigma}\}=\Phi(x)
即当n足够大时,\sum^{n}_{i=1}X_i 的标准化\frac{\sum^{n}_{i=1}X_i - n\mu}{\sqrt{n}\sigma}近似服从标准正态分布N(0,1),或者说\sum^{n}_{i=1}X_i近似地服从N(n\mu,n\sigma^2)

在实际问题中,很多情况下我们并不知道所采样的随机变量所服从的概率分布。但由于中心极限定理,使得对任意分布的统计分析成为可能,这也是假设检验的基石之一。

假设检验

假设一个糖果厂商出品的一种袋装糖果,其标称重量为\mu,方差为\sigma^2。为了判断出场的糖果是否符合自己设计的标准。厂商对一批货物进行抽取了n袋称重,每袋的重量为X_1,X_2,...,X_n
得到的结论可以分成2中:

  1. H_0:该批商品符合设计要求。
  2. H_1:该批商品不符合设计要求。
    其中H_0又成为零假设。那么,假设H_0是真的,那么就意味着这批货物的实际重量应该服从均值为\mu,方差为\sigma^2的分布(具体分布未知)。那么,根据中心极限定理,我们可以得到一个统计检测量U=\frac{\overline{X}-\mu}{\sqrt{n}\sigma},其中\overline{X}=\frac{1}{n}\sum^{n}_{i=1}X_i,U\sim N(0,1)
    由于商品的重量不应过高或过低,因此这里是双侧分位数的概念。假定我们设定p值为0.05,即对于一个服从标准正态分布的随机变量XX<x_{1-0.025}X>x_{0.025}的概率为0.05。换句话说,对于我们的统计检测量U来说,当H_0为真时,U没有落在区间(x_{1-0.025},x_{0.025})的概率只有5%。这个概率实在是有点太小以至于我们更愿意相信原假设不成立。这就是假设检验的概念和原理。

相关文章

  • 从正态分布到假设检验

    正态分布 一维正态分布的概率密度函数为:即随机变量X服从均值为,方差为的正态分布,记作。特别的,当,时成为标准正态...

  • 参数估计与假设检验

    ①标准误 ②标准正态分布 ③t分布 ④参数估计 总体率的估计 ⑤假设检验 假设检验是假定H0成立的条件下计算检验统...

  • 计量考试要点

    辨析题——从课后习题里去找 简答题——考概念,跨章节,DW检验用在什么地方,需要正态分布假设的假设检验有哪些,基于...

  • 从正态分布到T检验

    1. 说明  接上次的《几种常见的数学分布》。这次说说T分布和T检验,用词不够严谨,大家就领会精神为主吧~ 2. ...

  • 20210105

    研究目标: 深刻理解 置信区间、假设检验、大数定律、t分布、自由度、(标准)正态分布、显著性水平 点估计、区间估计...

  • 从假设检验到A/B测试

    1. 前言 A/B测试常用于算法优化(推荐,广告,搜索等),运营策略选择,UI设计等,是互联网产品迭代中最常用的评...

  • 4.6正态性检验:直方图初判 / QQ图判断 / K-S检验

    利用观测数据判断总体是否服从正态分布的检验称为正态性检验,它是统计判决中重要的一种特殊的拟合优度假设检验。直方图初...

  • 17-假设检验之Z检验

    利用观测数据判断总体是否服从正态分布的检验称为正态性检验(Z检验),它是统计检验中重要的一种拟合优度假设检验。T检...

  • 统计(九)_置换检验

    对于正态分布或其他已知分布的数据,有相应的假设检验与置信区间的计算方法,但是当数据抽样自未知或混合分布、样本量过小...

  • 统计(十)_自助法

    对于正态分布或其他已知分布的数据,有相应的假设检验与置信区间的计算方法,但是当数据抽样自未知或混合分布、样本量过小...

网友评论

      本文标题:从正态分布到假设检验

      本文链接:https://www.haomeiwen.com/subject/pabfrktx.html