2.3.7 学⽣t分布

作者: golfgang | 来源:发表于2019-03-02 15:18 被阅读0次

2.3.7 学⽣t分布
小马哥课堂-统计学-t分布
卡方分布、t分布、F分布的期望与方差的计算
Biostatistics(13)常见分布：t分布、卡方分布、F
统计学学习-1
简单的统计和数据处理
R语言绘制不同自由度下的卡方分布、t分布和F分布
R语言编程-Tidyverse 书籍 - 数据清洗
T分布
分布计算-t分布

先丢个链接：https://www.matongxue.com/madocs/580/

链接中的学生t分布公式：
$f(t) =\frac{\Gamma(\frac{v+1}{2})}{\Gamma(\frac{v}{2})} (\frac{1}{\sqrt{v\pi}})^2[1+\frac{t^2}{v}]^{-\frac{(v+1)}{2}}\\$

书中的t分布
$St(x|\mu, \lambda, v) = \frac{\Gamma(\frac{v}{2}+\frac{1}{2})}{\Gamma(\frac{v}{2})}(\frac{\lambda}{\pi v})^{\frac{1}{2}}[1+\frac{\lambda(x-\mu)^2}{v}]^{-\frac{v+1}{2}}$

以下要从高斯分布推导出学生t分布

已知高斯分布的精度的共轭分布是Gamma分布。假设我们有一个一元高斯分布 $N(x|\mu,\tau^{-1})$ 和一个Gamma分布 $Gam(\tau|a,b)$ ，我们把精度积分出来，可以得到 $x$ 的边缘分布
$p(x|\mu,a,b)=\int^\infty_0N(x|\mu,\tau^{-1})Gam(\tau|a,b)d\tau\\ =\int^\infty_0\frac{b^ae^{(-b\tau)}\tau^{a-1}}{\Gamma(a)}(\frac{\tau}{2\pi})^{\frac{1}{2}}\exp\{-\frac{\tau}{2}(x-\mu)\}d\tau\\=\frac{b^a}{\Gamma(a)}(\frac{1}{2\pi})^\frac{1}{2}[b+\frac{(x-\mu)^2}{2}]^{-a-\frac{1}{2}}\Gamma(a+\frac{1}{2})$
然后令 $v=2a$ ， $\lambda=\frac{a}{b}$ ，新参数下分布 $p(x|\mu,a,b)$ 为
$St(x|\mu, \lambda, v) = \frac{\Gamma(\frac{v}{2}+\frac{1}{2})}{\Gamma(\frac{v}{2})}(\frac{\lambda}{\pi v})^{\frac{1}{2}}[1+\frac{\lambda(x-\mu)^2}{v}]^{-\frac{v+1}{2}}$
参数 $\lambda$ 为t分布的精度（通常不等于方差的倒数），参数 $v$ 为自由度，作用如下图所示，对于 $v= 1$ 的情况，t 分布变为了柯西分布( Cauchy distribution )，而在极限 $v\rightarrow\infty$ 的情况下，t 分布 $St(x|\mu,\lambda,v)$ 变成了高斯分布 $N(x|\mu，\lambda-1)$ ，均值为 $\mu$ ，精度为 $\lambda$ 。

可以看出t分布比高斯分布有更长的尾巴，也就是两边延伸得更开，这给出了t分布的一个重要性质——鲁棒性，更长的尾巴意味着对于离群点能有更好的忍耐度，不会像高斯分布那样敏感。

在实际应用中,离群点可能产生于生成数据的过程,这个过程对应于一个有着长尾的概率分布,也可能产生于
误标记的数据。鲁棒性也是回归问题的一个重要性质。毫不惊讶地说,回归的最小平方的方法并不具有鲁棒性,因为它对应于(条件)高斯分布下的最大似然解。通过让回归模型基于一个长尾的概率分布(例如 t 分布),我们可以得到一个更加鲁棒的模型。

2.3.7 学⽣t分布
先丢个链接：https://www.matongxue.com/madocs/580/ 链接中的学生t分布公式： ...
小马哥课堂-统计学-t分布
T distribution 定义在概率论和统计学中，学生t-分布（t-distribution），可简称为t分...
卡方分布、t分布、F分布的期望与方差的计算
卡方分布卡方分布的期望和方差 t分布 t分布的期望 t分布的方差 F分布 F分布的期望 F分布的方差
Biostatistics(13)常见分布：t分布、卡方分布、F
t分布 t分布又可以被称为学生t分布。其由Wiliam Sealy Gosset在1908时发现，t分布与样本大小...
统计学学习-1
看了几篇统计学资料：恍然间不知道概率分布[二项分布] 与抽样分布[t 分布] 差别。大家知道，统计学分为描...
简单的统计和数据处理
常见的分布均匀分布: unif 正态分布: norm T分布 :t F分布 :f 二项分布:binom 负二项分...
R语言绘制不同自由度下的卡方分布、t分布和F分布
卡方分布 t分布 F分布
R语言编程-Tidyverse 书籍 - 数据清洗
1 描述统计不同概率分布就是不同随机现象规律性的数学描述。统计学最常用的四大概率分布：正太分布，t分布，卡方分...
T分布
小样本时，母体标准差未知（一般情况），抽样平均数的概率服从 T分布。
分布计算-t分布
t分佈簡介同z分布一样钟形结构且两边对称，但是标准差更大，自由度越大越接近z分布。t分布用于通过样本推测群体均值...