美文网首页
数学漫步——贝叶斯估计思想

数学漫步——贝叶斯估计思想

作者: 罗泽坤 | 来源:发表于2020-01-27 22:13 被阅读0次

统计学中有两个大的学派:频率学派(也称经典学派),和贝叶斯学派
总所周知统计推断是根据样本信息对总体分布或者是总体特征数进行推断,经典学派贝叶斯学派就是通过统计推断的不同方式划分的,经典学派的统计推断是依据样本信息总体信息来进行推断,而贝叶斯学派认为除了依据以上两种信息来进行推断以外还可以应该加上先验信息来进行统计推断。

样本信息:
样本信息即抽取样本观测其值所得到的信息,譬如在等到一组样本值之后可以计算出其样本均值和样本方差,可以大致知道总体的一些特征数,这是最'新鲜'的信息,并且多多益善,我们希望用样本信息来对总体特征进行推断,样本信息越多我们推断总体也就越是准确,可以这么说没有样本信息就没有统计推断可言

总体信息:
总体信息即总体分布或者总体分布族所提供的信息,譬如如果知道了总体是一个正态分布,那么我们可以知道总体的一切矩是存在的而且其密度函数是关于均值对称的,总体信息是很重要的,许多国家或者企业甚至耗费巨资来获取这种信息,因为如果知道某个随机变量服从某个分布就可以根据这个分布来进行统计推断,如果是我们已经熟悉的一些分布则有很多成熟的推断方式可供我们使用。

先验信息:
如果把抽取样本看做是一次随机试验,那么样本信息就是试验中得到的信息,但是往往我们在研究某些问题之前总要对研究的问题有所了解,这种了解包括经验上的了解即过去是否存在过同样的问题或者是关于同样问题的一些历史样本,这研究问题之前就能够了解到的信息就叫做先验信息,贝叶斯学派认为'历史经验'也能够在一定程度上面帮助我们进行统计推断。

贝叶斯学派与经典学派最大的不同之处在于其认为统计推断过程具有一种连续性,也即用历史的眼光看待问题,用发展的角度看待问题,他们认为过去的事情与现在的事情是有联系的或者是过去的样本与现在的样本是有联系的,能够运用历史经验来修正经典学派基于现有经验的统计推断。

贝叶斯学派的基本观点是:任一未知统计量\theta都可以看做一个随机变量也即我们需要推断的总体的某个特征服从某个分布,这也就是说我们可以根据先验信息建立一个\theta服从的分布,这样做的目的就在于合理的利用先验信息来进行统计推断

贝叶斯学派和经典学派在历史上争论了很久,如今经典学派已经基本上接受也贝叶斯学派的观点,现在这两派已经合流其争论的焦点在于如何利用各种先验信息来合理的进行统计推断。

贝叶斯公式的推到及其密度函数形式:

下面先介绍一些贝叶斯学想派的具体想法
(1) 在经典统计学中认为总体依赖与参数\theta其密度函数记为p(x;\theta),经典学派认为某个随机变量服从的分布中的参数\theta是固定不变的,即认为参数\theta 不是一个随机变量,而贝叶斯学派认为\theta是一个随机变量也即总体的密度函数是依赖于\theta的变化的他们将概率密度记为p(x|\theta),实际上大家仔细思考一下这个\theta是不是变化的,譬如某个工厂加工某种元件其生产机器随着时间的推移肯定性能上面是有所变化的所以工厂生产元件的合格品率也是在变化的如果我们将元件的合格率记为\theta的话,也即\theta是具有随机性的,因此贝叶斯学派的观点也是有事实依据的。

(2)贝叶斯学派认为可以依据参数\theta的先验信息来确定参数的先验分布\pi(\theta)

(3)从贝叶斯学派的观点来看样本X=(x_1,x_2,\cdots,x_n)的产生要分成两步走首先设想从先验分布\pi(\theta)中产生一个样本\theta_0这一步是玉帝老儿他老人家决定的,然后在\theta_0的条件下产生一组样本X=(x_1,x_2,\cdots,x_n)这时候X=(x_1,x_2,\cdots,x_n)的联合概率密度为
p(X|\theta_0)=p(x_1,\cdots,x_n|\theta_0)=\prod^n_{i=1}p(x_i|\theta_0)
这个分布综合了总体信息和样本信息.即有样本信息X=(x_1,x_2,\cdots,x_n)和总体信息概率密度

(4)由于\theta_0是假想出来的在实际情况下式不得而知有先验分布\pi(\theta)所决定的为了把先验信息综合进去,不能只考虑\theta_0,而应该考虑\theta所有可能的取值即将先验分布\pi(\theta)考虑进去,如何考虑进去嘞?这个简单我们写出样本X和参数\theta的联合分布不就可以了吗?记其联合分布如下:
h(X,\theta)=p(X|\theta)\pi(\theta) \ \cdots [1]
这个联合分布将样本信息,总体信息,先验信息三种可用信息综合起来了

(5)我们的目的是要对参数\theta做统计推断,在没有样本信息的时候我们只能根据先验分布来对\theta进行推断,但是有了样本信息观测值X=(x_1,x_2,\cdots,x_n)之后我们应该依据h(X,\theta)来对\theta做出推断.为了方便进行推断依据条件概率公式将h(X,\theta)分解如下:
h(X,\theta)=\pi(\theta|X)m(X) \cdots[2]
其中m(X)X的边际密度函数:
根据\cdots [1]:
m(X)=\int_{\theta}h(X,\theta)d\theta=\int_{\theta}p(X|\theta)\pi(\theta)d\theta \ \cdots[3]
这个m(X)与参数\theta无关,不包含\theta的任何信息,因此能用来对\theta做出统计推断的仅仅是条件分布\pi(\theta|X)联立[1],[2],[3]式变形可得他的计算公式是:
\pi(\theta|X)=\dfrac{h(X,\theta)}{m(X)}=\dfrac{p(X|\theta)\pi(\theta)}{\int_{\theta}p(X|\theta)\pi(\theta)d\theta}
我们在求\pi(\theta|X)的时候一般是先求出联合概率密度h(X|\theta)然后对其对\theta积分求出X的边际密度之后两者相除即可

贝叶斯估计:

用后验分布\pi(\theta|X)估计参数\theta的值常常用一下三种方法

  • 使用后验分布的密度函数最大值点作为\theta的点估计的最大后验估计
  • 使用后验分布的中位数作为\theta的点估计的后验中位数估计
  • 使用后验分布的均值作为\theta的点估计的后验期望估计

总结:

从贝叶斯公式可以看出,整个贝叶斯统计推断只要先验分布确定之后就没有理论上的困难,也从中可以看出贝叶斯学派的观点认为参数\theta是一个随机变量是从一个分布中抽出的样本,即\theta会影响X样本的取值从而我们只要知道了\pi(\theta|X)也就可以根据X及其后验分布来对\theta进行统计推断,这种推断是在样本X的情况下对\pi(\theta)\theta推断的一个修正.

注意:

贝叶斯估计与最大似然估计是两种截然不同的推断,前者属于贝叶斯学派结合了样本信息,总体信息,先验信息而最大似然估计只是结合了样本信息和总体信息, 在有些情况下贝叶斯估计要优于最大似然估计这个在这里不做过多叙述,感兴趣的自己去查阅资料。

相关文章

网友评论

      本文标题:数学漫步——贝叶斯估计思想

      本文链接:https://www.haomeiwen.com/subject/gobethtx.html