美文网首页
Chapter7—参数估计

Chapter7—参数估计

作者: crishawy | 来源:发表于2019-08-13 08:21 被阅读0次

根据样本信息来推断总体信息,比如总体分布函数的未知参数。

1. 点估计

点估计的问题定义:

设总体X的分布函数F(x;\theta)的形式已知,\theta是未知参数,X_{1},X_{2},\cdots,X_{n}是来自总体X的一个样本,x_{1},x_{2},\cdots,x_{n}是它的样本值。点估计就是要构造一个适当的统计量\hat{\theta}(X_{1},X_{2},\cdots,X_{n}),用该统计量作为总体未知参数\theta估计值

点估计的常用方法:矩估计法最大似然估计法

矩估计法:样本矩估计总体矩的方法

若总体中含有k个未知参数,令
E(X^{l})=A_{l}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{l},l=1,2,\cdots,k从中解出k个参数\hat{\theta}_{1},\hat{\theta}_{2},\cdots,\hat{\theta}_{k}作为\theta_{1},\theta_{2},\cdots,\theta_{k}的估计量,其中A_{l}l阶样本中心距。

注:矩估计法简单易行,并不需要事先直到总体是什么分布。缺点是,当总体类型已知,没有充分利用分布提供的信息,一般场合下,矩估计量不具有唯一性

最大(极大)似然估计:

基本原理:用使样本取值概率达到最大的参数值来估计未知参数

离散型随机变量:X是离散型随机变量,其分布律为P(X=x)=p(x;\theta),其中\theta为未知参数,X_{1},X_{2},\cdots,X_{n}是来自X的一个样本,设x_{1},x_{2},\cdots,x_{n}为对应的样本值,则事件X_{1}=x_{1},X_{2}=x_{2},\cdots,X_{n}=x_{n}发生的概率为
P=\prod_{i=1}^{n}p(x_{i};\theta)
L(\theta)=L(x_{1},x_{2},\cdots,x_{n};\theta)=\prod_{i=1}^{n}p(x_{i};\theta)为离散型的样本的似然函数。固定样本值x_{1},x_{2},\cdots,x_{n},取使得L(\theta)达到最大的参数值\hat{\theta}(x_{1},x_{2},\cdots,x_{n})作为\theta的参数估计。

连续型随机变量:
L(\theta)=L(x_{1},x_{2},\cdots,x_{n};\theta)=\prod_{i=1}^{n}f(x_{i};\theta)其中f(x;\theta)为概率密度函数。

估计量的评价标准:

  • 无偏性:若估计量\hat{\theta}=\hat{\theta}(X_{1},X_{2},\cdots,X_{n}) 的数学期望E ( \hat{ \theta } )存在,且对于任何\theta\in\Theta,有E(\hat{\theta})=\theta,则称\hat{\theta}\theta无偏估计量,否则为有偏估计量

  • 有效性:有效性是衡量两个无偏估计量的优劣,方差越小越有效,前提是样本容量固定
    但方差不能无限小到0,存在罗-克拉美下界(Rao-Cramer)
    D(\hat{\theta}) \ge \frac{1}{nE[\frac{\partial \ln f(x,\theta)}{\partial \theta}]^{2}}=\frac{1}{nI(\theta)}=G凡是能够达到Rao-Cramer下界的无偏估计量称为最小方差无偏估计量

  • 相合性:无偏性和有效性都是在样本容量固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值稳定与待估参数真值附近。
    \hat{\theta}(X_{1},X_{2},\cdots,X_{n})是参数\theta的一个估计量,当n\rightarrow\infty时,\hat{\theta}(X_{1},X_{2},\cdots,X_{n})依概率收敛于\theta,则称\hat{\theta}\theta相合估计量

2. 区间估计

未知参数的点估计仅仅是未知参数的一个近似值,它没有反映与真实值的接近程度,亦没有给出估计的精度,使用起来把握不大。现在我们要给出一个区间,这个区间包含未知参数的可信程度是预先给定的,此区间的长度给出了估计的精度,这就是我们要讨论的区间估计

定义:

设总体X的分布函数F(x;\theta),其中\theta\in\Theta是一个未知参数,对于给定的一个很小的正数\alpha,若由来自X的样本X_{1},X_{2},\cdots,X_{n}确定的两个统计量\hat{\theta_{1}}=\hat{\theta_{1}}(X_{1},X_{2},\cdots,X_{n}),\hat{\theta_{1}}=\hat{\theta_{2}}(X_{1},X_{2},\cdots,X_{n}),对于任意的\theta\in\Theta,满足
P(\hat{\theta_{1}}<\theta<\hat{\theta_{2}})\ge 1 - \alpha则称(\hat{\theta_{1}},\hat{\theta_{2}})\theta的置信水平为1-\alpha的置信区间,分别称\hat{\theta_{1}}\hat{\theta_{2}}是置信水平为1-\alpha双侧置信区间置信下界置信上界

相关文章

网友评论

      本文标题:Chapter7—参数估计

      本文链接:https://www.haomeiwen.com/subject/rcnpjctx.html