根据样本信息来推断总体信息,比如总体分布函数的未知参数。
1. 点估计
点估计的问题定义:
设总体的分布函数的形式已知,是未知参数,是来自总体的一个样本,是它的样本值。点估计就是要构造一个适当的统计量,用该统计量作为总体未知参数的估计值。
点估计的常用方法:矩估计法和最大似然估计法
矩估计法:样本矩估计总体矩的方法
若总体中含有个未知参数,令
从中解出个参数作为的估计量,其中是阶样本中心距。注:矩估计法简单易行,并不需要事先直到总体是什么分布。缺点是,当总体类型已知,没有充分利用分布提供的信息,一般场合下,矩估计量不具有唯一性。
最大(极大)似然估计:
基本原理:用使样本取值概率达到最大的参数值来估计未知参数
离散型随机变量:若是离散型随机变量,其分布律为,其中为未知参数,是来自的一个样本,设为对应的样本值,则事件发生的概率为
记
为离散型的样本的似然函数。固定样本值,取使得达到最大的参数值作为的参数估计。连续型随机变量:记
其中为概率密度函数。
估计量的评价标准:
无偏性:若估计量 的数学期望存在,且对于任何,有,则称为的无偏估计量,否则为有偏估计量。
有效性:有效性是衡量两个无偏估计量的优劣,方差越小越有效,前提是样本容量固定。
但方差不能无限小到0,存在罗-克拉美下界(Rao-Cramer):
凡是能够达到Rao-Cramer下界的无偏估计量称为最小方差无偏估计量。相合性:无偏性和有效性都是在样本容量固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值稳定与待估参数真值附近。
设是参数的一个估计量,当时,依概率收敛于,则称是的相合估计量。
2. 区间估计
未知参数的点估计仅仅是未知参数的一个近似值,它没有反映与真实值的接近程度,亦没有给出估计的精度,使用起来把握不大。现在我们要给出一个区间,这个区间包含未知参数的可信程度是预先给定的,此区间的长度给出了估计的精度,这就是我们要讨论的区间估计。
定义:
设总体的分布函数,其中是一个未知参数,对于给定的一个很小的正数,若由来自的样本确定的两个统计量,,对于任意的,满足
则称是的置信水平为的置信区间,分别称和是置信水平为双侧置信区间的置信下界和置信上界。
网友评论