在一个实际问题归纳出的统计结构中,和常可确定,而在可测空间上用什么分布去描述尚不确定.但我们可知道属于某个分布族,至于中哪一个分布最适合还是不知道,要解决这个问题,就要从样本空间抽取样本,凭借样本中的信息对总体分布作出判断,这就是统计推断要研究的问题。
统计量
样本中含有总体信息,但较为分散,一般不宜直接用于统计推断,常常是把样本中的信息加工处理,用样本的函数形式集中起来,这类样本函数在统计中称为统计量,然后用统计量去作各种推断,下面先给出统计量的一般定义。
定义1.14 设是一个统计结构,是从可测空间到的一个可测映照,假若这个映照不依赖于分布族,则称为此结构上的统计量,假如为参数分布族,则不依赖于参数的可测映照称为此此结构上的统计量,假如为参数分布族,则不依赖于参数的可测映照称为此结构上的统计量.
在统计中样本空间常为维欧氏空间,即,而统计量的值域为时,统计量就是不依赖于分布族的个可测函数,即称为向量统计量.
定义中强调了两点:
- 不依赖于参数,是为了得知样本后能立即算得统计量的值,而不受总体分布尚未知的影响.
- 强调可测性,是为了在以后遇到和统计量有关的事件时,总是有概率可言的.如在如下映射:
谈论概率都要设计分布族,在统计结构中虽然分布尚未确定,但对代数中任一个元素都可谈论概率.
抽样分布
统计量的分布称抽样分布,或称诱导分布,它在研究统计量的性质和评价一个统计推断的优良性等方面十分重要.近代统计学的创始人之一Fisher曾把抽样分布,参数估计和假设检验列为统计推断的三个中心内容.因此寻求抽样分布的理论与方法应十分重视.
设是从到的一个统计量.它是样本的函数.因此对分布族中每一个分布都可确定统计量的一个分布.实际上,对任意,概率
这就是统计量的分布,记为,即
容易验证:这样定义的是上的一个概率测度.
分布函数可通过积分算得,下面给出几种特殊场合的一些结果:
-
是一维统计量,设其中积分域是维欧式空间的一个子集,假如是可微函数,且其梯度的模为正,即则的密度函数可表示为如下维曲面积分
其中积分域为方程所决定的维曲面. -
是维统计量()
设,其中是个可测函数,则的联合分布函数
其中积分域
其中积分域为由个方程所决定的维曲面,而
是函数对变量的雅可比行列式 -
是维统计量
设其中是个可谓函数,并存在反函数,设其反函数为
又假设这些反函数可微,则其微分元之间有如下关系
其中
-
是上的仿射变换
设,为阶方阵,为维列向量,则称为上的仿射变换,若,则为上的线性变换。若是非奇方阵,则其逆变换
存在。并且,其雅可比行列式为
此时,的来奶和密度函数为
网友评论