在一个实际问题归纳出的统计结构中,
和
常可确定,而在可测空间
上用什么分布
去描述尚不确定.但我们可知道
属于某个分布族
,至于
中哪一个分布最适合还是不知道,要解决这个问题,就要从样本空间抽取样本,凭借样本中的信息对总体分布作出判断,这就是统计推断要研究的问题。
统计量
样本中含有总体信息,但较为分散,一般不宜直接用于统计推断,常常是把样本中的信息加工处理,用样本的函数形式集中起来,这类样本函数在统计中称为统计量,然后用统计量去作各种推断,下面先给出统计量的一般定义。
定义1.14 设
是一个统计结构,
是从可测空间
到
的一个可测映照,假若这个映照
不依赖于分布族
,则称
为此结构上的统计量,假如
为参数分布族
,则不依赖于参数
的可测映照
称为此此结构上的统计量,假如
为参数分布族
,则不依赖于参数
的可测映照
称为此结构上的统计量.
在统计中样本空间常为维欧氏空间,即
,而统计量的值域为
时,统计量就是不依赖于分布族的
个可测函数,即
称为向量统计量.
定义中强调了两点:
- 不依赖于参数,是为了得知样本
后能立即算得统计量
的值
,而不受总体分布尚未知的影响.
- 强调可测性,是为了在以后遇到和统计量
有关的事件时,总是有概率可言的.如在如下映射:
谈论概率都要设计分布族,在统计结构中虽然分布尚未确定,但对
代数
中任一个元素
都可谈论概率
.
抽样分布
统计量的分布称抽样分布,或称诱导分布,它在研究统计量的性质和评价一个统计推断的优良性等方面十分重要.近代统计学的创始人之一Fisher曾把抽样分布,参数估计和假设检验列为统计推断的三个中心内容.因此寻求抽样分布的理论与方法应十分重视.
设是从
到
的一个统计量.它是样本
的函数.因此对分布族
中每一个分布
都可确定统计量
的一个分布.实际上,对任意
,概率
这就是统计量的分布,记为
,即
容易验证:这样定义的是
上的一个概率测度.
分布函数可通过积分算得,下面给出几种特殊场合的一些结果:
-
是一维统计量,设
其中积分域
是
维欧式空间的一个子集,假如
是可微函数,且其梯度的模为正,即
则
的密度函数可表示为如下
维曲面积分
其中积分域为方程所决定的
维曲面
.
-
是
维统计量(
)
设,其中
是
个可测函数,则
的联合分布函数
其中积分域
其中积分域为由个方程
所决定的
维曲面
,而
是函数对变量
的雅可比行列式
-
是
维统计量
设其中
是
个可谓函数,并存在反函数,设其反函数为
又假设这些反函数可微,则其微分元之间有如下关系
其中
-
是
上的仿射变换
设,
为
阶方阵,
为
维列向量,则称
为
上的仿射变换,若
,则
为
上的线性变换。若
是非奇方阵,则其逆变换
存在。并且,其雅可比行列式为
此时,的来奶和密度函数为
网友评论