美文网首页
1.3 统计量及其分布

1.3 统计量及其分布

作者: 抄书侠 | 来源:发表于2020-03-05 19:52 被阅读0次

在一个实际问题归纳出的统计结构(\mathscr{X,B,P})中,\mathscr{X}\mathscr{B}常可确定,而在可测空间\mathscr{(X,B)}上用什么分布P去描述尚不确定.但我们可知道P属于某个分布族\mathscr{P},至于\mathscr{P}中哪一个分布最适合还是不知道,要解决这个问题,就要从样本空间抽取样本,凭借样本中的信息对总体分布作出判断,这就是统计推断要研究的问题。

统计量

样本中含有总体信息,但较为分散,一般不宜直接用于统计推断,常常是把样本中的信息加工处理,用样本的函数形式集中起来,这类样本函数在统计中称为统计量,然后用统计量去作各种推断,下面先给出统计量的一般定义。

定义1.14 设(\mathscr{X,B,P})是一个统计结构,T=T(x)是从可测空间(\mathscr{X,B})(\mathscr{T,B})的一个可测映照,假若这个映照T不依赖于分布族\mathscr{P},则称T为此结构上的统计量,假如\mathscr{P}为参数分布族\{P_{\theta}:\theta\in\Theta\},则不依赖于参数\theta的可测映照T称为此此结构上的统计量,假如\mathscr{P}为参数分布族\{P_{\theta}:\theta\in\Theta\},则不依赖于参数\theta的可测映照T称为此结构上的统计量.

在统计中样本空间常为n维欧氏空间,即\mathscr{X}=\mathbb{R}^n,而统计量的值域为\mathbb{R}^k时,统计量就是不依赖于分布族的k个可测函数,即T(X)=(T_1(X),\ldots,T_k(X))称为向量统计量.

定义中强调了两点:

  1. 不依赖于参数,是为了得知样本x后能立即算得统计量T(X)的值T(x),而不受总体分布尚未知的影响.
  2. 强调可测性,是为了在以后遇到和统计量T有关的事件时,总是有概率可言的.如在如下映射:
    T:(\mathscr{R}, \mathscr{B}, \mathscr{S}) \rightarrow(\mathscr{T}, \mathscr{C})
    谈论概率都要设计分布族\mathscr{P},在统计结构中虽然分布尚未确定,但对\sigma代数\mathscr{B}中任一个元素B都可谈论概率P(B).

抽样分布

统计量的分布称抽样分布,或称诱导分布,它在研究统计量的性质和评价一个统计推断的优良性等方面十分重要.近代统计学的创始人之一Fisher曾把抽样分布,参数估计和假设检验列为统计推断的三个中心内容.因此寻求抽样分布的理论与方法应十分重视.

T是从(\mathscr{X,B,P})(\mathscr{T,C})的一个统计量.它是样本X的函数.因此对分布族\mathscr{P}中每一个分布P都可确定统计量T的一个分布.实际上,对任意C\in\mathscr{C},概率
P(T(x) \in C)=\int_{\{x, T(x) \in C\}} d P =\int_{T^{-1}(C)} \mathbf{d} P=P\left(T^{\prime}(C)\right)
这就是统计量T的分布,记为P^T,即
P^{T}(C)=P\left(T^{-1}(C)\right), \quad \forall C \in \mathscr{C}
容易验证:这样定义的P^T(\mathscr{T,C})上的一个概率测度.

分布函数可通过积分算得,下面给出几种特殊场合的一些结果:

  1. T是一维统计量,设F_{T}(t)=P\left(T^{\prime}\left(X_{1}, \cdots, X_{n}\right) \leqslant t\right)=\int \ldots \int_{D} p\left(x_{1}, \cdots, x_{n}\right) \mathrm{d} x_{1} \cdots \mathrm{d} x_{n}其中积分域\left.D =\left\{\left(x_{1}, \cdots, x_{n}\right): T\left(x_{1}, \cdots, x_{n}\right) \leqslant \ell\right.\right\}n维欧式空间的一个子集,假如T(X_1,\ldots,X_n)是可微函数,且其梯度的模为正,即\left\|\operatorname{grad} T\left(x_{1}, \cdots, x_{n}\right)\right\|^{\frac{1}{2}}=\sqrt{\sum_{i=1}^{n}\left[\frac{\partial}{\partial x_{i}} T\left(x_{i}, \cdots, x_{n}\right)\right]^{2}}>0T的密度函数可表示为如下n-1维曲面积分
    p_{\tau}(t)=\int \ldots \int_{s_{n-1}} p\left(x, \cdots, x_{n}\right) \frac{d S_{n}}{\left\|\operatorname{grad} T\left(r_{1}, \cdots, x_{n}\right)\right\|^{\frac{1}{2}}}
    其中积分域为方程T(x_1,\ldots,x_n)=t所决定的n-1维曲面S_{n-1}.

  2. Tk维统计量(k<n)
    T=(T_1,\ldots,T_n),其中T_{,}=T_{j}\left(X_{1}, \cdots, X_{n}\right), j=1, \cdots, kk个可测函数,则(T_1,\ldots,T_k)的联合分布函数
    F_{\gamma}\left(t_{\mathrm{t}}, \cdots, t_{k}\right)=\int \ldots \int p\left(x_{1}, \cdots, x_{n}\right) \mathrm{d} x_{1}, \cdots, \mathrm{d} x_{n}
    其中积分域D=\left\{\left(x_{i}, \cdots, x_{n}\right): T_{j}\left(x_{1}, \cdots, x_{n}\right) \leqslant t_{j}, j-1, \cdots, k\right\}
    p_{T}\left(t_{1}, \cdots, t_{k}\right)=\int \ldots \int_{S_{n-k}} \frac{p\left(x_{1}, \cdots, x_{n}\right)}{\left\{\sum_{i_{1}<\cdots<i_{n}}\left[\frac{D\left(T_{1}, \cdots, T_{k}\right)}{D\left(x_{i_{1}}, \cdots, x_{i_{k}}\right)}\right]^{2}\right.}
    其中积分域为由k个方程T_j(x_1,\ldots,x_n)=t_j,j=1,\ldots,k所决定的n-k维曲面S_{n-k},而
    \frac{D\left(T_{1}, \cdots, T_{A}\right)}{D\left(x_{1}, \cdots, x_{i_{4}}\right)}=\left|\begin{array}{ccc} \frac{\partial T_{1}}{\partial x_{i_{1}}} & \cdots & \frac{\partial T}{\partial x_{i_{4}}} \\ \cdots & \cdots & \cdots \\ \frac{\partial T_{k}}{\partial x_{i_{1}}} & \cdots & \frac{\partial T_{k}}{\partial x_{i_{k}}} \end{array}\right|
    是函数T_1,\ldots,T_k对变量x_{i_1},\ldots,x_{i_k}的雅可比行列式

  3. Tn维统计量
    T=(T_1,\ldots,T_n)其中T_j=T_j(X_1,\ldots,X_n),j=1,\ldots,nn个可谓函数,并存在反函数,设其反函数为
    x_{i}=h_{i}\left(l_{1}, \cdots, l_{n}\right), i=1, \cdots, n
    又假设这些反函数可微,则其微分元之间有如下关系
    p\left(x,, \cdots, x_{n}\right) \mathrm{d} x_{1} \cdots \mathrm{d} x_{n}=p\left(h_{1}, \cdots, h_{n}\right)|J| \mathrm{d} t: \cdots \mathrm{d} t_{n}
    其中
    \begin{array}{c} p\left(h_{i}, \cdots, h_{n}\right)=p\left(h_{i}\left(t_{1}, \cdots, t_{n}\right), \cdots, h_{n}\left(t_{1}, \cdots, l_{u}\right)\right) \\ J=\frac{I\left(x_{1}, \cdots, x_{n}\right)}{\dot{I}\left(t_{1}, \cdots, t_{n}\right)}=\left[\frac{D\left(t_{1}, \cdots, t_{n}\right)}{D\left(x_{1}, \cdots, x_{n}\right)}\right] ^ {T} \end{array}
    \rho_{T}\left(t_{1}, \cdots, t_{n}\right)=p_{X}\left(h_{1}, \cdots, h_{n}\right) | \frac{D\left(x_{1}, \cdots, x_{n}\right)}{D\left(t_{1}, \cdots, t_{n}\right)}

  4. T\mathbb{R}^n上的仿射变换
    \boldsymbol{T}=\left(T_{1}, \cdots, T_{x}\right)^{\prime}, \boldsymbol{X}=\left(X_{1}, \cdots, X_{n}\right)^{\prime}An阶方阵,Cn维列向量,则称T=AX+C\mathbb{R}^n上的仿射变换,若C=0,则T\mathbb{R}^n上的线性变换。若A是非奇方阵,则其逆变换
    \boldsymbol{X}=\boldsymbol{A}^{-1}(\boldsymbol{T}-\boldsymbol{C})
    存在。并且,其雅可比行列式为
    J=\left|\operatorname{det} A^{-1}\right|=|\operatorname{det} A|^{-1}
    此时,T的来奶和密度函数为
    p_{T}(t)=p_{x}\left(A^{-1}(t-C)\right) /|\operatorname{det} A|

相关文章

  • 1.3 统计量及其分布

    在一个实际问题归纳出的统计结构中,和常可确定,而在可测空间上用什么分布去描述尚不确定.但我们可知道属于某个分布族,...

  • 统计学6-抽样分布

    定义 抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统...

  • 复习

    1.随机事件和概率 2.随机变量及其分布 3.多维随机变量及其分布 4.大数定律和中心极限定理 5.统计量及其分布...

  • 2018-02-12

    统计量及其统计抽样分布 统计量 def.统计量 $\quad\quad$ 不依赖于任何未知参数,仅与样本相关的量,...

  • 统计量及其抽样分布

    为了推断总体的某些特征,我们需要抽取若干个体,这一过程称为抽样,所抽取的这部分个体称为样本,样本中包含的个体数量称...

  • 统计学

    伯努利分布 伯努利分布,即是0,1分布,最简单的二项分布 z统计量和t统计量 使用z统计量的数据符合正态分布,当样...

  • 讲义·《会计》1.3会计要素及其确认与计量

    文/南城以南hong PS:讲义来源于中华考试网《会计》讲师庄欣老师,侵删。 第四节会计要素及其确认与计量 一、会...

  • 第五周作业:抽样分布

    抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布 1、卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,...

  • 大数据统计基础之F分布及其应用

    大数据统计基础之F分布及其应用 1. F分布1.1. Z检验和t检验的局限性1.2. 方差分析的含义与假设1.3....

  • 抽样分布

    抽样分布 定义:样本统计量的概率分布,是一种理论分布。——在重复选取容量为 n 的样本时,由该统计量的所有可能取值...

网友评论

      本文标题:1.3 统计量及其分布

      本文链接:https://www.haomeiwen.com/subject/wcnfrhtx.html