美文网首页分析101
经验分布函数简介

经验分布函数简介

作者: Boye0212 | 来源:发表于2021-06-15 14:18 被阅读0次

1 概念

如果我们想知道某个随机变量X的分布F,这在一般情况下当然是无法准确知道的,但如果我们手上有它的一些独立同分布的样本,可不可以利用这些样本?一个很简单的办法就是,把这些样本的“频率”近似为随机变量的“概率”。

经验分布函数empirical distribution function):给每个点1/n的概率质量,得到CDF:
\hat{F}_n(x) = \dfrac{\sum_{i=1}^{n}I(X_i\leq x)}{n}

2 性质

经验分布函数,有什么性质?它可以很好地近似真实的分布函数吗?我们给出如下几个定理。

定理:对于任意给定的x,有

  • E(\hat{F}_n(x) )=F(x)
  • V(\hat{F}_n(x) )=\dfrac{F(x)(1-F(x))}{n}\to 0
  • \text{MSE} = \dfrac{F(x)(1-F(x))}{n}\to 0
  • \hat{F}_n(x)\stackrel{P}{\longrightarrow}F(x)

Glivenko-Cantelli定理X_1,\ldots,X_n\sim F,那么
\sup_x |\hat{F}_n(x)-F(x)|\stackrel{P}{\longrightarrow}0
更准确地说,上式其实是几乎必然收敛的。

Dvoretzky-Kiefer-Wolfowitz (DKW) InequityX_1,\ldots,X_n\sim F,那么\forall \epsilon\gt 0,有
P\left(\sup_x |\hat{F}_n(x)-F(x)|\gt \epsilon\right) \leq 2e^{-2n\epsilon^2}

利用DKW不等式,可以构造出F的非参数的1-\alpha置信带:定义L(x)=\max\left\{\hat{F}_n(x)-\epsilon_n,0\right\}U(x)=\max\left\{\hat{F}_n(x)+\epsilon_n,0\right\},其中\epsilon_n=\sqrt{\dfrac{1}{2n}\log(\dfrac{2}{\alpha})},那么有
P[L(x)\leq F(x)\leq U(x),\forall x] \geq 1-\alpha

3 应用

经验分布函数有什么用?它可以用来计算一些statistical functional(统计泛函)。

假设要计算的statistical functional为T(F),那么,可以利用经验分布函数,代替未知的分布函数,计算出\theta=T(F)plug-in estimator(嵌入式估计量):\hat\theta=T(\hat{F}_n)

如果存在某个r(x)使得T(F)=\int r(x) dF(x),那么T就称为linear functional(线性泛函),这是因为这样的T必定满足T(aF+bG)=aT(F)+bT(G)。对于这样的linear functional T(F),它的plug-in estimator可以写为:
T(\hat{F}_n)=\int r(x)d \hat{F}_n=\dfrac{1}{n}\sum_{i=1}^{n}r(X_i)

相关文章

  • 经验分布函数简介

    1 概念 如果我们想知道某个随机变量的分布,这在一般情况下当然是无法准确知道的,但如果我们手上有它的一些独立同分布...

  • 计算数据的经验分布函数与MATLAB作图

    计算数据的经验分布函数与MATLAB作图 写在前面 因为某些原因,需要处理某些数据,比如说某项测量数据与理论值的误...

  • 18旅游二班各组自我简介汇总

    一组简介 二组简介 三组简介 四组简介 五组简介 六组简介 七组简介 八组简介

  • 简介

    上辈子,洛幽喜欢了东凡一辈子,没有结果,之后她死了,她不后悔,只是为什么她一睁眼,嗯?捏了捏自己的脸,她这是回到了...

  • 简介

    1.主动地去阅读。 2.阅读目的:获得资讯,获得理解 前者为了增进资讯,获得信息,不能增加理解力。后者为了理解更多...

  • 简介

    姓名:赵金星 电话:13903984903 坐标:河南三门峡市陕州区。 三个标签的自我介绍: 1.时间管理践行者 ...

  • 简介

    朱凝不过打错个字,便被天打雷劈回古代。 为毛别人穿个废柴嫡女,她穿个废柴庶女?地位更低了哎 哇喔,别人嫁王爷,她嫁...

  • 简介

    凌波网络考试系统,是一套运行于Windows系统之上的无纸化网络考试软件。包括试卷编辑、分发试卷、学生答卷、自动阅...

  • 简介

    名字:笨小孩 不是富二代的笨小孩为了生活选择了编程。在大多数人眼里可能感觉编程是很无聊很辛苦经常加班的事情,其实人...

  • 简介

    A Native Client web application consists of JavaScript, H...

网友评论

    本文标题:经验分布函数简介

    本文链接:https://www.haomeiwen.com/subject/ayezeltx.html