美文网首页
(概率论基础4)随机变量的数字特征

(概率论基础4)随机变量的数字特征

作者: To_QT | 来源:发表于2019-05-03 11:25 被阅读0次

1.数学期望(均值)

1.1 期望的定义

离散型随机变量

假设离散型随机变量X的分布律为:P(X = x_k)=p_k, k=1,2,..。若级数\sum_{k=1}^{\infty}x_kp_k收敛,则称\sum_{k=1}^{\infty}x_kp_k为随机变量X数学期望。记为E(X)

离散型随机变量函数

假设离散型随机变量X的分布律为:P(X = x_k)=p_k, k=1,2,..。若\sum_{k=1}^{\infty}g(x_k)p_k绝对收敛,则有
\begin{align} E(Y)=E(g(X))=\sum_{k=1}^{\infty}g(x_k)p_k \tag{1.1} \end{align}

连续型随机变量

假设连续型随机变量X的密度函数为:f(x)。若积分\int_{-\infty}^{\infty}xf(x)绝对收敛,则\int_{-\infty}^{\infty}xf(x)为随机变量X数学期望。记为E(X)

连续型随机变量的函数

假设连续型随机变量X的密度函数为:f(x)。若积分\int_{-\infty}^{\infty}g(x)f(x)绝对收敛,则:
E(Y)=E(g(X))=\int_{-\infty}^{\infty}g(x)f(x) \tag{1.2}

其实可以理解为:随机变量X的数学期望是随机变量函数的数学期望的特例,此时g(x)=x

1.2 期望的性质

  1. C为常数,则有E(C)=C
  2. 设随机变量X的期望为E(X),则有E(CX)=C·E(X)
  3. X,Y是两个随机变量,则有E(X+Y)=E(X)+E(Y)
  4. X,Y是两个相互独立的随机变量,则E(XY)=E(X)E(Y)

证明的方法:无脑带入公式(1.2)即可。

1.3 条件期望

1.3.1 条件期望的定义

与条件分布的定义类似,条件期望就是它在给定某种附加条件下的期望,可记为E(Y|X=x, Z=z, ...),若只有一个随机变量X,则可记为E(Y|x)

若知道了随机变量X,Y的联合概率密度f(x,y),则E(Y|x)可以定义为:先给定X=x之下,Y的条件密度函数f(y|x),由期望的定义:
E(Y|x) = \int_{-\infty}^{\infty}yf(y|x)dy \tag{1.4}

1.3.2 条件期望的意义

条件期望反映了随着X取值x的变化,Y的平均变化情况如何。在统计学上,常把条件期望E(Y|x)作为x的函数称为YX的“回归函数”。

结合全概率公式的意义可知:变量Y的期望,应该等于其条件期望E(Y|x)x取加权平均,即:
E(Y) = \int_ {-\infty}^{\infty} E(Y|x)f_1(x)dx \tag{1.5}

式(1.5)的证明如下:记f_1(x)=\int_{-\infty}^{\infty}f(x,y)dyf_2(y)=\int_{-\infty}^{\infty}f(x,y)dx,则按照定义:
\begin{align} E(Y) =& \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} yf(x, y)dxdy \\ =&\int_{-\infty}^{\infty} \left [\int_ {-\infty}^{\infty} yf(x, y)dy \right] dx \tag{1.6} \end{align}

在公式(1.6)中,\left [\int_ {-\infty}^{\infty} yf(x, y)dy \right] 的值可以写成:

\begin{align} \int_ {-\infty}^{\infty} yf(x, y)dy =& \int_ {-\infty}^{\infty} yf(y|x)·f(x)dy \\\\ =& \int_ {-\infty}^{\infty} yf(y |x)·f(x)dy\\\\ =& f(x)·\int_ {-\infty}^{\infty} yf(y |x)dy\\\\ =& f(x)E(Y|x)\\\\ =&E(Y|x)\int_ {-\infty}^{\infty} f(x,y) dy \tag{1.7} \end{align}
综上,E(Y) =\int_{-\infty}^{\infty} \left [ E(Y|x)\int_ {-\infty}^{\infty} f(x,y) dy \right] dx,公式(1.5)得证。

它可理解为一个“分两步走”去计算期望的方法,因为在不少情况下,迳直计算E(Y)较难,而在限定某变量X之值后,计算条件期望E(Y|x)则较容易.因此我们分两步走:第一步算出E(Y|x),再借助X的概率分布,通过E(Y|x)算出E(Y)。更直观一些,你可以把求E(Y)看成为在一个很大的范围求平均.限定X之值从这个很大的范围内界定了一个较小的部分。先对这较小的部分求平均,然后再对后者求平均。

比如要求全校学生的平均身高,你可以先求出每个班的学生的平均身高,然后再对各班的平均值求一次平均.自然,在作后一平均时,要考虑到各班人数的不同,是以各班人数为权的加权平均。


2. 方差(“差”的平方)

2.1 方差的意义

表示随机变量X与期望E(X)的偏离程度,方差越小,偏离程度越小,数据越稳定。

2.2 方差的定义

X是一个随机变量,若E\left \{[X-E(X)]^2\right \}存在,则E \left \{[X-E(X)]^2 \right \},通俗的说,就是随机变量X的函数g(X)=[X-E(X)]^2的期望
那么带入有公式(1.1)和公式(1.2)可知,方差有
E(Y)=E(g(X))=\sum_{k=1}^{\infty}[X-E(X)]^2p_k \tag{2.1}
E(Y)=E(g(X))=\int_{-\infty}^{\infty}[X-E(X)]^2f(x) \tag{2.2}
展开得:
\begin{align} E(Y)=E(g(X))=&\int_{-\infty}^{\infty}[X-E(X)]^2f(x)\\ =&\int_{-\infty}^{\infty}[X^2-2XE(X)+E(X)^2]f(x)\\ =&\int_{-\infty}^{\infty}[X^2f(x)-2XE(X)f(x)+E(X)^2f(x)]\\ =&\int_{-\infty}^{\infty}X^2f(x)-E(X) \int_{-\infty}^{\infty}2Xf(x)+E(X)^2\int_{-\infty}^{\infty}f(x)\\ =&E(X^2)-E(X)^2 \tag{2.3} \end{align}

2.3 方差的性质

  1. C为常数,则有D(C)=0
  2. 设随机变量X的期望为D(X),若C为常数,则有D(CX)=C^2·D(X)
  3. 设随机变量X的期望为D(X),若C为常数,则有D(C+X)=D(X)
  4. X,Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E\{(X-E(X))(Y-E(Y))\}
  5. X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)
  6. D(X)=E(X^2)-(E(X))^2
  7. D(X)=0的充分必要条件是X以概率1取常数E(X)
    P\{ X=E(X)\} =1

3. 协方差

3.1 协方差的意义

"协"是取“协同”之意,D(X)=E\left \{[X-E(X)]^2 \right \}COV(X, Y)=E\left \{[X-E(X)][Y-E(Y)] \right \}

3.2 协方差的定义

协方差:COV(X, Y)=E\left \{[X-E(X)][Y-E(Y)] \right \}
相关系数:\rho_{XY} = \frac {COV(X,Y)}{\sqrt{D(X)}·\sqrt{D(Y)}}

3.3 协方差的性质

  1. COV(aX, bY)=abCOV(X,Y)
  2. COV(X_1+X_2, Y) = COV(X_1, Y)+COV(X_2, Y)
  3. COV(X, Y) = E(XY)-E(X)E(Y)

3.4 相关系数的性质

  1. |\rho_{XY}| \leq 1
  2. |\rho_{XY}|越接近1,则X,Y相关性越好;越接近0,相关性越差。
  3. 0<|\rho|<1时,则可以解释为:X,Y之间有“一定程度”的线性关系,而非严格的线性关系
    在图3-1中,X,Y之间存在一种“线性趋势”,这种趋势在(a)中是正向的,\rho显著大于0。在(b)中趋势比(a)中的趋势更为明显,但是\rho<0;至于(c),\rho>0虽然仍大于0,但接近于
    图3-1

4. 矩、协方差矩阵

矩的定义:设X为随机变量,c为常数,k为正整数,则量E[(X-c)^k]称为X关于ck阶矩。那么,当c=0时,就称为“原点矩”,当c=E(x)时,就称为中心矩。

  1. XY是随机变量:若E(X^k), k=1, 2, ...,则称为Xk阶原点矩。

\begin{align} A_k = \frac{1} {n} \sum_{i=1}^{n}X_i^k, k=1, 2, ... \tag{4.1} \end{align}

  1. XY是随机变量:若E([X-E(X)]^k), k=1, 2, ...,则称为Xk阶中心矩。

\begin{align} B_k =&\frac{1}{n} \sum_{i=1}^{n}(X_i-\overline{X})^k, k=1,2, ... \tag{4.2} \end{align}

  1. XY是随机变量:若E(X^kY^l), k=1, 2, ...; l=1, 2, ...,则称为X、Yk+l阶混合中心矩。

  2. 三阶中心矩和一阶原点矩的关系:
    三阶中心矩可以衡量分布是否有偏。若f(x)关于a点对称,则有f(a+x)=f(a-x),那么f(x)的期望比为a。若B_3>0,则分布正偏或者右偏;若B_3<0,则分布负偏或者左偏。

  • 一般的,方差为二阶中心矩,则可以将“偏度系数”定义为:
    \beta_1=\frac {B_3}{B_2^{3/2}} \tag{4.3}

  • 峰度系数:衡量分布(密度)在均值附近的陡峭程度。
    \beta_2=\frac {B_4}{B_2^{2}} \tag{4.4}

在峰度中,B_4在除以B_2之后已经失去了因次,与X的单位无关。因此,若要比较X,Y两个变量的峰度,需要将方差调整至1后进行比较。

5. 三大分布

5.1 两个神奇的函数

1. \Gamma函数

\Gamma = \int_{0}^{\infty}e^{-t}t^{x-1}dt, x>0 \tag{5.1}

  • \Gamma(x+1)做分部积分,有\Gamma(x+1)=x\Gamma(x)
  • \Gamma(1/2) = \sqrt{\pi}
  • \Gamma(1) = 1
  • n为正整数:
    • n为奇数:\Gamma(\frac{n}{2}) = 1·3·5···(n-2)·2^{-\frac{n-1}{2}}·\sqrt{\pi}
    • n为偶数:\Gamma(n) = (n-1)!
Gamma函数实例
2. \beta函数

\beta(x,y)=\int_{0}^{1}t^{x-1}(1-t)^{y-1} dt; x>0, y>0 \tag{5.2}

5.2 \chi ^2分布

定义

X_1, X_2, ..., X_n服从标准正态分布N(0,1),则称统计量
\chi ^2 = X_1^2 + X_2^2 + ... + X_n^2 \tag{5.3}
服从自由度为n\chi ^2分布,记为\chi^2 \sim \chi^2(n)

性质
  • \chi_1 ^2 \sim \chi^2(n_1), \chi_2 ^2 \sim \chi^2(n_2),并且\chi_1, \chi_2相互独立,则有
    \chi_1 ^2 + \chi_2 ^2 \sim \chi^2(n_1+n_2) \tag{5.4}

5.3 t分布

定义

X服从标准正态分布N(0,1)Y服从\chi^2 (n)则称统计量
t=\frac {X}{\sqrt{\frac{Y}{n}}} \tag{5.5}
服从自由度为nt分布,记为t \sim t(n)

5.4 F分布

定义

X服从\chi^2(n_1)Y服从\chi^2 (n_2)则称统计量
f = \frac {\frac{Y}{n_1}}{\frac{Y}{n_2}} \tag{5.5}
服从自由度为(n_1, n_2)F分布,记为F \sim F(n_1, n_2)


6. 各种常见分布及其数字特征:

1.jpg 2.jpg 3.jpg

相关文章

  • (概率论基础4)随机变量的数字特征

    1.数学期望(均值) 1.1 期望的定义 离散型随机变量 假设离散型随机变量的分布律为:。若级数收敛,则称为随机变...

  • 金融分析师CFADay3

    概率论基础 概率论相关术语(Terminology of Probability): 1、随机变量(Random ...

  • 决战考研147天

    考研倒计时147天 数学8个小时:本来准备下午学习专业课的,可是想着上午概率论的随机变量的数字特征没有看完,试着看...

  • 概率论(四):随机变量的数字特征

    数学期望 对于离散型随机变量来说,若存在绝对收敛级数,则称此级数为随机变量的数学期望,记作:。若为连续型随机变量(...

  • 第一章 概率统计基本知识

    1.随机事件与概率 2.随机变量及其分布 3.随机变量的数字特征 4.极限定理 5.数理统计的基本概念

  • 无标题文章

    [TOC] # 四 随机变量的数字特征 ## 1.数学期望 离散型 $...

  • Python实现概率分布

    概率分布基础 概率分布,是概率论大的基本概念之一,主要用以表述随机变量取值的概率规律。为了使用的方便,根据随机变量...

  • 1.4 概率基础

    1.4 概率基础 本节介绍概率、随机变量、期望、方差等概率论的基础知识。 1.4.1 概率 概率是指一个事件出现(...

  • 附录E:概率论之随机变量的数字特征

    时间:2018-09-11 作者:魏文应 一、数学期望 平均值 我们给一个文艺一点的名字,把平均值叫做 数学期望。...

  • Chapter4—随机变量的数字特征

    1. 数学期望 数学期望刻画了随机变量X的所有可能取值在概率意义下的平均值,实际上是均值的一种体现。 离散型随机变...

网友评论

      本文标题:(概率论基础4)随机变量的数字特征

      本文链接:https://www.haomeiwen.com/subject/mkagnqtx.html