美文网首页
期望与方差之三:数据线性变换后的方差

期望与方差之三:数据线性变换后的方差

作者: 艾辛图 | 来源:发表于2020-09-22 10:53 被阅读0次

    方差(Variance)是描述一组数据离散程度的一个度量,数据越是离散的,方差越大,反之越小。方差一定是正数。方差经常用\sigma ^2或Var(X)表示(注意用Var()表示的话,X需要大写,表一个数据总体):

    \sigma^2 = Var(X) = \frac{(x_{1} - \mu )^2 + (x_{2} - \mu )^2 + ... + (x_{n} - \mu )^2}{n}  = E((X - \mu)^2 )

    与总体的期望值类似,在实际研究中,我们不单要知道原始数据的方差,还需要知道原始数据经过某种线性变换后的方差。因此,我们需要知道下面几个变换的结果是什么:

    1. Var(kX)

    2. Var(X + c)

    3. Var(kX + c)

    其中,k和c为任意实数。

    与数据线性变换后的期望值的几个证明类似,下面的证明尽量使用“加权平均”的式子进行证明,避免使用求和符号(Sigma notation),以区别于许多教科书直接用\Sigma 进行证明,方便初学者理解。

    关于第一个方差变换,因为每个数据都变成原来的k倍,那么期望值(均值)也变成原来的k倍,因为:

    E(kX) = kE(X)=k\mu

    于是 

    Var(kX) = \frac{(kx_{1} - k\mu )^2 + (kx_{2} - k\mu )^2 + ....(kx_{n} - k\mu )^2}{n}

    = \frac{k^2 (x_{1} - \mu )^2 + k^2 (x_{2} - \mu )^2  + ....k^2 (x_{n} - \mu )^2}{n}

    = k^2 \frac{ (x_{1} - \mu )^2 + (x_{2} - \mu )^2  + ....(x_{n} - \mu )^2}{n} = k^2Var(X)

    关于第二个方差变换,我们先要了解,数据总体增加常数c之后,期望值出现怎样的变化。根据上一篇文章,有:

    E(X + c) = E(X) + c = \mu + c

    于是当所有数值都增加c后,方差有:

    Var(X + c) = \frac{(x_{1} +c - \mu -c)^2 + (x_{2} +c - \mu -c)^2  + ....(x_{n} +c - \mu -c)^2}{n}

    = \frac{(x_{1} - \mu)^2 + (x_{2} - \mu )^2  + ....(x_{n}  - \mu )^2}{n} = Var(X)

    结合上面两个结论,并结合数据线性变换后的期望值:

    E(kX + c) = kE(X) + c = k\mu + c

    第三个方差有:

    Var(kX + c) = \frac{(kx_{1} +c - k\mu -c)^2 + (kx_{2} +c - k\mu -c)^2  + ....(kx_{n} +c - k\mu -c)^2 }{n}

    = \frac{(kx_{1} - k\mu ) ^2 + (kx_{2}  - k\mu )^2  + ....(kx_{n}  - k\mu)^2}{n}

    = k^2 \frac{(x_{1} - \mu ) ^2 + (x_{2}  - \mu )^2  + ....(x_{n}  - \mu)^2}{n} = k^2Var(X )

    综上可得:

    1. Var(kX) = k^2Var(X)

    2. Var(X + c) = Var(X)

    3. Var(kX + c) = k^2Var(X)

    相关文章

      网友评论

          本文标题:期望与方差之三:数据线性变换后的方差

          本文链接:https://www.haomeiwen.com/subject/qfoiyktx.html