美文网首页
期望与方差之二:数据线性变换后的期望值

期望与方差之二:数据线性变换后的期望值

作者: 艾辛图 | 来源:发表于2020-09-22 09:57 被阅读0次

    上一篇文章介绍了期望的计算公式:

    \mu = E(X) = \sum_{i=1}^n x_{i}p(x_{i}) 

    其中,x_{i} 为每一个数据元素数值,而p(x_{i}) 是这个值的出现概率。期望值,即一个数组的总体平均值,描述这组数据的中心趋势。在实际应用中,我们不单要知道一组原始数据的期望值,而且要知道这组数据线性变换后的期望值。

    那什么是线性变换呢?简单地说,就是一个数值x,可以乘任意系数k,在加上一个任意常数c后的数值y。说得专业一点,y是x的一个线性函数或线性映射。

    y = kx + c

    什么时候需要用到这样的变换呢?比如一件家具的生产出来后,成本价为x。经过流通环节,到达销售终端时,价格可能变成成本价的k倍,并加上c元。这就是一个线性变换。

    现在我们的问题是,如果一家工厂生产了n种家具,每一件的成本价为x_{1},  x_{2}.... x_{n}。那么,经过同样的流通后,也就是同样的线性变换后,最终售价的平均值,是否能用成本价的均值来推断呢,或者说,我们能否说

    E(Y) = E(kx + c) = kE(x) + c

    直觉上,这是可以的。很多书本或文章节选,都会直接给出这个式子,但是基本不作详细证明,直接来一句“显而易见”了事。我感觉这是不足够的。曾经看过某个数学家说过这么一句话,我深以为然。

    One can't apply a theorem confidently without knowing its validity.

    于是,我打算对下面关于期望的三个变换作推导。

    三个变换推论分别是:

    1. E(kX) = kE(X)

    2. E(X + c) = E(X) + c

    3. E(kX + c) = kE(X) + c

    第一种变换的证明:

    E(kX) =\sum_{i=1}^n kx_{i}p(x_{i} ) = \frac{kx_{1}+ kx_{2}+...kx_{ n}}{n}

    =k \frac{x_{1} + x_{2} + .... + x_{n} }{n} = k\mu = kE( X)

    证毕

    第二种变换的证明:

    E(X + c) = \sum_{i=1}^n (x_{i} + c) p(x_{i} ) = \frac{(x_{1}+c) + (x_{2}+c) + ....(x_{n}+c) }{n}

    =\frac{(x_{1} + x_{2} + ...x_{ n} )+ nc }{n} = \frac{x_{1} + x_{2} + ...x_{ n}}{n} +  \frac{nc}{n}

    = E(X) + c

    证毕

    第三种变换的证明:

    有了前两个推论证明,第三个变换已经显而易见。

    E(kX + c) = E(kX) + c = kE(X) + c

    证毕

    最后提一句,关于期望和方差的各种推导,我还是喜欢回到最原始的各个数字相加后取平均的写法,因为我发现很多关于这个话题的证明,都直接使用连加符号(Sigma notation),初学者通常不适应。因此,这系列的文章的证明过程或许会“丑”一点。

    相关文章

      网友评论

          本文标题:期望与方差之二:数据线性变换后的期望值

          本文链接:https://www.haomeiwen.com/subject/fuwbyktx.html