美文网首页机器学习与数据挖掘大数据
数理统计随笔01-什么是不相关

数理统计随笔01-什么是不相关

作者: 张浩洪 | 来源:发表于2016-10-09 00:37 被阅读70次

> 其实很多数理统计的概念都是非常直观的,这与数理统计本身是一门与现实生活密切相关的学科有关。很多数理统计上的公式仅是人们日常思维模式的形式化表达。可惜很多同学在学习这门课程的时候本里面各种复杂的公式吓唬住了,很少人会愿意理解这些公式背后的思想。这个系列的随笔是本人在读书过程中的一些笔记,纯属个人理解和体会,不一定是绝对的正确,但我自己会根据自己吸收到的新知识随时改进自己的理解——贝叶斯思维是个好东西。

很多童鞋在上数理统计的课程时,都会学到相关性(Correlation)这个概念,而且都会列出一个相关系数的计算公式:

而且教科书上会告诉你,当$\\\\beta=0$ 的时候,X和Y就不相关,接着会给出X和Y不相关时候对应的散点图(ScatterChart),如下:

从上图可以看出,这些点所构成的图形接近于一个圆(其实也不一定是圆形,也可能是边界连接后大致是一个对称的几何图形),但是为何当X和Y不相关的时候就会表现出这种图形呢?最近在读一本书叫How Not to Be Wrong: The Power of Mathmatical Thinking ,我认为里面就给出了一个很好的解答(作者以父亲和儿子身高的相关性作类比):

......这幅图与前面的散点图不同,没有表现出构成对角线的任何趋势。如果我们集中考虑父亲身高为73英寸的那些孩子的情况,….,就可以看出他们孩子的身高仍然会集中在69英寸周围(整体均值)。这表明孩子身高的条件期望值(也就是说,在父亲身高为73英寸时儿子的平均身高)与无条件期望值(在没有任何条件限制时儿子的平均身高)相同。

这时,在这种没有明显对焦趋势特征的散点图中,造成分布差异的很有可能仅为随机误差,这时起决定性作用的是回归平均值趋势,而不是别的因素。上述引用的那段话对什么是不相关有着很直观的阐述,它与我们日常的直观理解是一致的——别的因素的存在不会对目标产生影响,目标的波动仅仅是随机误差造成的,这类随机误差可以通过统计方法消除。

其实这里也可以写一个简单的推导,但是简书插公式太烦了,就留给大伙啦。

相关文章

  • 数理统计随笔01-什么是不相关

    > 其实很多数理统计的概念都是非常直观的,这与数理统计本身是一门与现实生活密切相关的学科有关。很多数理统计上的公式...

  • 01-什么是django

    什么是django 什么是djangoDjango是一个开放源代码的Web应用框架,由Python写成。采用了MT...

  • 数理统计学基本概念

    什么是数理统计学 数理统计学使用概率论和其他数学方法,研究怎样收集(通过试验或观察)带有随机误差的数据,并在设定的...

  • 01-思想随笔

    上午一家三口远赴独墅湖校区考试,叮嘱先生好不容易走这么远就带孩子看看吧,感受一下大学的气息。 我去考试,其实真的也...

  • 随笔01-等待

    我们的生命其实大部分时间都是在等待中度过的 小的时候等待快快长大,不用再考试,可以远离父母 上了大学等待快点毕业,...

  • 禅01-什么是禅学

    四十不惑,在人间的这个游戏场里的游戏玩得风波曲折,跌宕起伏,惊心动魄。金刚经里说:一切有为法,如梦幻泡影,如露亦如...

  • 随笔~~~

    什么是随笔

  • 随机事件及其发生的概率-贝叶斯公式

    参考教材概率论与数理统计(陈希孺)概率论与数理统计(茆诗松)参考视频中科大精品课程 概率论与数理统计(廖柏其) ...

  • 文章例话——《痈》

    该章节选了郭沫若的《痈》,用于讲解什么是随笔,随笔的精华是什么,做随笔的意义以及如何做随笔。部分摘录如下: 1、随...

  • 线性回归入门(1)

    1、什么是线性回归 线性回归(Linear Regression)是利用数理统计中回归分析,来确定两种或两种以上变...

网友评论

    本文标题:数理统计随笔01-什么是不相关

    本文链接:https://www.haomeiwen.com/subject/iwybjttx.html