美文网首页
007第三十二篇:“回归分析”是什么呢?—统计学(9)

007第三十二篇:“回归分析”是什么呢?—统计学(9)

作者: milk76 | 来源:发表于2018-03-14 15:49 被阅读0次
过去、现在、未来

概念:

“回归regression”望文生义应该是,回来、归来、落叶归根、浪子回头金不换。而统计学中的“回归”却是追本溯源的意思,我们看到了一个结果,它很重要、也很有意思,往前推推,看看能得到什么?

来源:

据说最早使用“回归”这个词的是人类学家高尔顿,1855年, 高尔顿发表《遗传的身高向平均数方向的回归》一文,他和他的学生卡尔•皮尔逊Karl·Pearson通过观察1078对夫妇的身高数据,成年儿子的身高随每对夫妇的平均身高增加而增加,两者近乎一条直线。但是有趣的是,通过观察,高尔顿还注意到,当父母身高走向极端(极高或极矮时),子女的身高不会象父母身高那样极端化,其身高要比父母们的身高更接近平均身高,即有“回归”到平均数去的趋势,这就是统计学上最初出现“回归”时的涵义,高尔顿把这一现象叫做“向平均数方向的回归” (regression toward mediocrity)。

现代意义:

它要比其原始意义广泛的多。具体地说,回归分析的内容包括:
• 确定因变项与自变项间的回归模型,即变量间相关关系的数学表达式(通常称为经验公式);
• 根据样本估计并检验回归模型及未知参数;
• 从众多的自变项中,判断哪些变量对因变项的影响是显著的,哪些是不显著的;
• 根据自变项的已知值或给定值来估计或因变项的平均值并给出预测精度,或根据因变项的给定值来估计自变项的值。

例子:

说人话,还是用人身高做例子吧。假定父母身高为自变量与子女身高因变量,有因果关系。

经过研究兴趣(身高)→测量工具(尺)→研究资源(观察人群)→测量层级(定比层级)→测量精度(小数点后两位,单位为米)→收集数据→抽样形成数据集。

• 形成一个关于父母身高与子女身高的数学公式。父母身高为自变项x、子女身高为因变向y。公式为y=ax+b。

• 将已知父母身高的数据,和子女身高的数据,带入上列公式,求出ab两常数或验证公式的正确性并修正。

Y= 0.8567+0.516*X (单位为米);假如父母辈的平均身高为1.75米,则预测子女的身高为1.7597米。                                                        ——高尔顿的数据

• 如果需要观察众多自变量影响子女身高时,还需收集子女发育时营养状况、健康状况、锻炼状况等,究竟是不是存在相关或因果关系,通过分析确定显著与非显著,得出结果。

• 根据父母的身高预测子女身高,或者根据子女身高溯源到父母的身高。

结论:

总之,推理过程是:

先看两(多个)变项先假设因果关系;其次看是否相关,再次看相关是否显著,最后显著时就很可能是因果关系才能讨论因果链是否成立。

整个过程后,我们就可以追溯过往、预测将来了。当然“坑”还很多,以后再说,毕竟比星座预测的准多了。

相关文章

  • 007第三十二篇:“回归分析”是什么呢?—统计学(9)

    概念: “回归regression”望文生义应该是,回来、归来、落叶归根、浪子回头金不换。而统计学中的“回归”却是...

  • 前言

    梳理统计学习相关的体系 进入统计机器学习模型部分,首先从最基础的从回归分析说起。 1.回归分析 回归分析大家相对来...

  • 广义线性模型(2)线性回归模型的理解

    1 原理 1.1 概述 回归问题:回归属于统计学,回归分析(regression analysis)指的是确定两种...

  • 回归

    参考书 《白话统计学》 回归可以考察变量间关系的性质与强度 简单回归和多元回归 简单回归 简单回归分析和单因子方差...

  • 实践-python实现回归分析

    作业:本周是统计学学习小组-第二期的第十三周,我们这周是python实践周,实现的内容是第十二周的回归分析部分,大...

  • 每周读一本书|《如何阅读一本书》阅读笔记(4)

    2019年3月9日 第二篇:阅读的第三个层次--分析阅读(重点) 第六~十二章内容概要 【分析阅读】的第一阶段 —...

  • 007第三十二篇

    在微信中,有那么一个人,朋友圈基本不发,基本不聊天;但他心中有我,我心中也有他;他是一个不被别人理解的人;他有自己...

  • R语言实战__第8章 回归

    [toc] 第8章 回归 拟合并解释线形模型 检验模型假设 模型选择 回归分析是统计学的核心,通指那些用预测变量(...

  • 绘制热图与预后评分关系的简易工具

    01—研究背景 多因素cox回归分析方法是英国统计学家 D.R.Cox 于 1972 年提出的比例风险回归模型 (...

  • 机器学习之数学知识

    1、向量 2、矩阵 3、导数 4、数值计算 5、概率分布 6、参数估计 7、回归分析 线性回归:是统计学中对若干样...

网友评论

      本文标题:007第三十二篇:“回归分析”是什么呢?—统计学(9)

      本文链接:https://www.haomeiwen.com/subject/dqvofftx.html