美文网首页
【计量经济学导论现代观点】读书笔记一:横截面数据的回归分析

【计量经济学导论现代观点】读书笔记一:横截面数据的回归分析

作者: 吾倩 | 来源:发表于2019-01-12 23:11 被阅读0次

重要的概念

横截面数据:给定时间节点,对个人、企业或其他一系列单位采集样本说构成的数据集;

无偏性:总体参数与估计值相等

一致性:当样本容量 n 趋于无穷大时,估计式依概率收敛于总体参数的真实值

自由度:以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,样本的离差平方和/自由度是总体的方差的无偏估计


第2章 简单回归模型

模型定义

简单回归的公式:y=\beta _{1}+\beta _{2}x+u

其中y是被解释变量,x是解释变量,\beta _{1}是截距,\beta _{2}表示x变化一个单位给y带来的影响,u是扰动项,可以理解成不被x和截距项解释的其他因素,这个模型的目的主要是为了解释其他条件不变的情况下,解释变量的变化给被解释变量带来的影响;

接下来要对这个方程中的\beta _{1}\beta _{2}进行无偏有效估计,需要满足以下几个假设条件

1.u零均值:E(u)=0,但是光有这个约束是不行的,为什么说E(u)=0的约束性不强?参见2.5节

2.u的均值独立于x:E(u|x)=E(u),为什么这里不说u和x不相关呢?因为我们一般度量的相关性都是线性相关性,即使u和x不相关,也有可能出现u和x^2相关等,所以用这个约束更好一些;为什么这么说,参见B.4

OLS推导

基于上述的两个假设,模型需要满足

E(u)=0   ……………………………………(2.10)

Cov(x,u)=E(xu)=0…………………………(2.11)

等价于

E(y-\beta _{1} -\beta _{2} x)=0…………………………………(2.12)

E[x(y-\beta _{1} -\beta _{2} x)]=0………………………………(2.13)

对上述约束进行求解,只要\sum_{i=1}^n(x_{i} -E(x))^2>0

\hat{\beta _{2} } =\frac{\sum_{i=1}^n(x_{i} -{E(x)} )(y_{i} -E(y) )}{\sum_{i=1}^n (x_{i} -E(x)) ^2 }  ………………………………(2.18)

\hat{\beta _{1} } =E(y)-\hat{\beta _{2} } E(x)  …………………………………………………(2.19)

得到上述两个估计量为模型中\hat{\beta _{1} } \hat{\beta _{2} } 的无偏估计且是残差平方和最小估计(基于2.10、2.11可以推导出这个约束求出来的解是残差平方和最小的),这种估计方法得到的估计量就是残差平方和最小的方法得到的估计量,所以该方法称为OLS;

OLS的操作技巧

ols统计量满足三个性质:

\sum_{i=1}^n \hat{u_{i} } =0  ………………………………………………………………(2.30)

\sum_{i=1}^n \hat{u_{i} }x_{i}  =0 ……………………………………………………………(2.31)

(E(x),E(y))在ols回归线上

通过2.30、2.31很容易推导出\sum_{i=1}^n \hat{u_{i} }\hat{y_{i}}  =0,这样也能很容易推导出SST=SSE+SSR,其中SST=\sum_{i=1}^n (y_{i}-E(y) )^2,SSE=\sum_{i=1}^n (\hat{ y_{i}}-E(y) )^2,SSR=\sum_{i=1}^n \hat{u_{i} }

拟合优度R^2=SSE/SST,代表的是样本波动中被x解释的部分的百分比,也等于y_{i} \hat{y_{i} } 相关系数的平方,但是要注意的是拟合优度低并不一定没有用,因为它也有可能是在其他条件不变的情况下,解释变化和被解释变量关系的良好估计;


度量单位和函数形式

改变度量单位并不会改变截距项,只会改变\beta _{2} ,也不会影响R^2

线性模型的含义主要是说明\beta _{1} \beta _{2} 是线性的,而不是x、y,可以对x、y进行一些变换,常用的含对数的函数形式,及其对应的解释

|                模型              |  因变量   |  自变量   |         对\beta _{1} 的解释                |

|:-----------------------------:|:-----------: |:-----------:|:-------------------------------------:|

|       水平值-水平值       |       y        |       x      |            \Delta y=\beta _{2}\Delta x          |

|       水平值-对数           |      y         |    log(x)  |   \Delta y=(\beta _{2}/100)%\Delta x |

|       对数-水平值           |   log(y)     |      x       |    %\Delta y=(100\beta _{2})\Delta x   |

|          对数-对数            |   log(y)     |   log(x)   |        %\Delta y=\beta _{2} %\Delta x    |

OLS估计量的期望值和方差


过原点回归及对常数回归



第3章 多元回归分析:估计


个人理解

1.我学习计量经济学的初衷

期望能够利用计量经济学的方法对企业中遇到的一些问题进行归因分析;

2.计量经济学与机器学习的方法关联与差异

相似性

(1)背后都是应用数学原理对现实社会的现象进行拟合,可能也是自己现在了解到的机器学习比较有限,强化学习不懂也没有应用,所以还没有get到机器-自动学习的点;

差异性

(1)计量经济学中的模型相对来说是一些比较简单的模型(此处的简单不是指模型原理的复杂度,简单也不代表好理解,而是指模型本身的层次、逻辑结构),解释性较强,不像深度学习的模型,很多时候无法简单直观地去解释隐层、权值的含义;

(2)两者目的不同,计量经济学中的模型更多是为了解释模型中被解释变量与解释变量的关系,用于归因,而机器学习中的模型更多是为了使得效率最高,所以应用场景也不同;

3.残差与扰动项的区别

残差实际是拟合出来的估计值与真实值之间的差异,因为估计的方法有差异,会带来残差的差异,而扰动项是指模型中不被解释变量和截距解释的部分,还是有差异的,但是假如估计是无偏且0方差的情况下,残差应该是等于扰动项的;


附录

1.

文中数据集&code

https://github.com/adaiagua317/introductory_econometrics.git

参考资料:

[1]计量经济学导论现代观点(第五版) 伍德里奇

[2]计量经济学导论现代观点(第五版)习题答案

[3]总体方差无偏估计推导:https://www.guokr.com/question/468100/

相关文章

网友评论

      本文标题:【计量经济学导论现代观点】读书笔记一:横截面数据的回归分析

      本文链接:https://www.haomeiwen.com/subject/bggqdqtx.html