静态面板数据分析

作者: CHEN_DIANDIAN | 来源:发表于2018-11-05 16:35 被阅读116次

    静态面板数据的主要问题

    • 横截面异方差
    • 序列自相关
    • 横截面同期相关

    基础工作

    屡次失败的经验表明,洗数据和看数据是非常基础且不可或缺的工作。基础不牢地动山摇,后面的分析全部得再来一遍,期间又会出现各种error。因此,面板数据分析的前几步毫无疑问就是

    1. 数据清理

    由于面板也是时间序列,为避免伪回归问题,很多人纠结是否应当先进行平稳性检验及差分。并非所有的面板数据都要进行平稳性处理,如短面板数据或N与T接近的情形,由于T信息含量不足,不考虑扰动项序列自相关。只有设定为时间序列模型的情况下才需要进行平稳性检验。

    2. 描述性分析

    xtdes 这个命令的重点在于看数据的轮廓:

    • 大N小T or 大T小N or 大N大T,即估计量的渐近性质
      a. N→∞比T→∞的渐近特性更合适:可以假定横截面具有大致的无关性(不存在组间同期相关);由于T小,不考虑序列自相关或通过聚类稳健标准误解决;适用短面板模型(FE,RE,GMM)
      b. T与N阶数相同或相近:可以假定时间序列无关性(不存在组内自相关);适用PCSE(hetonly)或面板误差修正模型
      c. T比N大:适用长面板模型或多元时间序列分析
    • balanced or unbalanced,进一步
      xtbalance, range(#year_begin #year_end) miss(_all)
    xtdes 数据概览

    xtsum 观察各变量是否正常:

    • mean 最好统一量纲,如人均实际GDP取对数
    • min和max 是否在合理区间内
    • N, n和T 各变量缺失值情况,区间长度可能不一致(与xtbalance配合使用)

    xttab 类别变量

    correlate 相关性分析的必要性:

    • 被解释变量和核心解释变量之间的关系,初步判断模型设定是否合理
      e.g. 负相关与设定为U型关系的模型
    • 核心解释变量与工具变量之间的关系,事关内生性

    P.S. 改变数据结构的两个常用命令 reshapegather

    3. 画图

    xtline 变量间关系可视化:与模型设定是否一致?与模型结果是否一致?

    面板模型及其Stata命令概览

    面板模型根据数据的结构可以分为长短面板,也可以根据模型的设定分为静态面板和动态面板。本文关注的是线性不可观测效应的面板数据模型,常用命令如下:

    xtreg Fixed-, between-, and random-effects, and population-averaged linear models
    xtregar Fixed- and random-effects linear models with an AR(1) disturbance
    xtgls Fit panel-data models by using GLS

    xtpcse Linear regression with panel-corrected standard errors
    xthtaylor Hausman–Taylor estimator for error-components models
    xtfrontier Stochastic frontier models for panel data
    xtrc Random-coefficients model
    xtivreg Instrumental variables and two-stage least squares for panel-data models
    Source: Stata Longitudinal-Data/Panel-Data Reference Manual - Linear regression estimators

    短面板模型

    1. 混合回归

    由于混合回归非常简单,人一兴奋就直接run regxtreg, fe 然后Hausman检验。这个做法相当不严谨,产生了误导性结果。记住,所有模型的第一步是进行假设检验

    1.1 假设检验

    混合回归 (Pooled regression) 也被称为“总体平均估计量 (Population-averaged model, or PA) ”,基本假设是不存在个体效应(包括固定效应和随机效应),因此必须对这个假设进行检验。

    (1) 固定效应检验

    • F检验(不推荐)
      xtreg y x1 x2 x3, fe
      注意是最下面一行的“F test that all u_i = 0”,不是表头的F检验。
      H0:接受混合回归;H1:FE优于混合回归。
      缺点:未使用稳健标准误估计,因此F检验有效性存疑。使用稳健标准误则愚蠢的stata不会报告F检验结果。

    • LSDV法
      reg y x1 x2 x3 i.id, vce cluster(id)
      test id*
      test id*=0
      若虚拟变量显著不为0,则存在个体效应,不应使用混合回归。

    (2) 随机效应检验

    • FGLS
      xtreg y x1 x2 x3, re r theta
      xttest0
      LM检验H0:不存在个体随机效应。

    • MLE
      xtreg y x1 x2 x3, mle [nolog]
      估计结果的最后一行“Likelihood ratio test of sigma_u=0"。

    1.2 xtregreg 的区别

    xtreg 默认设定是随机效应模型,混合OLS应当使用 reg 或者 xtreg, pa

    1.3 混合OLS基本格式

    reg y x1 x2 x3, vce cluster(id)

    划重点:

    • 由于不存在个体效应,回归中不应包含截面id的虚拟变量。
    • 使用聚类稳健标准误
      同一个体不同时期的扰动项往往存在自相关,聚类稳健标准误可以克服组内自相关。Stata默认使用的普通稳健标准误(假设扰动项为i.i.d) 大约是聚类稳健标准误的一半,因此不准确。从这个角度看,此处聚类稳健标准误的使用与cluster个数无关。(挖个坑,待填)
      在声明面板数据之后,选择项 ,robust,vce cluster(id) 效果完全相同。

    2. 个体效应模型

    • 模型选择问题:Hausman检验
    • 考虑双向固定效应:控制时间变量,并检验其显著性
    • 若数据质量不好,可考虑使用组间估计量(Regression on group means),或供模型对比参考使用,命令为 xtreg y x1 x2 x3, be
    • 不要忘记使用聚类稳健标准误
    • 由于LSDV法跟FE模型得到的估计量是一致的,因此在使用RE、BE和PA模型的时候注意不可加入截面id的虚拟变量
    • 多维固定效应 reghdfe
      这是一个可以处理多维固定效应(向下兼容)、可以聚类到3个层面、还可用工具变量处理内生性的命令,推荐使用。安装方法如下:

    ssc install reghdfe
    一般情况下会报错:“command ftools is unrecognized”
    检查ftools是否已安装:reghdfe, version
    安装ftools:ssc install ftools
    可能成功安装,可能继续报错:“connection timed out”
    这时候就需要手动安装了:ftools手动安装包
    下载zip解压到相应的ado文件夹中即可

    长面板模型

    1. 假设检验

    • 组间异方差:Wald test
      xtreg y x1 x2 x3 i.id t, r fextgls y x1 x2 x3 i.id t
      xttest3
    • 组内自相关:一阶差分回归(FD)
      xtsetrial y x1 x2 x3 i.id t [,output]
    • 组间同期相关:
      (1) LM检验--仅适用长面板
      xtreg y x1 x2 x3 i.id t, r fextgls y x1 x2 x3 i.id tivreg2
      xttest2
      (2) 截面相关检验(cross-sectional dependence)--普遍适用
      xtreg
      xtcsd, pes
      xtcsd, fri
      xtcsd, fre abs show

    2. 相应模型

    • 组间异方差:PCSE (hetonly)
      xtpcse y x1 x2 x3 i.id t, hetonly
    • 组内自相关:FGLS
      (1) 截面自回归系数相同 xtpcse y x1 x2 x3 i.id t, corr(ar1)
      (2) 截面自回归系数不同 xtpcse y x1 x2 x3 i.id t, corr(psar1)
    • 组间异方差+组间同期相关:PCSE(default)
      xtpcse y x1 x2 x3 i.id t
    • 组间异方差+组间同期相关+组内自相关:全面FGLS
      xtgls y x1 x2 x3 i.id t, panels(cor) corr(ar1) igls
    • 当异方差、序列相关以及截面相关性质未知时,最合适的处理方法是xtscc 命令,可以得到FE模型的稳健型标准误,但在N远大于T的情况下也应慎用。

    注意:分析长面板数据的 xtglsxtpcse 命令都没有考虑个体效果 (fixed effects) ,他们对截面异质性的处理都是通过 OLS 估计得到的残差进行了,也就是采用OLS估计的残差估得稳健型方差-协方差矩阵。因此,上述回归中均加入了i.id。这种情形下考虑固定效应有两种方法:

    (1) 加入 N-1 个虚拟变量(LSDV法)

    tab id, gen(dumid)
    drop dumid1
    xtgls y x dumid*, p(h) corr(ar1)
    
    长面板的估计策略

    (2) 先采用 xtdata 命令去除个体效果,再采用 xtgls 命令进行估计

    preserve
    xtdata y x , fe clear
    xtgls y x, p(h) corr(ar1)
    restore
    

    推荐采用后者,因为当 N 较大时,前者的输出结果管理起来比较繁琐。

    Source: 连玉君的回答,固定效应的FGLS估计怎么做

    面板工具变量法

    这一块以后跟GMM一起写。(又挖个坑)

    IV和GMM相关估计步骤,内生性、异方差性等检验方法

    一文读懂GMM的stata操作步骤

    古往今来,哪一个工具变量没有争议?寻找工具变量

    变量内生性和工具变量知识汇总

    Refer:陈强《高级计量经济学及stata应用(第二版)》

    相关文章

      网友评论

        本文标题:静态面板数据分析

        本文链接:https://www.haomeiwen.com/subject/gubsxqtx.html