## 一、动态门槛效应回归模型背景简介
在线性回归中,所有观测样本回归函数相同,那如果所有观测样本是离散类,那回归函数的差异性将如何体现? 在回归分析中,我们常常关心系数估计值是否稳定,即如果将整个样本分成若干子样本分别进行回归,是否还能得到大致相同的估计系数? 如果样本的变量不是离散型变量,而是连续型变量,就需要给定一个标准,即 “门槛值” 。传统的做法是,研究者主观的确定一个门槛值,然后将门槛值帮样本进行分割,即不对门槛值进行参数估计,也不对其显著性进行统计估计检验,所以很显然,这样得到的结果并不可靠。Hansen 于 1996 年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门槛自回归模型 (TAR) 的估计和检验。之后,他在门槛模型上连续追踪,发表了几篇经典文章,尤其是 1999 年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和 2004 年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。Hansen (1999) 提出的门槛效应模型是为存在个体固定效应非动态面板所设计的,门槛值的可以利用固定效应转换,通过最小二乘估计来得到回归斜率。利用一个非标准的渐近理论进行推断,并允许构建置信区间来进行假设测试。Hansen (2000) 假设样本数据为 $\left\{ {\left. {{y_{it}},{q_{it}},{x_{it}}:1 \le i \le n,1 \le t \le T} \right\}} \right.$,表达式为 ${y_{it}} = {\mu _i} + \beta _1^\prime {x_{it}}I\left( {{q_{it}}\gamma } \right) + \beta _2^\prime {x_{it}}I\left( {{q_{it}} > \gamma } \right) + {e_{it}}$,代表划分样本的门槛变量, 为待估计的门槛值,为外生解释变量,与扰动项不相关。I 为指示函数,即括号中的表达式为真,则取值为 1;反之,取 0。写成分段函数为:
$${y_{it}} = \left\{ {\begin{array}{*{20}{l}}
{{\mu _i} + \beta _1^\prime {x_{it}} + {e_{it}},}&{{q_{it}}\gamma }\\
{{\mu _i} + \beta _2^\prime {x_{it}} + {e_{it}},}&{{q_{it}} > \gamma }
\end{array}} \right.$$
但在这些文章中,均基于的假设是协变量必须为强外生变量,否则会形成有偏估计。而在现实中较难实现这一假设,故无法扩展应用领域。Caner and Hansen (2004) 年采用较为间接的方法解决了这个问题。他们研究了带有内生性的解释变量和一个外生门槛变量的面板门槛模型,只要利用简化型对内生变量进行一定的处理,然后用 2SLS (两阶段最小二乘法) 或者 GMM (广义矩估计) 对参数进行估计, 即放松了对内生解释变量的要求,但对于门槛变量的要求仍是必须强外生变量。本文即采用这个方法来运用动态门槛效应模型进行表征。Hansen (1999) 中的具有阈值效应的面板模型已被广泛用于实证研究。
Wang (2015) 开发了 Stata 命令 `xthreg`,他的固定效应估计量要求协变量必须是强烈外生的才能使估计量保持一致。 但是,强外生性可能在许多实际应用中受到限制。因此,Seo 和 Shin (2016) 将模型扩展为具有潜在内生阈值变量的动态面板模型。虽然先前的 `xthreg` 命令计算固定效果估计量,因此在此一般设置下不一致,但是的 `xthenreg` 命令产生一致且渐近的正态估计。Seo M H 和 Kim S (2019) 提出了一种计算上更有吸引力的自举算法来实现线性测试,而非 Seo 和 Shin (2016) 最初提出的非参数 i.i.d 自举算法。
## 二、用 STATA 运行动态门槛效应命令-基于 Seo M H 和 Kim S (2019)
使用数据来自British Cohort Study,该文采用动态门槛效应模型评估了肥胖对工人生产力的影响。肥胖是用体重指数(BMI)来衡量的,体重(公斤)除以身高(米)的平方。BMI在25到30之间的人被认为超重,BMI在30或更高的人被视为肥胖。更多的详细讨论见Kim(2019)。
### 2.1 命令的安装
```
ssc install xthenreg, replace //安装命令
net get xthenreg //下载命令附带的数据到当前工作路径下
```
### 2.2 命令的语法
该命令的语法如下:
```
xthenreg depvar indepvars[if] [in][,endogenous(varlist) inst(varlist) kink staticgridnum (integer20) trimrate (real0.4) h0(real1.5) boost(real0)]
```
以下是注意事项:
1、`xtset` 应该进行在运行此命令之前,变量必须事先按照 (i) 面板变量和 (ii) 时间变量进行排序
2、需要高度平衡的面板数据
3、输入应为 y q x1 x2···,其中 q 为门槛变量和 x1 x2 ··· 为其他自变量。
4、因为此命令使用 mm_quantilefunction,所以需要 moremata 图书馆。
5、当存在内生自变量时应该设置内生选项。例如,如果 x1 是外生的,而 x2 是内生的,则输入必须为 y q x1,endo(x2)
`endogenous` (varlist) 指定内生自变量。在逗号之前,必须将内生变量从自变量列表中排除。
`inst` (varlist) 指定其他工具变量的列表。
`static` 将模型设置为静态。与动态模型相反,静态模型不会自动包含 L.yas 独立变量。
`Kink`设置模型 kink。
`gridnum` (integer) 确定网格点数以估计阈值 γ,默认值为 20。
`trimrate` (real) 在构造用于估计 r 的网格时确定修整率,默认值为 0.4。
`h_0` (real) 用于内核估计的参数, 默认值为 1.5。
`boost`(integer) 为线性测试的引导次数,默认值为 0。
### 2.3 命令的应用
首先,应用该方法用于评估肥胖对工人生产率的影响。肥胖是通过体重指数 (BMI) 来衡量的,体重指数 (公斤) 除以身高 (米) 平方。BMI 在 25 到 30 之间的个人被认为是超重的,且 BMI 为 30 或更高被视为肥胖。使用英国队列研究的数据和前面部分所述的方法,我们检查了 BMI 与工作时间的关系。有关更详细的讨论,请参见 Kim (2019)。在此示例中,我们使用以下模型结合 BMI 中的扭结来考虑男性工人的工作时间和 BMI。在这个例子中,我们使用下面的模型考虑男性工人的工作时间和身体质量指数。
$$
y_{i t}=\beta_{0}+x_{i t} \beta_{1}+q_{i t} \beta_{2}+\delta\left(q_{i t}-\gamma\right) I\left\{q_{i t} \geq \gamma\right\}+\alpha_{i}+\varepsilon_{i t}
$$
在这里,我们呈现出个体化的工作时间,例如:牙周病,家庭大小和体质指数的 BMI。我们有两个周期面板数据 (t = 1,2),并采用如下的一阶差分法来去除与工作时间相关的各个时间不变特征 αi。
$$
\Delta y_{i 2}=\Delta x_{i 2} \beta_{1}+\Delta q_{i 2} \beta_{2}+\delta\left(q_{i 2}-\gamma\right) 1\left\{q_{i 2} \geq \gamma\right\}-\left(q_{i 1}-\gamma\right) \delta 1\left\{q_{i 1} \geq \gamma\right\}+\Delta \varepsilon_{i 2}
$$
为了实现 GMM 估计,我们在第一个差分模型中使用四个工具变量,出生体重 (bweight) 和工人自己的童年体重指数 (bmic) 和父母的体重指数 (bmim,bmid),用于体重指数变量 qi2,qi2,qi1 在第一差分模型。`xthenreg` 的默认模型是一个动态模型。因为考虑静态模型,而不是动态模型,所以将使用静态选项,还通过使用扭结选项在模型中强加了一个扭结 (kink)。

表格前面的信息如下。N 是唯一受试者的总数,T 是时间段的数量 Number of moment conditions 取决于仪器的选择。在这个例子中,我们可以通过使用 exo 选项将所有外部变量收集到一个地方来获得相同的结果,如下所示:
```stata
xthenreg nour bmi, endo (bith) exo (nsize) inst (bwelght ///
bmic bmim bmid ) kink static
```
还可以使用 `inst` 选项来更改包含和排除工具的集合,根据力矩条件的数量相应地变化。

还可以在样本有限制的情况下估计模型,如下所示:

接下来,以下模型考察的是 BMI 效应的不连续性,而不考虑模型的扭曲。
$$
y_{i t}=\beta_{0}+x_{i t} \beta_{1}+q_{i t} \beta_{2}+\left(\delta_{0}+x_{i t} \delta_{1}+q_{i t} \delta_{2}\right) I\left\{q_{i t}>\gamma\right\}+\alpha_{i}+\varepsilon_{i t}
$$
通过取一阶差分,得到以下模型,并仅用统计方法进行估计。
$$
\Delta y_{i 2}=\Delta x_{i 2} \beta_{1}+\Delta q_{i 2} \beta_{2}+\left(\delta_{0}+x_{i 2} \delta_{1}+q_{i 2} \delta_{2}\right) I\left\{q_{i 2}>\gamma\right\}-\left(\delta_{0}+x_{i 1} \delta_{1}+q_{i 1} \delta_{2}\right) I\left\{q_{i 1}>\gamma\right\}+\Delta \varepsilon_{i 2}
$$

### 参考文献:
[1] Adam, C. S., and Bevan, D. L. (2005). “Fiscal deficits and growth in devel-oping countries,”Journal of Public Economics,89(4), 571-597.
[2] Giacomini, R., Politis, D. N., & White, H. (2013). “A warp-speed methodfor conducting Monte Carlo experiments involving bootstrap estimators,”Econometric theory, 29(3), 567-589.
[3] Hansen, B. E. (1999). “Threshold effects in non-dynamic panels: Estimation,testing, and inference,”Journal of econometrics, 93(2), 345-368.
[4] Hidalgo, J., Lee, J., and M.H. Seo (2019). “Robust Inference for ThresholdRegression Models,”Journal of Econometrics, to appear.
[5] Khan, M. S., and Ssnhadji, A. S. (2001). “Threshold effects in the relation-ship between inflation and growth,”IMF Staff papers, 48(1), 1-21.
[6] Kim, Y-J. (2019). “The effect of weight on work hours,” working paper.
[7] Seo, M. and Y. Shin (2016). “Dynamic panels with threshold effect andendogeneity,”Journal of Econometrics, 195: 169-186.
[8] Wang, Q. (2015). “Fixed-effect panel threshold model using Stata,”TheStata Journal, 15(1), 121-134.
[9] Zhang, Y., Zhou, Q., and Jiang, L. (2017). “Panel kink regression with anunknown threshold,”Economics Letters, 157, 116-121.
网友评论