描述分析就是研究定量数据的整体情况、整体水平如何等;通常使用平均值、中位数来对数据进行描述。具体结果整体如下:
variable N min max mean sd p50
Invest 19493 0.00002 0.0427 0.0033 0.0061 0.0015
Over INV 7910 0.00002 0.056 0.0041 0.0085 0.0014
Under INV 11583 0.00003 0.0262 0.0028 0.004 0.0016
AQ1DA 19493 0.646 0.999 0.943 0.0607 0.961
lnSIZE 19493 19.92 26.23 22.31 1.282 22.13
AGE 19493 5 31 17.42 5.458 17
ROA 19493 -0.238 0.188 0.0354 0.0567 0.0336
LEV 19493 0.0574 0.884 0.438 0.204 0.433
SHD 19493 0 0.603 0.0834 0.149 0.0004
从上表可知:总样本量为19493个样本,而Over_INV、Under_INV这两项为Invest分散出来的故样本不存在缺失值。具体分析可知:AQ1DA、lnSIZE、AGE、LEV、这几项的平均值均要大于标准差,说明这几项数据之间的波动性较小,可以使用平均值来对这几项数据进行描述;Invest、Over_INV、Under_INV、ROA、SHD这几项的平均值要小于标准差,说明这几项数据的波动性较大,相对于平均值,用中位数描述数据整体水平更为合适。以及2011年至2019年中过度投资与投资不足的频数分布表如下:
Over_INV 占比 Under_INV 占比 合计
2011 319 24.31% 993 75.69% 1312
2012 754 45.10% 918 54.90% 1672
2013 645 32.64% 1331 67.36% 1976
2014 754 35.53% 1368 64.47% 2122
2015 963 45.47% 1155 54.53% 2118
2016 988 44.81% 1217 55.19% 2205
2017 1000 41.58% 1405 58.42% 2405
2018 1145 43.74% 1473 56.26% 2618
2019 1342 43.78% 1723 56.22% 3065
合计 7910 40.58% 11583 59.42% 19493
从上表可知:样本数量一共有19493个,其中过度投资样本数量为7910个,占比为40.58%,投资不足为1153个,占比为59.42%。说明投资不足的样本明显大于过度投资的样本。
4.2.2相关性分析
相关性分析就是研究各个变量之间的相关关系强弱程度。利用相关分析去研究被解释变量Invest、Over_INV、Under_INV与核心解释变量L.AQ1DA以及控制变量L.lnSIZE、L.AGE、L.ROA、L.LEV、L.SHD之间的相关关系,使用皮尔逊相关系数表示数据之间相关关系强弱程度,具体结果如下表:
Invest Over INV Under ~V L.AQ1DA L.lnSIZE L.AGE L.ROA L.LEV L.SHD
Invest 相关系数 1
p值
Over INV 相关系数 0.9910*** 1
p值 0
Under INV 相关系数 0.9726*** . 1
p值 0 .
L.AQ1DA 相关系数 -0.0204*** -0.0177 -0.0298*** 1
p值 0.0094 0.14 0.0042
L.lnSIZE 相关系数 0.1454*** 0.0976*** 0.1537*** 0.0407*** 1
p值 0 0 0 0
L.AGE 相关系数 0.0122 -0.0179 0.0366*** -0.0281*** 0.1478*** 1
p值 0.122 0.135 0.0004 0.0004 0
L.ROA 相关系数 0.0001 0.0195 -0.0508*** 0.1161*** 0.0075 -0.0535*** 1
p值 0.986 0.104 0 0 0.343 0
L.LEV 相关系数 0.0713*** -0.0055 0.1603*** -0.0851*** 0.5255*** 0.1745*** -0.3306*** 1
p值 0 0.648 0 0 0 0 0
L.SHD 相关系数 -0.0458*** -0.0202* -0.0594*** 0.0004 -0.3239*** -0.2839*** 0.0897*** -0.3080*** 1
p值 0 0.0929 0 0.964 0 0 0 0
- p < 0.1,** p < 0.05, *** p < 0.01
从上表可知:被解释变量Invest与L.AQ1DA、L.SHD这2项之间呈现显著的负相关关系,相关系数分别为-0.0204、-0.0458;与L.lnSIZE、L.LEV这2项之间呈现显著的正相关关系,相关系数分别为0.1454、0.0713;与L.AGE、L.ROA、这2项之间没有明显相关关系;
被解释变量Over_INV与L.SHD之间呈现显著的负相关关系,相关系数为-0.0202、;与L.lnSIZE之间呈现显著的正相关关系,相关系数为0.0976;与L.AQ1DA、L.AGE、L.ROA、L.LEV这几项之间没有明显相关关系;
被解释变量Under_INV与L.AQ1DA、L.ROA、L.SHD这3项呈现显著的负相关关系,相关系数分别为-0.0298、-0.0508、-0.0594;与L.lnSIZE、L.AGE、L.LEV这2项之间呈现显著的正相关关系,相关系数分别为0.1537、0.0366、0.1603。
为了验证上述各变量之间是否存在共线性关系,使用VIF值来进行共线性检验。整理结果如下:
Variable VIF 1/VIF
L.LEV 1.69 0.5918
L.lnSIZE 1.53 0.6545
L.SHD 1.22 0.8188
L.ROA 1.19 0.8399
L.AGE 1.1 0.9102
L.AQ1DA 1.02 0.9768
Mean VIF 1.29
从上表可知:各变量之间的VIF值均小于5,说明不存在共线性问题,可以
4.2.3面板回归分析
为了验证前文的假设,本文使用面板回归来进行模型估计。面板模型涉及3个模型,分别是混合POOL模型、固定效应FE模型和随机效应RE模型。首先进行模型检验,便于找出最优模型:
第一:F检验用于FE模型和POOL模型选择对比,p值小于0.05意味着FE模型更优,反之则使用POOL模型;
第二:BP检验用于RE模型和POOL模型选择对比,p值小于0.05意味着RE模型更优,反之则使用POOL模型;
第三:Hausman检验用于FE模型和RE模型选择对比,p值小于0.05意味着FE模型更优,反之则使用RE模型。
首先验证模型1,具体分析结果如下:
Model POOL FE RE
DV Invest Invest Invest
L.AQ1DA -0.0030*** -0.0027*** -0.0026***
(-3.9763) (-3.5510) (-3.5755)
L.lnSIZE 0.0007*** -0.0004*** 0.0005***
(14.7616) (-2.9610) (7.8143)
L.AGE 0.0000*** 0.0001 0.0000*
(2.8568) (0.4288) (1.6649)
L.ROA -0.0004 0.0020* 0.0006
(-0.4262) (1.7485) (0.5933)
L.LEV -0.0002 0.0006 0.0003
(-0.7018) (1.2094) (0.8154)
L.SHD 0.0006* -0.0002 0.0003
(1.8742) (-0.3211) (0.8087)
_cons -0.0092*** 0.0089* -0.0055***
(-7.7343) (1.9453) (-3.6904)
Industry Y Y Y
year Y Y Y
N 16158 16158 16158
R2 0.0377 0.0061 0.0013
Ftest F(2723, 13403) = 2.90,Prob > F = 0.0000
BPtest chibar2(01) = 2971.93,Prob > chibar2 =0.0000
hausman chi2(32)=126.56,Prob>chi2 =0.0000
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
首先进行模型检验,便于找出最优模型,从上表可知:F检验呈现出1%水平的显著性 F(2723, 13403) = 2.90,P= 0.0000<0.01,意味着相对POOL模型而言,FE模型更优。BP检验呈现出1%水平的显著性chibar2(01) = 2971.93,P =0.0000<0.01,意味着相对POOL模型而言,RE模型更优。Hausman检验呈现出1%水平的显著性chi2(32)=126.56,P=0.0000<0.01,意味着相对RE模型而言,FE模型更优。最终得出FE模型最优。以及模型公式为:
具体分析可知:针对L.AQ1DA而言,其呈现出0.01水平的显著性(t=-3.551,p
<0.01),且回归系数为-0.0027<0,说明L.AQ1DA对Invest呈现出显著的负向
影响关系;说明会计信息质量越高,投资效率就越低。
以及L.lnSIZE对于Invest呈现出显著的负向影响关系;L.ROA对于Invest呈现出显著的正向影响关系;以及LAGE、L.LEV、L.SHD对于Invest没有呈现出明显的影响关系。
然后验证模型2,具体分析结果如下:
然后验证模型2,具体分析结果如下:
Model POOL FE RE
DV Over_INV Over_INV Over_INV
L.AQ1DA -0.0049*** -0.0060*** -0.0046***
(-3.1923) (-3.6597) (-3.1627)
L.lnSIZE 0.0007*** -0.0019*** -0.0000
(7.2611) (-6.8612) (-0.0785)
L.AGE 0.0000** 0.0000 0.0000
(2.0601) (0.0380) (0.9758)
L.ROA -0.0001 0.0008 0.0004
(-0.0318) (0.2710) (0.1927)
L.LEV -0.0028*** -0.0034*** -0.0016**
(-4.3018) (-2.8106) (-2.0666)
L.SHD 0.0013 -0.0011 -0.0004
(1.5816) (-0.5310) (-0.3670)
_cons -0.0081*** 0.0504*** 0.0079**
(-3.1428) (5.2182) (2.4151)
Industry Y Y Y
year Y Y Y
N 6943 6943 6943
R2 0.0630 0.0382 0.0126
Ftest F(2013,4899) = 2.56,Prob > F = 0.0000
BPtest chibar2(01) =683.11,Prob > chibar2 =0.0000
hausman chi2(31)=170.29,Prob>chi2 =0.0000
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
首先进行模型检验,便于找出最优模型,从上表可知:F检验呈现出1%水平的显著性F(2013,4899) = 2.56,P= 0.0000<0.01,意味着相对POOL模型而言,FE模型更优。BP检验呈现出1%水平的显著性chibar2(01) =683.11,,P =0.0000<0.01,意味着相对POOL模型而言,RE模型更优。Hausman检验呈现出1%水平的显著性chi2(31)=170.29,P=0.0000<0.01,意味着相对RE模型而言,FE模型更优。最终得出FE模型最优。以及模型公式为:
具体分析可知:针对L.AQ1DA而言,其呈现出0.01水平的显著性
(t=-3.6597,p<0.01),且回归系数为-0.006<0,说明L.AQ1DA对Over_INV
呈现出显著的负向影响关系;说明会计信息质量越高,过度投资就越低。
以及L.lnSIZE、L.LEV对于Over_INV呈现出显著的负向影响关系;以及LAGE、L.ROA、L.SHD对于Over_INV没有呈现出明显的影响关系。
然后验证模型3,具体分析结果如下:
Model POOL FE RE
DV Under_INV Under_INV Under_INV
L.AQ1DA -0.0009 -0.0004 -0.0005
(-1.3111) (-0.5494) (-0.8103)
L.lnSIZE 0.0004*** 0.0003** 0.0006***
(7.1350) (2.4948) (8.5340)
L.AGE 0.0000** -0.0000 0.0000
(2.1305) (-0.0344) (1.5716)
L.ROA -0.0015* 0.0004 -0.0005
(-1.8634) (0.3568) (-0.5924)
L.LEV 0.0021*** 0.0027*** 0.0024***
(7.9373) (5.3150) (7.0602)
L.SHD 0.0005 0.0008 0.0006*
(1.6238) (1.2043) (1.6755)
_cons -0.0054*** -0.0071 -0.0101***
(-4.3085) (-1.4543) (-6.3745)
Industry Y Y Y
year Y Y Y
N 9215 9215 9215
R2 0.0430 0.0111 0.0079
Ftest F(2434,6749) = 2.12,Prob > F = 0.0000
BPtest chibar2(01) =167.51,Prob > chibar2 =0.0000
hausman chi2(32)=68.74,Prob>chi2 =0.0002
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
首先进行模型检验,便于找出最优模型,从上表可知:F检验呈现出1%水平的显著性 F(2434,6749) = 2.12,P= 0.0000<0.01,意味着相对POOL模型而言,FE模型更优。BP检验呈现出1%水平的显著性chibar2(01) =167.51,,P =0.0000<0.01,意味着相对POOL模型而言,RE模型更优。Hausman检验呈现出1%水平的显著性chi2(32)=68.74,P=0.0002<0.01,意味着相对RE模型而言,FE模型更优。最终得出FE模型最优。以及模型公式为:
具体分析可知:针对L.AQ1DA而言,其没有呈现出显著性(t=-0.5494,p>
0.1),且回归系数为-0.0004<0,说明L.AQ1DA对Under_INV没有呈现出显著的影响关系;但是还是有不明显的负向影响关系,说明会计信息质量越高,投资不足就越低。
以及L.lnSIZE、L.LEV对于Under_INV呈现出显著的正向影响关系;以及L.AGE、L.ROA、L.SHD对于Under_INV没有呈现出明显的影响关系。
4.2.4调节效应分析
调节作用是研究自变量对因变量的影响时,是否会受到调节变量的干扰;在进行调节效应分析时,需要对部分数据进行中心化处理,具体如下:
研究变量处理说明
类型 数据类型 数据处理
因变量 定量 不处理
自变量 定量 中心化
调节变量 定量 中心化
控制变量 - 不处理
首先分析加入股权集中度(TOP10)作为调节变量时,L.AQ1DA对于因变量的影响关系,具体结果如下:
Model 模型4(FE) 模型5(FE) 模型6(FE)
DV Invest Over_INV Under_INV
L.AQ1DA -0.0027*** -0.0057*** -0.0006
(-3.5238) (-3.4837) (-0.7627)
L.TOP10 0.0000*** 0.0000*** 0.0000***
(4.3005) (3.0760) (2.6861)
L.JHX1 -0.0001* -0.0001 -0.0001
(-1.6765) (-0.8972) (-1.4898)
L.lnSIZE -0.0005*** -0.0021*** 0.0003**
(-3.9834) (-7.4042) (1.9912)
L.AGE 0.0001 0.0000 -0.0000
(0.3742) (0.0220) (-0.0970)
L.ROA 0.0014 0.0004 -0.0000
(1.2764) (0.1216) (-0.0112)
L.LEV 0.0011** -0.0028** 0.0029***
(1.9930) (-2.2802) (5.7020)
L.SHD -0.0009 -0.0021 0.0004
(-1.1430) (-1.0118) (0.5926)
_cons 0.0105** 0.0522*** -0.0065
(2.2963) (5.3949) (-1.3164)
Industry Y Y Y
year Y Y Y
N 16158 6943 9215
R2 0.0077 0.0402 0.0125
从上表可知:加入股权集中度(TOP10)时,交互项仅在模型4时呈现出0.1水平的显著性(t=-1.6765,p<0.1),且回归系数为-0.0001<0,说明L.AQ1DA对于Invest的影响时,股权集中度具有负向调节作用。以及模型公式为:
而L.AQ1DA对于Over_INV、Under_INV的影响时,股权集中度不具有调节作用。
然后分析加入审计质量(SFLZSD)作为调节变量时,L.AQ1DA对于因变量的影响关系,具体结果如下:
Model 模型7(FE) 模型8(FE) 模型9(FE)
DV Invest Over_INV Under_INV
L.AQ1DA -0.0025*** -0.0050*** -0.0019**
(-3.0251) (-2.9832) (-1.9754)
L.SFLZSD -0.0012** -0.0019** -0.0015**
(-2.4161) (-2.2364) (-2.5147)
L.JHX2 -0.0027 -0.0249** 0.0240**
(-0.4062) (-2.3619) (2.4645)
L.lnSIZE -0.0004*** -0.0020*** 0.0003**
(-3.0866) (-7.0858) (2.4045)
L.AGE 0.0001 0.0000 -0.0000
(0.4306) (0.1064) (-0.0490)
L.ROA 0.0019* 0.0007 0.0002
(1.6960) (0.2488) (0.2210)
L.LEV 0.0006 -0.0035*** 0.0027***
(1.2026) (-2.8827) (5.3970)
L.SHD -0.0002 -0.0012 0.0008
(-0.2970) (-0.5556) (1.1886)
_cons 0.0113** 0.0540*** -0.0024
(2.4023) (5.4822) (-0.4684)
Industry Y Y Y
year Y Y Y
N 16158 6943 9215
R2 0.0066 0.0407 0.0126
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
从上表可知:加入审计质量(SFLZSD)时,交互项在模型7没有呈现出显著性(t=-0.4062,p>0.1),说明L.AQ1DA对于Invest的影响时,审计质量没有产生调节作用。
加入审计质量(SFLZSD)时,交互项在模型8时呈现出0.05水平的显著性(t=-2.3619,p<0.05),且回归系数为-0.0249<0,说明L.AQ1DA对于Over_INV的影响时,审计质量具有负向调节作用。以及模型公式为:
加入审计质量(SFLZSD)时,交互项在模型9时呈现出0.05水平的显著性(t=2.4645,p<0.05),且回归系数为0.024>0,说明L.AQ1DA对于Under_INV的影响时,审计质量具有正向调节作用。以及模型公式为:
4.5模型的稳健性检验
4.5.1替换投资效率衡量方法
本文将替换被解释变量来验证模型是否稳健,借鉴Hovakimian和Titman的方法,从资产负债表出发,用资产负债表的数据来度量新增投资支出,而不再是从现金流量表的角度出发。具体方法为:
其中,新增投资支出的计算方法为:新增投资支出=固定资产-无形资产。将以这种方法计算的投资效率作为被解释变量对模型1再次进行固定效应分析。具体结果如下:
Model FE
DV Invest_1
L.AQ1DA 0.0357**
(2.2772)
L.lnSIZE -0.0864***
(-32.9730)
L.AGE -0.0056
(-1.1862)
L.ROA -0.0884***
(-3.8203)
L.LEV 0.0109
(1.0266)
L.SHD 0.0177
(1.1838)
_cons 1.9924***
(21.2399)
Industry Y
year Y
N 16119
R2 0.164
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
从上表可知:将被解释变量由Invest替换成Invest_1之后,得出核心解释变量对于被解释变量呈现出显著的正向影响关系,说明会计信息质量越高,投资效率越高,与前文得出的结论相反,具体原因有待进一步考证。
4.5.2替换解释变量的衡量方法
本文将核心解释变量“应计盈余管理——修正的Jones模型”换成“应计盈余管理——DD模型”,再次对核心模型进行固定效应分析,具体结果如下:
Model FE FE FE
DV Invest Over_INV Under_INV
L.AQ3DD -0.0017*** -0.0023*** -0.0010***
(-5.0385) (-3.5760) (-2.6891)
L.lnSIZE -0.0004** -0.0020*** 0.0003**
(-2.4445) (-6.3367) (2.0458)
L.AGE 0.0001 -0.0001 0.0001
(0.2273) (-0.1044) (0.3262)
L.ROA 0.0018 0.0027 0.0010
(1.3468) (0.7868) (0.8195)
L.LEV 0.0004 -0.0035** 0.0028***
(0.6900) (-2.5614) (5.0942)
L.SHD -0.0002 -0.0036 0.0007
(-0.2291) (-1.4471) (0.9310)
_cons 0.0073 0.0459*** -0.0067
(1.3710) (3.6931) (-1.2345)
Industry Y Y Y
year Y Y Y
N 14025 6012 8013
R2 0.007 0.039 0.013
t statistics in parentheses,* p < 0.1,** p < 0.05, *** p < 0.01
从上表可知:将核心解释变量替换之后,得出核心解释变量的结果与前文保持一致,说明模型比较稳健。
网友评论