第4讲模型诊断与检验 (1)回归函数的F检验 (2)回归参数的t检验。 3)检验线性约束条件是否成立的F检验 (4)JB正态性检验 (5)似然比(LR)检验 (6)W检验 (7)LM乘数检验。 (8)邹突变点检验( Chow Breakpoint Tests) (9)回归系数的稳定性检验(Chow检验) (10)是否为白噪声过程的Q检验 (11)平方的残差值序列的Q检验 (12) Ramsey reSeT检验( Ramsey模型设定误差检验) (13)异方差的 White检验(略) (14)自相关的LM检验(亦称BG检验)(略) (15)格兰杰非因果性检验 (16)内生性 Hausman检验(不讲) (1)回归函数的F检验。 多元回归模型, y=Bo+Bixn+ Bxn +. Ba-1xrk-1+ur H:B1=B=,,=B1=0;H1:房不全为零 原假设成立条件下,统计量 F= SSR/(-D-F(k-1T-k) 其中SSR是回归平方和,SSE是残差平方和。k表示被估参数个数。 注意:SSR旧指回归平方和( regression sum of squares),现指残差平方和( sum of squared residuals)。SE旧指残差平方和( error sum of squares( sum of squared errors),现指回归平方和 (explained sum of squares)o 检验规则是,若F≤Fa(k-1,T-k),接受H 若F>Fa(k-1,T-k),拒绝Ho (2)回归参数的t检验 对于多元回归模型, B+B1x1+Bx2+..+R-1xk1+m, (2) 如果F检验的结论是接受原假设,则检验止。如果F检验的结论是拒绝原假设,则进一步作t 检验 Ho:B=0;H1:B≠0,(=1,2,…,k-1) 原假设成立条件下,统计量 (7-k) s(B 判别规则:若|t|≤t(r-k),接受Ho 若|t|>a(7-k),拒绝H
1 第 4 讲 模型诊断与检验 (1)回归函数的 F 检验。 (2)回归参数的 t 检验。 (3)检验线性约束条件是否成立的 F 检验。 (4)JB 正态性检验 (5)似然比(LR)检验 (6)W 检验 (7)LM 乘数检验。 (8)邹突变点检验(Chow Breakpoint Tests) (9)回归系数的稳定性检验(Chow 检验) (10)是否为白噪声过程的 Q 检验 (11)平方的残差值序列的 Q 检验 (12)Ramsey RESET 检验(Ramsey 模型设定误差检验) (13)异方差的 White 检验(略) (14)自相关的 LM 检验(亦称 BG 检验)(略) (15)格兰杰非因果性检验 (16)内生性 Hausman 检验(不讲) (1)回归函数的 F 检验。 多元回归模型, yt = 0 +1xt1 + 2xt2 +…+ k- 1xt k -1 + ut , (1) H0:1= 2 = … = k-1 = 0;H1:j 不全为零 原假设成立条件下,统计量 F = /( ) /( 1) SSE T k SSR k − − F(k-1,T-k) 其中 SSR 是回归平方和,SSE 是残差平方和。k 表示被估参数个数。 注意:SSR 旧指回归平方和(regression sum of squares),现指残差平方和(sum of squared residuals)。SSE 旧指残差平方和(error sum of squares (sum of squared errors)),现指回归平方和 (explained sum of squares)。 检验规则是,若 F F (k-1,T-k),接受 H0; 若 F > F (k-1,T-k) , 拒绝 H0。 (2)回归参数的 t 检验。 对于多元回归模型, yt = 0 +1xt1 + 2xt2 +…+ k- 1xt k -1 + ut , (2) 如果 F 检验的结论是接受原假设,则检验止。如果 F 检验的结论是拒绝原假设,则进一步作 t 检验。 H0:j = 0;H1:j 0,(j = 1, 2, …, k-1) 原假设成立条件下,统计量 t = ) ˆ ( ˆ j j s t(−k) 判别规则:若 t t(−k),接受 H0; 若 t > t(−k),拒绝 H0
(3)检验线性约束条件是否成立的F检验。 约束条件的F检验可以用来检验回归参数的一个或多个线性约束条件,如Ho:B1=0,B= 0,a1++负1=1,角1=0.8等。 在零假设“约束条件成立”条件下,统计量 (SSE -SEW)/n F(m,T-k SSE/T-k 其中SSEr表示施加约東条件后估计模型的残差平方和;SSEn表示未施加约東条件的估计模型 的残差平方和:m表示约東条件个数:T表示样本容量:k表示非约束模型中被估参数的个数 判别规则是,若F<Fa(2,T-4),约束条件成立, 若F>Fa(2,7-4),约束条件不成立 例:(file:blc4)中国国债发行额模型 首先分析中国国债发行额序列的特征。1980年国债发行额是4301亿元,占GDP当年总量 的1%,2001年国债发行额是4604亿元,占GDP当年总量的48%。以当年价格计算,21年间 (1980-2001)增长了106倍。平均年增长率是249%。 DEBT Mean 1216395 Median 4346850 Maximum 4604000 4301000 Std. Dev 1485993 中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发行总量 应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择3个解释变量,国内 生产总值,财政赤字额,年还本付息额,根据散点图(略)建立中国国债发行额模型如下: DEBT,=B0+PI GDPI+B2 DEF+B REPAYI+ ur 其中DEBT表示国债发行总额(单位:亿元),GDP1表示年国内生产总值(单位:百亿元), DEF1表示年财政赤字额(单位:亿元),REPY表示年还本付息额(单位:亿元)。用1980~2001 年数据(资料来源:《中国统计年鉴》2002,表8-19,表3-1,表8-1,表820)得输出结果如 DEBT=4.31 +0.35 GDP,+1. 00 DEF,+0. 88 REPAY. (0.2)(2.2)(31.5)(17.8) R2=0.999,DW=2.12,T=22,SSE=48460.78,(1980-2001) Correlation matrix DEBT GDP EPAY 0000009677510945247 09677511000008696430.954508 0.945247 86943100000787957 REAY09440954508078795710000 图112
2 (3)检验线性约束条件是否成立的 F 检验。 约束条件的 F 检验可以用来检验回归参数的一个或多个线性约束条件,如 H0:1 = 0,2 = 0,1 +0 + 1 =1,1 /2 =0.8 等。 在零假设“约束条件成立”条件下,统计量 F = /( ) ( )/ SSE T k SSE SSE m u r u − − F( m , T – k ) 其中 SSEr 表示施加约束条件后估计模型的残差平方和;SSEu 表示未施加约束条件的估计模型 的残差平方和;m 表示约束条件个数;T 表示样本容量;k 表示非约束模型中被估参数的个数。 判别规则是,若 F < F (2, T - 4),约束条件成立, 若 F F (2, T - 4),约束条件不成立。 例:(file: b1c4)中国国债发行额模型 首先分析中国国债发行额序列的特征。1980 年国债发行额是 43.01 亿元,占 GDP 当年总量 的 1%,2001 年国债发行额是 4604 亿元,占 GDP 当年总量的 4.8%。以当年价格计算,21 年间 (1980-2001)增长了 106 倍。平均年增长率是 24.9%。 0 1000 2000 3000 4000 5000 80 82 84 86 88 90 92 94 96 98 00 DEBT 中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发行总量 应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择 3 个解释变量,国内 生产总值,财政赤字额,年还本付息额,根据散点图(略)建立中国国债发行额模型如下: DEBTt = 0 +1 GDPt +2 DEFt +3 REPAYt+ ut 其中 DEBTt 表示国债发行总额(单位:亿元),GDPt 表示年国内生产总值(单位:百亿元), DEFt 表示年财政赤字额(单位:亿元),REPAYt 表示年还本付息额(单位:亿元)。用 19802001 年数据(资料来源:《中国统计年鉴》2002,表 8-19,表 3-1,表 8-1,表 8-20)得输出结果如 下; DEBTt = 4.31 +0.35 GDPt +1.00 DEFt +0.88REPAYt (11.7) (0.2) (2.2) (31.5) (17.8) R 2 = 0.9990, DW=2.12, T =22, SSEu= 48460.78, (1980-2001) 图 11.2
由上述4个变量的相关系数矩阵(图112)知,DEBT和GDP1的相关性最强。那么是否可 以从模型中删掉DEF和 REPAy呢? 可以用F统计量完成上述检验。原假设H是B3=B=0(约束DEF和 REPAY的系数为零) 给出约束模型估计结果如下 DEBT=-38840+4.49 GDP. (-3.1)(17.2) R2=0.94,DW=0.25,7=22,SSE=2942679,(1980-2001) 已知约束条件个数m=2,Tkl=18。根据(11.7)、(118)式,SSE=48460.78,SSE= 2942679。依照(11.6)式, F=(S-sE)/m=(2942679-4846078 537.5 SSE /(T-k-D 48460.78/(22-4) 因为F=537.5远远大于临界值Fo∞s(2,18)=3.5,所以拒绝原假设。不能从模型中删除解释变量 DEF和 REPAY EⅤiews可以有三种途径完成上述检验。 (1)在(11.7)式输出结果窗口中点击Vew,选 Coefficient Tests, Wald Coefficient Restrictions 功能(wald参数约束检验),在随后弹出的对话框中填入c(3)=c(4)=0。可得如图11.3结果。 其中F=537.5 Wald Test Equation: E@01 Test Statistic Valu df Probability F-statistic 53750502,18)0.000 Chi-square 1075012 Null Hypothesis Summary Normalized Restriction (0) alue Std. Err 09954030031613 C(4) 08797600049508 Restrictions are linear in coefficients 图11.3 (2)在(117)式输出结果窗口中点击vew,选 Coefficient Tests, Redundant variables Likelihood Ratio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF, REPAy。可得图11.4。计算结果同样是F=5375。 Redundant Variables: DEF REPAY F-statistic 537 5060 Probability Log likelihood ratio 90.33906 Probability 图114 (3)在(18)式输出结果窗口中点击View,选 Coefficient Tests, Omitted Variables- Likelihood Ratio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量 DEF, REPAY。可得到如图11.5的结果。同样是F=5375
3 由上述 4 个变量的相关系数矩阵(图 11.2)知,DEBTt 和 GDPt 的相关性最强。那么是否可 以从模型中删掉 DEFt 和 REPAYt 呢? 可以用 F 统计量完成上述检验。原假设 H0 是3 = 4 = 0(约束 DEFt 和 REPAYt 的系数为零)。 给出约束模型估计结果如下, DEBTt = -388.40 +4.49 GDPt (11.8) (-3.1) (17.2) R 2 = 0.94, DW=0.25, T =22, SSEr= 2942679, (1980-2001) 已知约束条件个数 m = 2,T- k-1 = 18。根据(11.7)、(11.8)式,SSEu= 48460.78,SSEr= 2942679。依照(11.6)式, F = /( 1) ( )/ − − − SSE T k SSE SSE m u r u = 48460.78 /(22 4) (2942679 48460.78)/ 2 − − = 537.5 因为 F=537.5 远远大于临界值 F0.05 (2, 18) =3.55,所以拒绝原假设。不能从模型中删除解释变量 DEFt 和 REPAYt。 EViews 可以有三种途径完成上述检验。 (1)在(11.7)式输出结果窗口中点击 View,选 Coefficient Tests, Wald Coefficient Restrictions 功能(Wald 参数约束检验),在随后弹出的对话框中填入 c(3) = c(4) = 0。可得如图 11.3 结果。 其中 F = 537.5。 图 11.3 (2)在(11.7)式输出结果窗口中点击 View,选 Coefficient Tests, Redundant Variables -Likelihood Ratio 功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF,REPAY。可得图 11.4。计算结果同样是 F = 537.5。 图 11.4 (3)在(11.8)式输出结果窗口中点击 View,选 Coefficient Tests, Omitted Variables -Likelihood Ratio 功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量 DEF,REPAY。可得到如图 11.5 的结果。同样是 F = 537.5
Omitted Variables, DEF REPAY F-statistic 537 5060 Probability Log likelihood ratio 90 33906 Probability 图11.5 (4)JB正态性检验 在给出JB统计量的定义之前,先给出偏度( skewness)和峰度( kurtosis,峭度)的定义, 对于时间序列(yn,y2,…,y),偏度S定义为, 其中y是观测值,是样本平均数,表示y的标准差,s=1三 T是样本容量。由 公式知,若分布是以对称的,则偏度为零。所以若y服从正态分布,则偏度为零;若分布是 右偏倚的,则偏度S>0:若分布是左偏倚的,则偏度S<0。 x< Md x= Md= mo Mo<md< x 峰度K定义为 正老分布,X=3 K 其中y是观测值,j是样本平均数,s是样本标准差,T是样本容量。正态分布的峰度值为3。 如果一个分布的两侧尾部比正态分布的两侧尾部“胖”,则该分布的峰度K>3,反之则K<3。 JB( Jarque-Bera)统计量定义如下
4 图 11.5 (4)JB 正态性检验 在给出 JB 统计量的定义之前,先给出偏度(skewness)和峰度(kurtosis,峭度)的定义。 对于时间序列(y1, y2, …, yT),偏度 S 定义为, 3 1 ( ) 1 = − = T t t s y y T S 其中 yt 是观测值, y 是样本平均数,s 表示 yt 的标准差, 1 ( ) 1 2 − − = = T y y s T t t ,T 是样本容量。由 公式知,若分布是以 y 对称的,则偏度为零。所以若 yt 服从正态分布,则偏度为零;若分布是 右偏倚的,则偏度 S 0;若分布是左偏倚的,则偏度 S 0。 x < Md < Mo x = Md = Mo MO Md x 峰度 K 定义为 4 1 ( ) 1 = − = T t t s y y T K 其中 yt 是观测值, y 是样本平均数,s 是样本标准差,T 是样本容量。正态分布的峰度值为 3。 如果一个分布的两侧尾部比正态分布的两侧尾部“胖”,则该分布的峰度 K 3,反之则 K 3。 JB(Jarque-Bera)统计量定义如下, JB = ( 3) ] 4 1 [ 6 2 2 + − − S K T n 2 (2)
其中T表示观测值个数。对于直接得到的观测时间序列,取n=0。对于残差序列,取n等于原 回归模型中解释变量个数。S表示偏度。K表示峰度。计算结果 若JB<x2(2),该分布为正态分布 若JB>x2(2),该分布不是正态分布 当用样本计算偏度和峰度时,T应换为T-1,σ2用y的样本方差s代替。 例:(fle:simu2,x) EViews操作如下。 ries: orkfile: SI12 spreadsheet eeze Edit+/- Smpl+/-Label+/ L: X Bar Graph ptive Statisti and Stat Tests for Descriptive Stats Stats by Classificati on 12000 ample 1 100000 10000 Observations 100000 8000 0.002371 Median 0.006320 4.546195 Minimum 4000 -0.014181 Kurtosis 3.009264 Jarque-Bera 3.709376 Probability 0. 156502 因为JB=3.71<x205(2)=599,所以上述分布为正态分布 0.5
5 其中 T 表示观测值个数。对于直接得到的观测时间序列,取 n = 0。对于残差序列,取 n 等于原 回归模型中解释变量个数。S 表示偏度。K 表示峰度。计算结果 若 JB 2 (2),该分布为正态分布, 若 JB 2 (2),该分布不是正态分布。 当用样本计算偏度和峰度时,T 应换为 T -1, 2 用 yt 的样本方差 s 2 代替。 例:(file: simu2, x)EViews 操作如下。 0 2000 4000 6000 8000 10000 12000 -2.5 0.0 2.5 Series: Y Sample 1 100000 Observations 100000 Mean 0.002371 Median 0.006320 Maximum 4.546195 Minimum -4.489619 Std. Dev. 0.998553 Skewness -0.014181 Kurtosis 3.009264 Jarque-Bera 3.709376 Probability 0.156502 因为 JB = 3.71 < 2 0.05 (2) = 5.99,所以上述分布为正态分布。 2 4 6 8 10 0.1 0.2 0.3 0.4 0.5