第七章协整与误差校正模型 本章将介绍:协整的概念及性质 协整检验 协整回归 误差校正模型。 第一节伪回归问题 、伪回归现象 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在 相依关系的错误结论。这是传统回归分析方法较易犯的一种错误。 经济学家早就发现经济变量之间可能会存在伪回归现象 20世纪70年代, Grange、 Newbold研究发现,造成“伪回归”的根本原因 在于变量的时序序列的非平稳性。 他们用 Monte carlo模拟方法表明,如果用传统回归分析方法对彼此不相关 联的非平稳变量进行回归,t检验值和R2值往往会倾向于显著,从而得出“变量 相依”的“伪回归结果”。 二、非平稳性对回归分析有什么影响? 考察如下例子:假设{x}、{;}是相互独立的随机游动过程(I(1)过程),即 x1=x1-1+v y,=yI+u, (7.1.2) 其中,{n}、{}为白噪声,且Cv(v,u,)=0。 形式地引入回归模型 Pdfcreatedwithpdffactorytrialversionwww.pdffactory.com
1 第七章 协整与误差校正模型 本章将介绍: 协整的 概念及 性质 协整检验 协整回归 误差校正模 型。 第一节 伪回归问题 一、伪回归现象 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在 相依关系的错误结论。这是传统回归分析方法较易犯的一种错误。 经济学家早就发现经济变量之间可能会存在伪回归现象。 20 世纪 70 年代,Grange、Newbold 研究发现,造成“伪回归”的根本原因 在于变量的时序序列的非平稳性。 他们用 Monte Carlo 模拟方法表明,如果用传统回归分析方法对彼此不相关 联的非平稳变量进行回归,t 检验值和 2 R 值往往会倾向于显著,从而得出“变量 相依”的“伪回归结果”。 二、非平稳性对回归分析有什么影响? 考察如下例子:假设{xt}、{yt}是相互独立的随机游动过程(I(1)过程),即 t t t x = x + v -1 (7.1.1) t t ut y = y -1 + (7.1.2) 其中,{vt }、{ut }为白噪声,且Cv(vt ,ut ) = 0。 形式地引入回归模型 PDF created with pdfFactory trial version www.pdffactory.com
y1=a+x1+ (7.1.3) 显然,由于序列{x}与{}互不相关,β应为0 如果利用传统回归分析方法来进行检验,是否能得出β=0的结论? 为了回答上述问题, Grange等通过 Monte carlo方法进行模拟 (1)他们首先用计算机生成样本容量为N=100的两个相互独立的随机序列 样本:,}、v~ⅣN(0);{n}、u1~I(0.1)。 (2)将它们代入(7.1.1)和(7.1.2),并设x=y=0,分别生成样本序列{x} 与{v}。 (3)然后利用样本序列{x与v}估计回归方程(7.1.3),并用t检验法对 回归系数的显著性进行检验。 (4)重复上述试验过程M1000,得到B的估计序列,1=12…,M及相 应的估计标准差序列{S,=12,…,M},计算出各次试验的t统计量值,然后考察 M次试验中拒绝零假设H:B=0的频率,以及y与x之间的样本相关系数的频率 分布 结果发现: 在显著性水平5%(t检验临界值为1.96)的情况下,拒绝零假设 H:B=0的频率高达0.76,而且这种拒绝率随着样本容量T的增加而增 大 此外他们还发现,y与x之间的样本相关系数R接近±1的频率很大。 如图6-1-1 (a)是两个非相关I(0)序列{x与{}的相关系数分布图,此分布 的均值为零,近似为正态。表明{与{y}的样本相关系数以较大频率 Pdfcreatedwithpdffactorytrialversionwww.pdffactory.com
2 t t t y = a + bx + e (7.1.3) 显然,由于序列{xt}与{yt}互不相关, b 应为 0。 如果利用传统回归分析方法来进行检验,是否能得出 b =0 的结论? 为了回答上述问题,Grange 等通过 Monte Carlo 方法进行模拟: (1)他们首先用计算机生成样本容量为 N=100 的两个相互独立的随机序列 样本:{vt }、v ~ IN(0,1) t ;{ut }、u ~ IN(0,1) t 。 (2)将它们代入(7.1.1)和(7.1.2),并设 x0 = y0 = 0,分别生成样本序列{xt} 与{yt }。 (3)然后利用样本序列{xt}与{yt }估计回归方程(7.1.3),并用 t 检验法对 回归系数的显著性进行检验。 (4)重复上述试验过程 M=10000 次,得到 b 的估计序列{b ˆ i ,i = 1,2,L,M }及相 应的估计标准差序列{Si ,i = 1,2,L,M},计算出各次试验的 t 统计量值,然后考察 M 次试验中拒绝零假设 : 0 H0 b = 的频率,以及 y 与 x 之间的样本相关系数的频率 分布。 结果发 现: 在 显著 性水平5%(t检验临界值为1.96)的情况下,拒绝零假设 H0 : b = 0的频率高达0.76,而且这种拒绝率随着样本容量T的增加而增 大 。 此 外 他们还发现, y与x之间的样本相关系数R接近 ±1的频率很大。 如 图 6-1-1: (a)是两个 非相关I(0)序列 {xt }与 {yt }的相关系 数分布图,此分布 的 均 值 为零,近似为正态。 表明 {xt }与 {yt}的样本相关系数以较大频率 PDF created with pdfFactory trial version www.pdffactory.com
取值于零的周围,这同{x}与}不相关是吻合的。 (b)是两个非相关I(1)序列{x}与}的样本相关系数分布图,此 分布呈倒U字形。需注意的是,尽管{}与{}的真实相关系数仍然为零, 但从模拟结果看,{x,}与}的样本相关系数为零的可能性与图(a)相比 大大降低,实际上,相关系数以较大频率靠近±1。 (a)两个非相关I(0)序列R分布 (b)两个非相关I(1)序列R分布 图6-1-1 上述结论表明: 对于两个本来不相依的I(1)变量,如果用传统回归分析方法进 行分析,会倾向于拒绝零假设H0:B=0,从而形成“伪回归”。换个角 度说,当回归模型中包含非平稳序列时,如果用传统回归分析方法进 行分析,即使t检验值和R2都显著,也不能据此推断变量间确实存在相 依关系。 、 Phillips的严格证明 对于上述现象, Phillips(1986)从理论上给出了严格论证。 假设数据序列由相互独立的随机游动过程(7.1.1)和(7.1.2)生 成,设定回归模型如下 y,=Bx, +Er (7.1.4) Pdfcreatedwithpdffactorytrialversionwww.pdffactory.com
3 取 值 于 零的周围,这 同 {xt}与 {yt}不相关是吻合的。 (b)是两个 非相关I(1)序列 {xt}与 {yt}的样本相关系数分布图,此 分 布呈倒 U字形。需注意的是,尽管 {xt}与 {yt }的真实相关系数仍然为零, 但 从 模 拟结果 看,{xt}与 {yt }的样本相关系数为零的可能性与图(a)相比 大大降低,实际上,相关系 数以较大频率靠近 ±1。 ( a) 两 个 非相关 I( 0) 序 列 R分 布 ( b)两个 非 相 关 I( 1) 序 列 R分 布 图6-1-1 上述结论表明: 对 于两个本来 不相依的I(1)变量,如果用传统回归分析方法进 行 分 析,会 倾向于拒绝零 假设 H0 : b = 0,从而形成“伪回归”。换个 角 度说 , 当回归 模型中包含非平稳序列时, 如果用传统回归分析方法进 行 分 析,即使 t检验 值和 2 R 都显著,也不能据此推断变量间确实存在相 依关系。 三、 Phillips的严 格证明 对 于 上述现象, Phillips(1986) 从 理论上给出了严格论证。 假设数据序列 由相互独立的随机游动过程(7.1.1) 和(7.1.2)生 成, 设 定回归 模型如下 t t t y = bx + e (7.1.4) PDF created with pdfFactory trial version www.pdffactory.com
其中,,}为白噪声序列。由0LS可得β的估计量如下: 根据第五章有关随机游动的极限分布,有 N∑y2-2aaW2(r)d ∑ V(rdr yrx ,o. w(v(r)dr 检验零假设H:B=0的t统计量为 B-B /∑ 其中s2为模型(7.1.4)的剩余方差。 由于 ∑E N-1 ∑(-x) x) y 因此 β-BB Pdfcreatedwithpdffactorytrialversionwww.pdffactory.com
4 其中, {et}为白噪声序列。由 OLS可得 b 的估计量如下: å = å 2 ˆ t t t x y x b (7.1.5) 根 据第五章有关随机 游动的极限分布,有 å ¾¾® ò - 1 0 2 2 2 2 N y W (r)dr u L t s å ¾¾® ò - 1 0 2 2 2 2 N x V (r)dr v L t s (7.1.6) å ¾¾® ò - 1 0 2 N y x W (r)V (r)dr u v L t t s s 检验零假设 : 0 H0 b = 的 t 统计量为 [ ] 2 1 2 2 ˆ ˆ ˆ ˆ å = - = t s x t b s b b b 其中 2 s 为模型(7.1.4)的剩余方差。 由于 ( ) 2 2 2 ˆ 1 1 ˆ 1 1 å å - - = - = t t t y x N N s e b 2 2 1 1 å å å ÷ ÷ ø ö ç ç è æ - × - = t t t t t x x x y y N ( ) ú ú û ù ê ê ë é - - = å å å 2 2 2 1 1 t t t t x x y y N 因此 [ ] 2 1 2 2 ˆ ˆ ˆ ˆ å = - = t s x t b s b b b PDF created with pdfFactory trial version www.pdffactory.com
令x N小x∑-∑)∑x) 用N对上述t统计量做变换,并利用(7.1.6)的结论,有 [()(r) (7.1.7) w( drS(F dr-ISwo(r)dra 该结论表明: 表明在零假设下统计量N2t弱收敛于维纳过程的泛函,Nt具有 规范的极限分布 原来的t统计量既不服从t分布,也不存在规范的极限分布,t统计 量将随样本容量的增加而发散 这从理论上解释了在对非平稳变量进行回归时,为什么t统计量值 往往偏大。 因此,在对回归模型(7.1.4)的回归系数作显著性检验时,不能使 用常规的t分布临界值,而应改用N2t的分布的临界值 结论:在回归分析中,不能盲目依赖于t检验值和R2来对回归结果 进行评价,必须注意变量的非平稳性可能带来的“伪回归”问题。 如何防止“伪回归”? 种办法是 采用变通的方式避免回归方程中出现非平稳项。例如,传统的做 Pdfcreatedwithpdffactorytrialversionwww.pdffactory.com
5 ( ) 1 2 2 2 å å = å t t t t x x y x ( ) 1 2 2 2 2 1 1 - ú ú û ù ê ê ë é ÷ ÷ ø ö ç ç è æ - - å å å t t t t x x y y N [ ][( )( ) ( ) ] 1 2 2 2 2 2 2 2 2 1 - - - - - = - å t t å t å t - å t t N N x y N x N y N x y 用 2 1 - N 对上述 t 统计量做变换,并利用(7.1.6)的结论,有 ( ) { [ ( )] [ ( )] ( ) } 2 1 2 1 0 1 0 2 1 0 2 1 2 0 1 [ ( ) ] ( ) ò ò ò ò × - ¾¾® - W r dr V r dr W r V r dr W r V r dr N t L (7.1.7) 该结论表明: 表明在零假设下统计量 2 1 - N t弱收敛 于维纳过程的泛函, 2 1 - N t具有 规范 的 极限 分布; 原来的 t统计量既不服从t分布,也不存在规范的极限分布,t统计 量将 随样本容量的增加而发 散; 这 从 理论上解释了在对非平稳变量进行回归时,为什么 t统计量值 往往 偏大。 因 此 ,在对回归 模型(7.1.4)的回归系 数作显著性检验时,不能 使 用 常规的t分布临界值,而应改用 2 1 - N t 的分布的临界值。 结论:在回归分析中,不能盲目依赖于t检验值和 2 R 来对回归结果 进行 评价,必须注意 变量的非平稳性可能带来的“伪回归”问题。 如何防止“伪回 归”? 一种 办法是: 采 用变通的方 式避免 回归方程中出现非平稳项。例如,传统的 做 PDF created with pdfFactory trial version www.pdffactory.com