1000 Senes: DRIFT Observations 10000 -0021116 Jarque-Bera 357 6793 (file: 5simu-d 有限样本条件下的1(分布的估计结果见表5 表6 估计式y=a+1-1+7+1中1(沙)的分布(模拟5万次) CV0005CV0025Cvo.05Cv95CV0.975Cv0995 -3.96132-3.20650-2830062.833723.231844.04315 390374-3.19471-2844962.784723.149823.85176 100 -3.858223.257752919852668203.021383.70615 1503.95734-3.29940-296328265191299519362287 20 -3.914883.315392966422639862961343.5707 T=100,模拟1万次的1()分布见图 sedie Observations 10000 arque-Bera 399.1753 (file: 5simu-df) 图4144(a),1()分布的蒙特卡罗模拟(T=100,模拟1万次)图414b(a),4(沙)分布与DF分布比较 B=-1时的DF的分布是B=1时的DF分布的镜像,所以只研究β=1条件下DF的分布 11
11 0 200 400 600 800 1000 -4 -2 0 2 4 Series: DRIFT Sample 1 10000 Observations 10000 Mean -0.021116 Median -0.025607 Maximum 4.850678 Minimum -5.339995 Std. Dev. 1.813019 Skewness -0.000229 Kurtosis 2.073485 Jarque-Bera 357.6793 Probability 0.000000 (file:5simu-df3) 有限样本条件下的 ( ˆ) t 分布的估计结果见表 5 表 6: 估计式 t t ut y = + y −1 +t + 中 ( ˆ) t 的分布(模拟 5 万次) T CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 30 -3.96132 -3.20650 -2.83006 2.83372 3.23184 4.04315 50 -3.90374 -3.19471 -2.84496 2.78472 3.14982 3.85176 100 -3.85822 -3.25775 -2.91985 2.66820 3.02138 3.70615 150 -3.95734 -3. 29940 -2.96328 2.65191 2.99519 3.62287 200 -3.91488 -3.31539 -2.96642 2.63986 2.96134 3.57071 250 -3.97728 -3.32261 -2.96771 2.63847 2.97243 3.56027 注:(M.File:unitroot01) T =100,模拟 1 万次的 ( ˆ) t 分布见图。 0 200 400 600 800 1000 -4 -2 0 2 4 Series: PARATREND Sample 1 10000 Observations 10000 Mean -0.009406 Median -0.021150 Maximum 5.159817 Minimum -5.170165 Std. Dev. 1.812880 Skewness 0.019728 Kurtosis 2.022010 Jarque-Bera 399.1753 Probability 0.000000 (file:5simu-df3) -6 -4 -2 0 2 4 6 0.05 0.1 0.15 0.2 -6 -4 -2 0 2 4 6 0.1 0.2 0.3 0.4 0.5 图 4.14a ( ˆ) t , ( ˆ) t 分布的蒙特卡罗模拟(T =100,模拟 1 万次)图 4.14b ( ˆ) t , ( ˆ) t 分布与 DF 分布比较 = -1 时的 DF 的分布是 = 1 时的 DF 分布的镜像,所以只研究 = 1 条件下 DF 的分布
即可。对于经济问题,很少出现B=-1的情形。 43DF统计量的有限样本分布特征总结 以模型(41)为条件,取样本容量T=100,用蒙特卡罗方法,分别用(417)、(4.16) 和(415)式各模拟10000次得到的DF的分布见图411。黑、蓝、红色直方图分别代表(417)、 (4_16)和(4.15)式中DF统计量的分布。随着确定项的增加,分布越来越向左移。蓝色 DF分布近似于t分布,但整体向左大约移动了1.6个单位 图411(4.1)~(4.3)的DF统计量分布的蒙特卡罗模拟(T=50) Ful(1976)用蒙特卡罗模拟方法得到TB-1)和DF统计量的百分位数表,分别见附表 5和6。 DF分布百分位数表 模型 00100250050100.90095097509 1610.911.3 60-2.24 1.61 1.29 1.64 2.03 模型(4.1)250258223-1.951620.89129163201 2.00 0.370.000.340.72 模型(42)2503.463.14-288-257042-0.060240.6 5003443.132.872.570430.070.240.61 3.12 2.862.57-0 25-4.383.953.60 3.24 1.14-0.80-0.50 0.15 0-4.153.80-3.503.18-1.19-0.87-0. 0.24 3.15 220.900.62 模型(4.3)2503993. 3.13-123 0.640.31 3.983.683.423.13-1.24-0.930.650.32 」4)NO.1)-2.33-1%6 128 2.33 注:1.适用于模型(41),(42)和(43),条件B=1。T:样本容量,a:检验水平。 2.摘自 Fuller(1976)第373页。 44进一步讨论 以上三个自回归模型对于研究实际经济变量太严格,还应该进一步讨论在AR(p)模型条 件下,随机误差项非白噪声条件下,检验用统计量的分布特征
12 即可。对于经济问题,很少出现 = -1 的情形。 4.3 DF 统计量的有限样本分布特征总结 以模型 (4.1)为条件,取样本容量 T = 100,用蒙特卡罗方法,分别用(4.17)、(4.16) 和(4.15)式各模拟 10000 次得到的 DF 的分布见图 4.11。黑、蓝、红色直方图分别代表(4.17)、 (4.16)和(4.15)式中 DF 统计量的分布。随着确定项的增加,分布越来越向左移。蓝色 DF 分布近似于 t 分布,但整体向左大约移动了 1.6 个单位。 图4.11 (4.1) (4.3) 的DF统计量分布的蒙特卡罗模拟(T=50) Full (1976) 用蒙特卡罗模拟方法得到 T( ˆ - 1) 和 DF 统计量的百分位数表,分别见附表 5 和 6。 DF 分布百分位数表 模型 T 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 2.66 - 2.26 - 1.95 - 1.60 0.92 1.33 1.70 2.16 50 - 2.62 - 2.25 - 1.95 - 1.61 0.91 1.31 1.66 2.08 (a) 100 - 2.60 - 2.24 - 1.95 - 1.61 0.90 1.29 1.64 2.03 模型 (4.1) 250 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.29 1.63 2.01 500 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00 25 - 3.75 - 3.33 - 3.00 - 2.63 - 0.37 0.00 0.34 0.72 50 - 3.58 - 3.22 - 2.93 - 2.60 - 0.40 - 0.03 0.29 0.66 (b) 100 - 3.51 - 3.17 - 2.89 - 2.58 - 0.42 - 0.05 0.26 0.63 模型 (4.2) 250 - 3.46 - 3.14 - 2.88 - 2.57 - 0.42 - 0.06 0.24 0.62 500 - 3.44 - 3.13 - 2.87 - 2.57 - 0.43 - 0.07 0.24 0.61 - 3.43 - 3.12 - 2.86 - 2.57 - 0.44 - 0.07 0.23 0.60 25 - 4.38 - 3.95 - 3.60 - 3.24 - 1.14 - 0.80 - 0.50 - 0.15 50 - 4.15 - 3.80 - 3.50 - 3.18 - 1.19 - 0.87 - 0.58 - 0.24 (c) 100 - 4.04 - 3.73 - 3.45 - 3.15 - 1.22 - 0.90 - 0.62 - 0.28 模型 (4.3) 250 - 3.99 - 3.69 - 3.43 - 3.13 - 1.23 - 0.92 - 0.64 - 0.31 500 - 3.98 - 3.68 - 3.42 - 3.13 - 1.24 - 0.93 - 0.65 - 0.32 - 3.96 - 3.66 - 3.41 - 3.12 - 1.25 - 0.94 - 0.66 - 0.33 t () N(0, 1) - 2.33 - 1.96 - 1.65 - 1.28 1.28 1.65 1.96 2.33 注:1. 适用于模型(4.1), (4.2)和(4.3), 条件 = 1。T:样本容量,:检验水平。 2. 摘自 Fuller (1976)第 373 页。 4.4 进一步讨论 以上三个自回归模型对于研究实际经济变量太严格,还应该进一步讨论在 AR(p) 模型条 件下,随机误差项非白噪声条件下,检验用统计量的分布特征
(1)对于AR(P)过程 =y1+y2+…+中p+ut (4.18) 当y中含有单位根时,可以通过如下模型研究β=1条件下,检验用统计量DF的分布特征 y=By1+∑的4-+l (4.19) 其中B=∑ψ,赙=∑,j=1,2,…,P-1 为(4.18)式中的自回归系数。为什么可以通过(4.19)式进行研究呢?解释如下。(4.18) 式可以用回归算子表示为 d(l)y=ur 若y中含有一个单位根,上式可以表达为 p()*(1-L)y= (L)*Ay=u (4.21) 其中φ(1)*表示从p阶自回归算子Φ(L)中分离出因子(1-L)后所得的p-1阶自回归 算子。可见对于Ay,(4.21)式是一个p-1阶的自回归模型 下面以AR(3)过程为例,验证关系式(410)。有 =y1+2+如3+ 上式右侧同时加减血y,y1,y2然后合并同类项, =y1+血y1+的y1-中y1+血y2-g1-如2+的2+=3+ =(+血+)y1-血41-的4-1-的4y2+ =(+血+)y-1-(+)4y1-g4yh-2+l By-1-*4y1-@*4y2+ B1∑的4 其中 B=∑响 *=∑ (419)式中相对于B的DF统计量的分布与(41)式中DF统计量的分布近似相同 (419)式中的差分项4m,j=1,2,…,p-1之所以不会对DF统计量的分布产生影响是因为 当y~I(1),则全部Δy~I(0)y与4的交叉积渐进被忽略。从而使(4.19)式中B的 DF统计量的分布与(41)式中B的DF统计量渐近相同 当模型(418)中含有位移项μ和趋势项αt时,对应β的DF统计量的分布分别与模 型(42)和模型(4.3)中DF统计量的分布相同 (2)现在进一步放宽对y的限制。考虑如下AR(1)过程
13 (1)对于 AR(p)过程 yt = 1 yt-1 + 2 yt-2 + … + p yt-p + u t (4.18) 当 yt 中含有单位根时,可以通过如下模型研究 = 1 条件下,检验用统计量 DF 的分布特征。 yt = yt-1 + t j p j j y − − = 1 1 + ut (4.19) 其中 = = p i i 1 ,j* = - = + p i j i 1 , j = 1, 2, …, p – 1 i 为 (4.18) 式中的自回归系数。为什么可以通过 (4.19) 式进行研究呢?解释如下。(4.18) 式可以用回归算子表示为 (L) yt = ut (4.20) 若 yt 中含有一个单位根,上式可以表达为 (L)* (1 – L ) yt = (L)* yt = u t (4.21) 其中 (L)* 表示从 p 阶自回归算子 (L) 中分离出因子 (1 – L ) 后所得的 p – 1 阶自回归 算子。可见对于 yt ,(4.21)式是一个 p – 1 阶的自回归模型。 下面以 AR (3) 过程为例,验证关系式 (4.10)。有 yt = 1 yt-1 + 2 yt-2 + 3 yt-3 + ut 上式右侧同时加减 2 yt-1,3 yt-1,3 yt-2 然后合并同类项, yt = 1 yt-1 + 2 yt-1 + 3 yt-1 - 2 yt-1 + 2 yt-2 - 3 yt-1 - 3 yt-2 + 3 yt-2 + 3 yt-3 + ut = (1 + 2 + 3) yt-1 - 2 yt-1 - 3 yt-1 - 3 yt-2 + ut = (1 + 2 + 3) yt-1 - (2 + 3) yt-1 - 3 yt-2 + ut = yt-1 - 1* yt-1 - 2* yt-2 + ut = yt-1 - = − 2 j 1 j t j y + ut 其中, = = 3 i 1 i j* = - = + 3 i j 1 i , j = 1, 2 . (4.19) 式中相对于 的 DF 统计量的分布与 (4.1) 式中 DF 统计量的分布近似相同。 (4.19) 式中的差分项 yt-j , j = 1,2, …, p – 1 之所以不会对 DF 统计量的分布产生影响是因为 当 yt I(1),则全部 yt-j I(0)。yt 与 yt-j 的交叉积渐进被忽略。 从而使 (4.19) 式中 的 DF 统计量的分布与 (4.1) 式中 的 DF 统计量渐近相同。 当模型 (4.18) 中含有位移项 和趋势项 t 时,对应 的 DF 统计量的分布分别与模 型 (4.2) 和模型 (4.3) 中 DF 统计量的分布相同。 (2)现在进一步放宽对 yt 的限制。考虑如下 AR(1) 过程
y,=B] 其中允许随机项是一个ARMA(P,q)过程,甚至参数pq的值也可未知。则可以用下式 研究β和DF统计量的分布 =BH+∑4y+, (4.23) 若B=1,上式是一个差分的AR(k)过程。加入A滞后项的目的是捕捉(422)式误差项 l中的自相关。(的自相关项对于模型(42)来说是移动平均项,所以Ay滞后项的加 入可以捕捉之。)因为可逆的移动平均过程可以转化为一个无限阶的自回归过程,所以对l1 而言的移动平均项ν,【=1,…,q完全可以通过增加的滞后项而吸收。进而被足够的Ay; 项所吸收。从而使讠近似为一个白噪声过程 Sad- Dickey(1984)证明(423)式中B的DF统计量的分布与(41)式中B的DF统 计量的分布类似。当(423)式中加入位移项μ和趋势项at时,B的DF分布分别与(416) 式和(417)式中B的DF分布类似 4.5单位根检验 对于时间序列y可用如下自回归模型检验单位根。 yr=By-1+ur (4.24) 零假设和备择假设分别是, (y2非平稳) H1:B<1,(y平稳) 在零假设成立条件下,用DF统计量进行单位根检验。 (4.25) 其中 以附表6中a部分的相应百分位数作为临界值,若用样本计算的 DF>临界值,则接受H,y非平稳: DF<临界值,则拒绝H,y是平稳的 图412单位根检验示意图 注意
14 yt = yt-1 + ut , (4. 22) 其中允许随机项 ut 是一个 ARMA(p, q) 过程,甚至参数 p, q 的值也可未知。则可以用下式 研究 和 DF 统计量的分布。 yt = ˆ yt-1 + = k i 1 ˆ yt-i + t v ˆ , (4.23) 若 = 1,上式是一个差分的 AR(k) 过程。加入 yt 滞后项的目的是捕捉 (4.22) 式误差项 ut 中的自相关。(ut 的自相关项对于模型 (4.22) 来说是移动平均项,所以 yt 滞后项的加 入可以捕捉之。)因为可逆的移动平均过程可以转化为一个无限阶的自回归过程,所以对 ut 而言的移动平均项 vt, t = 1, …, q 完全可以通过增加 ut 的滞后项而吸收。进而被足够的 yt-i 项所吸收。从而使 t v ˆ 近似为一个白噪声过程。 Said-Dickey (1984) 证明 (4.23) 式中 的 DF 统计量的分布与 (4.1) 式中 的 DF 统 计量的分布类似。当 (4.23) 式中加入位移项 和趋势项 t时, 的DF分布分别与 (4.16) 式和 (4.17) 式中 的 DF 分布类似。 4.5 单位根检验 对于时间序列 yt 可用如下自回归模型检验单位根。 yt = yt-1 + ut , (4. 24) 零假设和备择假设分别是, H0: = 1, ( yt 非平稳) H1: < 1, ( yt 平稳) 在零假设成立条件下,用 DF 统计量进行单位根检验。 DF = ) ˆ ( 1 ˆ s − = = − − T t u t s y 2 2 ( ) 1 1 ˆ (4.25) 其中 s(u) = = − T t ut T 2 2 ˆ 1 1 (4.26) 以附表 6 中 a 部分的相应百分位数作为临界值,若用样本计算的 DF > 临界值,则接受 H0,yt 非平稳; DF < 临界值,则拒绝 H0,yt 是平稳的。 图 4.12 单位根检验示意图 注意