第5讲非平稳随机过程 从本章起介绍计量经济学近20年来最新研究成果。如果把第1章内容称为经典计量经 济学,那么将要介绍的内容则应该称为非经典计量经济学 从1974年开始计量经济学工作者渐渐意识到当用含有单位根的时间序列建立经典计量 经济模型时会出现一些问题,这就是虚假回归 应该知道通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以 在建立模型时,必须依靠经济理论,同时对参数进行假设检验。实际上,只有经济理论是不 够的。比如处于调整中的经济变量,哪些是它的外生变量,哪些是它的无关变量,单凭经济 理论就很难判别清楚。所以当研究经济变量参数变化规律时,常常采用另外一种方法,即依 靠统计理论的方法,通过设计具有某种特征的能生成数据的随机过程或数据生成系统研究经 济问题。下面常常用到数据生成系统这个概念。 3.1单积性 单积(整):若一个随机过程{x}必须经过d次差分之后才能变换成一个平稳的可逆 的ARMA过程,则称{x}是d次单积(单整)过程。用x~Id)表示 对于平稳过程表示为I(O)。注意:单积过程是指单积次数大于零的过程。 对于Id过程x q(L)(1-L)“x=(L 因为含有d个单位根,所以常把时间序列单积次数的检验称为单位根检验( unit root test) 若x~I(d,y~I(c),则 Er=(axr+ by)-I(max[d, c 4==4(ax+by)=(ax+ by)-(axr-1+by-1)=(a4x+ b4y) 当c>d时,x只有差分c次才能平稳。 一般来说,若x~I(c),y~I(c),则 二=(ax+by)~I(c) 但也有=的单积次数小于c的情形。当=的单积次数小于c时,则称x与y存在协积(整) 关系。 3.2单积过程的统计特征 以随机游走过程和平稳的AR(1)过程作比较,对于随机游走过程 有 x1=x1-2+11-1+t= (具有永久记忆性) Var(x)=∑ran(u)=1o (随T的增加,方差变为无穷大) 下面求xr和x-k的(相隔k期的)相关系数pk。 Cox;xr)=E(xx)=E∑n∑u)=E(∑u2)=(T-a2
1 第 5 讲 非平稳随机过程 从本章起介绍计量经济学近 20 年来最新研究成果。如果把第 1 章内容称为经典计量经 济学,那么将要介绍的内容则应该称为非经典计量经济学。 从 1974 年开始计量经济学工作者渐渐意识到当用含有单位根的时间序列建立经典计量 经济模型时会出现一些问题,这就是虚假回归。 应该知道通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以 在建立模型时,必须依靠经济理论,同时对参数进行假设检验。实际上,只有经济理论是不 够的。比如处于调整中的经济变量,哪些是它的外生变量,哪些是它的无关变量,单凭经济 理论就很难判别清楚。所以当研究经济变量参数变化规律时,常常采用另外一种方法,即依 靠统计理论的方法,通过设计具有某种特征的能生成数据的随机过程或数据生成系统研究经 济问题。下面常常用到数据生成系统这个概念。 3.1 单积性 单积(整):若一个随机过程 {xt} 必须经过 d 次差分之后才能变换成一个平稳的可逆 的 ARMA 过程,则称 {xt} 是 d 次单积(单整)过程。用 xt I(d) 表示。 对于平稳过程表示为 I(0)。注意:单积过程是指单积次数大于零的过程。 对于 I(d) 过程 xt (L) (1- L) d xt = (L) ut 因为含有 d 个单位根,所以常把时间序列单积次数的检验称为单位根检验(unit root test)。 若 xt I(d),yt I(c),则 zt = (a xt + b yt) I (max[d, c]). zt = (a xt + b yt) = (a xt + b yt) - (a xt -1 + b yt - 1) = (a xt + b yt) 当 c > d 时,zt 只有差分 c 次才能平稳。 一般来说,若 xt I (c),yt I (c),则 zt = (a xt + b yt) I (c) 但也有 zt 的单积次数小于 c 的情形。当 zt 的单积次数小于 c 时,则称 xt 与 yt 存在协积(整) 关系。 3.2 单积过程的统计特征 以随机游走过程和平稳的 AR(1)过程作比较,对于随机游走过程 xt = xt-1 + ut , x0 = 0, ut IN (0, u 2 ) (3.7) 有 xt = xt-2 + ut-1 + ut = … = = t i i u 1 (具有永久记忆性) Var(xt) = = t i Var ui 1 ( ) = tu 2 (随 T 的增加,方差变为无穷大) 下面求 xT 和 xT - k的(相隔 k 期的)相关系数k 。 Cov(xT, xT-k) = E(xT xT-k) = E( = T i i u 1 − = T k i ui 1 ) = E( − = T k i ui 1 2 ) = (T - k) u 2
只有当样本容量趋于无穷时,相关系数才等于1。有限样本条件下,特别是小样本条件 下,随着滞后期k的增加,相关系数有所衰减。这正是在第2章求序列的自相关函数时看到 的结果 对于AR(1)过程y=y21+1,||<1,=0,~INO,G32)有 (38) y=v:+h1Vi-1+ony 只有有限记忆力) Va()=E∑-;)2 (方差为有限值) AR(1)过程的自相关系数公式,pk=p,(推导见上一章) 表3.Ⅰ随机游走过程和平稳的一阶自回归过程统计特征比较 方差 12(无限的) 2/(1-p2)(有限的) 自相关系数 =√-(k/T)→1,bk,T>P= 穿越零均值点的期望时间无限的 有限的 记忆性 永久的 暂时的 0.9 0.8 RHO50 RHO500 RHO100 RHO1000 246 T=50、100、500条件下随机游走过程对应的自相关函数图(rho000(1-@ trend(o000).5) 2
2 k = ( ) ( ) ( , ) T T k T T k Var x Var x Cov x x − − = 2 2 2 ( ) ( ) u u u T T k T k − − = T T − k = 1− k /T 只有当样本容量趋于无穷时,相关系数才等于 1。有限样本条件下,特别是小样本条件 下,随着滞后期 k 的增加,相关系数有所衰减。这正是在第 2 章求序列的自相关函数时看到 的结果。 对于 AR(1) 过程 yt = 1 yt-1 + vt , 1 < 1, y0 = 0, vt IN(0, v 2 ) 有 (3.8) yt = vt + 1vt-1 + 1 2 yt-2 = … = − = − 1 0 1 t i t i i v (yt 只有有限记忆力) Var(yt) = E( − = − 1 0 1 t i t i i v ) 2 = 2 1 1 1 − v 2 (方差为有限值) AR(1) 过程的自相关系数公式,k =1 k,(推导见上一章)。 表 3.1 随机游走过程和平稳的一阶自回归过程统计特征比较 随机游走过程 平稳的一阶自回归过程 方差 tu 2 (无限的) u 2 /(1-1 2 ) (有限的) 自相关系数 k = 1− (k / T) → 1, k, T→ k =1 k 穿越零均值点的期望时间 无限的 有限的 记忆性 永久的 暂时的 0.7 0.8 0.9 1.0 2 4 6 8 10 12 14 16 18 20 22 24 RHO50 RHO100 RHO500 RHO1000 T = 50、100、500 条件下随机游走过程对应的自相关函数图(rho1000=(1-(@trend(0)/1000))^.5) sigma=1/(1-(@trend(0)/20)^2)
AR(1)过程自相关系数与方差的关系 3.3虚假回归 (1)用蒙特卡罗模拟方法分析相关系数的分布。 v2~IN(O,1),v~I(0) 每次生成7=100的相互独立的{}和{v},并计算Rn。重复1万次,从而得到Rm的分布。 V=y-1+v,y=0,y~I(1) 利用{}和{w},每次生成7=100的{x}和{y}并计算Rx。重复1万次,从而得到Rx的分布 P=p-1+x,p=0,P~1(2) 利用{x}和{y},每次生成7=100的{pn}和{q}并计算R。重复1万次,从而得到Rp的分布 1.两个相互独立的I(0变量{}和{v}的相关系数Rn的分布为正态(见图3.1a)。 2.两个相互独立的I(1)变量{x}和{y}的相关系数Ry的分布为倒U形(见图3.1b) 3.两个相互独立的1(2)变量{P}和{qh}的相关系数Rpq的分布为U形(见图3.lc) 6000 5000 Sample 1 5000 Observations 50000 4000 3000 2000 Skewness -0.001366 Kurtosis 2.945059 304063 042765 (file: 5simu-r-1-2-5simu5)
3 0 0.2 0.4 0.6 0.8 1 10 20 30 40 50 60 AR(1)过程自相关系数1与方差的关系 3.3 虚假回归 ⑴ 用蒙特卡罗模拟方法分析相关系数的分布。 ut IN(0, 1), ut I (0) vt IN(0, 1), vt I (0) 每次生成 T=100 的相互独立的{ut}和{vt},并计算 Ruv。重复 1 万次,从而得到 Ruv的分布。 xt = xt-1 + ut , x0 = 0, xt I (1) yt = yt-1 + vt , y0 = 0, yt I (1) 利用{ut}和{vt},每次生成 T=100 的{xt}和{yt}并计算 Rxy。重复 1 万次,从而得到 Rxy的分布。 pt = pt-1 + xt , p0 = 0, pt I (2) qt = qt-1 + yt , q0 = 0, qt I (2) 利用{xt}和{yt},每次生成 T=100 的{pt}和{qt}并计算 Rpq。重复 1 万次,从而得到 Rpq 的分布。 1. 两个相互独立的 I(0)变量{ut}和{vt}的相关系数 Ruv的分布为正态(见图 3.1a)。 2. 两个相互独立的 I(1)变量{xt}和{yt}的相关系数 Rxy的分布为倒 U 形(见图 3.1b)。 3. 两个相互独立的 I(2)变量{pt}和{qt}的相关系数 Rpq 的分布为 U 形(见图 3.1c)。 0 1000 2000 3000 4000 5000 6000 -0.25 0.00 0.25 Series: CORRUV Sample 1 50000 Observations 50000 Mean -0.000297 Median -6.73e-05 Maximum 0.386098 Minimum -0.383657 Std. Dev. 0.100977 Skewness -0.001366 Kurtosis 2.945059 Jarque-Bera 6.304063 Probability 0.042765 (file:5simu-r-1-2- ,5simu5) 2 1
Observations 50 491984 Kurtosis 1879724 Probabilit 0.000000 samp150000 0.000123 00086 21956 Kurtis 1222225 arque-Bera 6584.344 血muum 0.000000 (file: simus) 0.3-0.2-0.100.10.20.30.4 -1-0.5 图3.b 图3.1c 问题的严重性在于当变量非平稳时,认为R服从的是正态分布,但实际上R服从的却 是图3.1b和图3.lc那样的倒U和U字型分布,因此增加了拒绝概率,本不相关的两个变量 结论却是相关! 1)分布 图3.1三条曲线叠加示意图 图3.249分布和虚假回归条件下的t分布
4 0 400 800 1200 1600 -1.0 -0.5 0.0 0.5 1.0 Series: CORRXY Sample 1 50000 Observations 50000 Mean 0.000369 Median 0.000965 Maximum 0.980302 Minimum -0.975489 Std. Dev. 0.491984 Skewness -0.002124 Kurtosis 1.879724 Jarque-Bera 2614.657 Probability 0.000000 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 -1.0 -0.5 0.0 0.5 1.0 Series: CORRPQ Sample 1 50000 Observations 50000 Mean 0.000123 Median 0.008650 Maximum 0.999704 Minimum -0.999772 Std. Dev. 0.821956 Skewness -0.000356 Kurtosis 1.222225 Jarque-Bera 6584.344 Probability 0.000000 (file:5simu5) -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0 1 2 3 4 -1 -0.5 0 0.5 1 0 0.01 0.02 0.03 0.04 0.05 0.06 -1 -0.5 0 0.5 1 0 0.5 1 1.5 2 2.5 图 3.1a 图 3.1b 图 3.1c 问题的严重性在于当变量非平稳时,认为 R 服从的是正态分布,但实际上 R 服从的却 是图 3.1b 和图 3.1c 那样的倒 U 和 U 字型分布,因此增加了拒绝概率,本不相关的两个变量 结论却是相关! 图 3.1 三条曲线叠加示意图 图 3.2 t(98)分布和虚假回归条件下的 t 分布
(2)t统计量的分布 有如下数据生成系统 llt E(lv)=0, 可知x和y为I(1)变量且相互独立。作如下回归 yI=Bo+ Pl (B1)的分布见图32。拒绝β1=0的概率大大增加。从而造成虚假回归( Granger1974年提 出)。 (3)简单回归中B1=0的拒绝概率与变量单积阶数的关系 两变量的单积阶数 P(以B1)2) I(O)与I(0) 0.045 I(1)与I(1) (4)样本容量与虚假回归的关系(回归变量均为I(1)变量) 随样本容量变化,拒绝B1=0的概率,即P((B1)>2)见图3.3 100 图3.3 3.4维纳过程、数量级概念、单积过程的极限分布 维纳过程可看作是一个在[0,1区间内连续的随机游走过程 标准维纳过程:对于任意一个连续的随机过程Wi),i≥0,i∈[0,1,如果满足以下四 个条件。 (1)P{(0)=0}=1。 (2)对于每个i≥0,有E[W()]=0。 (3)对于每个i≥0,()都是正态分布的并且是非退化的。 (4)()具有独立的增量。[()-0~N(0,÷) 则称()为标准布朗运动( Brownian motion)或标准 Wiener过程,用W()或B(表示 Norbert Wiener(1894-1964)是硏究随机过程的美国科学家,第二次世界大战时专门研究鱼雷击中潜 艇的问题。 Wiener过程是以他的名字命名的 其他时间连续的过程可以由标准的维纳过程生成。比如
5 ⑵ t 统计量的分布 有如下数据生成系统 xt = xt-1 + ut , x0 = 0, ut IID(0, 1) yt = yt-1 + vt , y0 = 0, vt IID (0, 1) E(ui vj) = 0, i, j 可知 xt 和 yt 为 I(1)变量且相互独立。作如下回归 yt = 0 + 1xt + wt , t( 1 ˆ )的分布见图 3.2。拒绝1 = 0 的概率大大增加。从而造成虚假回归(Granger 1974 年提 出)。 ⑶ 简单回归中1 = 0 的拒绝概率与变量单积阶数的关系 两变量的单积阶数 P(t( 1 ˆ )>2) I(0) 与 I(0) 0.045 I(1) 与 I(1) 0.77 I(2) 与 I(2) 0.95 ⑷ 样本容量与虚假回归的关系(回归变量均为 I(1)变量) 随样本容量变化,拒绝 1 = 0 的概率,即 P(t( 1 ˆ ) > 2 ) 见图 3.3。 0 50 100 150 200 0.3 0.4 0.5 0.6 0.7 0.8 0.9 图 3.3 3.4 维纳过程、数量级概念、单积过程的极限分布 维纳过程可看作是一个在 [0, 1] 区间内连续的随机游走过程。 标准维纳过程:对于任意一个连续的随机过程 V(i ),i 0,i [0, 1],如果满足以下四 个条件。 (1)P{V(0) = 0} = 1。 (2)对于每个 i 0,有 E[V(i)] = 0。 (3)对于每个 i 0,V(i) 都是正态分布的并且是非退化的。 (4)V(i) 具有独立的增量。[V(i)- V(j)] N(0, i-j) 则称V(i )为标准布朗运动(Brownian motion)或标准Wiener 过程,用W(i) 或B(i)表示。Norbert Wiener (1894-1964) 是研究随机过程的美国科学家,第二次世界大战时专门研究鱼雷击中潜 艇的问题。Wiener 过程是以他的名字命名的。 其他时间连续的过程可以由标准的维纳过程生成。比如, Z(i) = W(i) T