2.13稳健估计 robust estimation method GMM估计在大样本情况下是渐近有效的,在小样本情况下是无效的。所以,只有在大样 本情况下,才使用GMM方法进行参数估计。 佔计步骤对于模型 v=h(X1,B)+∈ (2-69) (1)采用OLS法估计模型得出B (2)计算权矩阵的估计量 (3)代入(2-67)。 假设检验 2.13稳健估计 robust estimation method 设第i个观察的古典线性回归模型为 Yt=Xta+ett=1,2,……,T (2-70) 其中随机扰动项et为独立同分布,且有分布密度f()。M-估计设p()是一个任一给定的上凸 函数( conve.T),则称最小值问题 min∑p(Y1-Xa) (2-71) 的解a=a为参数a的一个M-估计。若p()有导函数v(),则它等价于下面这个方程的解: Xtv(Yt- Xta)=0 最小绝对偏差估计p(x)= 最小二乘估计p(x)=2 极大似然估计p(x)=-lnf(x) L—估计设参数0<θ<1,最小值问题 Imn 8- Xtal+ (1-0)Yt- Xtal (2-73) t:Yt<Xto 若取θ=号,则为最小绝对偏差( minimumobsolutedeviation)估计。进一步,若误差项 服从一个双边指数分布,即具有分布密度: 入 f(c)2cAl 则这个MAD估计就是极大似然估计。 214工具变量法 阶差分或固定效应估计排除了不随时间变化的变量。迄今为止我们已研究出的综列数据 法还不能解决与解释变量相关的随同时间变化的遗漏变量的问题。 在存在遗漏变量时,OLS估计量是有偏误且非一致的。对未能观测到的解释变量给出适宜 的代理变量,能消除或减轻遗漏变量偏误。 对于内生性问题的解决,一是工具变量法;一是两阶段最小二乘法 ⅠV法可
2.13 稳健估计 robust estimation method GMM 估计在大样本情况下是渐近有效的,在小样本情况下是无效的。所以,只有在大样 本情况下,才使用 GMM 方法进行参数估计。 估计步骤 对于模型 yi = h(Xi , β) + εi (2-69) (1) 采用 OLS 法估计模型得出 βˆ; (2) 计算权矩阵的估计量; (3) 代入(2-67)。 假设检验 2.13 稳健估计 robust estimation method 设第 i 个观察的古典线性回归模型为 Yt = Xtα + εt t = 1, 2, · · · , T (2-70) 其中随机扰动项 εt 为独立同分布,且有分布密度 f(·)。M–估计 设 ρ(·) 是一个任一给定的上凸 函数(convex),则称最小值问题: min α X T i=1 ρ(Yt − Xtα) (2-71) 的解 α = ˆα 为参数 α 的一个 M− 估计。若 ρ(·) 有导函数 ψ(·),则它等价于下面这个方程的解: X T i=1 Xtψ(Yt − Xtα) = 0 (2-72) 最小绝对偏差估计ρ(x) = |x| 最小二乘估计ρ(x) = x 2 2 极大似然估计ρ(x) = − ln f(x) L–估计 设参数 0 < θ < 1,最小值问题 min X T t:Yt≥Xtα θ |Yt − Xtα| + X T t:Yt<Xtα (1 − θ)|Yt − Xtα| (2-73) 若取 θ = 1 2,则为最小绝对偏差(minimumobsolutedeviation)估计。进一步,若误差项 服从一个双边指数分布,即具有分布密度: f(x) = λ 2 e −λ|x| 则这个 MAD 估计就是极大似然估计。 2.14 工具变量法 一阶差分或固定效应估计排除了不随时间变化的变量。迄今为止我们已研究出的综列数据 法还不能解决与解释变量相关的随同时间变化的遗漏变量的问题。 在存在遗漏变量时,OLS 估计量是有偏误且非一致的。对未能观测到的解释变量给出适宜 的代理变量,能消除或减轻遗漏变量偏误。 对于内生性问题的解决,一是工具变量法;一是两阶段最小二乘法。 IV 法可: - 22 -
第二章估计方法引论 在存在遗漏变量的情况下,获得一致性估计量 ●解决含误差变量 errors-in- variable的问题 ●估计联立方程模型 定义28(工具变量)若简单回归模型:y=6+1x+u。假定我们有一个可观测到的 变量z,它满足两个假定 (1)z与不相关:Cov(x,u)=0 (2)z与x相关:Co(z,x)≠0 (3)为用IV估计量做统计推断,需要同方差假定E(212)=a2=Var(u 我们称z是x的 instrumentalvariable 工具变量估计量 B1 Cov(z, y) n 1(x2-2)(v1-) (z1-2)(x1-2) (2-74) 大数定律表明,IV估计量具有一致性:plim(B1)=A1。它的渐近方差为 在高斯-马尔科夫假定下,OLS估计量的方差为σ2/SSTx,而IV估计量类似的计算式是 a2/SSTR2所以,IV估计量的渐近方差总是大于OLS估计量的渐近方差。 2.15蒙特卡罗模拟
第二章 估计方法引论 • 在存在遗漏变量的情况下,获得一致性估计量 • 解决含误差变量 errors − in − variable 的问题 • 估计联立方程模型 定义 2.8 (工具变量) 若简单回归模型:y = β0 + β1x + u 。假定我们有一个可观测到的 变量 z,它满足两个假定: (1) z 与u 不相关:Cov(z, u) = 0 (2) z 与x 相关:Cov(z, x) 6= 0 (3) 为用 IV 估计量做统计推断,需要同方差假定E(u 2 |z) = σ 2 = V ar(u) 我们称 z 是 x 的 instrumentalvariable。 工具变量估计量: βˆ 1 = Cov(z, y) Cov(z, x) = Pn i=1(zi − z¯)(yi − y¯) Pn i=1(zi − z¯)(xi − x¯) (2-74) 大数定律表明,IV 估计量具有一致性:plim(βˆ 1) = β1。它的渐近方差为: σ 2 nσ2 xρ 2 x,z (2-75) 在高斯–马尔科夫假定下,OLS 估计量的方差为 σ 2/SSTx ,而 IV 估计量类似的计算式是: σ 2/SSTxR2 x,z。所以,IV 估计量的渐近方差总是大于 OLS 估计量的渐近方差。 2.15 蒙特卡罗模拟 - 23 -
2.15蒙特卡罗模拟 style= numbers, caption=SAS产生AR1序列 原代码2.1 OPTIONS MSTORED SASMSTORE=LI %MACRO ARI(N=50, A=0.7, B=0.3, SEED=-1, CNAME=ARISER, DNAME ARIDST); DATA AR ARRAY OBS OBSI-OBS&N: *** Room is made for observations OBS(1)=RANNOR(&SEED);*** Generated the first observation DO=2 TO &N: OBS(J=SQRT(&A)*OBS(J-1)+SQRT(&B)*Rannor(&seeD) END OUTPUT. KEEP OBS1-OBS&N R PROC TRANSPOSE OUT=&DNAME: Data &DNAME SET &DNAMe REN AME COLI=&CNAME RUN PROC ARIMA DA DNAME IDENTIFY VAR=& CNAME NLAG=l ESTIMATE P=1: ZOMEND VaRI The multivariate AR model is defined by dpyt-p+Et What may not be obvious is that a g matrix holds not only the ar coefficients for each process, but also cross-lag coefficients existing between the multiple series collected Consider the case in which a researcher wants to model three 200-observation series hold ing cross-lagged relationships. Again, because the first observation in each series equals the first error, we begin by specifying those codes Program(2.2) generates three series of 200 observations each with a Multivariate AR1 process with cross-lagged relationships. The cross-lagged relationship between Series A and B is 20: between Series A and C is. 10: and between Series B and C is 30 Program(2.3)accumulated the results of 200 replications
2.15 蒙特卡罗模拟 [style=numbers,caption=SAS:产生AR1 序列] 源代码 2.1 OPTIONS MSTORED SASMSTORE=LI; %MACRO AR1(N=50,A=0.7,B=0.3,SEED=−1,CNAME=AR1SER,DNAME= AR1DST); DATA AR; ARRAY OBS OBS1−OBS&N; ∗∗∗ Room is made for observations; OBS(1)=RANNOR(&SEED); ∗∗∗ Generated the first observation; DO J=2 TO &N; OBS(J)=SQRT(&A)∗OBS(J−1)+SQRT(&B)∗RANNOR(&SEED); END; OUTPUT; KEEP OBS1−OBS&N; RUN; PROC TRANSPOSE OUT=&DNAME; DATA &DNAME; SET &DNAME; RENAME COL1=&CNAME; RUN; PROC ARIMA DATA=&DNAME; IDENTIFY VAR=&CNAME NLAG=1; ESTIMATE P=1; RUN; %MEND; %AR1 The multivariate AR model is defined by yt = Φ1yt−1 + Φ2yt−2 + · · · + Φpyt−p + εt What may not be obvious is that a Φ matrix holds not only the AR coefficients for each process,but also cross-lag coefficients existing between the multiple series collected. Consider the case in which a researcher wants to model three 200-observation series holding cross-lagged relationships.Again,because the first observation in each series equals the first error,we begin by specifying those codes . Program (2.2) generates three series of 200 observations each with a Multivariate AR1 process with cross-lagged relationships.The cross-lagged relationship between Series A and B is .20;between Series A and C is .10;and between Series B and C is .30. Program (2.3) accumulated the results of 200 replications. - 24 -
第二章估计方法引论 源代码2.2 Generating Multivariate ARl 1 DATA GENERATE ***each creates room for 200 observations ARRAY SERIEA SERIEA1-SERIEA200 ARRAY SERIEB SERIEBI-SERIEB200 ARRAY SERIEC SERIEC1-SERIEC200 6 ARRAY VARA VAR Al-VAR A200 ARRAY VAR B VAR B1-VAR_ B200 8 ARRAY VAR C VAR C1-VAR__C200 ***generates the first occasion SerieA(1)=rannor(-1) SerieB(1=rannor(-11): B456 VAR A(1)=0 VAR B(1)=0 VARC(1)=0; 890 DO J=2 TO 200: ***k random normal deviates are generated VAR-A(J)=rannor (-1lll VAR B()= rannor(-11111) VAR C()= rannor(-111111); *** the equations which generate the process follow SerieA(J)=VAR-A(J)*SQRT(20)+ SerieA(J-1)*SQRT(.80) SerieB(J)=VAR B()*SQRT(20)+ SerieB(J-1)*SQRT(60)+ SerieA(J-1) SerieC(J)=VAR_C()*SQRT(.50)+SerieC(J-1)*SQRT(.45)+ SerieA(J-1) (10)+ SerieB(J-1)*(.30) END KEEP SERIEAI-SERIEA200 SERIEBI-SERIEB200 SERIECI-SERIEC200 OUTPUT: 34 RUN;
第二章 估计方法引论 源代码 2.2 Generating Multivariate AR1 1 DATA GENERATE; 2 ∗∗∗each creates room for 200 observations; 3 ARRAY SERIEA SERIEA1−SERIEA200; 4 ARRAY SERIEB SERIEB1−SERIEB200; 5 ARRAY SERIEC SERIEC1−SERIEC200; 6 ARRAY VAR A VAR A1−VAR A200; 7 ARRAY VAR B VAR B1−VAR B200; 8 ARRAY VAR C VAR C1−VAR C200; 9 10 ∗∗∗generates the first occasion; 11 SerieA(1)=rannor(−1); 12 SerieB(1)=rannor(−11); 13 SerieC(1)=rannor(−111); 14 15 VAR A(1)=0; 16 VAR B(1)=0; 17 VAR C(1)=0; 18 19 DO J=2 TO 200; 20 ∗∗∗ random normal deviates are generated; 21 VAR A(J) = rannor(−1111); 22 VAR B(J) = rannor(−11111); 23 VAR C(J) = rannor(−111111); 24 ∗∗∗ the equations which generate the process follow ; 25 SerieA(J)=VAR A(J)∗SQRT(.20) + SerieA(J−1)∗SQRT(.80); 26 SerieB(J)=VAR B(J)∗SQRT(.20) + SerieB(J−1)∗SQRT(.60) + SerieA(J−1)∗ (.20); 27 SerieC(J)=VAR C(J)∗SQRT(.50) + SerieC(J−1)∗SQRT(.45) + SerieA(J−1)∗ (.10) + SerieB(J−1)∗(.30); 28 END; 29 30 KEEP SERIEA1−SERIEA200 31 SERIEB1−SERIEB200 32 SERIEC1−SERIEC200; 33 OUTPUT; 34 RUN; - 25 -
源代码2.3 Macro for Multivariate AR 1 OPTIONS LINESIZE=100 NOSOURCE NOSOURCE2 NONOTES 2 IIBNAME MULTITS 'D: SAS DST MYLIB 4 %MACRO MULTITS(REPS, N, VARA, AR AA, VARB, AR BB, AR BA, VARC, AR CC. AR_CAAR_CB SCENARI 6 %DO J=1 %TO&REPS; **k 200 replications are undertaken; 8 DATA GENERATES; **k creates space for the observations ARRAY SERIEA SERIEA1-SERIEA&N: o12 ARRAY SERIEB SERIEB1-SERIEB&N: ARRAY SERIEC SERIECI-SERIEC& N ARRAY VAR_A VAR__A1-VAR_A&N ARRAY VAR B VAR BI-VAR B&N ARRAY VAR C VAR CI-VAR C& SERIEA(1)=RANNOR(1); 567890123 SERIEB(1=RANNOR(11); SERIEC(1)=RANNOR(111); VAR-A(1=0; VAR- B(1=0 VAR_C(1=0 DOJ=2 TO &N: VAR-A(=RANNOR(1111) VAR B(J=RANNORG11111); VAR-CO)=RANNOR(111111); *** generate the mulitvariate process with cross-lagged relationships SERIEA(J=VAR A(J)*SQRT (& vARa)+ sEriEA(J-1)*SQRT(&AR AA) SERIEB(J)=VAR B()*SQRT(&VARB)+ sErieB(J-1)*SQRT(&AR BB) sERiEA(J-1)*(&AR Ba) SERIEC(J)=VAR_C(J)*SQRT(& VARC)+ SEriEC(J-1)*SQRT(&AR CC) sERIEA(-1)*(&AR_CA)+ serIeB(J-1*(&AR CB); END KEEP SERIEA1-SERIEA&N SERIEB1-SERIEB&N SERIECI-SERIEC&N OUTPUT 41 42 RUN 43 *** transpose series a to prepare it for analys 44 DATA GENERATI SET GENERATE&
2.15 源代码 2.3 Macro for Multivariate AR1 1 OPTIONS LINESIZE=100 NOSOURCE NOSOURCE2 NONOTES; 2 lIBNAME MULTITS ’D:\SAS\DST\MYLIB’; 3 4 %MACRO MULTITS (REPS,N,VARA,AR AA,VARB,AR BB,AR BA,VARC,AR CC,AR CA,AR CB,SCENARI); 5 6 %DO J=1 %TO &REPS; ∗∗∗ 200 replications are undertaken; 7 8 DATA GENERATES; ∗∗∗ creates space for the observations; 9 ARRAY SERIEA SERIEA1−SERIEA&N; 10 ARRAY SERIEB SERIEB1−SERIEB&N; 11 ARRAY SERIEC SERIEC1−SERIEC&N; 12 ARRAY VAR A VAR A1−VAR A&N; 13 ARRAY VAR B VAR B1−VAR B&N; 14 ARRAY VAR C VAR C1−VAR C&N; 15 16 SERIEA(1)=RANNOR(−1); 17 SERIEB(1)=RANNOR(−11); 18 SERIEC(1)=RANNOR(−111); 19 VAR A(1)=0; 20 VAR B(1)=0; 21 VAR C(1)=0; 22 23 DO J=2 TO &N; 24 25 VAR A(J)=RANNOR(−1111); 26 VAR B(J)=RANN0R(−11111); 27 VAR C(J)=RANNOR(−111111); 28 29 ∗∗∗ generate the mulitvariate process with cross−lagged relationships; 30 SERIEA(J)=VAR A(J)∗SQRT(&VARA) + SERIEA(J−1)∗SQRT(&AR AA); 31 SERIEB(J)=VAR B(J)∗SQRT(&VARB) + SERIEB(J−1)∗SQRT(&AR BB) 32 + SERIEA(J−1)∗(&AR BA); 33 SERIEC(J)=VAR C(J)∗SQRT(&VARC) + SERIEC(J−1)∗SQRT(&AR CC) 34 + SERIEA(J−1)∗(&AR CA) + SERIEB(J−1)∗(&AR CB); 35 36 END; 37 KEEP SERIEA1−SERIEA&N 38 SERIEB1−SERIEB&N 39 SERIEC1−SERIEC&N; 40 OUTPUT; 41 42 RUN; 43 ∗∗∗ transpose series a to prepare it for analysis ; 44 DATA GENERAT1; 45 SET GENERATE&J; - 26 -