第四章经典单方程计量经济学模型:放宽基本假定的模型 、内容提要 本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模 型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用OLS估计模型所 带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线 性问题以及随机解释变量这四大类问题。 异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS 估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的t检验和F检 验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值 的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法, 如图示法、Park与 Gleiser检验法、 Goldfeld-uand检验法以及 White检验法等。而当检测 出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计 序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类 似,在序列相关存在的情况下,OLS估计量仍具无偏性与一致性,但通常的假设检验不再 可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法 Durbin- Watson检验法以及 Lagrange乘子检验法等。存在序列相关性时,修正的估计方法有 广义最小二乘法(GLS)以及广义差分法。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模 型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性, 这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的 参数的标准差往往较大,从而使得t-统计值减小,参数的显著性下降,导致某些本应存在于 模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模 型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检 验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共 线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰 动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项
第四章 经典单方程计量经济学模型:放宽基本假定的模型 一、内容提要 本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模 型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用 OLS 估计模型所 带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线 性问题以及随机解释变量这四大类问题。 异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS 估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的 t 检验和 F 检 验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值 的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法, 如图示法、Park 与 Gleiser 检验法、Goldfeld-Quandt 检验法以及 White 检验法等。而当检测 出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计。 序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类 似,在序列相关存在的情况下,OLS 估计量仍具无偏性与一致性,但通常的假设检验不再 可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法、 Durbin-Watson 检验法以及 Lagrange 乘子检验法等。存在序列相关性时,修正的估计方法有 广义最小二乘法(GLS)以及广义差分法。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模 型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性, 这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的 参数的标准差往往较大,从而使得 t-统计值减小,参数的显著性下降,导致某些本应存在于 模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模 型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检 验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共 线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰 动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项
同期相关。第一种类型不会对OLS估计带来任何问题。第二种类型则往往导致模型估计的 有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量 是克服偏误的有效途径。第三种类型的OLS估计则既是有偏、也是非一致的,需要采用工 具变量法来加以克服 二、典型例题分析 1、下列哪种情况是异方差性造成的结果? (1)OLS估计量是有偏的 (2)通常的t检验不再服从t分布 (3)OLS估计量不再具有最佳线性无偏性。 解答 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起ωLS估计量出现偏误 2、已知模型 Y=Bo+BX+B2x 式中,Y、X1、X2和Z的数据已知。假设给定权数w,,加权最小二乘法就是求下式中的各 B,以使的该式最小 ∑(wx,)2=∑-R,-Bw,X1-B2w,X2) (1)求RSS对β1、阝2和β2的偏微分并写出正规方程 (2)用Z去除原模型,写出所得新模型的正规方程组。 (3)把w1=1/Z,带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 解答 (1)由RSS=∑1)2=∑(-Bw,-B,X1-B,k2)2对各B求偏导得如 下正规方程组: ∑(0n,y-Bv,-B,X1-B2X2)n,=0 >Ow, Y,-Bow, -, w, X-B,w, X2 )w, X,=0 >(w, Y,-Bow, -B,w, X1-B2w, x2 )w, X=0 (2)用Z去除原模型,得如下新模型
同期相关。第一种类型不会对 OLS 估计带来任何问题。第二种类型则往往导致模型估计的 有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量 是克服偏误的有效途径。第三种类型的 OLS 估计则既是有偏、也是非一致的,需要采用工 具变量法来加以克服。 二、典型例题分析 1、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的 (2)通常的 t 检验不再服从 t 分布。 (3)OLS 估计量不再具有最佳线性无偏性。 解答: 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起 OLS 估计量出现偏误。 2、已知模型 Yt = 0 + 1X1t + 2X2t + ut 2 2 2 ( ) Var ut = t = Zt 式中,Y、X1、X2 和 Z 的数据已知。假设给定权数 wt ,加权最小二乘法就是求下式中的各 β,以使的该式最小 2 0 1 1 2 2 2 ( ) ( ) RSS = wtut = wtYt − wt − wt X t − wt X t (1)求 RSS 对1、2 和2 的偏微分并写出正规方程。 (2)用 Z 去除原模型,写出所得新模型的正规方程组。 (3)把 wt Zt = 1/ 带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 解答: (1)由 2 0 1 1 2 2 2 ( ) ( ) RSS = wtut = wtYt − wt − wt X t − wt X t 对各β求偏导得如 下正规方程组: (wtYt − 0wt − 1wt X1t − 2wt X2t )wt = 0 (wtYt − 0wt − 1wt X1t − 2wt X2t )wt X1t = 0 (wtYt − 0wt − 1wt X1t − 2wt X2t )wt X1t = 0 (2)用 Z 去除原模型,得如下新模型
Y-Bo+B7+B2z,z, 对应的正规方程组如下所示: B1-B2 Y B X X. X B1--B2-)2=0 B1--B2-) (3)如果用一代替(1)中的,则容易看到与(2)中的正规方程组是一样的 3、已知模型 =B+B1X1+B2X2+l1 式中,为某公司在第i个地区的销售额:x1为该地区的总收入:X21为该公司在该地区 投入的广告费用(i=0,1,2 (1)由于不同地区人口规模P可能影响着该公司在该地区的销售,因此有理由怀疑随 机误差项山是异方差的。假设σ,依赖于总体P的容量,请逐步描述你如何对此进行检验 需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包 括自由度):4)接受或拒绝零假设的标准。 (2)假设σ=σP。逐步描述如何求得BLUE并给出理论依据 解答: (1)如果σ依赖于总体P的容量,则随机扰动项的方差σ2依赖于P2。因此,要进 行的回归的一种形式为a2=a+a1P2+E;。于是,要检验的零假设H:ax1=0,备择 假设Hl:a1≠0。检验步骤如下: 第一步:使用OLS方法估计模型,并保存残差平方项2 第二步:做e2对常数项C和P2的回归 第三步:考察估计的参数a1的t统计量,它在零假设下服从自由度为2的t分布。 第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值, 如果估计的参数a1的t统计值大于该临界值,则拒绝同方差的零假设
t t t t t t t t t Z u Z X Z X Z Z Y = + + + 2 2 1 1 0 对应的正规方程组如下所示: 0 1 ( ) 2 2 1 1 0 − − − = t t t t t t t t Z Z X Z X Z Z Y ( ) 0 2 1 2 1 1 0 − − − = t t t t t t t t t Z X Z X Z X Z Z Y ( ) 0 2 2 2 1 1 0 − − − = t t t t t t t t t Z X Z X Z X Z Z Y (3)如果用 1 Zt 代替(1)中的 wt ,则容易看到与(2)中的正规方程组是一样的。 3、已知模型 Yi = 0 + 1X1i + 2X2i + ui 式中, Yi 为某公司在第 i 个地区的销售额; X1i 为该地区的总收入; X 2i 为该公司在该地区 投入的广告费用(i=0,1,2……,50)。 (1)由于不同地区人口规模 Pi 可能影响着该公司在该地区的销售,因此有理由怀疑随 机误差项 ui 是异方差的。假设 i 依赖于总体 Pi 的容量,请逐步描述你如何对此进行检验。 需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包 括自由度);4)接受或拒绝零假设的标准。 (2)假设 i = Pi 。逐步描述如何求得 BLUE 并给出理论依据。 解答: (1)如果 i 依赖于总体 Pi 的容量,则随机扰动项的方差 2 i 依赖于 2 Pi 。因此,要进 行的回归的一种形式为 i Pi i = + + 2 0 1 2 。于是,要检验的零假设 H0: 1 = 0 ,备择 假设 H1:1 0 。检验步骤如下: 第一步:使用 OLS 方法估计模型,并保存残差平方项 ~2 i e ; 第二步:做 ~2 i e 对常数项 C 和 2 Pi 的回归 第三步:考察估计的参数 1 的 t 统计量,它在零假设下服从自由度为 2 的 t 分布。 第四步:给定显著性水平面 0.05(或其他),查相应的自由度为 2 的 t 分布的临界值, 如果估计的参数 1 ˆ 的 t 统计值大于该临界值,则拒绝同方差的零假设
(2)假设σ.=OP时,模型除以P有: u Bo+B,+B, P PP 由于Wam(u1/P)=a2/P2=a2,所以在该变换模型中可以使用OLS方法,得出BLUE估 计值。方法是对Y/P关于1/P、X1/P、X21P做回归,不包括常数项。 4、以某地区22年的年度数据估计了如下工业就业回归方程 Y=-389+0.5hx1-0.25hX2+0.62nX3 (-0.56)(2.3) (-1.7) R=0.996 DW=1.147 式中,Y为总就业量:X1为总收入:X2为平均月工资率;X3为地方政府的总支出 (1)试证明:一阶自相关的DW检验是无定论的 2)逐步描述如何使用LM检验 解答: )由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临 界值为d=1.664、d1=1.503。由于DW=1.147位于这两个值之间,所以DW检验是无 定论的 (2)进行LM检验 第一步,做Y关于常数项、lnX1、lnX2和lnX3的回归并保存残差e,; 第二步,做E关于常数项、lnX1、lX2和lnX3和E的回归并计算R2; 第三步,计算检验统计值(n-l)R=21×0.996=20.916; 第四步,由于在不存在一阶序列相关的零假设下(n-1)R2呈自由度为1的x2分布。在5% 的显著性水平下,该分布的相应临界值为3.841。由于20.916>3.841,因此拒绝零假设,意 味着原模型随机扰动项存在一阶序列相关 5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型: water=-3269+0.305/ouse+0.363pop-0.005pcy-1787prce-1.123uin (-1.7)(0.9) (1.4) R2=0.93 F=38.9 式中, water—一用水总量(百万立方米), house—一住户总数(千户),pop-总人口(千 人),pcy-一人均收入(元), price-一价格(元/100立方米),rain-一降雨量(毫米)
(2)假设 i = Pi 时,模型除以 Pi 有: i i i i i i i i i P u P X P X P P Y = + + + 2 2 1 0 1 1 由于 2 2 2 Var(ui / Pi ) = i / Pi = ,所以在该变换模型中可以使用 OLS 方法,得出 BLUE 估 计值。方法是对 Yi Pi / 关于 Pi 1/ 、 X i Pi / 1 、 X i Pi / 2 做回归,不包括常数项。 4、以某地区 22 年的年度数据估计了如下工业就业回归方程 1 2 3 Y = −3.89 + 0.51ln X − 0.25ln X + 0.62ln X (-0.56)(2.3) (-1.7) (5.8) 2 R = 0.996 DW =1.147 式中,Y 为总就业量;X1 为总收入;X2 为平均月工资率;X3 为地方政府的总支出。 (1)试证明:一阶自相关的 DW 检验是无定论的。 (2)逐步描述如何使用 LM 检验 解答: (1)由于样本容量 n=22,解释变量个数为 k=3,在 5%在显著性水平下,相应的上下临 界值为 dU = 1.664、dL =1.503 。由于 DW=1.147 位于这两个值之间,所以 DW 检验是无 定论的。 (2)进行 LM 检验: 第一步,做 Y 关于常数项、lnX1、lnX2 和 lnX3 的回归并保存残差 t e ~ ; 第二步,做 t e ~ 关于常数项、lnX1、lnX2 和 lnX3 和 1 ~ t− e 的回归并计算 2 R ; 第三步,计算检验统计值(n-1) 2 R =210.996=20.916; 第四步,由于在不存在一阶序列相关的零假设下(n-1) 2 R 呈自由度为 1 的 2 分布。在 5% 的显著性水平下,该分布的相应临界值为 3.841。由于 20.916>3.841,因此拒绝零假设,意 味着原模型随机扰动项存在一阶序列相关。 5、某地区供水部门利用最近 15 年的用水年度数据得出如下估计模型: water = −326.9 + 0.305house + 0.363pop − 0.005pcy −17.87 price −1.123rain (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8) 0.93 2 R = F=38.9 式中,water——用水总量(百万立方米),house——住户总数(千户),pop——总人口(千 人),pcy——人均收入(元),price——价格(元/100 立方米),rain——降雨量(毫米)
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符 号与你的直觉相符吗? (2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T检验与F检验结 果有相矛盾的现象吗? 3)你认为估计值是(1)有偏的:(2)无效的或(3)不一致的吗?详细阐述理由 解答: (1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越 高。所以可期望 house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期 符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期 price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可 以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的 这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所 有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。 这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值 为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的 T检验与F检验结果的矛盾可能是由于多重共线性造成的。 house、pop、pey都是高度 相关的,这将使它们的t-值降低且表现为不显著。 prIce和rain不显著另有原因。根据经 验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好 地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况 下,近似共线并不意味着基本假定的任何改变,所以0LS估计量的无偏性、一致性和有效性 仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线 性的情况。 6、一个对某地区大学生就业增长影响的简单模型可描述如下 gEMP=Po+BigMN+B2gPOP+B,gGDP+ B4gGDP+A 式中,为新就业的大学生人数,MN1为该地区最低限度工资,POP为新毕业的大学生人数 GDPl为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。 (1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为 基础来选择最低限度工资,则OLS估计将会存在什么问题? (2)令MN为该国的最低限度工资,它与随机扰动项相关吗? (3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMN能成为 gMINI 的工具变量吗? 解答: (1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景 来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符 号与你的直觉相符吗? (2)在 10%的显著性水平下,请进行变量的 t-检验与方程的 F-检验。T 检验与 F 检验结 果有相矛盾的现象吗? (3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。 解答: (1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越 高。所以可期望 house 和 pop 的符号为正;收入较高的个人可能用水较多,因此 pcy 的预期 符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期 price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可 以期望 rain 的系数符号为负。从估计的模型看,除了 pcy 之外,所有符号都与预期相符。 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。 这里 t-检验的自由度为 15-5-1=9,在 10%的显著性水平下的临界值为 1.833。可见,所 有参数估计值的 t 值的绝对值都小于该值,所以即使在 10%的水平下这些变量也不是显著的。 这里,F-统计值的分子自由度为 5,分母自由度为 9。10%显著性水平下 F 分布的临界值 为 2.61。可见计算的 F 值大于该临界值,表明回归系数是联合显著的。 T 检验与 F 检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy 都是高度 相关的,这将使它们的 t-值降低且表现为不显著。price 和 rain 不显著另有原因。根据经 验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好 地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度 量。 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况 下,近似共线并不意味着基本假定的任何改变,所以 OLS 估计量的无偏性、一致性和有效性 仍然成立,即仍是 BLUE 估计量。但共线性往往导致参数估计值的方差大于不存在多重共线 性的情况。 6、一个对某地区大学生就业增长影响的简单模型可描述如下 gEMPt = 0 + 1gMIN1t + 2 gPOP + 3 gGDP1t + 4 gGDPt + t 式中,为新就业的大学生人数,MIN1 为该地区最低限度工资,POP 为新毕业的大学生人数, GDP1 为该地区国内生产总值,GDP 为该国国内生产总值;g 表示年增长率。 (1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为 基础来选择最低限度工资,则 OLS 估计将会存在什么问题? (2)令 MIN 为该国的最低限度工资,它与随机扰动项相关吗? (3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么 gMIN 能成为 gMIN1 的工具变量吗? 解答: (1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景 来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型