第二章经典单方程计量经济学模型:一元线性回归模型 、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归 函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回 归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是 建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总 体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS 的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所 谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”, 第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检 验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成:第-ˉ 检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以 及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。 其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性 与一致性构成了对样本估计量优劣的最主要的衡量准则 Goss-markov定理表明OLS估计量 是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个 值的预测,以及预测置信区间的计算及其变化特征。 典型例题分析 例1、令kds表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为 kids=Po+B,educ+A
1 第二章 经典单方程计量经济学模型:一元线性回归模型 一、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归 函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回 归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是 建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总 体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS) 的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所 谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”, 第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检 验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的 t 检验完成;第二, 检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以 及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。 其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性 与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov 定理表明 OLS 估计量 是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个 值的预测,以及预测置信区间的计算及其变化特征。 二、典型例题分析 例 1、令 kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为 kids = 0 + 1 educ +
(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答 (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上 述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如 收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰 动项相关的情形,基本假设4不满足。 例2.已知回归模型E=a+N+,式中E为某类公司一名新员工的起始薪金(元), N为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释a和B。 (2)OLS估计量a和B满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由 解答 (1)α+BN为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金 为α,因此α表示没有接受过教育员工的平均起始薪金。B是每单位N变化所引起的E的 变化,即表示每多接受一年学校教育所对应的薪金增加值 (2)OLS估计量a和仍β满足线性性、无偏性及有效性,因为这些性质的的成立无需 随机扰动项的正态分布假设。 (3)如果1的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立 在的正态分布假设之上的。 例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的 截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距 项与斜率项有无变化? 解答 首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则
2 (1)随机扰动项 包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答: (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上 述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如 收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平 educ 相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰 动项相关的情形,基本假设 4 不满足。 例 2.已知回归模型 E = + N + ,式中 E 为某类公司一名新员工的起始薪金(元), N 为所受教育水平(年)。随机扰动项 的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释 和 。 (2)OLS 估计量 ˆ 和 ˆ 满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 解答: (1) + N 为接受过 N 年教育的员工的总体平均起始薪金。当 N 为零时,平均薪金 为 ,因此 表示没有接受过教育员工的平均起始薪金。 是每单位 N 变化所引起的 E 的 变化,即表示每多接受一年学校教育所对应的薪金增加值。 (2)OLS 估计量 ˆ 和仍 ˆ 满足线性性、无偏性及有效性,因为这些性质的的成立无需 随机扰动项 的正态分布假设。 (3)如果 t 的分布未知,则所有的假设检验都是无效的。因为 t 检验与 F 检验是建立 在 的正态分布假设之上的。 例 3、在例 2 中,如果被解释变量新员工起始薪金的计量单位由元改为 100 元,估计的 截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距 项与斜率项有无变化? 解答: 首先考察被解释变量度量单位变化的情形。以 E*表示以百元为度量单位的薪金,则
E=E*×100=a+BN+ 由此有如下新模型 E*=(a/100)+(B/100)N+(4/100) 或 E*=a*+B*N+* 这里a*=a/100,β=B/100。所以新的回归系数将为原始模型回归系数的1/100 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度, 则N*=12N,于是 E=a+BN+4=a+B(N*/12)+ 或 E=a+(B/12)N*+ 可见,估计的截距项不变,而斜率项将为原回归系数的1/12 例4、对没有截距项的一元回归模型 =B1X1+H1 称之为过原点回归( regrission through the origin)。试证明 (1)如果通过相应的样本回归模型可得到通常的的正规方程组 ∑e 则可以得到B1的两个不同的估计值:B=F/,A=C∑X)C∑x (2)在基本假设E()=0下,B1与B1均为无偏估计量。 (3)拟合线Y=B1X通常不会经过均值点(X,Y),但拟合线Y=B1X则相反。 (4)只有B1是B1的OLS估计量。 解答 (1)由第一个正规方程∑e=0得 ∑(-1X) 或 ∑=B∑X 求解得 B=Y/X
3 E = E *100 = + N + 由此有如下新模型 E* = ( /100) + ( /100)N + ( /100) 或 E* = *+ * N + * 这里 * = /100, * = /100 。所以新的回归系数将为原始模型回归系数的 1/100。 再考虑解释变量度量单位变化的情形。设 N*为用月份表示的新员工受教育的时间长度, 则 N*=12N,于是 E = + N + = + (N * /12) + 或 E = + ( /12)N *+ 可见,估计的截距项不变,而斜率项将为原回归系数的 1/12。 例 4、对没有截距项的一元回归模型 Yi = 1Xi + i 称之为过原点回归(regrission through the origin)。试证明 (1)如果通过相应的样本回归模型可得到通常的的正规方程组 = = 0 0 i i i e X e 则可以得到 1 的两个不同的估计值: 1 = Y X ~ , = ( ) ( ) 2 1 ˆ XiYi Xi 。 (2)在基本假设 E(i ) = 0 下, 1 ~ 与 1 ˆ 均为无偏估计量。 (3)拟合线 Y ˆ = ˆ 1X 通常不会经过均值点 (X,Y ) ,但拟合线 Y 1X ~ ~ = 则相反。 (4)只有 1 ˆ 是 1 的 OLS 估计量。 解答: (1)由第一个正规方程 et = 0 得 ) 0 ~ ( Yt − 1Xt = 或 Yt = 1Xt ~ 求解得 Y / X ~ 1 =
由第2个下规方程∑X(-Bx,)=0得 ∑X,H,=B∑X2 求解得 月=C∑x,H)∑X) (2)对于B1=Y/X,求期望 (B)=EY X)n E[-(B1X1+1) [E{ B, XL)+E(W, ) X X B1=B1 这里用到了X的非随机性。 对于B=C∑XH)∑H),求期望 E(A)=E∑X∑X2) (vE(X, Y,)(vELX, (B,X,+u) ∑∑(x)+(2X,E(A)=B (3)要想拟合值=X通过点(x,),BR必须等于F。但Bx=∑xy,x 通常不等于Y。这就意味着点(X,)不太可能位于直线Y=BX上。 相反地,由于BX=Y,所以直线Y=BX经过点(X,)。 (4)OLS方法要求残差平方和最小 Min rss=∑2=∑(-B1X1) 关于B1求偏导得 aS=2>(1-BH-X)=0 aB ∑X(x,-B1X)=0 A=CX)∑x2)
4 由第 2 个下规方程 ) 0 ˆ ( Xt Yt − 1Xt = 得 = 2 1 ˆ t t XtY X 求解得 ( )/( ) ˆ 2 1 = XtYt Xt (2)对于 Y / X ~ 1 = ,求期望 1 1 1 1 1 [ { ) ( )] 1 ( )] 1 [ 1 ) ( ) ~ ( = = = + = = + X X E n X E X X n E X E E Y X t t t t 这里用到了 Xt 的非随机性。 对于 ( )/( ) ˆ 2 1 = XtYt Xt ,求期望 ) ( / ) ˆ ( 2 E 1 = E XtYt Xt 2 1 2 2 1 2 2 1 ) ( ) 1 ) ( ) ( 1 ( ) [ ( )] 1 ) ( ) ( 1 ( = + = = = + t t t t t t t t t t t t X E X X X E X X X E X Y X (3)要想拟合值 Y ˆ = ˆ 1X 通过点 (X,Y ) , ˆ 1X 必须等于 Y 。但 X X X Y X t t t = 1 2 ˆ , 通常不等于 Y 。这就意味着点 (X,Y ) 不太可能位于直线 Y ˆ = ˆ 1X 上。 相反地,由于 1X = Y ~ ,所以直线 Y 1X ~ ˆ = 经过点 (X,Y ) 。 (4)OLS 方法要求残差平方和最小 Min = = − 2 1 2 ) ˆ ( t Yt Xt RSS e 关于 1 ˆ 求偏导得 )( ) 0 ˆ 2 ( ˆ 1 1 = − − = Yt Xt Xt RSS 即 ) 0 ˆ ( Xt Yt − 1Xt = = ( ) ( ) 2 1 ˆ XiYi Xi
可见B1是OLS估计量。 例5.假设模型为H=a+BX,+1。给定n个观察值(X1,Y1),(X2,H2),…… (xnn),按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来 并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜 最后对这些斜率取平均值,称之为β,即β的估计值 (1)画出散点图,给出B的几何表示并推出代数表达式 (2)计算β的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解 释理由。 3)证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。 解答: (1)散点图如下图所示。 (Xn.Y) (X1,Y1) 首先计算每条直线的斜率并求平均斜率。连接(X1,H1)和(X)的直线斜率为 (X-H1)A(x,-X1)。由于共有n-1条这样的直线,因此 B= (2)因为X非随机且E(P1)=0,因此 (a+B,+)-(+B+A1=B+E[A-A]=B XI 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏 (3)根据高斯一马尔可夫定理,只有β的OLS估计量是最付佳线性无偏估计量,因此, 这里得到的B的有效性不如B的OLS估计量,所以较差
5 可见 1 ˆ 是 OLS 估计量。 例 5.假设模型为 Yt = + Xt + t 。给定 n 个观察值 ( , ) X1 Y1 , ( , ) X2 Y2 ,…, ( , ) Xn Yn ,按如下步骤建立 的一个估计量:在散点图上把第 1 个点和第 2 个点连接起来 并计算该直线的斜率;同理继续,最终将第 1 个点和最后一个点连接起来并计算该条线的斜 率;最后对这些斜率取平均值,称之为 ˆ ,即 的估计值。 (1)画出散点图,给出 ˆ 的几何表示并推出代数表达式。 (2)计算 ˆ 的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解 释理由。 (3)证明为什么该估计值不如我们以前用 OLS 方法所获得的估计值,并做具体解释。 解答: (1)散点图如下图所示。 (X2,Y2) (Xn,Yn) (X1,Y1) 首先计算每条直线的斜率并求平均斜率。连接 ( , ) X1 Y1 和 ( , ) Xt Yt 的直线斜率为 ( )/( ) Yt −Y1 Xt − X1 。由于共有 n -1 条这样的直线,因此 [ ] 1 1 ˆ 2 1 1 = = − − − = t n t t t X X Y Y n (2)因为 X 非随机且 E(t ) = 0 ,因此 = − − = + − + + − + + = − − ] [ ] ( ) ( ) [ ] [ 1 1 1 1 1 1 1 X X E X X X X E X X Y Y E t t t t t t t 这意味着求和中的每一项都有期望值 ,所以平均值也会有同样的期望值,则表明是无偏 的。 (3)根据高斯-马尔可夫定理,只有 的 OLS 估计量是最付佳线性无偏估计量,因此, 这里得到的 ˆ 的有效性不如 的 OLS 估计量,所以较差