第十四章其他回归方法 本章讨论加权最小二乘估计,异方差性和自相关一致协 方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘 估计和广义矩估计(GMM)。这里的大多数方法在“联立方 程系统”一章中也适用
1 第十四章 其他回归方法 本章讨论加权最小二乘估计,异方差性和自相关一致协 方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘 估计和广义矩估计(GMM)。这里的大多数方法在“联立方 程系统”一章中也适用
线性回归模型的基本假设 y,=Bo+B,x+B B,xk+ 在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出 若干基本假设: 1.解释变量之间互不相关: 2.随机误差项具有0均值和同方差。即 E(l1)=0 arlu 即随机误差项的方差是与观测时点t无关的常数 3.不同时点的随机误差项互不相关(序列不相关),即 Covu,,u_=0 s≠O,i=1,2,…,n 4.随机误差项与解释变量之间互不相关。即 Cov(,u=0 k 随机误差项服从0均值、同方差的正态分布。即 1~N(0,a2 当随机误差项满足假定1~4时,将回归模型称为“标准回归模型”,当随机 误差项淸足偎定1~5时,将回归模型称为“标准正态回归模型”。如果实际模型 满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型
2 线性回归模型的基本假设 t i i k ki ui y = 0 + 1 x1 + 2 x2 ++ x + i = 1 , 2 , … , n 在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出 若干基本假设: 1.解释变量之间互不相关; 2.随机误差项具有0均值和同方差。即 E(ui ) = 0 2 Var(ui ) = i = 1 , 2 , … , n 即随机误差项的方差是与观测时点t无关的常数; 3.不同时点的随机误差项互不相关(序列不相关),即 Cov(ui ,ui−s ) = 0 4.随机误差项与解释变量之间互不相关。即 Cov(x ji ,ui ) = 0 5.随机误差项服从0均值、同方差的正态分布。即 ui ~ (0, ) 2 N 当随机误差项满足假定1 ~ 4时,将回归模型称为“标准回归模型”,当随机 误差项满足假定1 ~ 5时,将回归模型称为“标准正态回归模型”。如果实际模型 满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型。 j = 1 , 2 , … , k , i = 1 , 2 , … , n i = 1 , 2 , … , n s ≠ 0, i = 1 , 2 , … , n
§141加权最小二乘估计 古典线性回归模型的一个重要假设是总体回归方程的随机扰 动项同方差,即他们具有相同的方差σ如果随机扰动项的方 差随观测值不同而异,即1的方差为a2,就是异方差。用符号 表示异方差为E(2)=a 异方差性在许多应用中都存在,但主要出现在截面数据分析 中。例如我们调査不同规模公司的利润,会发现大公司的利润变 化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小 公司利润的方差大。利润方差的大小取决于公司的规模、产业特 点、研究开发支出多少等因素。又如在分析家庭支出模式时,我 们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大 的方差
3 古典线性回归模型的一个重要假设是总体回归方程的随机扰 动项 同方差,即他们具有相同的方差 。如果随机扰动项的方 差随观测值不同而异,即 的方差为 ,就是异方差。用符号 表示异方差为 。 异方差性在许多应用中都存在,但主要出现在截面数据分析 中。例如我们调查不同规模公司的利润,会发现大公司的利润变 化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小 公司利润的方差大。利润方差的大小取决于公司的规模、产业特 点、研究开发支出多少等因素。又如在分析家庭支出模式时,我 们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大 的方差。 ui 2 2 i 2 2 ( ) E ui = i ui §14.1 加权最小二乘估计
表1中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出 单位:元 变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出 地区 CUM 地区 CUM 甘肃40961 15960 新疆500.79 212.30 山西 4098.73 137.11 河北508464 270.09 宁夏 4112.41 231.51 四川5127.08 212.46 吉林 4206.64 17265 山东5380.08 255.53 河南 421942 193.65 广西5412.24 252.37 陕西 4220.24 191.76 湖南|5434.26 255.79 青海 4240.13 197.04 重庆5466.57 337.83 江西 4251.42 17639 江苏6017.85 255.65 黑龙江 4268.50 185.78 云南6042.78 266.48 内蒙古435302 206.91 福建648563 346.75 贵州 4565.39 227.21 天津|711054 258.56 辽宁 4617.24 201.87 浙江7836.76 388.79 安徽 4770.47 237.16 北京847198 36954 湖北 4826.36 214.37 上海8773.10 384.49 海南 4852.87 265.98 广东883968 640.56
4 变量 可支配收入 交通和通讯支出 变量 可支配收入 交通和通讯支出 地区 IN CUM 地区 IN CUM 甘 肃 山 西 宁 夏 吉 林 河 南 陕 西 青 海 江 西 黑龙江 内蒙古 贵 州 辽 宁 安 徽 湖 北 海 南 4009.61 4098.73 4112.41 4206.64 4219.42 4220.24 4240.13 4251.42 4268.50 4353.02 4565.39 4617.24 4770.47 4826.36 4852.87 159.60 137.11 231.51 172.65 193.65 191.76 197.04 176.39 185.78 206.91 227.21 201.87 237.16 214.37 265.98 新 疆 河 北 四 川 山 东 广 西 湖 南 重 庆 江 苏 云 南 福 建 天 津 浙 江 北 京 上 海 广 东 5000.79 5084.64 5127.08 5380.08 5412.24 5434.26 5466.57 6017.85 6042.78 6485.63 7110.54 7836.76 8471.98 8773.10 8839.68 212.30 270.09 212.46 255.53 252.37 255.79 337.83 255.65 266.48 346.75 258.56 388.79 369.54 384.49 640.56 表1 中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出 单位:元
我们研究人均家庭交通及通讯支出(CUM和可支配收入(ⅣN)的关系, 考虑如下方程:CUM=B+B1N+l 利用普通最小二乘法,得到如下回归模型 CUM-56917+0.05807*N (1.57)(8.96) R2=0.74DW=200 CUM VS IN 70o 6OO 5Oo 400 300 200 10O 2000 4000 6OOO
5 我们研究人均家庭交通及通讯支出(CUM)和可支配收入(IN )的关系, 考虑如下方程: CUM=B0 + B1 IN + ui 利用普通最小二乘法,得到如下回归模型: CUM= -56.917+ 0.05807*IN (1.57) (8.96) R2=0.74 D.W.=2.00 100 200 300 400 500 600 700 2000 4000 6000 8000 10000 IN CUM CUM vs. IN