第三章K元线性回归模型 一、填空题 1.对于模型Y,=B。+BX,1+B2X2+.+BX+4,i=1,2n,一般经验认为 满足模型估计的基本要求的样本容量为】 2.对于总体线性回归模型y,=B。+B,X,+B,X2+B,Xa+4:,运用最小二乘法欲 得到参数估计量,所要求的最小样本容量n应满足或至少 3.多元线性计量经济学模型的矩阵形式 。,对应的样本线性回归模型的矩 阵形式 ,模型的最小二乘参数估计量」 及其方差估计 量 4.总平方和可以分解为 和 ,可决系数为 5.多元回归方程中每个解释变量的系数B(偏回归系数),指解释变量变化一个单位引 起的被解释变量平均变化 个单位 6.线性模型的含义,就变量而言,指的是回归模型变量的 ;就参数而言,指 的是回归横型中参数的 ·通常线性回归横型指的是 二、问答题 1,什么是多元回归模型?它与一元、二元回归模型有何区别? 2.极大似然法(maximum likehood)的原理是什么? 3.什么是拟合优度(R2)检验?有什么作用? 4.可决系数R低的可能的原因是什么? 5,多元回归的判断系数R具有什么性质?运用2时应注意什么问题? 6·多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有 效性的过程中,哪些基本假设起了作用? 7.说明区间估计的含义 三、实践题
第三章 K 元线性回归模型 一、填空题 1. 对于模型 Yi = 0 + 1Xi1 + 2Xi2 ++ k Xik + ui ,i=1,2,.,n,一般经验认为, 满足模型估计的基本要求的样本容量为_ _ 2. 对于总体线性回归模型 Yi = 0 + 1Xi1 + 2Xi2 + 3Xi3 + ui ,运用最小二乘法欲 得到参数估计量,所要求的最小样本容量 n 应满足 或至少_。 3. 多元线性计量经济学模型的矩阵形式 ,对应的样本线性回归模型的矩 阵形式 ,模型的最小二乘参数估计量 及其方差估计 量 。 4. 总平方和可以分解为 和 ,可决系数为 。 5. 多元回归方程中每个解释变量的系数 β(偏回归系数),指解释变量变化一个单位引 起的被解释变量平均变化 个单位。 6. 线性模型的含义,就变量而言,指的是回归模型变量的 ;就参数而言,指 的是回归模型中参数的 。通常线性回归模型指的是 。 二、问答题 1. 什么是多元回归模型?它与一元、二元回归模型有何区别? 2. 极大似然法(maximum likehood)的原理是什么? 3. 什么是拟合优度(R 2)检验?有什么作用? 4. 可决系数 R 2 低的可能的原因是什么? 5. 多元回归的判断系数 R 2 具有什么性质?运用 R 2 时应注意什么问题? 6. 多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有 效性的过程中,哪些基本假设起了作用? 7. 说明区间估计的含义。 三、实践题
1.下表给出三变量模型的回归结果: 亚和LSS 同口亚方nF 65965 残美平方和RSS) 66042 14 要求:(1)样本容量是多少?(2)求RSS?(3)ESS和RSS的自由度各是多少?(4) 求R和R?(5)检验假设:X,和X2对y无影响。你用什么假设检验?为什么?(6)根 据以上信息,你能否确定X,和X,各自对y的贡献吗? 2.下面给出依据15个观察值计算得到的数据,其中小写字母代表了各值与其样本均值 的离差。 7=367.693,X1=4m.70,x2=8.0,∑y=66042.269 ∑x7=84855.09%,∑x3=280.0,∑yxu=74778.346 ∑yx2=4250.9,∑xwx2=4796.0 要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出R2与R2?(3) 估计A、P295%的置信区间:(4)在a-5%下,检验估计的海个回归系数的统计显著性(双 尾检验):(5)给出方差分析表 3.考虑以下方程(括号内为估计标准差):n=19,R2=0.873 +03686+005-266 ∥=8.562+0.364+0.004- 其中:W一1年的每位雇员的工资和薪水;P一1年的物价水平;U一1年的失业率。 要求:(1)对个人收入估计的斜率系数进行假设检验; (2)讨论P,-在理论上的正确性,对本横型的正确性进行讨论;P-是否应从方程中 除?为什么?
1.下表给出三变量模型的回归结果: 方差来源 平方和(SS) 自由度(d.f.) 均方差(MSS) 回归平方和(ESS) (RSS)EEESS(ESSEEES(ESS) 65965 残差平方和(RSS) 总平方和(TSS) 66042 14 要求:(1)样本容量是多少?(2)求 RSS?(3)ESS 和 RSS 的自由度各是多少?(4) 求 2 R 和 2 R ?(5)检验假设: X1 和 X2 对 Y 无影响。你用什么假设检验?为什么?(6)根 据以上信息,你能否确定 X1 和 X2 各自对 Y 的贡献吗? 2.下面给出依据 15 个观察值计算得到的数据,其中小写字母代表了各值与其样本均值 的离差。 Y = 367.693 , X 1 = 402.760 , X 2 = 8.0 , 66042.269 2 yi = 84855 .096 2 x1i = , 280.0 2 x2i = , yi x1i = 74778 .346 yi x2i = 4250 .9 , x1i x2i = 4796 .0 要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出 2 R 与 2 R ?(3) 估计 1、 2 95%的置信区间;(4)在 = 5% 下,检验估计的每个回归系数的统计显著性(双 尾检验);(5)给出方差分析表。 3.考虑以下方程(括号内为估计标准差): n =19, 0.873 2 R = (0.080) (0.072) (0.658) 8.562 0.364 0.004 2.560 ˆWi = + Pt + Pt −1 − Ut 其中: W —t 年的每位雇员的工资和薪水; P —t 年的物价水平; U — t 年的失业率。 要求:(1)对个人收入估计的斜率系数进行假设检验; (2)讨论 Pt−1 在理论上的正确性,对本模型的正确性进行讨论; Pt−1 是否应从方程中 删除?为什么?
4.克莱因和戈德伯格曾用1921-1941年与1945-1950年(1942-1944年战净期间略去) 美国国内消费C和工资收入W、非工资一非农业收入P、农业收入A的供27年时间序列资 料,利用普通最小二乘法估计得出了下列回归方程: G823+05+02+02.R2=095,F=10737 式中括号中的数字为相应参数估计量的标准误。试对该模型进行评价,指出其中存在的问 题。(显若性水平a=5%,已知(623)=3.03,tm(23)=2069) 5.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 edu=10.36-0.094sbs+0.131medu+0.210fedu,R2=0.214 式中,cdu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,mcdu与fed 分别为母亲与父亲受到教育的年数。问 (1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教 育水平减少一年,需要sibs增加多少? (2)请对medu的系数给予适当的解释。 (3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另 个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 6.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1) 与利润占销售额的此重(X2)为解释变量,一个有32个企业的样本估计结果如下】 Y=0.472+0.321ogX1)+0.05X2 1.37)(0.22)(0.046,R2=0.099 其中括号中为系数估计值的标准差 (1)解释1og(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济 上是一个很大的影响吗?
4.克莱因和戈德伯格曾用 1921-1941 年与 1945-1950 年(1942-1944 年战争期间略去) 美国国内消费 C 和工资收入 W、非工资—非农业收入 P、农业收入 A 的共 27 年时间序列资 料,利用普通最小二乘法估计得出了下列回归方程: (8.92) (0.17) (0.452) (1.09) Ct = 8.133+1.059Wt + 0.452Pt + 0.121At , 0.95, F 107.37 2 R = = 式中括号中的数字为相应参数估计量的标准误。试对该模型进行评价,指出其中存在的问 题。(显著性水平 = 5% ,已知 F0.05 (3,23) = 3.03, t 0.025 (23) = 2.069 ) 5.某地区通过一个样本容量为 722 的调查数据得到劳动力受教育的一个回归方程为 edu = 10.36 − 0.094sibs + 0.131medu + 0.210 fedu ,R 2=0.214 式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与 fedu 分别为母亲与父亲受到教育的年数。问 (1)sibs 是否具有预期的影响?为什么?若 medu 与 fedu 保持不变,为了使预测的受教 育水平减少一年,需要 sibs 增加多少? (2)请对 medu 的系数给予适当的解释。 (3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为 12 年,另一 个的父母受教育的年数为 16 年,则两人受教育的年数预期相差多少? 6.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1) 与利润占销售额的比重(X2)为解释变量,一个有 32 个企业的样本估计结果如下: (1.3 7) (0.2 2) (0.046) , 0.099 0.472 0.3 2log( ) 0.0 5 2 1 2 = = + + R Y X X 其中括号中为系数估计值的标准差。 (1)解释 log(X1)的系数。如果 X1 增加 10%,估计 Y 会变化多少个百分点?这在经济 上是一个很大的影响吗?
(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的 设。分别在5%和10%的显著性水平上进行这个检验。 (3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响? (3)对X2,参数估计值的1统计值为005046=1.087,它比在10%的显著性水平下的 临界值还小,因此可以认为它对Y在统计上没有显著的影响。 7,下表为有关经批准的私人住房单位及其决定因素的4个植型的估计量知相关统计值 (括号内为-值)(如果某项为空,则意味着模型中没有此变量,数据为美国40个城市的 数据。模型如下: housin g=Bo +B density +Bvalue +Bincome+Ba popchang +B;unemp+B localtax+Bstatetax+u 式中housing-—实际颁发的建筑许可证数量density—每平方英里的人口密度,value-一 自由房屋的均值(单位:百美元),income一平均家庭的收入(单位:干美元) popchang- -1980-1992年的人口增长百分比,unemp-一失业率,localtax一 一人均交纳的 地方税,statetax- 一人均缴纳的州税 变量 模型A 横型B 模型Cc 模型D c 813(0.74) -392(0.81) -1279(0.34) -973(0.44) Density 0.075(0.43) 0.062(0.32) 0.0420.47 Value -08550131 -0.873(0.11) -0.994(0.06) -0.778(0.07 Income 133.03(0.04) 125.710.05 1660(006 Popchang 29.19(0.06) 29.41(0.001) 24.86(0.08) Unemp -76.55(0.48) Localtax -0.061(0.95) Statetax -1.006(0.40) -1.004(0.37 RSS 4.763e+7 4.843e+ 4.962e+7 5.038e+7 R2 0.349 0.338 0.322 0.312 1.488e+6 1.424e+6 1.418e+6 1.399e+6 1776e+6 1634e+6 1593e+6 1538e+6
(2)针对 R&D 强度随销售额的增加而提高这一备择假设,检验它不虽 X1 而变化的假 设。分别在 5%和 10%的显著性水平上进行这个检验。 (3)利润占销售额的比重 X2 对 R&D 强度 Y 是否在统计上有显著的影响? (3)对 X2,参数估计值的 t 统计值为 0.05/0.46=1.087,它比在 10%的显著性水平下的 临界值还小,因此可以认为它对 Y 在统计上没有显著的影响。 7.下表为有关经批准的私人住房单位及其决定因素的 4 个模型的估计量和相关统计值 (括号内为 p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国 40 个城市的 数据。模型如下: + + + + = + + + + unemp localtax statetax hou g density value income popchang 5 6 7 0 1 2 3 4 sin 式中 housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value—— 自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元), popchang——1980~1992 年的人口增长百分比,unemp——失业率,localtax——人均交纳的 地方税,statetax——人均缴纳的州税 变量 模型 A 模型 B 模型 C 模型 D C 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44) Density 0.075 (0.43) 0.062 (0.32) 0.042 (0.47) Value -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07) Income 110.41 (0.14) 133.03 (0.04) 125.71 (0.05) 116.60 (0.06) Popchang 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08) Unemp -76.55 (0.48) Localtax -0.061 (0.95) Statetax -1.006 (0.40) -1.004 (0.37) RSS 4.763e+7 4.843e+7 4.962e+7 5.038e+7 R 2 0.349 0.338 0.322 0.312 Se 1.488e+6 1.424e+6 1.418e+6 1.399e+6 AIC 1.776e+6 1.634e+6 1.593e+6 1.538e+6
(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择 P值。根据检验结果,你认为应该把变量保留在模型中还是去掉? (2)在模型A中,在10%水平下检验联合假设H:B=0(=1,5,6,7)。说明被择假设, 计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准,说明你的结论 (3)哪个模型是最优的”?解释你的选择标准。 (4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。 确认其是否为正确符号。 参考答案 一、填空题 1.230或至少e3(k+1)2.230或至少e243.y=X3+u,y=Xb+e,b=(XX)XY, ar(b)=o2(XX)m:4.回归平方和;残差平方和;回归平方和与残差平方和之比。5B: 6.非线性;非线性;变量非线性而参数为线性。 二、问答题 1.答:回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数 不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之 间不存在线性相关关系”的假定:三是多元线性回归模型的参数估计式的表达更复杂。 2.答:极大似然法(ML)是不同于OLS法的另一种模型参数估计方法。M方法需要 利用有关模型随机扰动项分布的知识构建似然函数然后利用使似然函数最大的方法得出参 数估计。其基本思路是确定观察到的样本数据最可能来自某个分布,该分布的参数值即为总 体参数的估计量。 3.答:所谓拟合优度检验,指对样本回归直线与样本观测值之间拟合程度的检验。如 果所有的观测值都落在回归线上,称为“完全拟合”。这种情况很少发生。一般情况下,总
(1)检验模型 A 中的每一个回归系数在 10%水平下是否为零(括号中的值为双边备择 p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉? (2)在模型 A 中,在 10%水平下检验联合假设 H0:i =0(i=1,5,6,7)。说明被择假设, 计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。 (3)哪个模型是“最优的”?解释你的选择标准。 (4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。 确认其是否为正确符号。 参考答案 一、填空题 1.n≥30 或至少 n≥3(k+1);2. n≥30 或至少 n≥24;3. Y = X +u,Y = Xb + e ,b = X X X Y −1 ( ) , 2 1 ( ) ( ) − = Var b u X X ii ; 4.回归平方和;残差平方和;回归平方和与残差平方和之比。5. β ; 6.非线性;非线性;变量非线性而参数为线性。 二、问答题 1. 答:回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数 不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之 间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更复杂。 2. 答:极大似然法(ML)是不同于 OLS 法的另一种模型参数估计方法。ML 方法需要 利用有关模型随机扰动项分布的知识构建似然函数,然后利用使似然函数最大的方法得出参 数估计。其基本思路是确定观察到的样本数据最可能来自某个分布,该分布的参数值即为总 体参数的估计量。 3. 答:所谓拟合优度检验,指对样本回归直线与样本观测值之间拟合程度的检验。如 果所有的观测值都落在回归线上,称为“完全拟合”。这种情况很少发生。一般情况下,总