第一章模型概论线性模型是一类统计模型的总称,它包括了线性回归模型、方差分析模型、协方差分析模型和线性混合效应模型(或称方差分量模型)等:许多生物、医学、经济、管理、地质、气象、农业、工业、工程技术等领域的现象都可以用线性模型来近似描述:因此线性模型成为现代统计学中应用最为广泛的模型之一。本书将系统讨论线性模型统计推断的基本理论与方法本章将通过实例引进各种线性模型,使读者对模型的丰富实际背景有一些了解,这将有助手对后面引进的统计概念和方法的理解我们先从线性回归模型谈起81.1线性回归模型在现实世界中,存在着大量的这样的情况:两个变量例如X和Y有一些依赖关系:由X可以部分地决定Y的值,但这种决定往往不很确切:常常用来说明这种依赖关系的最简单、直观的例子是体重与身高.若用X表示某人的身高,用Y表示他的体重众所周知,一般来说,当X大时,Y也倾向于大,但由X不能严格地决定Y.又如,城市生活用电量Y与气温X有很大的关系,在夏天气温很高或冬天气温很低时,由于空调、冰箱等家用电器的使用,用电量就高.相反,在春秋季节气温不高也不低,用电量就相对少。但我们不能由气温X准确地决定用电量Y,类似的例子还很多变量之间的这种关系称为“相关关系”,回归模型就是研究相关关系的一个有力工具在以上诸例中,Y通常称为因变量或响应变量,X称为自变量或预报变量.我们可以设想,Y的值由两部分组成:一部分是由X能够决定的部分,它是X的函数,记为f(X).在许多情况下,这个函数关系或者是线性的或者是近似线性的,即(1.1.1)f(X) = βo + βX,这重和是未知参数:而另一部分则由其它众多未加考虑的因素(包括随机因素)所产生的影响,它被看作随机误差,记为e.这里e作为随机误差,我们有理由要求它的均值E(e)=0,其中E()表示随机变量的均值于是,我们得到Y=Bo+BiX+e.(1.1.2)在这个模型中,若忽略掉e,它就是一个通常的直线方程。因此,我们称(1.1.2)为线性回归模型或线性回归方程。关于“回归”一词的由来,我们留在后面作解释
✂✁✂✄ ☎ ✆ ✝ ✞ ✟✡✠✡☛✡☞✡✌✡✍✡✎✡✏✡✑✡☛✡☞✡✒✡✓✡✔✡✕✗✖✡✘✡✙✡✚✡✟✡✠✜✛✣✢✡☛✡☞✥✤✗✦✡✧✡★✥✩✡☛✡☞✡✤✗✪ ✦✫✧✬★✬✩✬☛✬☞✬✭✬✟✬✠✬✮✬✯✬✰✬✱✬☛✬☞ (✲✔✬✦✬✧✬★✬✳✬☛✬☞) ✴✬✵✫✶✬✷✬✸✬✹✤✫✺✬✻✬✤✫✼ ✽✡✤✿✾✡❀✡✤✿❁✫❂❃✤✿❄✡❅✡✤✿❆✡❇✡✤✿❈✡❇✡✤✿❈✡❉✡❊✡❋✴✡●✡❍✒✡■✡❅✡❏✡❑✡▲✡▼✡✟✡✠✡☛✡☞✡◆ ❖✥P✥◗✥❘✵❚❙✥❯✟✥✠✥☛✥☞✥❱✥❲✡■✥❳✡✏✥✑✡✻❩❨✣✱✡▼✥❬✡❲✥❭✡❪✡✒✥☛✡☞✥❫✡✍✵❵❴✥❛✡❜✥❝✏ ❞✡❡✡✟✡✠✡☛✡☞✡✏✡✑✡❢✡❣✡✒✡❤❴ ❀✡❡✡✐✡✦✡❥✵ ❴✬❦✬❜✬❧✬♠✬♥✬♦✬♣✬q✬r✬s✟✬✠✬☛✬☞✬✕✫t✬✉✬✈✬✇✬☛✬☞✬✒✬①✬②♥✬③✬④✬⑤✬⑥✍✬⑦✬✚ ⑧✬✕✫⑨❜✬⑥✬⑩✬❶✇✬❷✬❸♣✬q✒✬✏✬✑✬❹✬❺✬✭✬✦✬❥✬✒✬❀✬⑧✵✫❻✬❼❾❽✬❿✟✬✠➀✛➁✢✬☛✬☞❾➂ ➃ ✵ §1.1 ➄➆➅➈➇➊➉➆➋➍➌ ➎■ ♥✡➏✡➐ ❨✣✕➒➑➎✡➓✡➔✳✡✒✡⑨✡→✡✒✡➣✡↔✡↕➒➙✡➛✡➜✡✳♦✡➝ X ✭ Y ⑥✍✡⑦✡➞✡➟ ➠ ❝✡✵➢➡ X ❑✡▲✡➤✡★✡❁✡➥✡➦ Y ✒✡➧✡✕➩➨✡⑨s➥✡➦✡➫✡➫✡➭✡➯✡➲✡➳✵➩➵✡➵▼✡◆✡➸✜➺✣⑨ s➞✡➟➠ ❝✒✡❬✡➻✡➼✡✤✫➽✡➾✡✒♦✡➚✌✡➪✡➶✫✐✡➹✡➘✵✫➴▼ X ➷✡➬✡➮✡➱✒✡➹✡➘✡✕✫▼ Y ➷✡➬✡✃✒✡➪✡➶✵❒❐✡❮✡❰✡Ï✕❒✍✡Ð✡◆✡➸✡✕❒Ñ X ➔✡Ò✕ Y Ó✡Ô✜Õ✣❶➔✕❒➨➡ X ➭✡Ö✡× Ø❁✡➥✡➦ Y . Ù✡➝✕➁Ú✡Û✸✡Ü▼✜Ý✣✳ Y ✐✡❄✡Þ X ⑥➯➔✒➠ ❝ ✕ ➎✡ß✡à❄✡Þ✡➯✡➘ ✲✡áà❄✡Þ✡➯✡âÒ✕ ➡✣❶✡ã✡ä✤➩å✡æ✴✡ç▼✜Ý✣è✡✒✡t✡▼✡✕➩▼✜Ý✣✳✡é✡➘✵➩ê✡ë✕ ➎✡ì í✡î✡ï❄✡Þ✡➭✡➘Ó ➭✡â✡✕ð▼✜Ý✣✳✡éê✇✡ñ✵ ➨ ❻✡❼➭✡Ö ➡ ❄✡Þ X ò ➲✡❁✡➥✡➦✡▼✜Ý ✳ Y . ✎P✒ ♦✡➚✡ó➯ ✷✡✵ ➜✡✳✡❫✡ô✡✒✬⑨s➠ ❝✔✡❲öõê➠✬➠❝✬÷ ✕ø✛➁✢✡☛✬☞✡é✬✌ ù✡úê➠✡➠❝✒✡✍✡➛⑥✡û❈✡ü✵ ➎▲✥ý✥þ♦ ❨✿✕ Y ❧✥➵✔✥❲❙➜✥✳✲✥ÿ✱✥➜✥✳, X ✔✥❲✁ ➜✥✳✲✄✂✄☎➜✥✳✵ ❻ ❼❑✡▲✝✆✝✞ , Y ✒✡➧➡ ➙✡➤✡★✝✟✡❱✡↕ ✍✡➤✡★✡✌ ➡ X Ö✝✠✡➥✡➦✡✒✡➤✡★✡✕ ✖✡✌ X ✒✝✡ ☛✥✕✌☞✥❲ f(X). ➎✶✥✷➣✥↔✄✍✥✕ ⑨✥➛✄✡✄☛➠ ❝✡✲✈✡✌✡✟✥✠✡✒✲✈✡✌❖✡P✟✡✠✡✒✥✕✌✎ f(X) = β0 + β1X, (1.1.1) ⑨✝✏ β0 ✭ β1 ✌✝✑Ï✝✒☛ ✵✔✓✝✕✍✡➤✡★✝✖ ➡✘✗✖❐✡✷✑✝✙✝✚✝✛✡✒❙✝✜ (✘✡✙✝✢✝✣❙ ✜) ❮✝✤✡✸✒✝✥ÿ ✕ ✖✝✦✝✧✝★✝✢✝✣✝✩✡✧✡✕✔☞✡❲ e. ⑨✝✏ e ★✡❲✝✢✝✣✝✩✡✧✡✕ ❻✡❼✡⑥❀ ➡ ✪✝✫✖✡✒✝✬✡➧ E(e) = 0, ✗ ❨ E(·) ➷✡➬✢✝✣✡➜✡✳✡✒✝✬✡➧✵✫❶✌✡✕ ❻✡❼✝✭✝✮ Y = β0 + β1X + e. (1.1.2) ➎⑨✡➛✡☛✡☞✜❨✣✕ ➴✝✯✝✰✝✱ e, ✖✡é✡✌✡✍✡➛❧✡➵✒✡➽✡✟✡✦✡❉✵➁❙✡❯✕ ❻✡❼✔ (1.1.2) ❲ ✟✡✠✜✛✣✢✡☛✡☞✲ ✟✡✠✜✛✣✢✡✦✡❉✵ ➠ ❶ õ ✛✣✢÷ ✍✝✲✡✒ ➡ ◆✡✕ ❻✡❼✴✳➎❷✡❸✝★✡⑧✝✵✵
.2.张成空间交影变梦分皆将依常数β是直线的β1是直线的也称为回归系数.在实际应用中,βo乘排迹和 βI次是严知的,通过观测数一来*计.机均机积设符量X分机均值为F1,2,…,n时,因变量Y对应的观测值分”为观测值(ri.yi),i=1,..,n.如值Y与X有回归于是我们有n91,y2,..,3差协维关系(1.1.2),的这些(i,y)应i=l,...,n,(1.1.3)yi=Bo+Biai+ei,半估计为最大数差。基于(13),应用查当的统计方法(将在这ei为对应的章讨论)换来可以顺序Bo和βI的计值Bo,3,将它们代小(1.1.2),三征佳差ei顺序Y = βo +BX.(1.1.4)线线半线性称之为经回归直线,也称为经回归方程。这半“经线,两件表示这个回归直线是基于无面的n偏观测数(i,i),i=1,,n阵回顺的.残误归人们在不关致的一个重迹引起,混情,况下1.1.1五平和是现代体重多少膝用量个人的身高有关,于是许多学者应用直线回归方法研究人是平和本?这当和设X表示身高(cm)Y表示体重(kg).我们设Y与X的体重与身高的关系.半数差e表示体了身高X之表所有行响体重Y之间具有回归关系(1.1.2):在这“餐余白美、体交驾学多少等,为了来计广中的方数 的广它因有,例如示外因有、和β1,研究者测量了很多人的身高;和体重yi,i=1,…,n顺序关系(1.1.3)从除应用统计方法可以聚计命% 和 P1:一种研究“值是,若用 X-150 泌不符量的线顺序B=50.β1=0.6,也就是说我们有经×回归直线Y=50+(X-150)×0.6.对我们可以把它改写成如形式:Y =-40+0.6X,(1.1.5)线这个经回归方程在一定程度上描述了体重与身高的相关关系,给定X的一个具丹对应的Y值yo=-40+0.6ro.例如某甲身高To=160(cm)体值1o,我们可以下母代小(1.1.5)可以对应yo=56(kg).我们称56kg为身高是160cm的人的体重的,测.这就是说,对于一个身高160cm的人,我们,测它的体重大致为56kg,但实上,它的体重不可能恰为56kg.可能比56kg多,可能比56kg少。归1.1.2我们知道,一个公司的商品销售量与广广告费有密切关系,一般XT说来在广它因有(如秩品质量等)保持不变的情况,用在广告上的费用愈高,它的商品销售量也就愈多.但这也只是一种相关关系.某公司为了进一步研究这
· 2 · ✶✸✷✸✹✻✺✽✼✽✾✽✿ ➵☛✝❀ β0 ✌✡➽✡✟✡✒✝❁✝❂, β1 ✌✡➽✡✟✡✒✝❃✝❄✡✕ Ó✔✡❲✜✛✣✢❝☛ ✵ ➎ ♥✡③✱✡▼✜❨✣✕ β0 ✭ β1 ❅✌✝✑Ï ✒✡✕❇❆✪❧✡♠➾✝❈✝☛✝❉✡◆✝❊✡✑✵ ❋✝✆●✗➜✡✳ X ★✝❍✝■✡➧✡❲ x1, x2, · · · , xn Ò✕ ❙➜✡✳ Y ✇✡✱✡✒✡➾✝❈✡➧✡★✝❍✡❲ y1, y2, · · · , yn. ❶✌ ❻✡❼✡⑥ n ✟✡➾✝❈✡➧ (xi , yi), i = 1, · · · , n. ➝✝❏ Y ✐ X ⑥ ✛✣✢ ➠ ❝ (1.1.2), ✖✡⑨✡⑦ (xi , yi) ✱✝❑✝▲✝▼ yi = β0 + β1xi + ei , i = 1, · · · , n, (1.1.3) ⑨✄✏ ei ❲✥✇✥✱✥✒✄✢✄✣✄✩✥✧✵ ❤ ❶ (1.1.3), ✱✥▼✄◆✥Ñ✥✒✥✏✥✑✥✦✥❥ (⑨ ❜ ➎✄❖✄P❦❞✥❡) ❑✡▲ ✭✝✮ β0 ✭ β1 ✒✝❊✡✑✡➧ βˆ 0, βˆ 1, ❜ ✖ ❼❳✝◗ (1.1.2), ❘✝✰✝❙✩✡✧✝❀ ei ✭✝✮ Y = βˆ 0 + βˆ 1X, (1.1.4) ✔✡❫✡❲✡✼✝❚✜✛✣✢✡➽✡✟✡✕ Ó✔✡❲✡✼✝❚✜✛✣✢✡✦✡❉✵ ⑨✝✏ õ✼✝❚÷ ➙✝❯➷✡➬⑨✡➛✜✛✣✢✡➽✡✟ ✌✡❤❶✝❱❸✡✒ n ❲➾✝❈✝☛✝❉ (xi , yi), i = 1, · · · , n ✓✝❳✝✭✒ ✵ ❨ 1.1.1 ❩✄❬✌✥■✥❳✄❭✄❪➱✥❼✄❫✄❴➠✄❵✒✡✍✥➛✡➶✪✝❛✄❜✕❞❝✝❡✥➪✡➶✷ñ✄❢✝❣ ✌ ❩❤❬❤✐❦❥ ⑨✬Ñ❤❧❤♠❤♥✬➛➱ ✒✬➹✬➘⑥➠✕ ❶✌✶✬✷✻✬✈✬✱✬▼✬➽✬✟ ✛➁✢✬✦✬❥ù✬ú➱ ✒✡➪✡➶✡✐✡➹✡➘✡✒➠ ❝✡✵ ❋✝✆ X ➷✡➬➹✡➘ (cm), Y ➷✡➬➪✡➶ (kg). ❻✡❼❋✝✆ Y ✐ X ❫✡ô✡ü⑥ ✛✣✢➠ ❝ (1.1.2). ➎⑨✝✏✝✩✡✧ e ➷✡➬✝♦✚✡➹✡➘ X ❫✝♣✡✕ ❮✡⑥✥ ÿ➪✡➶ Y ✒✗ ✖ ❙✄✜✕ ♦✥➝✄q✄r✥❙✄✜✤ts✝✉✄✈✝✇✡✤ ➪✄①✝②✝③✷ñ ✴✥✵ ❲✡✚✄❊✑ ✗ ❨✣✒✒☛ β0 ✭ β1, ù✬ú✈❤❈✬✳✬✚✬➯✷✬➱✒✬➹✬➘ xi ✭✬➪✬➶ yi , i = 1, · · · , n ✭❤✮➠ ❝ (1.1.3). ❿ ✓✱✡▼✡✏✡✑✡✦✡❥✡❑✡▲✝❊✡✑✝④ β0 ✭ β1. ✍ sù✡ú✝⑤❏ ✌✡✕ ➴ ▼ X − 150 ★●✗➜✡✳✡✕ ✖✭✝✮ βˆ 0 = 50, βˆ 1 = 0.6, Ó é✡✌✡➸❻✡❼✡⑥✼✝❚✜✛✣✢✡➽✡✟ Y = 50 + (X − 150) × 0.6. ❻✡❼❑✡▲✝⑥✡✖✝⑦✝⑧✡❱➝✍✝⑨✝⑩✡↕ Y = −40 + 0.6X, (1.1.5) ⑨✡➛✡✼✝❚✜✛✣✢✡✦✡❉➎✍✡➦✡❉✝❶✡ý◗✡❘✚✡➪✡➶✡✐✡➹✡➘✡✒ê➠✡➠❝✡✵✘❷➦ X ✒✡✍✡➛✡ü ➪✡➧ x0, ❻✡❼❑✡▲✝❣✝④✡✇✡✱✡✒ Y ➧ y0 = −40 + 0.6x0. ♦✡➝✡➮✴❸➹✡➘ x0 = 160(cm), ❳✝◗ (1.1.5) ❑✡▲✝❣✝④✡✇✡✱ y0 = 56(kg). ❻✡❼✔ 56kg ❲✡➹✡➘✡✌ 160cm ✒➱ ✒✡➪✡➶ ✒✂ ❈ ✵ ⑨✡é✡✌✡➸✡✕ ✇ ❶✍✡➛✡➹✡➘ 160cm ✒➱ ✕ ❻✡❼✝✂❈✡✖✡✒✡➪✡➶➔✝❹❲ 56kg, ➨ ♥✡③ý✡✕✫✖✡✒✡➪✡➶✡➭✡❑✡Ö✝❺✡❲ 56kg. ❑✡Ö✴❻ 56kg ✷ ✕ Ó ❑✡Ö✴❻ 56kg ñ ✵ ❨ 1.1.2 ❻✬❼✬Ï❤❼✕✫✍✬➛❤❽❤❾✬✒❤❿❤➀❤➁❤➂✬✳❾✐✗ ❭❤➃➅➄⑥➅➆➳➠ ❝ ✕✫✍❾Ð ➸✡◆➎✗ ✖ ❙✝✜ (➝✝✤➀✡❂✡✳✴) ➇✝➈➭✡➜✡✒✡➣✡↔✝✍✡✕✫▼➎❭✝➃✡ý✡✒✝➄✡▼✝➉✡➘✡✕ ✖ ✒❤❿❤➀❤➁❤➂✬✳Ó é❤❪❤➉✷✬✵ ➨✬⑨Ó❤➊✌✬✍s✬ê➠✬➠❝✬✵✫➮❽❤❾✬❲✬✚ q ✍❤➋ù✬ú⑨
.3.S1.1线性回归间交与种关系,用X表示在某地区的年度广告费,Y表示年度商品销售量。根过售母积定计段时间的销售记录(iyi),i=1,.,n,采用线性回归模型(1.1.3),6o=1608.5,B=20.1,于是顺序经回归直线Y =1608.5+20.1X.差小线墨增满一个单位,公司销售收就增满这个经回归直线告诉我们,广告费X“混情20.1个单位。如值某地区人口增满很快,用很可能人口总数也是响销售量的一X个重迹因有。若记x为年度广告费,X2为某地区人口总数。我们可以是算如含两个符量的线性回归模型:Y=Bo+BXi+BX+e.与与乘母积乘态同样,根记录的历史数与,应用态当统计方法可以辈计母P.i=0.1,2.定母计的6o=320.3.B=18.4,B=0.2线的我们顺序经回归方程Y=320.3+18.4X+0.2X2从这个经线回归方程我们可以式母,当广告费XI增票或人口总数X2增满时,商品销售量都增满,且当人口总数保持不变时,广告费需增满1个单位,锁售量增满黑增满一个单位,差公司销售18.4个单位。阵当广告费保持不变,差地区人口总数需量增达0.2个单位。当除,在实际应用中,并不是黑个经线回归方程都能描述变量之间的客观存在的真正的关系,关于这一点,将在五章详细讨论,排迹足具标引起中,行i在实际响因变量的主迹因有往往很多,这就含多个符变量的回归奇蔻积t设因变量Y和p-1个符量X1,,Xp-1之间有如关系(1.1.6)Y =βo +βiXi+..+βp-1Xp-1 +e,最大数换这是多元线性回归模型,广中Bo为常数,β1...·,β,-1为回归系数,e为差为积,设我们对Y,X1,..,Xp-1进行了n偏观测,顺序n观测值i=l,...,n,Til,...,aip-l,yi,协维它们关系式(1.1.7)i=l,,n,Yi=Bo+aipi+...+ip-1p-1+ei
§1.1 ➌✸➍❇➎➐➏✸✺✸✼ · 3 · s➠ ❝ ✕✫▼ X ➷✡➬➎➮ ❁✝➑✡✒✝➒✝❶✡❭✝➃✝➄ , Y ➷✡➬➒✝❶✝❿✝➀✝➁✝➂✡✳✵❇➓❉ ♠✝❙✍ ➔Òô❾✒➅➁➅➂➅☞➅→ (xi , yi), i = 1, · · · , n, ➣ ▼❾✟❾✠➀✛ð✢❾☛❾☞ (1.1.3) , ❋❾➦❾✑➅❣➅④ βˆ 0 = 1608.5, βˆ 1 = 20.1, ❶✌ ✭✝✮✼✝❚✜✛✣✢✡➽✡✟ Y = 1608.5 + 20.1X. ⑨✡➛✡✼✝❚✜✛✣✢✡➽✡✟✝➃✝↔❻✡❼✕ð❭✝➃✝➄ X ♥✝↕✝✙✡✍✡➛✡➼✝➙✡✕➛❑✝❽✝❾✝➁✝➂✝➜✝◗✡é✝↕✝✙ 20.1 ➛✥➼✄➙✵❵➝✄❏✥➮❁✄➑➱➞➝ ↕✄✙✥➯✝➟✡✕➠❝✄❡✥➯✡❑✡Ö➱✴➝ ✓✝☛Ó ✌✄✥ÿ ➁✝➂✡✳✥✒✡✍ ➛✬➶✪ ❙❤✜✬✵✫➴☞ X1 ❲❤➒❤❶✬❭❤➃❤➄ , X2 ❲➮ ❁❤➑➱➡➝ ✓❤☛✵✫❻✬❼❑✬▲❤✚❤✛➝✍ ➢➙✡➛●✗➜✡✳✡✒✡✟✡✠✜✛✣✢✡☛✡☞✡↕ Y = β0 + β1X1 + β2X2 + e. ➤→✡✕ ➓ ❉✝☞✝→✡✒✝➥✝➦✝☛✝❉✡✕✫✱✡▼✝◆✡Ñ✡✏✡✑✡✦✡❥✡❑✬▲✝❊✡✑✝④ βi , i = 0, 1, 2. ❋✡➦✝❊ ✑✝④✡✒ βˆ 0 = 320.3, βˆ 1 = 18.4, βˆ 2 = 0.2, ✖❻✡❼✝✭✝✮✼✝❚✜✛✣✢✡✦✡❉ Y = 320.3 + 18.4X1 + 0.2X2. ❿⑨✡➛✡✼✝❚✜✛✣✢✡✦✡❉❻✡❼❑✡▲✝✧✝④✡✕✿Ñ✡❭✝➃✝➄ X1 ↕✝✙✲✡➱✴➝ ✓✝☛ X2 ↕✝✙Ò✕➧❿ ➀✝➁✝➂✡✳✡❏✝↕✝✙✡✕➩➨✡Ñ➱✴➝ ✓✝☛➇✝➈➭✡➜Ò✕✗❭✝➃✝➄✝♥✝↕✄✙ 1 ➛✡➼✝➙✡✕➩➁✝➂✡✳✝↕✝✙ 18.4 ➛✡➼✝➙✵➩✓Ñ✡❭✝➃✝➄➇✝➈➭✡➜✡✕➩❑✡❁✝➑➱✴➝ ✓✝☛✝♥✝↕✝✙✡✍✡➛✡➼✝➙✥✕➩❑✝❽✝❾✝➁✝➂ ✳✝↕✝➫ 0.2 ➛✡➼✝➙✵ Ñ✝❧✡✕ ➎ ♥✡③✱✡▼✜❨✣✕➯➭✡➭✡✌✝♥✡➛✡✼✝❚✜✛✣✢✡✦✡❉✡❏✡Ö◗✡❘➜✡✳ ❫✡ô✡✒✝➲✡➾✡➑➎✒✝➳✝➵✡✒➠ ❝✡✵ ➠ ❶⑨✡✍✝➸✡✕ ❜ ➎✝❖✝➺❦✝➻✝➼❞✡❡✵ ➎ ♥✥③❛✄❜❨✿✕➐✥ÿ✥❙➜✥✳✥✒✝➽✪ ❙✄✜➫✥➫✡➯✷ ✕❚⑨✥é✝❆✪✚✄✛➢ ✷➛● ➜✡✳ ✒✜✛✣✢❛✝❜✵ ❋✝✆❙➜✡✳ Y ✭ p − 1 ➛●✗➜✡✳ X1, · · · , Xp−1 ❫✡ô⑥✡➝✍➠ ❝ ↕ Y = β0 + β1X1 + · · · + βp−1Xp−1 + e, (1.1.6) ⑨✡✌✷✝➾✟✡✠✜✛✣✢✡☛✡☞✡✕ ✗ ❨ β0 ❲➵☛✝❀ , β1, · · · , βp−1 ❲✜✛✣✢❝☛ , e ❲✝✢✝✣✝✩ ✧ ✵ ❋✝✆❻✡❼✇ Y, X1, · · · , Xp−1 q✝➚✚ n ❲➾✝❈✡✕ ✭✝✮ n ✟✡➾✝❈✡➧ xi1, · · · , xi,p−1, yi , i = 1, · · · , n, ✖ ❼▲✝▼➠ ❝⑩ yi = β0 + xi1β1 + · · · + xi,p−1βp−1 + ei , i = 1, · · · , n, (1.1.7)
许多章模,概论.4-达式偏根方英记身形统ei归机误表示.体重191T11T1,p119221X2,p-1X=y=1...1.:1Tn1YnIn,p-1Boe1β1e2β=......详偏就写高这式增1.1.7)(1.1.8)y=x+e,偏偏为"且偏正方元無乐英形统y测向量.Xnxp若知设nxl支员短积表体重常体重方真最正归方“设正,位李果拜装3数识“设何切2含维?体重知记百所对维1般矩当议此者对改学”,月就而若几年“数记成维宜储重自日“设正数向量短其数项矩而,37计知oβp-1成.B体重正偏具最的偏偏和向量短其均值零矩即E(e)=0. 关混数.n×1归机误而e正度维方假设记增式列式矩即项具,量(a)误把Var(ei) = ?i=l....,n.式记方矩即能性并相关(b) 误Cov(ei,e,) = 0,itj, i,j=l,...,n.偏且协们短对方列式刻画足可上位条道知们个归机收量除Gauss-Markov假设正记与于方刘式矩也就记要并同段小矩佳性假设(a)要求ei量归机收量现值散布来估回对方元口与于记对方波动测乐其均值附录”,形个要求,时显严厉改改把和偏方元诉二短道并,Var(e)=,i=1,.n.假设(b)量并放松要求并同X为我和简根维归记形个假设较容易以用测记并箱关黑字偏告短差详高分特回对,Gauss-Markov假设高表示数记(1.1.8)Cov(e) = α2I,(1.1.9)E(e) = 0,y=Xβ+e
· 4 · ✶✸✷✸✹✻✺✽✼✽✾✽✿ ⑨✝✏ ei ❲✡✇✡✱✡✒✝✢✝✣✝✩✡✧✵✫♣✡q✝➪✝➶☞✝➹ y = y1 y2 . . . yn , X = 1 x11 · · · x1,p−1 1 x21 · · · x2,p−1 . . . . . . . . . 1 xn1 · · · xn,p−1 , β = β0 β1 . . . βp−1 , e = e1 e2 . . . en , (1.1.7) é✝⑧✡❲➝✍✡➻✝➘✝⑨✝⑩✡↕ y = Xβ + e, (1.1.8) ⑨✝✏ y ❲ n × 1 ✒✡➾✝❈ Õ✳ ✵ X ❲ n × p ➴✣Ï✝➪✝➶✕ ❧✡➵✔✡❲✝✆✡✑➪✝➶✡✵ ✇ ❶ ✟✡✠ ✛✣✢✡☛✡☞✡✕✿❋✝➷ õ➬✆✡✑➪✝➶✡÷ ❨✣✒ õ➬✆✡✑÷ ➙✝❯✝➭✡➭✝➮➢✝➱✝✃➳✝➵✝✆✡✑✡✒➢✝❐✕ ➊ ✌✝✈✝✇✡▼✡❥✓✴➴✣✵❇❒➒✡◆✡✕ ⑥✍✡⑦✡✻✡✈✝❮✝❰✝⑦✡▼öõ☛✡☞➪✝➶✡÷ ✵ ➨✡é❦Ï ❱ ◆✝Ð✡✕ÒÑ ▼öõ➬✆✡✑➪✝➶✡÷ ✈✝Ó✷ . β ❲✝✑Ï✝✒☛ Õ✳✡✕ ✗ ❨ β0 ✔✡❲➵☛✝❀✡✕ ✓ β1, · · · , βp−1 ❲✜✛✣✢❝☛ ✵Ô✓ e ❲ n × 1 ✢✝✣✝✩✡✧ Õ✳✡✕ ✗ ✬✡➧✡❲✝Õ✡✕Ô✎ E(ei) = 0. ➠ ❶ e ❬ ➵ ▼✡✒✝❋✝✆✡✌✡↕ (a) ✩✡✧✝❀✡ü⑥✡✴✦✡✧✡✕❇✎ Var(ei) = σ 2 , i = 1, · · · , n, (b) ✩✡✧✡✌✝Ö❯ ➭ ê➠✒✡✕❇✎ Cov(ei , ej ) = 0, i 6= j, i, j = 1, · · · , n. ❧✡➵✔✡▲✡ý✡➙✝×✡❲ Gauss-Markov ❋✝✆✵✿❻✡❼✡Ï✝❼✕✿✍✡➛✝✢✝✣✡➜✡✳✡✒✡✦✡✧✝Ø✝Ù✡✚✝❑ ✢✝✣✡➜✡✳✝■✡➧✝Ú✝Û✡❉✝❶✡✒➔✝Ü✕ ❙✬❯❋❤✆ (a) ✪✝✫ ei ✴✦✡✧✡✕ Ó é✡✌✪✝✫➭➤❲ ✒✡➾✝❈ yi ➎✗ ✬✡➧✝Ý❖✝Þ✝ß❉✝❶✡✌✡✍✡→✡✒✵ ⑨✡➛✪✝✫⑥Ò✝à✭×✝á✡⑦✵ ➎✍✡⑦✬➣ ↔✄✍✥✕ ❻✥❼➭ ✭ ➭✝â✄ã✥❲ Var(ei)=σ 2 i , i = 1, · · · , n. ❋✄✆ (b) ✴✄ä✥❶✪✄✫➭➤❲ ✒✥➾ ❈✡✌✡➭ê➠✒ ✵ ➎ ♥✡③✱✡▼✜❨✣⑨✡➛✝❋✝✆✴❻✘å✝æ✝ç✝▲✝▼✵ ☛✡☞ (1.1.8) ✭ Gauss-Markov ❋✝✆✡✯➎✍✡➃✡✕✫❑✡➻✝➘✡❁➷✡➬❲ y = Xβ + e, E(e) = 0, Cov(e) = σ 2 I, (1.1.9)
.5.81.1线性,归模这统Cov(e)表示归机量e的要方差:(1.1.9)就是我们以后要讨论的最基本的重零线性回归数记将在一些实际问付中,Var(e)=α?,i=1,...,n.这统o?可能不全相等.这时观测量或误差量的要方差。_这为A电0a20000Cov(e) =(1.1.10):02格在经济问y1,y2.*,9n表示某经济就标在n个不同时刻的观测值,它中们往往是相关的.这种相关性反应在误差项上,就是误差项的自相关性。一种最简单的自相关关系是误差为一阶自回归这式,即1<1,ei=pei-i+ei,其中εi,i=1,..",n是独立同分布的归机变量,E(e)=0,Var(ei)=o2.这时11a?4Cov(e):(1.1.11)...::12上面我们讨论的都是线性回归数记.有一些数记虽然是非线性的,但经过适当变换,可以化为线性数记中1.1.3在经济学中,著名的Cobb-Douglas生产函模为Qt = aLKs,这统Qt,Lt和Kt分别为t年的产值、间力投描量和资金投描量,a,b和c为,模的到在上式两边取自然对模,和In(Qt) = ln(a) +bln(Lt) +cln(Kt) .若令yt =ln(Qt),t1=ln(Lt),t2=ln(Kt),βo = ln(a), βi = b, β2 = c
§1.1 ➌✸➍❇➎➐➏✸✺✸✼ · 5 · ⑨✝✏ Cov(e) ➷✡➬✢✝✣ Õ✳ e ✒✡✪✡✦✡✧➶✡✵ (1.1.9) é✡✌❻✡❼▲✡❷✪❞✡❡✡✒✡❬✡❤❴ ✒ ✟✡✠✜✛✣✢✡☛✡☞✵ ➎✍✡⑦♥✡③❛✝❜ ❨✣✕ Var(ei) = σ 2 i , i = 1, · · · , n. ⑨✝✏ σ 2 i ❑✡Ö✡➭✝èê✡✴✡✵ ⑨Ò ➾✝❈ Õ✳ ✲✩✡✧ Õ✳✡✒✡✪✡✦✡✧➶ ⑨✡❲ Cov(e) = σ 2 1 0 · · · 0 0 σ 2 2 · · · 0 . . . . . . . . . 0 0 · · · σ 2 n . (1.1.10) ➎✼✬✽❛❤❜ ❨➁✕ y1, y2, · · · , yn ➷✬➬✬➮✼✬✽❤é❤ê➎ n ➛✬➭➤ÒØ✬✒✬➾❤❈✬➧✬✕✫✖ ❼➫✡➫✡✌ê➠✒ ✵ ⑨ s✡ê➠✠ ë✱➎✩✡✧✝❀✡ý✡✕✗é✡✌✝✩✡✧✝❀✡✒✁ ê➠✠ ✵ ✍ s ❬✡➻ ➼✡✒● ê➠✡➠❝✌✝✩✡✧✡❲✡✍✝ë●✣✛✣✢✝⑨✝⑩✡✕❇✎ ei = ϕei−1 + εi , | ϕ |< 1, ✗ ❨ εi , i = 1, · · · , n ✌✝ì✝í➤★✝Û✡✒✝✢✝✣✡➜✡✳ , E(εi) = 0, Var(εi) = σ 2 ε . ⑨Ò Cov(e) = σ 2 ε 1 − ϕ2 1 ϕ · · · ϕ n−1 ϕ 1 · · · ϕ n−2 . . . . . . . . . ϕ n−1 ϕ n−2 · · · 1 . (1.1.11) ý✥❸❻✥❼❞✥❡✥✒✥❏✥✌✥✟✥✠❩✛✿✢✡☛✡☞✵❚⑥✍✥⑦✡☛✥☞✝î✄❧✡✌✄ï✡✟✥✠✡✒✥✕❵➨✥✼♠ ◆✡Ñ ➜✝ð✡✕✫❑✡▲✝ñ✡❲✡✟✡✠✡☛✡☞✵ ❨ 1.1.3 ➎✼✡✽✡✻✜❨✣✕❇ò✝ó✡✒ Cobb-Douglas ✸✝✤✡✝☛✡❲ Qt = aLb tKc t , ⑨✄✏ Qt, Lt ✭ Kt ★✄❍✥❲ t ➒✥✒✤➧✥✤➐ôû✄õ◗✥✳✥✭✄ö✄÷õ ◗✡✳✥✕ a, b ✭ c ❲✒☛✥✕ ➎ý✝⑩✡➙✝ø✝■●➩❧✡✇✝☛✡✕ ✭✝✮ ln(Qt) = ln(a) + b ln(Lt) + c ln(Kt) . ➴✝ù yt = ln(Qt), xt1 = ln(Lt), xt2 = ln(Kt) , β0 = ln(a), β1 = b, β2 = c