问题的提出 因变量y;=自变量的线性组合再加上一个 随机扰动项,自然因变量y;也是一个随 机变量,于是必须对y;的分布做一番讨 论 而a、b等回归估计系数乃是由y和x;估 计出来的(可以证明它们是y的线性组 合),自然也需对它们的性质作进一步 的讨论。关于它们性质的讨论十分有用, 影响到估计得到规律(回归方程)的检 验——一可靠性和预测
21 问题的提出 • 因变量yi =自变量的线性组合再加上一个 随机扰动项,自然因变量yi也是一个随 机变量,于是必须对yi的分布做一番讨 论。 • 而a、b等回归估计系数乃是由yi和xij估 计出来的(可以证明它们是yi的线性组 合),自然也需对它们的性质作进一步 的讨论。关于它们性质的讨论十分有用, 影响到估计得到规律(回归方程)的检 验——可靠性和预测
解决问题的思路 根据古典模型的假设,推断出因变量的 性质 在通过高斯-马尔科夫定理精确地讨论最 小二乘估计量的性质
22 解决问题的思路 • 根据古典模型的假设,推断出因变量的 性质 • 在通过高斯-马尔科夫定理精确地讨论最 小二乘估计量的性质
关于随机扰动项的6项假定 假设1随机扰动项■;垂直波动 ◇自变量X是确定性变量 假设2残差分布均值为零 ◇∑ui=0 假设3随机扰动项方差一定 <→Var(ui)=o 假设4随机扰动项(误差)相互独立 <→E(ui,uj)=0÷∑uiuj=0(i<>j 假设5所有xi都是可观察的并且独立于u1 →E(x,uj)=0÷∑xuj=0 假设6数据产生过程是线性的 Y=XB+u 23
23 关于随机扰动项的6项假定 假设1 随机扰动项ui垂直波动 自变量X是确定性变量 假设2 残差分布均值为零 ui=0 假设3 随机扰动项方差一定 Var(ui)= 2 假设4 随机扰动项(误差)相互独立 E(ui,uj)=0uiuj=0 (i<>j) 假设5 所有xi都是可观察的并且独立于ui E(x,uj)=0xuj=0 假设6 数据产生过程是线性的 Y=XB+u
、yi的分布 根据以上6项假设,模型: yi=a+b, Xi1+b2X;2+b3 X13+.tbkxiktu 中的的各个观察值的方差=σ2,数学期望 =0,相互独立,即u;服从i.i.d(0,σ2) i.i.d是 Identical Independent Distribution 指的是独立同分布。但是,并没有指出 它是何种具体的分布形式
24 一、yi的分布 • 根据以上6项假设,模型: • yi=a+b1xi1+b2xi2+b3xi3++bkxik+ui (i=1,2, ,n) • 中的的各个观察值的方差= 2,数学期望 =0,相互独立,即ui 服从i.i.d(0, 2) • i.i.d是 • Identical Independent Distribution • 指的是独立同分布。但是,并没有指出 它是何种具体的分布形式
yi的分布的数字特征 E(y;)=E(a+b1x1+b2x12+b2x13+……+ OkXik fu °因为a,b1,b2,b3,b,(参数)和 x1,x;2,x13,xi(确定性变量)都不是随机变 量(而a,b1,b2,b3,b的估计量才是随机变 量),所以 E(y;) a+b,x:1+box:otb 2 12 b kAi Var (yi)=var (a+b xi1+b2 X;2+b3X13+t b,x:+u.) Var(y1)=2,所以y;服从 i.i.d (a+b1Xil+b2X;2+b3X13+.tbkXik, 02) Cov(yi, yj=0
25 yi的分布的数字特征 • E(yi)=E(a+b1xi1+b2xi2+b3xi3++ bkxik+ui) • 因为a,b1,b2,b3,bk,(参数) 和 xi1,xi2,xi3,xik(确定性变量)都不是随机变 量(而 a,b1,b2,b3,bk的估计量才是随机变 量),所以 • E(yi)=a+b1xi1+b2xi2+b3xi3++bkxik • Var(yi)=Var(a+b1xi1+b2xi2+b3xi3++ bkxik+ui) • Var(yi)=2 ,所以yi 服从 • i.i.d(a+b1xi1+b2xi2+b3xi3++bkxik,2) • Cov(yi,yj)=0