残差的方差与杠杆值 二、有关残差的性质 性质1E(e)=0 证明:E(e:)=E(y)-E() =(+月A1x,)-(+月1x)=0 性质2 w(o)1- =(1-ha)d2 (2.63) 其中,-,三称为杠杆值。0<,<1,当第近时,,的值接近 0,相应的残差方差就大。当:远离元时,h,的值接近1,相应的残差方差就 小。也就是说靠近x附近的,点相应的残差方差较大,远离元附近的点相应的残 差方差较小,这条性质可能令读者感到意外。实际上,远离x的点数目必然较 少,回归线容易“照顾”到这样的少数点,使得回归线接近这些点,因而远离 附近的云相应的残差方差较小。 性质3残差满足约束条件:之:=0,之xg=0,此关系式已在(2.27)式 中给出。这表明残差e1,e2,…,en是相关的,不是独立的 一元回归预测值的区间估计 由此我们可以求得o的置信概率为1一a的置信区间为 %土ta2(n-2)W1+h0G (2.80〉 hw=1+0-x)2 元回归综合题
残差的⽅差与杠杆值 ⼀元回归预测值的区间估计 ⼀元回归综合题
12.为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y (万元)和广告费用x(万元),数据见表2.6,要求用手T计算: 表2.6 月份 2 3 4 5 10 10 40 (1)画散点图; (2)x与y之间是否大致成线性关系? (3)用最小二乘估计求出可片方程: (4)求回归标准误差G: (5)给出与房,的置信度为95%的区间估计: (6)计算x与y的决定系数: (7)对回归方程作方差分析: (8)做回归系数A1显著性的检验: (9)做相关系数的显著性检验; (10)对回归方程作残差图并作相应的分析: (11)求当广告费用为4,2万元时,销售收人将达到多少,并给出置信度 95%的置信区间。 多元回归的最小二乘估计 即得回归参数的最小二乘估计为 B=(XXXy 多元回归的残差阵
多元回归的最⼩⼆乘估计 多元回归的残差阵
D(e)=cov(e,e) =cov((I-H)y,(IH)y) =(I-H)cov(y,y)(I-H) =02(I-H)I (I-H) =o2(I-H) D(e,)=(1-h:)a2,i=1,2,…,n 多元回归的F检验(方程显著性) SST=SSR+SSE 此分解式的证明只需利用(3.25)式即可。构造F检验统计量如下 SSR/p F=SSE/(n-p-1) (3.36) 在正态假设下,当原假设Ha:月===月。=0成立时,F服从自由度为(p, ”一力一1)的F分布。于是,可以利用F统计量对回归方程的总体显著性进行检 验。对于给定的数据,i=1,2,…,n,计算出SSR和SSE,进而得到F的值, 表34 方差分析表 方老来源自由度平方和一 均方 F值 P值 SSR SSR/p SSR/ P(F>F值)=P值 残差 n--l SSE SSEn-p-1) 38E/八n-p-1) 总和 n-1 SST 多元回归的t检验(系数显著性)
多元回归的F检验(⽅程显著性) 多元回归的t检验(系数显著性)
月-N(B,c2),5=0,1,2,…,p (3.39) 据此可以构造t统计量 (3.40) 其中 -√-p-2i=√。--2-护 (3.41) 是回归标准差。 当原假设H0,:B=0成立时,(3.40)式构造的5;统计量服从自由度为m 力-1的t分布。给定显著性水平a,查出双侧检验的临界值ta2。当1,≥。2 时拒绝原值设H:?=0,认为月显著不为零,自变量x,对因变量y的线性效 果显著;当|5<t妇2时接受原假设Ho:8=0,认为B为零,自变量x:对因变 量y的线性效果不显著。 (房-ta2VC,房+ta2Wc) 偏相关系数 ri= (r12-Y13232 (1-ri)(1-2) 多元回归综合题
偏相关系数 多元回归综合题