(一)必要性 1、必要性模型通过F检验(模型有效)仅只表示解释变量作为 一个整体以线性模型的形式对y的解释作用是显著 的,并不能说明每个解释变量都是必需的,从而需要 判断每一个解释变量的作用是否显著。 2、前提模型通过F检验 (二)方法 1、假设Ho:B=0 H1:β 2、检验统计量 ~1(n-k-1)(Ho为真) 其中B-B的OLS估计量Sn=√G2-B的标准误(愈小愈好) 0 cn(xx)主对角现第1个元素 3、决策规则 若|t≥t2(n-k-1),则认为x对y的解释作用显著;否 则不显著。 例p4例2-3-1中 t=32.363 t 5.701 取a=001,查t分布表得tm2(n-k-1)=10013)=3012,可见 所有回归系数的t统计量的绝对值均大于该临界值,故而GDP(X1) 和上年消费额(X2)对消费额都有显著解释作用,均应予以保留
(一)必要性 1、必要性 模型通过 F 检验(模型有效)仅只表示解释变量作为 一个整体以线性模型的形式对 y 的解释作用是显著 的,并不能说明每个解释变量都是必需的,从而需要 判断每一个解释变量的作用是否显著。 2、前提 模型通过 F 检验 (二)方法 1、假设 H0 : = 0, j H1 : j 0 2、检验统计量 t = ~ ( 1) ˆ ˆ t n − k − s j j (H0 为真) 其中 j ˆ — j 的 OLS 估计量 j S = 2 ˆ jj c — j ˆ 的标准误(愈小愈好) 2 ˆ = 1 2 − − n k ei jj c —( 1 ) − X X T 主对角现第 j+1 个元素 3、决策规则 若 | t| ≥ ( 1) t 2 n − k − ,则认为 xj 对 y 的解释作用显著;否 则不显著。 例 p44 例 2-3-1 中 | t 1 | = 32.363 | t 2 | = 5.701 取 = 0.01, 查 t 分布表得 t 2 (n − k −1) = t .0005(13) = 3.012 ,可见 所有回归系数的 t 统计量的绝对值均大于该临界值,故而 GDP(X1) 和上年消费额(X2)对消费额都有显著解释作用,均应予以保留
§2.5多元线性回归模型的置信区间 参数的置信区间 (一)回归系数的置信区间 、使用的统计量 B-B t(n-k-1) 2、置信度为(1-a)的置信区间:(B,-5n,B+S) 3、P4例2-3-1中的回归系数的99置信区间 查表得tm2(n-k-1)=t0133012 从回归计算结果中可得 B=540.52=79.081 B 0.4809 0.0149 B2=0.1985 S:=0.0348 可计算得,B,B2的置信度99%的置信区间分别为 (302.33 33778.71) (04360 0.5258) (00937 0.3033) (二)置信区间的意义 以95%的置信度为例,它表明重复估计的区间中约有 95%的区间包含有参数的真值;同一置信度之下,区间长 度越短越好。 上例中,B1得置信区间的长度d=0.0898在三个区间中 最短表明其稳定性最好,质量最高
§2.5 多元线性回归模型的置信区间 一、参数的置信区间 (一)回归系数的置信区间 1、使用的统计量 ~ ( 1) ˆ − − − = t n k S t J j j 2、置信度为(1- )的置信区间:( j j j − t S j + S ˆ , ˆ 2 ) 3、P44 例 2-3-1 中的回归系数的 99%置信区间 查表得 t 2 (n − k −1) = t 0.005 (13)3.012 从回归计算结果中可得: 540.52 ˆ 0 = 79.081 0 ˆ = S 0.4809 ˆ 1 = 0.0149 1 ˆ = S 0.1985 ˆ 2 = 0.0348 2 ˆ = S 可计算得 0 1 2 , , 的置信度 99%的置信区间分别为: (302.33 , 33778.71) (0.4360 , 0.5258) (0.0937 , 0.3033) (二)置信区间的意义 以 95%的置信度为例,它表明重复估计的区间中约有 95%的区间包含有参数的真值;同一置信度之下,区间长 度越短越好。 上例中, 1 得置信区间的长度 d=0.0898 在三个区间中 最短表明其稳定性最好,质量最高
被解释变量预测值的置信区间 (一)被解释变量的预测值及预测误差的方差 、Y的预测值 设模型=AB经检验是有效的,对所确定(方法 不限)的样本以外的解释变量的观测值X0=(1x10,x20, xo),Y的预测值被定义为: 如P4例2-3-1中假设1997年GDP=7466282(亿元),上期 消费额40172(亿元)那么1997年的消费额的预测值为 540.52 =074628240172)04809=44231(亿元) 0.1985 2、预测误差及其方差 (1)预测误差 eo =yo-yo (2)误差的方差Var(e)=o2(+X0(xx)x) (3)误差的标准误6=6√+X0(xx)xo (二)yo的置信度为(1-a)置信区间 1、统计量 t(n-k-1) 2、置信区间(0-1mo。,+n。) 3、该置信区间的特性X接近x=(1x,x2…,x)时区间 较短,X0离ξ越远,区间越长
二、被解释变量预测值的置信区间 (一)被解释变量的预测值及预测误差的方差 1、Y 的预测值 设模型 Y ˆ = XB ˆ 经检验是有效的,对所确定(方法 不限)的样本以外的解释变量的观测值 X0 =(1,x10,x20,… xk0) ,Y 的预测值被定义为: 0 y ˆ = X0 B ˆ 如 P44 例 2-3-1 中假设 1997 年 GDP=74662.82(亿元),上期 消费额 40172(亿元)那么 1997 年的消费额的预测值为 ( ) = 0.1985 0.4809 540.52 yˆ 0 1,74662.82,40172 =44420.31(亿元) 2、预测误差及其方差 (1)预测误差 0 0 0 e = y − y ˆ (2)误差的方差 Var( 0 e ) = (1 ( ) ) 0 1 0 2 T T X X X X − + (3) 误差的标准误 0 1 0 ˆ ˆ 1 ( ) 0 T T e X X X X − = + (二)y0 的置信度为(1- )置信区间 1、统计量 t = ~ ( 1) ˆ ˆ 0 0 0 − − − t n k y y e 2、置信区间 ( 0 0 ˆ ˆ , ˆ ˆ 0 2 e 0 2 e y − t y + t ) 3、该置信区间的特性 X0 接近 (1, , , , ) 1 2 k X = x x x 时区间 较短,X0 离 X 越远,区间越长
§2.6异方差性 含义及产生的机理 1、含义:异方差的含义指线性回归模型 y=Bo+B,xu+B2x Boxx +u 中基本假设同方差Ⅴar(A)=σ2,i=12,…n的违背,即 (1)Var(A)=an2,1=12…n(随机误差项的方差不完全相同); (2)模型的其它基本假设不变。 2、产生机理: (1)模型设立时忽略的因素对被解释变量影响随解释变 量取值的不同而不同 (2)使用截面数据的模型中随机误差项包含的内容随解 释变量取值不同而改变。 例如:以绝对收入理论建立的模型 C1=B+B1l1+1 中使用截面数据(将消费者按收入水平不同进行分组),随 收入水平提高,人的消费行为的不可预知性增强,随机误差 项的分布范围扩大,从而Var()逐渐增大,不再保持不变。 二、常见形式 1、Var(μ)=∫(x1,x2…x)2(如在一元线性回归模型 y=+Bx+1中Va()=0%) 2、不规律(较少见)
§2.6 异方差性 一、 含义及产生的机理 1、含义:异方差的含义指线性回归模型 i i i k ki i y = 0 + 1 x1 + 2 x2 ++ x + 中基本假设同方差 Var( ) i = 2 ,i = 1,2, n 的违背,即 (1)Var( 2 ) i = i , i = 1,2, n (随机误差项的方差不完全相同); (2)模型的其它基本假设不变。 2、产生机理: (1)模型设立时忽略的因素对被解释变量影响随解释变 量取值的不同而不同; (2)使用截面数据的模型中随机误差项包含的内容随解 释变量取值不同而改变。 例如:以绝对收入理论建立的模型 i i i C = 0 + 1 I + i = 1,2, n 中使用截面数据(将消费者按收入水平不同进行分组),随 收入水平提高,人的消费行为的不可预知性增强,随机误差 项的分布范围扩大,从而 Var( ) i 逐渐增大,不再保持不变。 二、 常见形式 1、Var( 2 1 2 ) ( , ) i i i ki = f x x x (如在一元线性回归模型 i i i y = 0 + 1 x + 中 Var( i i x 2 ) = ) 2、不规律(较少见)
三、异方差的后果 指模型中存在异方差,但估计之前没有发觉,依然使用 OLS或ML估计参数所导致的不良后果 1、B=(xx)2(xY)虽然仍为无偏的,但却不再是有效的 (方差不是最小的,参数变动范围更大,稳定性降低); 2、变量显著性检验和方程显著性检验的功效下降甚至 失效(高估误差项方差,T统计量分母被反常扩大,导致T 值减小,增加接受原假设的概率,将有效的解释变量误判为 不显著的:残差扩大,回归平方和ESS减小F=ES非 RSS/(n 正常缩小增加接受“方程作用不显著”的概率); 3、模型的预测功能失效(预测误差的方差增大,导致 区间长度在置信度不变的条件下增加,预测的精度下降)。 四、异方差的检验(检测、侦察或诊断) 1、图示法(残差诊断图)一国外有称非正式方法 步骤:直接用OLS估计模型参数,计算残差e=y-j的 平方作为误差项方差的近似→以x为横坐标,e2为纵坐 标作散点图→判断,若图形规律则说明有异方差;否则没 有 评价:直观,简便; 缺乏客观标准 2、Park检验
三、 异方差的后果 指模型中存在异方差,但估计之前没有发觉,依然使用 OLS 或 ML 估计参数所导致的不良后果: 1、 ( ) ( ) ˆ 1 B X X X Y T − T = 虽然仍为无偏的,但却不再是有效的 (方差不是最小的,参数变动范围更大,稳定性降低); 2、变量显著性检验和方程显著性检验的功效下降甚至 失效(高估误差项方差,T 统计量分母被反常扩大,导致 T 值减小,增加接受原假设的概率,将有效的解释变量误判为 不显著的;残差扩大,回归平方和 ESS 减小,F= RSS (n − k −1) ESS k 非 正常缩小增加接受“方程作用不显著”的概率); 3、模型的预测功能失效(预测误差的方差增大,导致 区间长度在置信度不变的条件下增加,预测的精度下降)。 四、 异方差的检验(检测、侦察或诊断) 1、图示法(残差诊断图)—国外有称非正式方法 步骤:直接用 OLS 估计模型参数,计算残差 ei = i i y − y ˆ 的 平方作为误差项方差的近似 → 以 xj 为横坐标,ei 2 为纵坐 标作散点图 → 判断,若图形规律则说明有异方差;否则没 有。 评价:直观,简便; 缺乏客观标准 2、Park 检验