§24多元线性回归模型的统计检验 拟和优度检验 总体平方和、回归平方和与残差平方和 1、总体平方和:TSs=∑(-)2大小反映y的变动度 (正比) 2、回归平方和:ESS=∑(-2大小反映x对y解 释作用的大小(正比) 3、残差平方和:RSS=∑(-)大小反映随机因素 对y的作用的大小(正比) (二)相互关系 1、前提:y与x1x2…xk之间的关系确为线性关系 数量关系:TSS=ESS+RSS(y的变动可以被全部分解 为解释变量与随机误差的作用) (三)测定拟合优度的统计量 1、判定系数(可决系数) (1)定义:R2 ESS TSS (2)含义:在Y每单位以平方和测度的变动中由解释变量做 出解释的比重 (3)取值范围:0≤R2≤1 (4)意义:R2越接近1表明拟合优度越高,R2越接近于零拟合 优度愈低。 如,p44例2-3-1中R2=0997,表明模型的拟合优度非常高,模型的
§2.4 多元线性回归模型的统计检验 一、 拟和优度检验 总体平方和、回归平方和与残差平方和 1、总体平方和:TSS= 2 ( ˆ ) i i y − y 大小反映 y 的变动度 (正比) 2、回归平方和: ESS= 2 (y ˆ y) i − 大小反映 x 对 y 解 释作用的大小(正比) 3、残差平方和: RSS= 2 ( ˆ ) i i y − y 大小反映随机因素 对 y 的作用的大小(正比) (二) 相互关系 1、 前提:y 与 x1,x2 … xk 之间的关系确为线性关系 数量关系:TSS = ESS + RSS(y 的变动可以被全部分解 为解释变量与随机误差的作用) (三)测定拟合优度的统计量 1、判定系数(可决系数) (1)定义:R2 = TSS RSS TSS ESS = 1− (2)含义:在 Y 每单位以平方和测度的变动中由解释变量做 出解释的比重 (3)取值范围:0≤R2≤1 (4)意义:R2越接近 1 表明拟合优度越高,R2越接近于零拟合 优度愈低。 如,p44 例 2-3-1 中 R2=0.9997,表明模型的拟合优度非常高,模型的
质量很好。 (5)评价: 优:直观、含义明确和方便 缺:①R2是解释变量的单调非降函数,导致为追求较高 的R2而增加解释变量 ②R2接近于1或者0的程度缺乏客观数量标准 1、校正的可决系数 (1)定义:R2=1 其中:S,=RS(n-k-1) S,=TSS/(n-1) a)意义与范围:与可决系数相同(可能小于零此时规定为0) b)优点:不再是K的非降函数 c)与可决系数的关系:同一组数据估计的模型R2≤R2 16-1 如:P44之例23-1R2=16-2-1×(-09979=09940.997=R2 二、方程显著性检验(F检验) (一)假设检验的一般问题 1、关于假设 (1)概念:关于总体分布、数字特征和相互关系的论断成为假 设,以H表示 如H总体服从正态分布 H总体的均值山=1000 H总体X与Y优相同的分布H总体Ⅹ与Y相互独立 (2)原假设与备择假设 者必居其一的假设中的一个称为原假设以H表示,另一
质量很好。 (5)评价: 优:直观、含义明确和方便 缺:○1 R2 是解释变量的单调非降函数,导致为追求较高 的 R2而增加解释变量; ○2 R2接近于 1 或者 0 的程度缺乏客观数量标准 1、校正的可决系数 (1)定义: t r S S R =1− 2 = 1 (1 ) 1 1 2 R n k n − − − − − 其中: S = RSS (n − k −1) r S = TSS (n −1) t a) 意义与范围: 与可决系数相同(可能小于零此时规定为 0) b) 优点:不再是 K 的非降函数 c) 与可决系数的关系:同一组数据估计的模型 2 2 R R 如:P44 之例 2-3-1 (1 0.9997) 16 2 1 16 1 1 2 − − − − R = − =0.9994<0.9997=R2 二、 方程显著性检验(F-检验) (一)假设检验的一般问题 1、关于假设 (1)概念:关于总体分布、数字特征和相互关系的论断成为假 设,以 H 表示 如 H 总体服从正态分布 H 总体的均值 = 10.00 H 总体 X 与 Y 优相同的分布 H 总体 X 与 Y 相互独立 (2)原假设与备择假设 二者必居其一的假设中的一个称为原假设以 H0 表示,另一
个称为备择假设以H1表示 如HoB=0 H1B≠0 (3)假设检验假设可能对也可能错,抽取样本并进行推理决定 假设真假的过程称为假设检验。 2、假设检验的原理与方法 (1)实际推断原理小概率事件(发生的概率部超过0.10)被 认为在一次试验中实际上不会发生。→小概率事件在一次试 验中没有发生是合理的,发生则是不合理的。 (2)假设检验的原理利用实际推断原理这一概率性质的反证 法,即事先假定假设Ho成立,如果导致小概率事件在一次 试验中发生→不合理→假设H不真;若小概率事件在一次 试验中没有发生,→合理,不能认为假设H不真。 (3)检验的方法寻找以合适的统计量T(不一定是T分布) 一有分布、能包含H、H成立条件下不含未知数→构造一 个小概率事件,把T的取值范围分割成不相重叠的两部分Ⅴ 和萨,使 P{T∈T}=a(a≤0.10) V-Ho的拒绝域—H0的接收域a—显著性水平 在H成立的条件下计算T的观察值t若te则表明H导 致小概率事件在一次试验中发生,不合理(实际推断原理), 从而认为H不真,即拒绝Ho;若tgV,没有导致小概率事件 在一次试验中发生,没有不合理,故而不能认为Ho不真即
个称为备择假设以 H1表示。 如 H0 = 0 H1 0 (3)假设检验 假设可能对也可能错,抽取样本并进行推理决定 假设真假的过程称为假设检验。 2、假设检验的原理与方法 (1)实际推断原理 小概率事件(发生的概率部超过 0.10)被 认为在一次试验中实际上不会发生。 小概率事件在一次试 验中没有发生是合理的,发生则是不合理的。 (2)假设检验的原理 利用实际推断原理这一概率性质的反证 法,即事先假定假设 H0 成立,如果导致小概率事件在一次 试验中发生 不合理 假设 H0不真;若小概率事件在一次 试验中没有发生, 合理,不能认为假设 H0不真。 (3)检验的方法 寻找以合适的统计量 T(不一定是 T 分布) —有分布、能包含 H0、H0成立条件下不含未知数 构造一 个小概率事件,把 T 的取值范围分割成不相重叠的两部分 V 和 V ,使: P{T V }= ( 0.10) V—H0的拒绝域 V — H0的接收域 —显著性水平 在 H0成立的条件下计算 T 的观察值 t,若t V 则表明H0导 致小概率事件在一次试验中发生,不合理(实际推断原理), 从而认为 H0不真,即拒绝 H0;若 t V,没有导致小概率事件 在一次试验中发生,没有不合理,故而不能认为 H0 不真即
接受H (4)假设检验与显著性水平 ①改变显著性水平a,就有可能改变检验的结论 ②显著性水平a的数值越小,拒绝H的说服力越强 ③计量经济学统计检验中一般取a≤005 (5)假设检验中的两类错误 第一类错误Ho本身为真,经检验却被拒绝,犯这类错 误的概率为a 第二类错误H0本身不真,经检验却被接受,犯这类错 误的概率为B (6)两类错误间的关系在样本容量不变的条件下,一个减小另 个必然增大(此消彼长) (7)处理方法事先确定a,然后找β最小(功效最大)的检验 方法一今后使用的方法均符合这一要求 (二)方程显著性的检验 1、F一检验 (1)假设H0B1=B2=…=B4=0分解释变量对y没有任何解释作用 H1B,B2B不全为零→解释变量中至少有一部分对y有 解释作用 (2)统计量 ESS/K F(k,n-k-1) RSS/(n-k-1) (3)决策规则
接受 H0。 (4)假设检验与显著性水平 ○1 改变显著性水平 ,就有可能改变检验的结论; ○2 显著性水平 的数值越小,拒绝 H0的说服力越强; ○3 计量经济学统计检验中一般取 0.05 (5)假设检验中的两类错误 第一类错误 H0 本身为真,经检验却被拒绝,犯这类错 误的概率为 第二类错误 H0 本身不真,经检验却被接受,犯这类错 误的概率为 (6)两类错误间的关系 在样本容量不变的条件下,一个减小另一 个必然增大(此消彼长) (7)处理方法 事先确定 ,然后找 最小(功效最大)的检验 方法—今后使用的方法均符合这一要求。 (二)方程显著性的检验 1、F—检验 (1)假设 H0 1 = 2 == K = 0 解释变量对 y 没有任何解释作用 H1 K , , 1 2 不全为零 解释变量中至少有一部分对y有 解释作用 (2)统计量 F = RSS (n − k −1) ESS K ~ F( k , n-k-1) (3)决策规则
若F≥F(k,n-k-1),则Ho不真,即解释变量对y的解释作用 显著→模型有效若F<F(k,n-k-1),则Ho为真,解释变 量对y的解释作用不显著→模型无效 如P44例2-3-1中 F=28682>>670=Fo(2,13):模型是非常有效的 2、软件中F检验的输出格式 来源平方和自由度均方F值P值 df 回归 ESS K ESS÷KF 残差 RSS n-k-1 RSS 总和 TSS -1 (n-k-1) 决策规则若Po≤a(005),认为模型有效,若Po≥a(0.05), 模型无效 (三)F检验与可决系数的关系 (1)数量关系 F= ESS/k RSGn-k-)(-R2)k(与可决系数) R2大则F值大,R2小则F值小 (2)结论间的关系 二者所的结论一般是一致的,但有时会矛盾 三、变量显著性检验(t检验)
若 F≥ F (k,n-k-1),则 H0不真,即解释变量对 y 的解释作用 显著 模型有效 若 F< F (k,n-k-1),,则 H0为真,解释变 量对 y 的解释作用不显著 模型无效。 如 P44 例 2-3-1 中 F = 28682>>6.70=F0.01(2,13) 模型是非常有效的 2、软件中 F 检验的输出格式 来源 平方和 自由度 df 均方 F 值 P 值 回归 残差 总和 ESS RSS TSS K n-k-1 n-1 ESS÷K RSS ÷ (n-k-1) F0 P0 决策规则 若 P0≤ (0.05),认为模型有效,若 P0≥ (0.05), 模型无效 (三)F 检验与可决系数的关系 (1)数量关系 F = R k n k R RSS n k ESS k (1 ) ( 1) ( 1) 2 2 − − − = − − (与可决系数) R2大则 F 值大,R2小则 F 值小 (2)结论间的关系 二者所的结论一般是一致的,但有时会矛盾。 三、变量显著性检验(t 检验)