餐馆编号x1X2x3x4x5y5一153.2163168.660046.52218.51522.52091116.03311.38810109.4191918.247484.71527287277.010.0557.3791517.4531117.568617.96093.061093.672.55321.51718.57405783827.3109114.541614.0995.9491011.661.321661023.9910143129.81112514.2111169.4215159.41393722.512126620.691.040001812.013131.9136.128411412.814143.061267.860.312731534157.32151.124042.7161646.211473.6123.261091741778.8300171.7155717.6181811.17938.842281111.0198.6901519105.3377228.42052048.9160161.564516.2212122.1843275910.8122.6222211.17938.842281033.723238.6901416.5105.337722462448.9160161.564519.3252522.184122.632751011.6标准化回归一相对重要性分析(例题10一1)思考题、讨论、作业、技能操作:参考资料(含参考书籍、文献、网络资料):[1]《统计学一基于SPSS》》(第3版),贾俊平编著,中国人民大学出版社,2019年4月。[2】《应用统计学》(第五版),卢冶飞编著,清华大学出版社,2022年6月。[3]《统计学原理与SPSS应用》,季丽,黄爱玲主编,立信会计出版社,2021年5月。-21-
- 21 - 标准化回归—相对重要性分析 (例题10—1) 思考题、讨论、作业、技能操作: 参考资料(含参考书籍、文献、网络资料): [1]《统计学—基于 SPSS》(第 3 版),贾俊平编著,中国人民大学出版社,2019 年 4 月。 [2]《应用统计学》(第五版),卢冶飞编著,清华大学出版社,2022 年 6 月。 [3]《统计学原理与 SPSS 应用》,季丽, 黄爱玲主编,立信会计出版社,2021 年 5 月
教学后记:-22 -
- 22 - 教学后记:
教学单元教案参考模板授课题目多元线性回归第二十三次课教学时数2 学时授课时间教学目的与要求:能够进行多重共线性的识别并且能利用回归方程进行预测。教学基本内容:1.拟合优度和显著性检验2.多重共线性及其处理。3.利用回归方程进行预测。4.哑变量回归教学重点、难点:重点:变量选择与逐步回归,利用回归方程进行预测难点:多重共线性及其识别教学方法:讲授法,演示法,案例分析,讨论互动,实操教学过程:补充内容10.2拟合优度和显著性检验10.2.1模型的拟合优度多重判定系数1.回归平方和占总平方和的比例2.计算公式为之(,-)SSRSSETR2=15SSTSST(y/ -)isl3.因变量取值的变差中,能被估计的多元回归方程所解释的比例修正多重判定系数1.用样本量n和自变量的个数k去修正R得到2.计算公式为n-1n-k-3.避免增加自变量而高估R4.意义与R类似5.数值小于R-23 -
- 23 - 教学单元教案参考模板 授课题目 多元线性回归 教学时数 2 学时 授课时间 第二十三次课 教学目的与要求: 能够进行多重共线性的识别并且能利用回归方程进行预测。 教学基本内容: 1. 拟合优度和显著性检验 2. 多重共线性及其处理。 3. 利用回归方程进行预测。 4. 哑变量回归 教学重点、难点: 重点:变量选择与逐步回归,利用回归方程进行预测 难点:多重共线性及其识别 教学方法: 讲授法,演示法,案例分析,讨论互动,实操 教学过程: 10.2 拟合优度和显著性检验 10.2.1 模型的拟合优度 多重判定系数 1.回归平方和占总平方和的比例 2.计算公式为 SST SSE SST SSR y y y y R n i i n i i 1 ˆ 1 2 1 2 2 3.因变量取值的变差中,能被估计的多元回归方程所解释的比例 修正多重判定系数 1.用样本量n和自变量的个数k去修正R 2得到 2.计算公式为 1 1 1 1 2 2 n k n R a R 3.避免增加自变量而高估 R 2 4.意义与 R 2类似 5.数值小于R 2 补充内容
多重相关系数1.多重判定系数的平方根R2.反映因变量y与k个自变量之间的相关程度3.实际上R度量的是因变量的观测值V.与由多元回归方程得到的预测值之间的关系强度,即多重相关系数R等于因变量的观测值,与估计值之间的筒单相关系数即R=R=I(一元相关系数r也是如此,即。读者自己去验证)Ixy=y估计标准误差S。1.对误差项的标准差的一个估计值2.衡量多元回归方程的拟合优度3.计算公式为2(v1-)SSE1=VMSESe=Vn-k-1n-10.2.2模型的显著性检验线性关系检验1.检验因变量与所有自变量之间的线性关系是否显著2.也被称为总体的显著性检验3.检验方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著■如果是显著的,因变量与自变量之间存在线性关系■如果不显著,因变量与自变量之间不存在线性关系线性关系检验1.提出假设■ H%: β=β=..=β=0线性关系不显著■H:β,β,…β至少有一个不等于02.计算检验统计量F-24 -
- 24 - 多重相关系数 1.多重判定系数的平方根R 2.反映因变量y与k个自变量之间的相关程度 3.实际上R度量的是因变量的观测值y i 与由多元回归方程得到的预测值 yˆi 之间的关系强度,即多重相关系数R等于因变量的观测值y i 与估计值yˆi 之间的简单相关系数即 R R ryyˆ 2 (一元相关系数r也是如此,即 rxy ryyˆ。读者自己去验证) 估计标准误差 Se 1.对误差项的标准差 的一个估计值 2.衡量多元回归方程的拟合优度 3.计算公式为 MSE n k SSE n k y y S n i i i e 1 1 ˆ 1 2 10.2.2 模型的显著性检验 线性关系检验 1.检验因变量与所有自变量之间的线性关系是否显著 2.也被称为总体的显著性检验 3.检验方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用 F 检验 来分析二者之间的差别是否显著 如果是显著的,因变量与自变量之间存在线性关系 如果不显著,因变量与自变量之间不存在线性关系 线性关系检验 1.提出假设 H0: 1 2 k=0 线性关系不显著 H1: 1, 2, k至少有一个不等于0 2.计算检验统计量F
(, - /kSSR/k_~F(k,n-k- 1)F=SSE/(n - k - 1)Z(v; - /n - k - 1)=13.确定显著性水平α和分子自由度k、分母自由度n-k-1找出临界值Fα4.作出决策:若F>Fα,拒绝H回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竞要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第I类错误(弃真错误)4.对每一个自变量都要单独进行检验5.应用t检验统计量(步骤)1.提出假设■H:bi=0(自变量X与因变量y没有线性关系)■H:b0(自变量X与因变量y有线性关系)2.计算检验的统计量tB~ t(n - k- 1)Spi3.确定显著性水平α,并进行决策■「ttaz,拒绝H;tktaz,不拒绝H回归系数的推断(置信区间)回归系数在(1-)%置信水平下的置信区间为β, ± ta/(n - k - 1)sp)S.Spr=Z(, -x)回归系数的抽样标准差多重共线性的处理-25-
- 25 - ~ ( , 1) ˆ ( 1) ˆ ( 1) 1 2 1 2 F k n k y y n k y y k SSE n k SSR k F n i i n i i 3.确定显著性水平和分子自由度k、分母自由度n-k-1找出临界值F 4.作出决策:若F>F ,拒绝H0 回归系数的检验 1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验 2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定 3.对回归系数检验的个数进行限制,以避免犯过多的第Ⅰ类错误(弃真错 误) 4.对每一个自变量都要单独进行检验 5.应用 t 检验统计量 (步骤) 1.提出假设 H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系) 2.计算检验的统计量 t ~ ( 1) ˆ ˆ t n k S t i i 3.确定显著性水平,并进行决策 t >t ,拒绝H0; t <t ,不拒绝H0 回归系数的推断 (置信区间) 回归系数在(1-)%置信水平下的置信区间为 i i t n k s 2( 1) ˆ ˆ 2 ˆ x x s s i e i 回归系数的抽样标准差 多重共线性的处理