多元逐步回归 多元线性回归中自变量的确定: ·根据理论知识与经验决定自变量,由于对 部分自变量的作用不确认,借助统计分析 来实现,剔除: (1)对问题的研究可能不重要; (2)可能实际上与其他变量重叠: (3)较大测量误差
多元线性回归中自变量的确定: • 根据理论知识与经验决定自变量,由于对 部分自变量的作用不确认,借助统计分析 来实现,剔除: (1)对问题的研究可能不重要; (2)可能实际上与其他变量重叠; (3)较大测量误差。 多元逐步回归
为何要剔除一部分自变量? 自变量太多,信息成本高,模型复杂,不 易分析理解; ·高度相关的自变量并不增强模型的预测 能力,反而加大回归系数的样本变差, 削弱模型的描述能力
为何要剔除一部分自变量? 自变量太多,信息成本高,模型复杂,不 易分析理解; • 高度相关的自变量并不增强模型的预测 能力,反而加大回归系数的样本变差, 削弱模型的描述能力
多元逐步回归 ·多元逐步回归-从m个自变量中选择K(K≤m) 个自变量,拟合最优或较理想的多元线性回归方 程。 选出的自变量数应: ·足够少:对应变量无重要作用的自变量不能多, 剔除在方程外 ·充分多:对应变量有重要作用的自变量不能少, 保留在方程中
多元逐步回归 • 多元逐步回归-从m个自变量中选择K(K≤m) 个自变量,拟合最优或较理想的多元线性回归方 程。 选出的自变量数应: • 足够少:对应变量无重要作用的自变量不能多, 剔除在方程外 • 充分多:对应变量有重要作用的自变量不能少, 保留在方程中
自变量选择准测 ·残差平方和(SS残)与确定系数(R2) ·残差均方(MS残)与调整确定系数(AdjR2) ·AC信息统计量 ·Cp统计量 ·预测残差平方和PRESS
自变量选择准则 • 残差平方和(SS残)与确定系数(R2) • 残差均方( MS残)与调整确定系数(Adj R2) • AIC信息统计量 • CP统计量 • 预测残差平方和PRESS
残差平方和(SS残) ·残差平方和(SS残)与确定系数(R2) 以某一自变量X被引入模型中导致残差平方 和的改变量评价在此模型条件下X对应变 量影响程度; 引入Xj,SS残减少量多,则X对Y的作用大, 可被引入 剔除Xi, S残增加量多,则Xj对Y的作用大, 不应剔除
残差平方和(SS残) • 残差平方和(SS残)与确定系数(R2) 以某一自变量Xj被引入模型中导致残差平方 和的改变量评价在此模型条件下Xj对应变 量影响程度; 引入Xj,SS残减少量多,则Xj对Y的作用大, 可被引入; 剔除Xj, SS残增加量多,则Xj对Y的作用大, 不应剔除.