“由大到小”( general to specific)的建模方式从尽可 能大的模型开始,收集所有可能的解释变量,再逐步剔 除不显著的解释变量(可依次剔除最不显著,即p值最大 的变量) 虽然冒着包含无关变量的危险,但危害性没有遗漏变 量严重。 但在实际操作上,很难找到与被解释变量相关的所有 解释变量 实证研究中,常采用以上两种策略的折中方案。 11
“由大到小”(general to specific)的建模方式从尽可 能大的模型开始,收集所有可能的解释变量,再逐步剔 除不显著的解释变量(可依次剔除最不显著,即p值最大 的变量)。 虽然冒着包含无关变量的危险,但危害性没有遗漏变 量严重。 但在实际操作上,很难找到与被解释变量相关的所有 解释变量。 实证研究中,常采用以上两种策略的折中方案。 11
3.4解释变量个数的选择 好的经济理论使用简洁的模型来很好地描述复杂的经 济现实,但这两个目标常常矛盾。 加入过多的解释变量可提高模型的解释力(比如增大拟 合优度),但也牺牲了模型的简洁性( parsimony)。 需在模型的解释力与简洁性之间找到最佳平衡 在时间序列模型里,常需选择解释变量滞后的期数(比 如,确定自回归模型的阶数) 更一般地,要确定解释变量的个数 12
3.4 解释变量个数的选择 好的经济理论使用简洁的模型来很好地描述复杂的经 济现实,但这两个目标常常矛盾。 加入过多的解释变量可提高模型的解释力(比如增大拟 合优度 ),但也牺牲了模型的简洁性(parsimony)。 需在模型的解释力与简洁性之间找到最佳平衡。 在时间序列模型里,常需选择解释变量滞后的期数(比 如,确定自回归模型的阶数)。 更一般地,要确定解释变量的个数。 12
可供选择的权衡标准如下, (1)校正可决系数R:选择解释变量的个数K以最大化R (2)“赤池信息准则”( Akaike information criterion, AC):选择解释变量的个数K,使得目标函数最小化: min alc≡ln SSR,2 +-K K (38) 13
可供选择的权衡标准如下。 (1)校正可决系数 :选择解释变量的个数K以最大化 (2)“赤池信息准则”(Akaike Information Criterion, AIC):选择解释变量的个数K,使得目标函数最小化: (3.8) 13
其中,SSR为残差平方和 第一项为对模型拟合度的奖励(减少残差平方和SSR) 第二项为对解释变量过多的惩罚(为解释变量个数K的 增函数)。 当K上升时,第一项下降而第二项上升 (3)“贝叶斯信息准则”( Bayesian Information Criterion,BIC或“施瓦茨信息准则”( Schwarz Information criterion,SIC或SBIC):选择解释变量的个 数K,使得目标函数最小化:
其中,SSR为残差平方和 。 第一项为对模型拟合度的奖励(减少残差平方和SSR). 第二项为对解释变量过多的惩罚(为解释变量个数K的 增函数)。 当K上升时,第一项下降而第二项上升。 (3)“贝叶斯信息准则”(Bayesian Information Criterion,BIC)或“施瓦茨信息准则”(Schwarz Information Criterion,SIC或SBIC):选择解释变量的个 数K,使得目标函数最小化: 14
SSR In min bic≡l K 3.9) K BIC准则与AIC准则仅第二项有差别 般来说hn>2,故BIC准则对于解释变量过多的惩罚 比AIC准则更为严厉。 BIC准则更强调模型的简洁性。 在时间序列模型中,常用信息准则确定滞后阶数 考虑p阶自回归模型, y=B+Ay1+…+Byp+E1(3.10) 15
(3.9) BIC准则与AIC准则仅第二项有差别。 一般来说 ,故BIC准则对于解释变量过多的惩罚 比AIC准则更为严厉。 BIC准则更强调模型的简洁性。 在时间序列模型中,常用信息准则确定滞后阶数。 考虑p 阶自回归模型, (3.10) 15