注意问题1: 什么是拟合优度高呢? 计量分析中,对使用时间序列数据还是使 用截面数据有着不同的标准: ·对时间序列数据而言,r2的值在0.8,09 以上是很常见的。 ·对于截面数据而言,0.4,05的r2值也不 能算低
注意问题1: 什么是拟合优度高呢? • 计量分析中,对使用时间序列数据还是使 用截面数据有着不同的标准: • 对时间序列数据而言, r 2的值在0.8,0.9 以上是很常见的。 • 对于截面数据而言,0.4,0.5 的r 2值也不 能算低
例2:美国的凯恩斯消费函数,1980-1991 根据美国1980-1991年间个人消费支出与国内生产总 值数据得: y=-23180+0.7194x;r2=0.9909 其中y代表以10亿1987年美元计的个人消费支出 (PcE),x代表以10亿1987年美元计的国内生产总值 (GDP) 结果表明:在1980-1991年期间,GDP每增加1美元, 平均个人消费支出约增加72美分,即边际消费倾向约为 0.72。从字面上解释,约为一232的截距值表明若GDP 为零,平均个人消费支出约为-2320亿美元。再次说 明机械的解释截距是没有经济意义的
例2:美国的凯恩斯消费函数,1980-1991 • 根据美国1980-1991年间个人消费支出与国内生产总 值数据得: • 其中y代表以10亿1987年美元计的个人消费支出 (PCE),x代表以10亿1987年美元计的国内生产总值 (GDP) • 结果表明:在1980-1991年期间,GDP每增加1美元, 平均个人消费支出约增加72美分,即边际消费倾向约为 0.72。从字面上解释,约为-232的截距值表明若GDP 为零,平均个人消费支出约为-2320亿美元。再次说 明机械的解释截距是没有经济意义的。 ˆ 231.80 0.7194 0.9909 2 yt =- + xt r =
231.80+0.7194x.r2=0.9909 严2约为099,说明GDP解释了平均个人消费支出 变动中的99%,因此,在此例中可以认为样本回 归线很好的拟合了样本数据。 尽管产2值很高,但如此简单的一个凯恩斯消费函 数作为解释美国消费支出的模型是否适当呢?需 要考虑。这属于模型设定是否恰当的问题。 ·不过,有时非常简单的回归模型能够提供有用的 信息。根据复杂的模型作出的美国MPc的估计也 表明其约为07左右
• r 2约为0.99,说明GDP解释了平均个人消费支出 变动中的99%,因此,在此例中可以认为样本回 归线很好的拟合了样本数据。 • 尽管r 2值很高,但如此简单的一个凯恩斯消费函 数作为解释美国消费支出的模型是否适当呢?需 要考虑。这属于模型设定是否恰当的问题。 • 不过,有时非常简单的回归模型能够提供有用的 信息。根据复杂的模型作出的美国MPC 的估计也 表明其约为0.7左右。 ˆ 231.80 0.7194 0.9909 2 yt =- + xt r =
注意问题2:拟合优度是不是判断模型质 量的唯一标准呢? ·拟合优度高固然不错,但r2值的大小并不是判断模型质量 的唯一标准。 ·例:中国消费基金三-1472013+6849苏联人口数 2=0.9 ·中国消费与苏联人口显然没有联系。模型中变量选择不合 理 由此可以看出,r2的值高不是判断模型质量的唯一标准, 只是可供参考的一个条件。有时为了追求模型的经济意义, 是可以牺牲一点拟合优度的。 切记要避免仅根据r2的值来选择模型。而应将模型的经济 理论基础、预期的参数符号、参数估计量的统计显著性等 因素作为选择模型的基本准则
注意问题2:拟合优度是不是判断模型质 量的唯一标准呢? • 拟合优度高固然不错,但r 2值的大小并不是判断模型质量 的唯一标准。 • 例:中国消费基金=-14720.13+68.49苏联人口数 r 2=0.9 • 中国消费与苏联人口显然没有联系。模型中变量选择不合 理。 • 由此可以看出, r 2的值高不是判断模型质量的唯一标准, 只是可供参考的一个条件。有时为了追求模型的经济意义, 是可以牺牲一点拟合优度的。 • 切记要避免仅根据r 2的值来选择模型。而应将模型的经济 理论基础、预期的参数符号、参数估计量的统计显著性等 因素作为选择模型的基本准则
扩展 1.可决系数又称为判定系数,样本可决系数; 2.TSS又称为总平方和; 3.EsS又称为解释平方和; 4.有些参考书中将回归平方和记为RSs而将 残差平方和记为ESS,注意区分
扩展 1. 可决系数又称为判定系数,样本可决系数; 2. TSS又称为总平方和; 3. ESS又称为解释平方和; 4. 有些参考书中将回归平方和记为RSS而将 残差平方和记为ESS,注意区分