3.1.2遗漏变量与解释变量相关 根据大样本理论,OLS估计不一致,称为“遗漏变量 偏差”( omitted variablebias) 这种偏差在实践中较常见,成为某些实证研究的致命 伤 比如,研究教育投资回报时,个人能力因无法观测而 遗漏,但能力与教育年限正相关。 存在遗漏变量本身并不要紧;关键在于,遗漏变量不 能与方程的解释变量相关
3.1.2 遗漏变量与解释变量相关 根据大样本理论,OLS估计不一致,称为“遗漏变量 偏差”(omitted variablebias)。 这种偏差在实践中较常见,成为某些实证研究的致命 伤。 比如,研究教育投资回报时,个人能力因无法观测而 遗漏,但能力与教育年限正相关。 存在遗漏变量本身并不要紧;关键在于,遗漏变量不 能与方程的解释变量相关。 6
解决遗漏变量偏差的方法主要有: ()加入尽可能多的控制变量( control variable) (i)随机实验与自然实验 (ⅲ)工具变量法(第10章); (ⅳ)使用面板数据(第12章);
解决遗漏变量偏差的方法主要有: (i)加入尽可能多的控制变量(control variable); (ii)随机实验与自然实验; (iii)工具变量法(第10章); (iv)使用面板数据(第12章); 7
3.2无关变量 与遗漏变量相反的情形是,在回归方程中加入了与被 解释变量无关的变量。假设真实的模型为 a+ x,+8 (3.5) 其中Cov(x1,E)=0。而实际估计的模型为 y=a+Bx1+yx2+(E-yx2)(36) 由于真实参数y=0,故可将模型写为 y=a+Bx,+yx,+e 3.7)
3.2 无关变量 与遗漏变量相反的情形是,在回归方程中加入了与被 解释变量无关的变量。假设真实的模型为 (3.5) 其中 。而实际估计的模型为 (3.6) 由于真实参数 ,故可将模型写为 (3.7) 8
由予2与y无关,根据“无关变量”的定义,也x2与y 的扰动项无关,即Cov(x2,e)=0 扰动项与所有解释变量均无关,故OLS一致,即 plim B=B pliny= y=0 1→0 n→)0 引入无关变量后,受到无关变量的干扰,估计量β 的方差一般会增大
由于 与y无关,根据“无关变量”的定义, 也 与y 的扰动项无关,即 扰动项与所有解释变量均无关,故OLS一致,即 引入无关变量后,受到无关变量的干扰,估计量 的方差一般会增大。 9
3.3建模策略:“由小到大”or“由大到小” “由小到大”( specific to general)的建模方式首先从 最简单的小模型开始,逐渐增加解释变量 比如,先将被解释变量对关键解释变量回归,然后 再加入其他控制变量 但小模型很可能存在遗漏变量偏差,系数估计不一致 t检验、F检验都失效,很难确定如何取舍变量。 10
3.3 建模策略:“由小到大”or“由大到小” “由小到大”(specific to general)的建模方式首先从 最简单的小模型开始,逐渐增加解释变量。 比如,先将被解释变量 对关键解释变量 回归,然后 再加入其他控制变量 。 但小模型很可能存在遗漏变量偏差,系数估计不一致 ,t检验、F检验都失效,很难确定如何取舍变量。 10