第5章二值选择模型
第5章 二值选择模型
主要内容 ◆离散被解释变量的例子 ◆二值选择模型 ◆二值选择模型的微观基础 ◆二值选择模型中的异方差问题 ◆稀有事件偏差(选读) ◆含内生变量的Prob模型(选读) ◆双变量Prob模型(选读) ◆部分可观测的双变量Pob模型(选读)
2 主要内容 离散被解释变量的例子 二值选择模型 二值选择模型的微观基础 二值选择模型中的异方差问题 稀有事件偏差(选读) 含内生变量的Probit模型(选读) 双变量Probit模型(选读) 部分可观测的双变量Probit模型(选读)
5.1离散被解释变量的例子 二值选择:考研或不考研;就业或待业;买房或不买房;买保 险或不买保险等。 多值选择:对不同交通方式的选择(走路、骑车、坐车上班); 对不同职业的选择。 这类模型被称为“离散选择模型”或“定性反应模型”。有时 被解释变量只能取非负整数: 企业在某段时间内获得的专利数;某人在一定时间内去医院看 病的次数;某省在一年内发生煤矿事故的次数。 这类数据称为“计数数据”,被解释变量也是离 散的。 考虑到离散被解释变量的特点,通常不宜用OLS进行回归
3 5.1 离散被解释变量的例子 二值选择:考研或不考研;就业或待业;买房或不买房;买保 险或不买保险等。 多值选择:对不同交通方式的选择(走路、骑车、坐车上班); 对不同职业的选择。 这类模型被称为“离散选择模型”或“定性反应模型” 。有时 被解释变量只能取非负整数: 企业在某段时间内获得的专利数;某人在一定时间内去医院看 病的次数;某省在一年内发生煤矿事故的次数。 这类数据称为“计数数据” ,被解释变量也是离 散的。 考虑到离散被解释变量的特点,通常不宜用OLS进行回归
52二值选择模型 “线性概率模型” y=xB+8(i= 优点:计算方便,容易得到边际效应。 缺点:(1)由于E=y-xB,故E1=1-xB或E1=-XB, 因此x必然与E相关,导致估计不一致。 (2)E服从两点分布,而非正态分布。 (3)由于ar(t;)=var(xP),故扰动项E的方差依赖 于x,存在异方差(故应使用稳健标准误)。 (4)可能出现y>1或j<0的不现实情形,参见图 5.1
4 5.2 二值选择模型 “线性概率模型” : 优点:计算方便,容易得到边际效应。 缺点:(1)由于 ,故 或 , 因此 必然与 相关,导致估计不一致。 (2) 服从两点分布,而非正态分布。 (3)由于 ,故扰动项 的方差依赖 于 ,存在异方差(故应使用稳健标准误)。 (4)可能出现 或 的不现实情形,参见图 5.1。 ( 1, , ) i i i y i n = + = x i i i = − y x 1 i i = − x i i = −x i i x i Var( ) Var( ) i i = x β i i x y ˆ 1 y ˆ 0
52二值选择模型 y OLS 图5.10LS与二值选择模型 5
5 5.2 二值选择模型 图5.1 OLS与二值选择模型