52二值选择模型 为使y的预测值总是介于[O,1之间,给定x,考虑y的两 点分布概率: P(y=1|x)=F(x,B) P(y=0x)=1-F(x,B 函数F(x,B)也称“连接函数” 通过选择合适的F(x,B),可保证0≤j≤1并将j理解为 “y=1”发生的概率,因为: B(y|x)=1P(y=11x)+0P(y=0|x)=P(y=1|1x) 如果F(x,B)为标准正态的cdf: P(=1|x)=F(,B)=D(xB)=p(dt 该模型称为“ Probit
6 5.2 二值选择模型 为使y的预测值总是介于 之间,给定 ,考虑y的两 点分布概率: 函数 也称“连接函数” 。 通过选择合适的 ,可保证 并将 理解为 “ ”发生的概率,因为: 如果 为标准正态的cdf: 该模型称为“Probit” 。 0,1 x P( 1| ) ( , ) P( 0 | ) 1 ( , ) y F y F = = = = − x x x x F( , ) x β F( , ) x β 0 1 y ˆ y ˆ y =1 E( | ) 1 P( 1| ) 0 P( 0 | ) P( 1| ) y y y y x x x x = = + = = = F( , ) x β P( 1| ) ( , ) ( ) ( ) y F t dt − = = = x x x x
52二值选择模型 如果F(x,B)为“逻辑分布”的cdf P(=1x=F(x,B)=M(x)=,0p(xB) 1+exp(x')(5.1) 该模型称为“ Logit”。 由于逻辑分布的cdf有解析表达式(而标准正态没有) 故计算 Logit比 Probit更为方便
7 5.2 二值选择模型 如果 为“逻辑分布”的cdf (5.1) 该模型称为“Logit”。 由于逻辑分布的cdf有解析表达式(而标准正态没有) ,故计算 Logit比Probit更为方便。 F( , ) x β exp( ) P( 1| ) ( , ) ( ) 1 exp( ) y F = = = + x x x x x
52二值选择模型 对于此非线性模型,进行MLE估计。 以 Logit模型为例。第i个观测数据的概率密度为: f(y1|x1,B) A(xB)若男 1-A(xB),若y=0 f(|x,B)=[(x)[-A(x月 Inf( lx B)=y, In[A(x B)+(1-y)1n [1-A(x B) 假设样本中的个体相互独立,则整个样本的对数似然函 数为 nL(B|x)=∑yn[A(x月+∑(1-y)n[-N(x) 在此非线性模型中,佔计量Bn并非边际效应
8 5.2 二值选择模型 对于此非线性模型,进行MLE估计。 以Logit模型为例。第i个观测数据的概率密度为: 假设样本中的个体相互独立,则整个样本的对数似然函 数为: 在此非线性模型中,估计量 并非边际效应。 ( ), 1 ( | , ) 1 ( ), 0 i i i i i i y f y y = = − = x x x 若 若 1 ( | , ) ( ) 1 ( ) i i y y i i i i f y − x x x = − ln ( | , ) ln ( ) (1 )ln 1 ( ) f y y y i i i i i i x x x = + − − 1 1 ln ( | , ) ln ( ) (1 )ln 1 ( ) n n i i i i i i L y y = = y x x x = + − − MLE ˆ