172通过随机分组解决选择难题 ◆因为D独立于(my在随机分组的情况下,只需 要计算样本中实验组与控制组的平均收入之差 即可一致地估计平均处理效应,即“差额估计量 (difference estimator) ◆上述结果在更弱的均值独立(,即只要都均 ean independence)条件下也成立 值独立于马 ◆如果只关心ATT,则只需要均值独立于即可, 因为选择偏差(|D=1为o。D=0) 16
16 17.2 通过随机分组解决选择难题 因为 独立于 。在随机分组的情况下,只需 要计算样本中实验组与控制组的平均收入之差, 即可一致地估计平均处理效应,即“差额估计量 ”(difference sestimator)。 上述结果在更弱的均值独立(mean independence)条件下也成立,即只要 都均 值独立于 。 如果只关心ATT,则只需要 均值独立于 即可, 因为选择偏差 为0。 Di 0 1 ( , ) i i y y 0 1 , i i y y Di 0i y Di E( | 1) E( | 0) 0 0 i i i i y D y D = − =
172通过随机分组解决选择难题 ◆如果只有观测数据,很可能不满足“y均值独立 于的假设。 ◆可使用以下两类方法。 第一类方法假设个体依可测变量选择是否参加 项目第3-7节)。 第二类方法假设个体依不可测变量选择(第8节)
17 17.2 通过随机分组解决选择难题 如果只有观测数据,很可能不满足“ 均值独立 于 ”的假设。 可使用以下两类方法。 第一类方法假设个体依可测变量选择是否参加 项目(第3-7节)。 第二类方法假设个体依不可测变量选择(第8节) 。 0i y Di
173依可测变量选择 除u0外,通常还可观测到个体的一些特征比 如年龄、性别、培训前收入,记为向量X也称 为“协变量”( covariates)。总体可由(yn,y,D,x) 来表示。 ◆如果个体对的选择完全取决于可观测的x称 为“依可测变量选择,则可以找到估计处理效应 的合适方法即使没有合适的工具变量) ◆如果个体对的选择完全取决于x则在给定x 的情况下,潜在结果(y,将独立于。D 18
18 17.3 依可测变量选择 除 外,通常还可观测到个体i的一些特征,比 如年龄、性别、培训前收入,记为向量 ,也称 为“协变量”(covariates)。总体可由 来表示。 如果个体i对 的选择完全取决于可观测的 ,称 为“依可测变量选择,则可以找到估计处理效应 的合适方法(即使没有合适的工具变量)。 如果个体 对的选择完全取决于 ,则在给定 的情况下,潜在结果 将独立于 。 ( , ) i i y D i x 0 1 ( , , , ) y y D x i x Di Di i x i x 0 1 ( , ) i i y y Di
173依可测变量选择 Rosenbaum and rubin(1983)提出“ 可忽略性”假设: 假定171可忽略性( Ignorability ◆给定x,则(y,独立于记为(,n)+中 表示相互独立。 可忽略性”的含义是,给定x,则(y,对于的 D影响可以忽略。 19
19 17.3 依可测变量选择 Rosenbaum and Rubin(1983)提出“ 可忽略性”假设: 假定17.1可忽略性(Ignorability)。 给定 ,则 独立于 ,记为 ,其中“ ”表示相互独立。 “可忽略性”的含义是,给定 ,则 对于的 影响可以忽略。 i x 0 1 ( , ) i i y y Di 0 1 ( , ) | i i i i y y D ⊥ x ⊥ i x 0 1 ( , ) i i y y Di
173依可测变量选择 ◆可忽略性也称为“无混淆 unconfoundedness),“条件独立假定 简记CIA),或“依可测变量选择” ◆此假定意味着,绐定x,则(y,在处理组与控制 组的分布完全一样,即 F(oi, yu lx, Di=1)=f(oi, yu 分布函数。在很多情况下,只需更弱的均值 独立假定
20 17.3 依可测变量选择 可忽略性也称为“无混淆 ”(unconfoundedness), “条件独立假定”( 简记CIA),或“依可测变量选择” 。 此假定意味着,给定 ,则 在处理组与控制 组的分布完全一样,即 为分布函数。在很多情况下,只需更弱的均值 独立假定。 i x 0 1 ( , ) i i y y 0 1 0 1 ( , | , 1) ( , | , 0) F y y D F y y D i i i i i i i i x x = = = F()