4.2.2可忽略性假设 观察性研究仅对观测数据进行观察,以推断变量间的因果效应,但这种方法不能由研究者决定 是否针对某些研究对象采取干预或对照操作,因此观察性研究不再满足随机对照试验的条件。 在可忽略性假设(Ignorability of Treatment Assignment Mechanism)中阐述了干预分配机制的可 忽略性:即,在给定协变量V的条件下,干预X的分配独立于潜在结果(化,Y)独立于XIV。可忽略 性假设表明了两点:(1)如果给定两个研究对象共同的协变量V,不管他们的分配机制如何,二 者的潜在结果应该是相同的:(2)如果给定两个研究对象共同的协变量V,无论他们潜在结果的 值是什么,它们的干预分配机制应该是相同的。因此,可忽略性假设又被称为无混杂假设,它意味 着在具有相同协变量的研究对象之间,无论进行干预还是进行对照都不会影响潜在结果,也就是分 配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3正值假设 如果在给定某些协变量的情况下,其干预分配机制是固定不变的,那么途类依据协变量所做 的分层中,至少有一种潜在结果是无法观察到的,在这种情况下,是无法通过潜在结果之间的差别 来推断因果关系的。例如,假设有两种药物A和B,想要评估药物A对孕妇的影响,孕中期的孕妇 总是被分配服用药物A,那么在孕中期孕妇这个分组中研究药物B对影响是役有意义的。正值假 设可用数学符号表达为:0<px=1<1,表明在基于协变量的分层中莓个研究对象接受干预或 对照的概率都是正值。正值假设表明了分配机制的可变性,这对仿对干预效果有着不可忽视的重要 意义。 在文献[Io]中,可忽略性假设和正值假设一起被称为强可忽略性分配假设(Strongly Ignorable Treatment Assignment)。二者条件相合就能得到总/体的可识别平均因果效应: E(化-Y)=E(化-YIV)】=EE(Y1X=1,)-E(YIO】。句忽略性假设表明了随机对照试验和观 察性研究的区别,当协变量的分布在干预组和对照组不大致时,就会产生一些偏差,我们将在下一 部分进行讨论。 4.3潜在结果的因果推理方法 观察性研究中如果忽略了协变量的作用,仅使用随机对照试险进行因果关系推断就会产生偏差 我们就将这种影响因果关系估计的变量称为混杂因素,判定混杂因素是因果推断中最基本和最关键 的问题。文献[20]基于相关关系的度量定必混杂因素为:如果两个变量之间相关关系的度量受到第 三个变量的影响,那么称第三个变量为混杂因素。文献22]则从潜在结果出发定义了混杂因素: p(化IX=1)=p(化|X=0)且Y。X=1)=pY。|X=0),即如果干预总体的潜在结果Y。和Y的分布与 对照总体的潜在结果的分布糊夙那么可以说在干预组和对照组之间无因混在因素而产生的混杂偏 差。 本节将在4.2并斑分绍的潜在结果模型的三个基本假设基础上,对潜在结果模型中现有的因果 推理方法进行延展,义根据其控制混杂因素的方式,我们重点介绍其中三种:匹配法、逆概率加权和 分层方法。 4.3.1匹配法 在可忽略性假设中,协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻 重的作用,为了消除协变量分布在两组研究对象之间的差异,匹配法(Matching Methods)常用于 观察性研究中,其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合, 使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布,然后再根据匹配数据进行 因果推断。鲁宾等人在1973年提出用一个或多个协变量构建协变量集合,但在一些因果关系中, 所涉及到的协变量较多,难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果。因此, 文献[24]中提出了倾向值匹配(Propensity Score Matching),即将协变量的倾向值作为参考值来构 造匹配集合,并逐渐成为了观察性研究中最常用的匹配方法。 文献[24中同时定义了倾向值为给定协变量时干预的条件概率:π(W=p(X=1川),并提出如果
4.2.2 可忽略性假设 观察性研究仅对观测数据进行观察,以推断变量间的因果效应,但这种方法不能由研究者决定 是否针对某些研究对象采取干预或对照操作,因此观察性研究不再满足随机对照试验的条件。 在可忽略性假设(Ignorability of Treatment Assignment Mechanism)中阐述了干预分配机制的可 忽略性;即,在给定协变量V 的条件下,干预 X 的分配独立于潜在结果 1 0 ( , ) Y Y 独立于 X V| 。可忽略 性假设表明了两点:(1)如果给定两个研究对象共同的协变量V ,不管他们的分配机制如何,二 者的潜在结果应该是相同的;(2)如果给定两个研究对象共同的协变量V ,无论他们潜在结果的 值是什么,它们的干预分配机制应该是相同的。因此,可忽略性假设又被称为无混杂假设,它意味 着在具有相同协变量的研究对象之间,无论进行干预还是进行对照都不会影响潜在结果,也就是分 配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3 正值假设 如果在给定某些协变量的情况下,其干预分配机制是固定不变的,那么在这些依据协变量所做 的分层中,至少有一种潜在结果是无法观察到的,在这种情况下,是无法通过潜在结果之间的差别 来推断因果关系的。例如,假设有两种药物 A 和 B,想要评估药物 A 对孕妇的影响,孕中期的孕妇 总是被分配服用药物 A,那么在孕中期孕妇这个分组中研究药物 B 对其影响是没有意义的。正值假 设可用数学符号表达为: 0 ( 1| ) 1 p X V ,表明在基于协变量的分层中,每个研究对象接受干预或 对照的概率都是正值。正值假设表明了分配机制的可变性,这对估计干预效果有着不可忽视的重要 意义。 在文献[10]中,可忽略性假设和正值假设一起被称为强可忽略性分配假设(Strongly Ignorable Treatment Assignment ) 。 二 者 条 件 相 合 就 能 得 到 总 体 的 可 识 别 平 均 因 果 效 应 : 1 0 1 0 E Y Y E E Y Y V E E Y X V E Y X V ( ) [ ( | )] [ ( | 1, ) ( | 0, )] 。可忽略性假设表明了随机对照试验和观 察性研究的区别,当协变量的分布在干预组和对照组不一致时,就会产生一些偏差,我们将在下一 部分进行讨论。 4.3 潜在结果的因果推理方法 观察性研究中如果忽略了协变量的作用,仅使用随机对照试验进行因果关系推断就会产生偏差 我们就将这种影响因果关系估计的变量称为混杂因素,判定混杂因素是因果推断中最基本 和最关键 的问题。文献[20]基于相关关系的度量定义混杂因素为:如果两个变量之间相关关系的度量受到第 三个变量的影响,那么称第三个变量为混杂因素。文献[22]则从潜在结果出发定义了混杂因素: 1 1 p Y X p Y X ( | 1) ( | 0) 且 0 0 p Y X p Y X ( | 1) ( | 0) ,即如果干预总体的潜在结果Y0 和Y1的分布与 对照总体的潜在结果的分布相同,那么可以说在干预组和对照组之间无因混在因素而产生的混杂 偏 差。 本节将在 4.2 节所介绍的潜在结果模型的三个基本假设基础上,对潜在结果模型中现有的因果 推理方法进行延展,根据其控制混杂因素的方式,我们重点介绍其中三种:匹配法、逆概率加权和 分层方法。 4.3.1 匹配法 在可忽略性假设中,协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻 重的作用,为了消除协变量分布在两组研究对象之间的差异,匹配法(Matching Methods)常用于 观察性研究中,其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合 , 使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布,然后再根据匹配数据进行 因果推断。鲁宾[23]等人在 1973 年提出用一个或多个协变量构建协变量集合,但在一些因果关系中, 所涉及到的协变量较多,难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果 。因此, 文献[24]中提出了倾向值匹配(Propensity Score Matching),即将协变量的倾向值作为参考值来构 造匹配集合,并逐渐成为了观察性研究中最常用的匹配方法。 文献[24]中同时定义了倾向值为给定协变量时干预的条件概率: ( ) ( 1| ) V p X V ,并提出如果 录用稿件,非最终出版稿
在给定协变量V的情况下可忽略性假设成立,那么在给定倾向值时可忽略性假设也成立,因此可 以用倾向值替代协变量在因果推断中进行分层或匹配,从而避免了从众多协变量中遴选最适组合的 困难。文献[25]中给定研究对象集合i∈L,2,,,将研究对象i根据倾向值得到的匹配集合定义为: J)={U=1,2,,n:X,=1-X;∑6lπ(V)-π(W)π(W)-π(W)B≤M0。 &X=I-X 其中6}是示性函数,当括号中的条件满足时取值1,否则取值0。M为整数,代表每一研究 对象的匹配数,例如,M=1时得到1:1匹配。这个定义允许在构造匹配集合过程中放回已被使用的 个体,并用在其他个体的匹配集合中,平均因果效应的匹配估计为:匹片产--立)° 如果在实际运算中无从得知真实的倾向值,那么可以首先根据观察数据进行预先估计,然后再 用估计所得的倾向值做匹配,常用的基于倾向值匹配的方法包括回归[2]和决策树27等。 4.3.2逆概率加权 除匹配法之外,逆概率加权估计方法[2也是一种基于倾向值的方法 由汗混因素的存在,干 预组和对照组的协变量分布不同,会导致内生选择性偏差。也就是说, 预分配机制与观测数据中 的协变量有关,逆概率加权就是消除内生选择性偏差最有效的方法 通过给观测数据中的每个 研究对象分配适当的权重,可以创建一个干预组与对照组具有相份布的伪总体。样本重加权方法 涉及到的关键概念一一均衡得分(Balancing Score),经均衡得分处理后的协变量与干预分配机制 相独立,倾向值就是均衡得分中的一种。 逆概率加权(Inverse Propensity Weighting,PW 将权重P分配给每个研究对象: w=X/π(x)+(1-X)/(1-π(x).其中,X表示分配机制, t)表示倾向值。文献[29]在重加权后,可 以将平均因果效应的逆概率加权估计为:ATE V)-∑1-X)y,1[1-π(W】。 文献[30]表明,经不同规模的估计总体研究表明倾向值机制足以消除因可观测到的协变量而产 生的偏差;然而在实际估计中,逆概率加权的确性高度依赖倾向值的正确性,一旦倾向值计算出 现偏差就会严重影响逆概率加权的准确性:为了消除这种影响,罗宾斯等人在文章中提出了双稳健 估计,将逆概率加权与结果回归相结合,为因果关系估计提供双保险。 4.3.2分层方法 分层方法(Stratification)又被称为子分类o,,是调整混杂因素的代表性方法之一。这种方法通 过将整个总体划分为同质的子分层(bo©k)来调整因干预组和对照组之间差别造成的偏差,理想 状况下每个子层中干预组利对照组在协变量前提下的特定观测值是相似的,因此,同个子层中的研 究对象可以看作遵循随机府照试验的分配机制,也可以依据随机对照试验中的计算方法计算各子层 内的平均因果效应 ATE stra ∑g正0-)。其中,假设总体中划分了n个子层,q①)=N)1N为 第,个子层中的例究对像个数在总体中所占的比重, 和和,0分别表示第,个子层中干预结果和 对照结果的平均值。 与直接计算干预组和对照组结果差值的估计方法相比,分层方法显著降低了平 均因果估计的偏差,但如何确定分层方式又是另一个研究要点。 等概率(Equal-frequency)方法P4通过倾向值对总体进行分层,使得协变量在每一个子层中具 有相等的倾向值,总体的平均因果效应则通过每个子层中平均因果效应的加权平均进行估计。然而 这种方法会在某些权重过高或过低的子层中导致较大的方差,针对这类问题,文献[31]提出了一种 对倾向值分层得到的子层进行逆概率加权的估计方法,降低了等概率方法中出现的高方差问题。 5结构因果模型 除潜在结果模型外,因果推断中使用最多的一类模型就是结构因果模型(Structure Causal
在给定协变量V 的情况下可忽略性假设成立,那么在给定倾向值时可忽略性假设也成立,因此可 以用倾向值替代协变量在因果推断中进行分层或匹配,从而避免了从众多协变量中遴选最适组合的 困难。文献[25]中给定研究对象集合i n {1, 2,..., },将研究对象i 根据倾向值得到的匹配集合定义为: : 1 ( ) { 1, 2,..., : 1 ; {| ( ) ( ) | | ( ) ( ) |} } k j j i i k i j k X X J i j n X X V V V V M 。 其中{ } 是示性函数,当括号中的条件满足时取值 1,否则取值 0。 M 为整数,代表每一研究 对象的匹配数,例如, M 1 时得到1:1匹配。这个定义允许在构造匹配集合过程中放回已被使用的 个体,并用在其他个体的匹配集合中,平均因果效应的匹配估计为: 1 ( ) 1 1 (2 1)( ) n psm i i j i j J i ATE X Y Y n M 。 如果在实际运算中无从得知真实的倾向值,那么可以首先根据观察数据进行预先估计,然后再 用估计所得的倾向值做匹配,常用的基于倾向值匹配的方法包括回归[26]和决策树[27]等。 4.3.2 逆概率加权 除匹配法之外,逆概率加权估计方法[28]也是一种基于倾向值的方法。由于混杂因素的存在,干 预组和对照组的协变量分布不同,会导致内生选择性偏差。也就是说,干预分配机制与观测数据中 的协变量有关,逆概率加权就是消除内生选择性偏差最有效的方法之一。通过给观测数据中的每个 研究对象分配适当的权重,可以创建一个干预组与对照组具有相似分布的伪总体。样本重加权方法 涉及到的关键概念——均衡得分(Balancing Score),经均衡得分处理后的协变量与干预分配机制 相独立,倾向值就是均衡得分中的一种。 逆 概 率 加 权 ( Inverse Propensity Weighting, IPW ) 将 权 重 w 分 配 给 每 个 研 究 对 象 : w X x X x / ( ) (1 ) / (1 ( )) .其中, X 表示分配机制, ( ) x 表示倾向值。文献[29]在重加权后,可 以将平均因果效应的逆概率加权估计为: 1 1 / ( ) (1 ) / [1 ( )] n n ipw i i i i i i i i ATE X Y V X Y V 。 文献[30]表明,经不同规模的估计总体研究表明倾向值机制足以消除因可观测到的协变量而产 生的偏差;然而在实际估计中,逆概率加权的正确性高度依赖倾向值的正确性,一旦倾向值计算出 现偏差就会严重影响逆概率加权的准确性;为了消除这种影响,罗宾斯等人在文章中提出了双稳健 估计,将逆概率加权与结果回归相结合,为因果关系估计提供双保险。 4.3.2 分层方法 分层方法(Stratification)又被称为子分类[10] ,是调整混杂因素的代表性方法之一。这种方法通 过将整个总体划分为同质的子分层(block)来调整因干预组和对照组之间差别造成的偏差,理想 状况下每个子层中干预组和对照组在协变量前提下的特定观测值是相似的,因此,同个子层中的研 究对象可以看作遵循随机对照试验的分配机制,也可以依据随机对照试验中的计算方法计算各子层 内的平均因果效应: 1 0 1 ( )[ ( ) ( )] n strat i ATE q i Y i Y i 。其中,假设总体中划分了 n 个子层, q i N i N ( ) ( ) / 为 第i 个子层中的研究对象个数在总体中所占的比重, 1Y i( ) 和 0 Y i( ) 分别表示第i 个子层中干预结果和 对照结果的平均值。与直接计算干预组和对照组结果差值的估计方法相比,分层方法显著降低了平 均因果估计的偏差,但如何确定分层方式又是另一个研究要点。 等概率(Equal-frequency)方法[24]通过倾向值对总体进行分层,使得协变量在每一个子层中具 有相等的倾向值,总体的平均因果效应则通过每个子层中平均因果效应的加权平均进行估计。然而 这种方法会在某些权重过高或过低的子层中导致较大的方差,针对这类问题,文献[31]提出了一种 对倾向值分层得到的子层进行逆概率加权的估计方法,降低了等概率方法中出现的高方差问题。 5 结构因果模型 除潜在结果模型外,因果推断中使用最多的一类模型就是结构因果模型(Structure Causal 录用稿件,非最终出版稿