《工程科学学报》录用稿,htps:/doi.org/10.13374/i,issn2095-9389.2021.07.04.002©北京科技大学2020 《工程科学学报》编辑部 因果推断三种分析框架及其应用综述1 马忠贵,徐晓晗,刘雪儿 北京科技大学计算机与通信工程学院,北京100083 ☒通信作者,E-ail:g_runeko@163.com 摘要探寻事物之间的因果效应在统计学、计算机科学、计量经济学等许多领域都是一个焕具力的研究课题。伴 随着2021年约书亚·安格里斯特(Joshua D.Angrist)和圭多·因本斯(GuidoW.Imbens)因对因果关系分析的 方法学贡献”而获得诺贝尔经济学奖,因果推断必将在这些领域大放异彩。本文简要众绍闲果推断所涉及的基本概 念及其三种分析框架:反事实框架、潜在结果模型和结构因果模型。首先,从反事实椎架介绍因果效应的发端:然后, 从基于反事实的两个因果推断分析框架:潜在结果模型和结构因果模型,来分别御述网个分析框架所涉及的关键理 论和应用方法。其中,潜在结果模型使用数学和可计算的语言对因果理论进行阐述、是一种将假设、命题和结论清晰 化表达的计算模型,其在原因和结果变量已知的前提下定量分析原因变量对结果变量的因果效应,并对缺失的潜在 结果进行补齐,使观察性研究的效果接近试验性研究。结构因果模型则是一种基于图论的因果推断方法,它将事件 分为观察、干预和反事实三个层级,并通过o运算将干预和反事著层级的因果关系都降维成可以通过统计学手段解 决的问题。最后,本文探讨了现今多领域内因果推断的应用场景 并总结了三种分析框架的异同点。 关键词因果效应:因果推断:反事实:潜在结果模型:结构医 分类号TG142.71 Three Analytical l Frameworksòf Causal Inference and Their Applications MA Zhong-gui,XU Xiao-han回,LIU Xue-er School of Computer and Communication Engineering. University of Science and Technology Beijing,Beijing 100083,P.R. China Corresponding author, 0163.com ABSTRACT Causality is a generic relationship between an effect and the cause that produces it,the causal relationship among things is a problem we have been thinking about,but the complexity of causality is sometimes far beyond our imagination.Even if some causality problems seem easy to analyze,it may not be easy to get an exact answer.However, through the continuous innovation and development of empirical research methods in recent decades,we have had several clear analytical frameworks and effective methods for how to define causality and determine the degree of causality. Exploring the causal effects among things is a promising research topic in many fields such as statistics,computer science, econometrics,etc.With Joshua D.Angrist and Guido W.Imbens winning the Nobel Prize in economics for their methodological contributions to the analysis of causality in 2021,causal inference will shine in these fields.This article briefly introduces the basic concepts involved in causal inference,and its three analytical frameworks:Counterfactual Framework(CF),Potential Outcomes Framework(POF)and Structural Causal Model(SCM).Firstly,we introduce the origin of causal effects according to CF.Secondly,based on the counterfactual theory,there are two analysis frameworks,called POF and SCM,and we introduce the key theories and methods respectively.The SCM explains the causal theory through 败离日期:2021-07-04 演自中央高校基本科研业务费专项资金资助项目RE-DF-20-12,ERF-GF-18-0ZB) 地址:北京市海淀区学院路30号 邮政编码:100083 电话:010-62333436 E-mail:xuebaozr@ustb.edu.cn http://cje.ustb.edu.cn
《工程科学学报》编辑部 因果推断三种分析框架及其应用综述1 马忠贵,徐晓晗,刘雪儿 北京科技大学计算机与通信工程学院,北京 100083 通信作者,E-mail: g_runeko@163.com 摘 要 探寻事物之间的因果效应在统计学、计算机科学、计量经济学等许多领域都是一个颇具潜力的研究课题。伴 随着 2021 年约书亚·安格里斯特(Joshua D. Angrist)和圭多·因本斯(Guido W.Imbens)因“对因果关系分析的 方法学贡献”而获得诺贝尔经济学奖,因果推断必将在这些领域大放异彩。本文简要介绍因果推断所涉及的基本概 念及其三种分析框架:反事实框架、潜在结果模型和结构因果模型。首先,从反事实框架介绍因果效应的发端;然后, 从基于反事实的两个因果推断分析框架:潜在结果模型和结构因果模型,来分别阐述两个分析框架所涉及的关键理 论和应用方法。其中,潜在结果模型使用数学和可计算的语言对因果理论进行阐述,是一种将假设、命题和结论清晰 化表达的计算模型,其在原因和结果变量已知的前提下定量分析原因变量对结果变量的因果效应,并对缺失的潜在 结果进行补齐,使观察性研究的效果接近试验性研究。结构因果模型则是一种基于图论的因果推断方法,它将事件 分为观察、干预和反事实三个层级,并通过 do 运算将干预和反事实层级的因果关系都降维成可以通过统计学手段解 决的问题。最后,本文探讨了现今多领域内因果推断的应用场景,并总结了三种分析框架的异同点。 关键词 因果效应;因果推断;反事实;潜在结果模型;结构因果模型 分类号 TG142.71 Three Analytical Frameworks of Causal Inference and Their Applications MA Zhong-gui, XU Xiao-han , LIU Xue-er School of Computer and Communication Engineering, University of Science and Technology Beijing, Beijing 100083, P. R. China Corresponding author, E-mail: g_runeko@163.com ABSTRACT Causality is a generic relationship between an effect and the cause that produces it, the causal relationship among things is a problem we have been thinking about, but the complexity of causality is sometimes far beyond our imagination. Even if some causality problems seem easy to analyze, it may not be easy to get an exact answer. However, through the continuous innovation and development of empirical research methods in recent decades, we have had several clear analytical frameworks and effective methods for how to define causality and determine the degree of causality. Exploring the causal effects among things is a promising research topic in many fields such as statistics, computer science, econometrics, etc. With Joshua D. Angrist and Guido W. Imbens winning the Nobel Prize in economics for their methodological contributions to the analysis of causality in 2021, causal inference will shine in these fields. This article briefly introduces the basic concepts involved in causal inference, and its three analytical frameworks: Counterfactual Framework(CF), Potential Outcomes Framework(POF) and Structural Causal Model(SCM). Firstly, we introduce the origin of causal effects according to CF. Secondly, based on the counterfactual theory, there are two analysis frameworks, called POF and SCM, and we introduce the key theories and methods respectively. The SCM explains the causal theory through 1收稿日期:2021-07-04 基金项目: 中央高校基本科研业务费专项资金资助项目(FRF-DF-20-12, FRF-GF-18-017B) 地址:北京市海淀区学院路 30 号 邮政编码:100083 电话:01062333436 E-mail: xuebaozr@ustb.edu.cn http://cje.ustb.edu.cn 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.07.04.002 ©北京科技大学 2020 录用稿件,非最终出版稿
mathematics and computable language,and it is a calculation model that clearly expresses hypotheses,propositions and conclusions.It quantitatively analyzes the pair of cause variables under the premise that the cause variables and effect variables are known.The potential outcome framework makes up for the missing potential results,so that the effect of observational research is close to experimental research.The SCM is a causal inference method based on graph theory.It divides events into three levels:observation,intervention,and counterfactual.Through the do-operation,the causal relationship at the intervention and counterfactual levels could be reduced to low-dimensional problems which can be solved by statistical methods.Finally,the application scenarios of causal inference in many fields today has been discussed in this paper and the three analysis frameworks are compared KEY WORDS Causal Effect:Causal Inference;Counterfactual;Potential Outcome Model:Structural Causality Model 1引言 为什么需要研究因果关系?有三件事需要在厘清原因的情况下才能更好地做到,那就是:解释 预测和干预。合理的解释可以为探索世界提供支撑,准确的预测可以可靠地描述事件结果。有时我们 可能需要用一些理由去解释事件发生的原因,不仅想知道为什么发生,更希望可以利用其中某些信 息来促进或者避免某些结果的产生,也就是对原本的事件施加氏预(可以是一项行动、措施或政 策)去得到特定的结果。 无论是哲学、自然科学还是社会科学领域,研究因果关系一直是人类持之以恒探索的终极目标。 从亚里士多德山在“四因说”中对因果概念的论述:事物的出现所必需的条件都被称为原因:到约 翰·穆勒John Muller)关于确定现象因果联系提出的“穆勒五法”,再到大卫·休谟(David Hume) 提出的从“是”能否推出“应该”,也即“事实贪@能否推导出“价值”命题。哲学先贤们都 对因果关系相关概念做出了透彻论述,因果关系的哲学德想发展史纵贯两千余年,因果推断的统计 方法至今依然在社会学、计量经济学、流行病学等诸多科学领域发挥余韵,并展现出了巨大的潜力。 弗朗西斯·培根(Francis Bacon)曾提出“真正的知识是根据因果关系得到的知识”,如何找到一种 科学普适的方法探寻事物间的因果关系,随着人类认知的发展不断精深,依旧是一项不小的挑战。 因果推断一直以来都是一个充满挑战性的课题,目前因果推断的方法主要可以分为基于实证的 方法和基于数据观察的方法。其中(实证方法是进行因果关系推断的黄金标准,其干预决策是随机 的,公认最有效的是随机对照试验Random Controlled Trials,RCT),也称为AB测试(AB Tst)。随机对照试验将雾者随机分配到对照组或实验组,并将在试验中对照组和实验组唯一的 预期差异视为实验的结果父然命随机对照试验虽然是分析因果关系的绝佳环境,但其受到伦理问 题、个体不依从等因索影响,往往具有不可操作性,其试验范围也不可能遍及所有真实场景,因此 在很大程度上限制了因果推断的应用。基于数据观察的观察性研究(Observational Study)也是一种 常用方法。研究人员在没有任何干扰的情况下观察受试者并得出数据,从观测数据中得到他们的行 动及其结果,不能得到他们采取特定行动的动机。其核心问题就是如何基于已有的观测数据得到 反事实结果,√这是颇具挑战性的一项工作,主要原因如下:(1)根据获取到的观测数据只能得到事 实结果,无从得知其反事实结果:(2)在无干预的观测环境中,试验往往不是随机分配的,这可能 会因观察对象群体分布不同有较大偏差。为了合理地从数据中推断因果关系,研究者们构建出了基 于潜在结果模型和结构因果模型两种主流方法的分析框架,我们将针对不同的分析框架分别进行介 绍。 本文第2节介绍因果关系和因果推断过程中所涉及到的基本概念,以辅助对后文因果推断的理 解:在第3、4、5节我们将分别阐述现阶段因果推断中三种主流分析框架:反事实框架、潜在结果模 型和结构因果模型:第6节介绍因果推断在各个学科领域的研究应用:第7节总结三种分析框架的 主要特点,并提出因果推断未来的应用前景及其巨大潜力
mathematics and computable language, and it is a calculation model that clearly expresses hypotheses, propositions and conclusions. It quantitatively analyzes the pair of cause variables under the premise that the cause variables and effect variables are known. The potential outcome framework makes up for the missing potential results, so that the effect of observational research is close to experimental research. The SCM is a causal inference method based on graph theory. It divides events into three levels: observation, intervention, and counterfactual. Through the do-operation, the causal relationship at the intervention and counterfactual levels could be reduced to low-dimensional problems which can be solved by statistical methods. Finally, the application scenarios of causal inference in many fields today has been discussed in this paper and the three analysis frameworks are compared. KEY WORDS Causal Effect; Causal Inference; Counterfactual; Potential Outcome Model; Structural Causality Model 1 引言 为什么需要研究因果关系?有三件事需要在厘清原因的情况下才能更好地做到,那就是:解释 预测和干预。合理的解释可以为探索世界提供支撑,准确的预测可以可靠地描述事件结果。有时我们 可能需要用一些理由去解释事件发生的原因,不仅想知道为什么发生,更希望可以利用其中某些信 息来促进或者避免某些结果的产生,也就是对原本的事件施加干预(可以是一项行动、措施或政 策)去得到特定的结果。 无论是哲学、自然科学还是社会科学领域,研究因果关系一直是人类持之以恒探索的终极目标。 从亚里士多德[1]在“四因说”中对因果概念的论述:事物的出现所必需的条件都被称为原因;到约 翰·穆勒(John Muller) [2]关于确定现象因果联系提出的“穆勒五法”,再到大卫·休谟(David Hume) [3]提出的从“是”能否推出“应该”,也即“事实”命题能否推导出“价值”命题。哲学先贤们都 对因果关系相关概念做出了透彻论述,因果关系的哲学思想发展史纵贯两千余年,因果推断的统计 方法至今依然在社会学、计量经济学、流行病学等诸多科学领域发挥余韵,并展现出了巨大的潜力。 弗朗西斯·培根(Francis Bacon)曾提出“真正的知识是根据因果关系得到的知识”,如何找到一种 科学普适的方法探寻事物间的因果关系,随着人类认知的发展不断精深,依旧是一项不小的挑战。 因果推断一直以来都是一个充满挑战性的课题,目前因果推断的方法主要可以分为基于实证的 方法和基于数据观察的方法。其中,实证方法是进行因果关系推断的黄金标准,其干预决策是随机 的,公认最有效的是随机对照试验(Random Controlled Trials,RCT),也称为 A/B 测试(A/B Test)。随机对照试验将参与者随机分配到对照组或实验组,并将在试验中对照组和实验组唯一的 预期差异视为实验的结果。然而,随机对照试验虽然是分析因果关系的绝佳环境,但其受到伦理问 题、个体不依从等因素影响,往往具有不可操作性,其试验范围也不可能遍及所有真实场景,因此 在很大程度上限制了因果推断的应用。基于数据观察的观察性研究(Observational Study)也是一种 常用方法。研究人员在没有任何干扰的情况下观察受试者并得出数据,从观测数据中得到他们的行 动及其结果,但不能得到他们采取特定行动的动机。其核心问题就是如何基于已有的观测数据得到 反事实结果,这是颇具挑战性的一项工作,主要原因如下:(1)根据获取到的观测数据只能得到事 实结果,无从得知其反事实结果;(2)在无干预的观测环境中,试验往往不是随机分配的,这可能 会因观察对象群体分布不同有较大偏差。为了合理地从数据中推断因果关系,研究者们构建出了基 于潜在结果模型和结构因果模型两种主流方法的分析框架,我们将针对不同的分析框架分别进行介 绍。 本文第 2 节介绍因果关系和因果推断过程中所涉及到的基本概念,以辅助对后文因果推断的理 解;在第 3、4、5 节我们将分别阐述现阶段因果推断中三种主流分析框架:反事实框架、潜在结果模 型和结构因果模型;第 6 节介绍因果推断在各个学科领域的研究应用;第 7 节总结三种分析框架的 主要特点,并提出因果推断未来的应用前景及其巨大潜力。 录用稿件,非最终出版稿
2因果推断的相关概念 2.1相关不是因果 事物间的因果关系常常是我们经常要面对和分析的问题,研究因果的意义在于:在许多领域, 我们需要理解数据并据此做出进一步的行动和决策。比如对于我们而言,常常会想要知道“学历越 高就会找到越好的工作吗?”政府可能想知道“增设离婚冷静期会对离婚率有影响吗?”医生可能 想知道“某种药剂的使用会增加患者康复的几率吗?”这些问题的核心就是因果效应,即:X的 变化会对Y造成影响吗?如果会,Y受影响的程度要如何度量?在研究因果关系的基础上,还要进 一步挖掘因果关系产生的原因及其造成的影响。 从时间序列的角度,经济学家克莱夫·格兰杰(Clive Granger)给出了因果关系的文字描述: 如果利用X可以更好地预测Y,那么就可以说X是Y的原因。经过后来的研究不难发现,这段描 述中存在着一些谬误:严格来说,这句话描述的是相关关系,而非因果关系那么相关关系和因果 关系究竞有何不同?其实,相关关系和因果关系是完全不同的两个概念,因果关系阐述了一些关于 世界本身的信息,而实证的统计学方法却不能。相关表示一种一般关系,/即:当两个变量同时呈现 出增加或减少的趋势时,它们就是相关的:而因果关系中原因会导致绮果、结果部分取决于原因。 两个变量之间即便没有相关关系也可能具有因果关系,反之有相关关系也过能没有因果关系。例如, 一项研究表明,通常吃早饭的人比不吃早饭的人体重轻,因此得出结论:不吃早饭有利于减肥。但 事实上,不吃早饭和体重轻之间可能只是相关,而并非因果关系。从事实的角度出发为这个现象寻 求一种解释,可能只是因为每天吃早饭的人习惯于保持一种健康的性活方式,定期运动、睡眠规律、 饮食健康,最终才拥有了更加理想的体重。在这类情况中拥有更健康的生活方式是吃早饭和轻体 重的共同原因,因此也可以将其视为吃早饭和轻体这间因果关系的混淆因素。 因此,相关不是因果。虽然相关关系在统计学得子一系列成果,但因果关系可以拓展传统 统计学解决新问题所需的必要内容,并可延伸到其他学科, 因此更具研究价值。 2.2因果推断的基本概念 在因果推断中有一些基本概念,某种程度在几类分析框架中是通用的,也是理解因果推断的 基础,以下将分别进行介绍。 (1)同一个研究对象(Uit):即在施加于预以研究因果关系时选定的研究对象,可以是一个物理 对象也可以是一个对象的集合: 在潜在结果模型中,不同时间点下的研究样本是不同的研究对象。 (2)千预(Treatment)):干预指对个释本采取的行为,用We{0,l,2,,N}表示干预,目前大多数因 果推断采用二元干预,即采角了干预(W=1)的样本划为干预组:未进行干预(W=0)划为对照组。 (3)潜在结果(Potential Outcom和事实结果(Observed Outcome):在现实世界中,对于每一个研究 对象,其在每一种预灭都存在一个可能的结果,即潜在结果:而在真实观测数据中出现的结果称 为事实结果。(④)效应):效应即评判干预与否所导致结果差别的指标,通过对各个研究对象 干预与否的潜在结果的比较得出。(5)分配机制(Assignment Mechanism):哪些结果可以被观察到主 要取决于干预的分配机制,即哪些研究对象对应采取了哪些干预。对于一个二值干预,X=1代表干 预组,X=0代表对照组,在接受干预分配X=x后结果变量表示为Y,,表示接受相应干预后的潜 在结果。 2.3因果推断的分析框架 近几十年来,因果推断一直是许多领域的关键性研究课题,在各个领域都涌现出了令人瞩目的 研究成果。2008年,诺贝尔经济学奖获得者詹姆斯·海克曼(James.J Heckman)提出了政策评价中 出现的三个基于因果推断且极具挑战性的难题: (1)评价历史上出现的干预对结果的影响: (2)预测在一个环境中曾经经历过的干预在其他环境中的影响: (3)预测历史上从没有经历过的干预在各种环境中的影响
2 因果推断的相关概念 2.1 相关不是因果 事物间的因果关系常常是我们经常要面对和分析的问题,研究因果的意义在于:在许多领域, 我们需要理解数据并据此做出进一步的行动和决策。比如对于我们而言,常常会想要知道“学历越 高就会找到越好的工作吗?”政府可能想知道“增设离婚冷静期会对离婚率有影响吗?”医生可能 想知道“某种药剂的使用会增加患者康复的几率吗?”这些问题的核心就是因果效应,即: X 的 变化会对Y 造成影响吗?如果会,Y 受影响的程度要如何度量?在研究因果关系的基础上,还要进 一步挖掘因果关系产生的原因及其造成的影响。 从时间序列的角度,经济学家克莱夫·格兰杰(Clive Granger)[4] 给出了因果关系的文字描述: 如果利用 X 可以更好地预测Y ,那么就可以说 X 是Y 的原因。经过后来的研究不难发现,这段描 述中存在着一些谬误;严格来说,这句话描述的是相关关系,而非因果关系。那么相关 关系和因果 关系究竟有何不同?其实,相关关系和因果关系是完全不同的两个概念,因果关系阐述了一些关于 世界本身的信息,而实证的统计学方法却不能。相关表示一种一般关系,即:当两个变量同时呈现 出增加或减少的趋势时,它们就是相关的;而因果关系中原因会导致结果,结果部分取决于原因。 两个变量之间即便没有相关关系也可能具有因果关系,反之有相关关系也可能没有因果关系。例如 , 一项研究表明,通常吃早饭的人比不吃早饭的人体重轻,因此得出结论:不吃早饭有利于减肥。但 事实上,不吃早饭和体重轻之间可能只是相关,而并非因果关系。从事实的角度出发为这个现象寻 求一种解释,可能只是因为每天吃早饭的人习惯于保持一种健康的生活方式,定期运动、睡眠规律、 饮食健康,最终才拥有了更加理想的体重。在这类情况中,拥有更健康的生活方式是吃早饭和轻体 重的共同原因,因此也可以将其视为吃早饭和轻体重之间因果关系的混淆因素。 因此,相关不是因果。虽然相关关系在统计学中取得了一系列成果,但因果关系可以拓展传统 统计学解决新问题所需的必要内容,并可延伸到其他学科,因此更具研究价值。 2.2 因果推断的基本概念 在因果推断中有一些基本概念,某种程度上在几类分析框架中是通用的,也是理解因果推断的 基础,以下将分别进行介绍。 (1)同一个研究对象(Unit):即在施加干预以研究因果关系时选定的研究对象,可以是一个物理 对象也可以是一个对象的集合;在潜在结果模型中,不同时间点下的研究样本是不同的 研究对象。 (2)干预(Treatment):干预指对一个样本采取的行为,用 {0,1, 2,..., } W N w 表示干预,目前大多数因 果推断采用二元干预,即采用了干预(W 1)的样本划为干预组;未进行干预(W 0 )划为对照组。 (3)潜在结果(Potential Outcome)和事实结果(Observed Outcome):在现实世界中,对于每一个研究 对象,其在每一种干预下都存在一个可能的结果,即潜在结果;而在真实观测数据中出现的结果称 为事实结果。(4)效应(Effect):效应即评判干预与否所导致结果差别的指标,通过对各个研究对象 干预与否的潜在结果的比较得出。(5)分配机制(Assignment Mechanism):哪些结果可以被观察到主 要取决于干预的分配机制,即哪些研究对象对应采取了哪些干预。对于一个二值干预, X 1代表干 预组, X 0 代表对照组,在接受干预分配 X x 后结果变量表示为Yx ,表示接受相应干预后的潜 在结果。 2.3 因果推断的分析框架 近几十年来,因果推断一直是许多领域的关键性研究课题,在各个领域都涌现出了令人瞩目的 研究成果。2008 年,诺贝尔经济学奖获得者詹姆斯·海克曼(James. J Heckman) [5]提出了政策评价中 出现的三个基于因果推断且极具挑战性的难题: (1)评价历史上出现的干预对结果的影响; (2)预测在一个环境中曾经经历过的干预在其他环境中的影响; (3)预测历史上从没有经历过的干预在各种环境中的影响。 录用稿件,非最终出版稿
通常认为,哲学和统计学是得益于定量化数据记录对各个学科的普适性,以及统计学以数据为 分析对象的特点,先后提出了三种分析框架,即反事实框架、潜在结果模型和结构因果模型。反事实 框架介绍因果效应的起源,潜在结果模型和结构因果模型是在反事实理论的基础上进一步发展,并 成为了发现因果关系和评价因果效应时理论最成熟、应用最广泛的两种因果推断分析框架。随着实证 研究方法的不断创新发展,对于如何界定因果关系以及推断事物间的因果关系已经有了比较成熟的 理论,以下将详细阐述。 3反事实框架 在因果关系的研究中,对于因果关系的界定几个世纪以来哲学家们都没有给出一个明确的定义 这主要是因为因果关系中原因和结果的定义在某种程度上都是以彼此为阐述条件,即需要结果来定 义原因,也需要原因来判定结果,使得二者的关系纷繁复杂、扑朔迷离。 在很长一段时间内,哲学中关于因果推理的主要范式是遵循“连续性或相象烘的规律”,将因 果推断看成是一个挖掘事物规律的过程。无论是威廉姆·沙迪什(William Shadish的@提出的判定因果 关系的三项原则,还是保罗·拉扎斯菲尔德(Paul Lazarsfeld)提出的因果判定方法,都强调因果关 系中“规律性”的影响:随后,越来越多的学者认识到通过连续性或相关性的规律并不一定能得出 真正的因果关系,使得哲学中开始出现通过反事实框架(Counterfactual Framework)来探究因果关 系的方法。休谟]于18世纪最早提出基于反事实框架讨论因果关系年给出了反事实的文字化阐述, 大卫·刘易斯(David Lewis)在休谟的研究基础上给出了反事实框架的符号化表达,结合可能世界 语义学和反事实来刻画因果依赖性,并形成了“界定可比较相@性一用相似性来说明反事实一用反 事实来定义反事实依赖性→用反事实依赖性来阐述因果依獭性一用因果依赖性来解释因果性”的逻 辑链条。刘易斯提出的因果依赖命题是对休漠因果关的正式概括一一“若事件A没有发生,则事 件B也不会发生”,一旦这一反事实命题成立,则何得出“若事件A发生,则事件B发生”的命 题自然成立。至此,刘易斯完成了从因果依赖性向因果性的跨越,他指出:“如果A和B是两个现 实事件且满足若A不发生则B不发生,则可以确定事件A是事件B的原因”,这一结论给出了因 果关系中对于原因和结果比较明晰的界定方法,为因果关系的理论思考提供了一种明确的道路。 4潜在结果模型 在因果推断的理论体系中气潜在结果模型(Potential Outcomes Framework)是其中最重要的理 论模型之一。潜在结果模型由哈佛太学知名统计学者唐纳德·鲁宾(Donald B.Rubin)提出,因此该 模型又称鲁宾因果模型。潜在果模型的核心是对同一个研究对象,比较其接受干预和不接受干预 的效应。对于接受干预的研宽对象而言,其不接受干预是一种“反事实”状态,而对于不接受干预 的研究对象而言,共接受干预就是一种“反事实”状态。对于“反事实”框架的概念,鲁宾却并不 认同,他认为对于之不研究对象,其结果出现与否主要取决于分配机制(Assignment Mechanism), 事实上我们只能看到一种结果,但并不意味着另一种结果不存在,这并不是一个非黑即白的概念, 因此用潜在结果表描述事件是一种更加恰当的方式。 4.1基本概念 潜在结果模型跳脱出因果推理的正统思想,转而着重哲学中反事实框架的影响,通过借鉴统计 学中随机对照试验和潜在结果的概念,构建了因果推断的新分析框架。潜在结果模型的核心假设是 “没有假设就没有因果”,以下将分别介绍潜在结果模型中涉及到的一些必要概念,以更好地理解 这种分析框架。 潜在结果框架分析中,通常说因果将干预和研究对象联系在一起,干预就是原因,干预所导致 的结果就是效应。鲁宾在文献[10]中提出潜在结果的含义,即:给定一个研究对象和一系列干预, 将每一对“干预-结果”界定为一个潜在结果。在潜在结果模型中,文献[11]将因果效应定义为同一 个研究对象潜在结果之差,研究对象i的因果效应(Individual Causal Effect,ICE)定义为
通常认为,哲学和统计学是得益于定量化数据记录对各个学科的普适性,以及统计学以数据为 分析对象的特点,先后提出了三种分析框架,即反事实框架、潜在结果模型和结构因果模型。反事实 框架介绍因果效应的起源,潜在结果模型和结构因果模型是在反事实理论的基础上进一步发展,并 成为了发现因果关系和评价因果效应时理论最成熟、应用最广泛的两种因果推断分析框架。随着实证 研究方法的不断创新发展,对于如何界定因果关系以及推断事物间的因果关系已经有了比较成熟的 理论,以下将详细阐述。 3 反事实框架 在因果关系的研究中,对于因果关系的界定几个世纪以来哲学家们都没有给出一个明确的定义 这主要是因为因果关系中原因和结果的定义在某种程度上都是以彼此为阐述条件,即需要结果来定 义原因,也需要原因来判定结果,使得二者的关系纷繁复杂、扑朔迷离。 在很长一段时间内,哲学中关于因果推理的主要范式是遵循“连续性或相关性的规律”,将因 果推断看成是一个挖掘事物规律的过程。无论是威廉姆·沙迪什(William Shadish)[6] 提出的判定因果 关系的三项原则,还是保罗·拉扎斯菲尔德(Paul Lazarsfeld)[7]提出的因果判定方法,都强调因果关 系中“规律性”的影响;随后,越来越多的学者认识到通过连续性或相关性的规律并不一定能得出 真正的因果关系,使得哲学中开始出现通过反事实框架(Counterfactual Framework)来探究因果关 系的方法。休谟[8]于 18 世纪最早提出基于反事实框架讨论因果关系并给出了反事实的文字化阐述, 大卫·刘易斯(David Lewis)[9]在休谟的研究基础上给出了反事实框架的符号化表达,结合可能世界 语义学和反事实来刻画因果依赖性,并形成了“界定可比较相似性→用相似性来说明反事实→用反 事实来定义反事实依赖性→用反事实依赖性来阐述因果依赖性→用因果依赖性来解释因果性”的逻 辑链条。刘易斯提出的因果依赖命题是对休谟因果关系的正式概括——“若事件 A 没有发生,则事 件 B 也不会发生”,一旦这一反事实命题成立,则可得出“若事件 A 发生,则事件 B 发生”的命 题自然成立。至此,刘易斯完成了从因果依赖性向因果性的跨越,他指出:“如果 A 和 B 是两个现 实事件且满足若 A 不发生则 B 不发生,则可以确定事件 A 是事件 B 的原因”,这一结论给出了因 果关系中对于原因和结果比较明晰的界定方法,为因果关系的理论思考提供了一种明确的道路。 4 潜在结果模型 在因果推断的理论体系中,潜在结果模型(Potential Outcomes Framework)是其中最重要的理 论模型之一。潜在结果模型由哈佛大学知名统计学者唐纳德·鲁宾(Donald B. Rubin)提出,因此该 模型又称鲁宾因果模型。潜在结果模型的核心是对同一个研究对象,比较其接受干预和不接受干预 的效应。对于接受干预的研究对象而言,其不接受干预是一种“反事实”状态,而对于不接受干预 的研究对象而言,其接受干预就是一种“反事实”状态。对于“反事实”框架的概念,鲁宾却并不 认同,他认为对于一个研究对象,其结果出现与否主要取决于分配机制(Assignment Mechanism), 事实上我们只能看到一种结果,但并不意味着另一种结果不存在,这并不是一个非黑即白的概念, 因此用潜在结果去描述事件是一种更加恰当的方式。 4.1 基本概念 潜在结果模型跳脱出因果推理的正统思想,转而着重哲学中反事实框架的影响,通过借鉴统计 学中随机对照试验和潜在结果的概念,构建了因果推断的新分析框架。潜在结果模型的核心假设是 “没有假设就没有因果”,以下将分别介绍潜在结果模型中涉及到的一些必要概念,以更好地理解 这种分析框架。 潜在结果框架分析中,通常说因果将干预和研究对象联系在一起,干预就是原因,干预所导致 的结果就是效应。鲁宾在文献[10]中提出潜在结果的含义,即:给定一个研究对象和一系列干预, 将每一对“干预-结果”界定为一个潜在结果。在潜在结果模型中,文献[11]将因果效应定义为同一 个研究对象潜在结果之差,研究对象 i 的因果效应(Individual Causal Effect,ICE)定义为 录用稿件,非最终出版稿
IC)=Y()-Y,)。尽管鲁宾等学者清楚地定义了一个研究对象的因果效应,但是通常对于同一个 研究对象,不可能既接受干预又接受对照,自然也不能够同时观测到两种结果。统计学中往往关注 总体的统计特征,利用潜在结果还可以得到总体的平均因果效应(Average Causal Effect,ACE)。 假设所有研究对象都接受干预X=1的平均结果为E(Y),所有研究对象都接受对照X=0的平均结 果为E(O),则平均因果效应可定义为两个平均结果之差:ACE)=E(ICE)=E(化-Y)=E(Y)-(Y)。 统计学家罗纳德·艾尔默·费舍尔(Ronald Aylmer Fisher)给出了识别平均因果效应的方法一一 随机对照试验,即将干预X随机分配给研究对象ⅰ。例如,通过抛硬币决定研究对象ⅰ是否接受干预, 这个随机决定的过程与潜在结果无关,可以保证潜在结果(化,。)与干预分配机制完全独立,进而得 到E(Y)=EY|X=x)平均因果效应可以通过在干预组与对照组中观测到的结果变量期望之差 ACE=E(YIX=1)-E(YIX=O)得到,计算式中不再含有潜在结果变量Y和Y。,可以通过传统的统 计方法,分别估计EY)=E(Y|X=1)和E(Y)=E(Y|X=O)来推断平均因果效应。 在实际研究中,随机对照试验往往需要比较理想的试验条件。例如,研究孕归服用某种药物对 婴儿致畸率的影响,不能随机分配一位孕妇服药或者不服药,随机对照试验道往往会受到伦理问题、 个体不依从等问题的限制。一旦随机对照试验条件不成立,这种通过计算禾预组与对照组之间差值 来得到平均因果关系的方法就面临着内生选择性偏差2]、差别化干预效应偏差等问题的困扰。内生 选择偏差意味着分配机制本身对干预组和对照组的差异性,差别化干预偏差意味着干预组和对照组 对于干预本身的反应效应不一,导致干预组和对照组并非在统一理想实验条件下接受比对参考。文 献13]定义了观察性研究的概念,其不再满足随机分配的条件,在此种情形下如果忽略协变量的作 用,仅通过随机对照试验方法估计因果效应就会产生偏差 乃至造成统计学悖论,如辛普森悖论。 4.2关键假设 在哲学和统计学领域,许多优秀的学者为潜在结果模型的研究发展做出了卓越贡献,休谟和 穆勒作为哲学家的典型代表最早从反事实框架的视角过论因果关系:泽西·奈曼(Jerzy Neyman)6 和费舍尔则从统计学家的立场出发,分别提出从潜在结果和随机的视角来讨论因果关系。费希尔提 出了“随机对照试验”的概念,而奈曼提出了潜在结果”并将其应用于随机对照试验,鲁宾在文 献[17]中进一步结合了“潜在结果”和“随机对照试验”这两个概念,系统性地提出了潜在结果模 型的理论假设、核心内容和推理方法。奈曼利用数学语言描述了潜在结果框架下的因果效应,鲁宾刀 将这一数学定义推广到观察性研究中,潜在结果模型作为一种因果推断的重要分析框架,其本身需 要建立在一些基本假设和前提之上)如果现实情况不能满足其基本假设,潜在结果的结论就不成立, 本节我们将重点讨论潜在结果模型的三个基本假设。 4.2.1研究对象干预值稳定性假设 研究对象干预值稳定性假设(Stable Unit Treatment Value Assumption,SUTVA)是一个先验假 设,从广义上看,研究对象干预值稳定性假设强调两个要点:(1)研究对象之间不存在相互影响, 互相独立;(2)每种开预的单一性,即不同层次的干预在SUTVA下不能归因为同一种干预。 鲁宾在986年指出无论分配干预X到研究对象i的分配机制是什么,也无所谓其他研究对 象接受干预入研究对象1受到干预X影响而得到的结果总是不变的。这一假设中既明确了其他 研究对象的决策对参考研究对象接受干预与否没有影响,也包含了分配机制对潜在结果没有影响的 假设。对于每个研究对象,实际观察的结果变量可以用潜在结果(化,Y)表示为Y=Y,+(1-X)Y。。 STUVA假设意味着每个研究对象所做出的决策并不受其他研究对象影响,然而在现实中这往 往是不现实的,比如同学A计划接种新冠疫苗后,同学B也许也会受其邀约一起接种:STUVA假 设是针对潜在结果模型的不完全假设,完全忽略了研究对象之间相互影响的间接效应。针对STUVA 的局限性,辛克莱2o]等提出了部分千扰假设(Partial Interference Assumption)的方法,即对干预分 配机制进行两阶段随机对照设计,第一阶段给研究对象随机分层到不同干预分配策略,第二阶段将 同层级内的研究对象进行随机干预或对照。实验表明,当群体在空间、事件或社会性上充分分离的情 况下,部分干扰假设可能是合理的
1 0 ICE i Y i Y i ( ) ( ) ( ) 。尽管鲁宾等学者清楚地定义了一个研究对象的因果效应,但是通常对于同一个 研究对象,不可能既接受干预又接受对照,自然也不能够同时观测到两种结果。统计学中往往关注 总体的统计特征,利用潜在结果还可以得到总体的平均因果效应(Average Causal Effect,ACE)。 假设所有研究对象都接受干预 X 1的平均结果为 1 E Y( ) ,所有研究对象都接受对照 X 0 的平均结 果为 0 E Y( ) ,则平均因果效应可定义为两个平均结果之差: 1 0 1 0 ACE i E ICE E Y Y E Y Y ( ) ( ) ( ) ( ) ( ) 。 统计学家罗纳德·艾尔默·费舍尔(Ronald Aylmer Fisher)给出了识别平均因果效应的方法—— 随机对照试验,即将干预 X 随机分配给研究对象i 。例如,通过抛硬币决定研究对象i 是否接受干预, 这个随机决定的过程与潜在结果无关,可以保证潜在结果 1 0 ( , ) Y Y 与干预分配机制完全独立,进而得 到 ( ) ( | ) E Y E Y X x x 平均因果效应可以通过在干预组与对照组中观测到的结果变量期望之差 ACE E Y X E Y X ( | 1) ( | 0) 得到,计算式中不再含有潜在结果变量 Y1和Y0 ,可以通过传统的统 计方法,分别估计 E Y E Y X ( ) ( | 1) 和 E Y E Y X ( ) ( | 0) 来推断平均因果效应。 在实际研究中,随机对照试验往往需要比较理想的试验条件。例如,研究孕妇服用某种药物对 婴儿致畸率的影响,不能随机分配一位孕妇服药或者不服药,随机对照试验也往往会受到伦理问题 、 个体不依从等问题的限制。一旦随机对照试验条件不成立,这种通过计算干预组与对照组之间差值 来得到平均因果关系的方法就面临着内生选择性偏差[12]、差别化干预效应偏差等问题的困扰。内生 选择偏差意味着分配机制本身对干预组和对照组的差异性,差别化干预偏差意味着干预组和对照组 对于干预本身的反应效应不一,导致干预组和对照组并非在统一理想实验条件下接受比对参考。文 献[13]定义了观察性研究的概念,其不再满足随机分配的条件,在此种情形下如果忽略协变量的作 用,仅通过随机对照试验方法估计因果效应就会产生偏差,乃至造成统计学悖论,如辛普森悖论。 4.2 关键假设 在哲学和统计学领域,许多优秀的学者为潜在结果模型的研究发展做出了卓越贡献,休谟[14]和 穆勒[15]作为哲学家的典型代表最早从反事实框架的视角讨论因果关系;泽西·奈曼(Jerzy Neyman)[16] 和费舍尔则从统计学家的立场出发,分别提出从潜在结果和随机的视角来讨论因果关系。费希尔提 出了“随机对照试验”的概念,而奈曼提出了“潜在结果”并将其应用于随机对照试验,鲁宾在文 献[17]中进一步结合了“潜在结果”和“随机对照试验”这两个概念,系统性地提出了潜在结果模 型的理论假设、核心内容和推理方法。奈曼利用数学语言描述了潜在结果框架下的因果效应,鲁宾[17] 将这一数学定义推广到观察性研究中,潜在结果模型作为一种因果推断的重要分析框架,其本身需 要建立在一些基本假设和前提之上,如果现实情况不能满足其基本假设,潜在结果的结论就不成立 , 本节我们将重点讨论潜在结果模型的三个基本假设。 4.2.1 研究对象干预值稳定性假设 研究对象干预值稳定性假设(Stable Unit Treatment Value Assumption,SUTVA)是一个先验假 设,从广义上看,研究对象干预值稳定性假设强调两个要点:(1)研究对象之间不存在相互影响, 互相独立;(2)每种干预的单一性,即不同层次的干预在 SUTVA 下不能归因为同一种干预。 鲁宾[19]在 1986 年指出无论分配干预 X 到研究对象 i 的分配机制是什么,也无所谓其他研究对 象接受干预与否,研究对象i 受到干预 X 影响而得到的结果总是不变的。这一假设中既明确了其他 研究对象的决策对参考研究对象接受干预与否没有影响,也包含了分配机制对潜在结果没有影响的 假设。对于每个研究对象,实际观察的结果变量可以用潜在结果 1 0 ( , ) Y Y 表示为 1 0 Y XY X Y (1 ) 。 STUVA 假设意味着每个研究对象所做出的决策并不受其他研究对象影响,然而在现实中这往 往是不现实的,比如同学 A 计划接种新冠疫苗后,同学 B 也许也会受其邀约一起接种;STUVA 假 设是针对潜在结果模型的不完全假设,完全忽略了研究对象之间相互影响的间接效应。针对 STUVA 的局限性,辛克莱[20]等提出了部分干扰假设(Partial Interference Assumption)的方法,即对干预分 配机制进行两阶段随机对照设计,第一阶段给研究对象随机分层到不同干预分配策略,第二阶段将 同层级内的研究对象进行随机干预或对照。实验表明,当群体在空间、事件或社会性上充分分离的情 况下,部分干扰假设可能是合理的。 录用稿件,非最终出版稿