心理科学进展2011,Vol.19,No.8,1115-1125 Advances in Psychological Science D0L:10.3724/SPJ.1042.2011.01115 ·研究方法(Research Method)· 安慰剂效应研究实验设计的历史和发展 张文彩1袁立壮2陆运青2罗劲,3 (中国科学院心理研究所心理健康重点实验室,北京100101) (2河北师范大学教育学院心理系,石家庄050024)(心首都师范大学学习与认知实验室,北京100048) 摘要安慰剂处理从最初作为研究某种真实治疗效应的控制条件,已演变为研究者直接关注的研究目标, 其实验范式也发生了相应变化。双盲随机设计关注真实的治疗是否优于安慰剂处理,欺骗设计直接比较安慰 剂处理效应和自然历史效应的差异,关注安慰剂效应本身:公开隐藏设计通过计算公开治疗效应和隐藏治疗 效应之差来估计安慰剂效应的大小;平衡范式可同时观察安慰剂效应和真实治疗效应:强化范式通过条件性 强化获得加强的安慰剂效应,是研究其作用机制的优化方案:本课题组建立的迁移强化范式,研究安慰剂效 应从痛觉到情绪的迁移,是强化范式的重要补充 关键词安慰剂效应;实验范式;安慰剂预期 分类号B845,R395 安慰剂效应是指由治疗的象征性意义而不是 互信相悖(Finniss,.Kaptchuk,Miller,,&Benedetti, 特定的药物学或生理学特性引起的心理生理变 2011)。同时,近年来研究者们开始使用心理生理 化。尽管安慰剂不含有任何治疗疾病的特异性物 学、神经生物学和脑成像等多种研究手段,在疼 质或方法,但是病人使用它们之后病情经常会有 痛、抑郁症、帕金森症和负性情绪等领域积极探 显著的改善。安慰剂这种强大的效力在近年来已 索了安慰剂效应的心理生物机制。这些不同领域 经引起了研究者的密切关注。因为安慰剂拥有“神 的证据都证明,安慰剂效应是真实存在的心理生 奇效力”,以至于在最近一项美国全国调查中发 物学现象(Price,Finniss,&Benedetti,2008; 现,美国医生常常给患者开一些并没有特异性疗 Zubieta Stohler,2009). 效的药物,目的只是为了满足患者的治疗愿望, 安慰剂效应现象的提出起源于医疗实践。在 诱发安慰剂反应(Tilburt,.Emanuel,Kaptchuk, 医学实践中,实施某种治疗之后患者体验到的病 Curlin,&Miller,2008)。甚至有研究者进一步讨论 情好转可能有多种原因:可能是实施的治疗确实 了临床上使用安慰剂如何突破医学伦理困境一尽 发挥了良好的治疗效果,也有可能是病情随时间 管安慰剂有着强大的效力,但它是在病人不知情 历程发生的自然改善,即便在没有治疗的情况下 的情况下使用的,这种行为与病患知情权、医患 这种改善也会发生,还可能是患者对治疗者或药 物本身的作用非常信赖,由此产生的心理安慰作 用缓解了病情,因此这种改善并不是由治疗本 收稿日期:2011-04-07 身引起的。所以,只有在自然历史因素和安慰剂 ◆973国家重点基础研究发展计划(Grant2010CB833904)、 效应得到控制的条件下,才能得出某种治疗确 863国家高技术研究发展计划(Grants2008AA022604)、 实有效的结论。传统的临床实验并不关心安慰剂 国家自然科学基金面上项目(Grants30970890and 效应的心理神经机制。设定安慰剂条件只是为了 30770708)、中国科学院心理研究所青年人才科研基 金(Grant Y0cX451S01)和中国科学院知识创新工程 检验一种新药物的有效性,甚至安慰剂效应被 (Grant KSCX2-EW-J-8)等项目支持。 看做干扰药物作用检验的一种麻烦。随着对安慰 通讯作者:罗劲,E-mail:luoj@psych.ac.cn 剂效应的认识更加深入,安慰剂效应及其心理 1115 ?1994-2015 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
心理科学进展 2011, Vol. 19, No. 8, 1115–1125 Advances in Psychological Science DOI: 10.3724/SP.J.1042.2011.01115 1115 ·研究方法(Research Method)· 安慰剂效应研究实验设计的历史和发展* 张文彩 1 袁立壮 2 陆运青 2 罗 劲 1,3 ( 1 中国科学院心理研究所心理健康重点实验室, 北京 100101) ( 2 河北师范大学教育学院心理系, 石家庄 050024) (3 首都师范大学学习与认知实验室, 北京 100048) 摘 要 安慰剂处理从最初作为研究某种真实治疗效应的控制条件, 已演变为研究者直接关注的研究目标, 其实验范式也发生了相应变化。双盲随机设计关注真实的治疗是否优于安慰剂处理; 欺骗设计直接比较安慰 剂处理效应和自然历史效应的差异, 关注安慰剂效应本身; 公开隐藏设计通过计算公开治疗效应和隐藏治疗 效应之差来估计安慰剂效应的大小; 平衡范式可同时观察安慰剂效应和真实治疗效应; 强化范式通过条件性 强化获得加强的安慰剂效应, 是研究其作用机制的优化方案; 本课题组建立的迁移强化范式, 研究安慰剂效 应从痛觉到情绪的迁移, 是强化范式的重要补充。 关键词 安慰剂效应; 实验范式; 安慰剂预期 分类号 B845;R395 安慰剂效应是指由治疗的象征性意义而不是 特定的药物学或生理学特性引起的心理生理变 化。尽管安慰剂不含有任何治疗疾病的特异性物 质或方法, 但是病人使用它们之后病情经常会有 显著的改善。安慰剂这种强大的效力在近年来已 经引起了研究者的密切关注。因为安慰剂拥有“神 奇效力”, 以至于在最近一项美国全国调查中发 现, 美国医生常常给患者开一些并没有特异性疗 效的药物, 目的只是为了满足患者的治疗愿望, 诱发安慰剂反应 (Tilburt, Emanuel, Kaptchuk, Curlin, & Miller, 2008)。甚至有研究者进一步讨论 了临床上使用安慰剂如何突破医学伦理困境—尽 管安慰剂有着强大的效力, 但它是在病人不知情 的情况下使用的, 这种行为与病患知情权、医患 收稿日期: 2011-04-07 * 973 国家重点基础研究发展计划(Grant 2010CB833904)、 863 国家高技术研究发展计划(Grants 2008AA022604)、 国家自然科学基金面上项目(Grants 30970890 and 30770708)、中国科学院心理研究所青年人才科研基 金(Grant Y0CX451S01)和中国科学院知识创新工程 (Grant KSCX2-EW-J-8)等项目支持。 通讯作者: 罗劲, E-mail: luoj@psych.ac.cn 互信相悖(Finniss, Kaptchuk, Miller, & Benedetti, 2011)。同时, 近年来研究者们开始使用心理生理 学、神经生物学和脑成像等多种研究手段, 在疼 痛、抑郁症、帕金森症和负性情绪等领域积极探 索了安慰剂效应的心理生物机制。这些不同领域 的证据都证明, 安慰剂效应是真实存在的心理生 物学现象 (Price, Finniss, & Benedetti, 2008; Zubieta & Stohler, 2009)。 安慰剂效应现象的提出起源于医疗实践。在 医学实践中, 实施某种治疗之后患者体验到的病 情好转可能有多种原因:可能是实施的治疗确实 发挥了良好的治疗效果; 也有可能是病情随时间 历程发生的自然改善, 即便在没有治疗的情况下 这种改善也会发生; 还可能是患者对治疗者或药 物本身的作用非常信赖, 由此产生的心理安慰作 用缓解了病情, 因此这种改善并不是由治疗本 身引起的。所以, 只有在自然历史因素和安慰剂 效应得到控制的条件下, 才能得出某种治疗确 实有效的结论。传统的临床实验并不关心安慰剂 效应的心理神经机制。设定安慰剂条件只是为了 检验一种新药物的有效性, 甚至安慰剂效应被 看做干扰药物作用检验的一种麻烦。随着对安慰 剂效应的认识更加深入, 安慰剂效应及其心理
1116 心理科学进展 第19卷 神经机制已经成为研究者关注的科学研究目标。 者按奇偶顺序依次分成两组一一白喉抗毒素血清 在这一过程中,安慰剂效应的实验设计思想也 组和不含抗毒素的血清组,然后评价疗效。他最 在不断发展。 后得出结论,使用正常马的血清和使用抗毒素血 1安慰剂研究的历史 清所得治疗效果相似(Kaptchuk,.1998)。应该说, 这个实验设计己经非常接近有安慰剂控制的实 安慰剂(Placebo,拉丁语,I shall please)这个 验。在1938年,Diehl等人介绍了他们的实验控制, 词在14世纪首次使用,来自于葬礼上雇佣的哭丧 安慰剂这个概念被首次用于实验处理方面。研究 者祷文,其含义与现代的安慰剂含义相差甚远。 者报告说:“安慰剂组的被试接受与实验组看起来 在1785年第二版New Medicum Dictionay中,安 完全相同的处理,但接受的是安慰剂而不是疫苗 慰剂被描述为一种无特定效应的方法或药物,这 即所吃的胶囊中是乳糖而不是疫苗,两组接受完 一定义虽然有了医学上的含义,但仍然不同于现 全相同的指导语”。这个实验目的在于检验一种疫 代安慰剂的含义。1817年,修订后的Quincy's 苗是否具有预防感冒的作用,设置了接受疫苗组 Lexicon-Medicum中,安慰剂被定义为用于取悦 和接受安慰剂治疗组,结果发现安慰剂组没有接 患者而不是使患者受益的任何药物的总称,这一 受疫苗治疗,却获得与接收疫苗治疗效果相当的 定义与现在的含义比较贴近(de Craen,Kaptchuk, 结果。显然,这个实验已经基本具备了控制安慰 Tijssen,Kleijnen,1999). 剂效应的条件,并获得了具有现代意义的安慰剂 20世纪以前,在临床医学上判断某种治疗是 效应(de Craen et al.,1999). 否有效,大都依据权威医生提供的病理推理,而 2安慰剂效应的定义 不是建立在有安慰剂控制的实验研究基础之上。 但在这一时期,仍然有一些人在检验某种药物或 随着对安慰剂效应的认识越来越深入,人们 治疗的效果时进行了安慰剂的控制,这些开创性 对其逐渐给出了比较科学的定义。最初内科医生 的工作为现代安慰剂的研究奠定了基础。1801年, 给患者的糖丸被定义为安慰剂,这是最狭窄的一 John Haygarth首次报告了安慰剂控制(Placebo- 种定义,后来将安慰剂的含义拓宽为“假装进行 controlled)的实验结果。当时常用的一种治疗疾病 活性药物治疗(Active treatment)的任何物质,但 的方法是将金属棍(Metallic rods,称为Perkins 实际上对要干预的条件没有任何药物学的影响” tractor)放在身体上,认为人体可以通过接受金属 (Kirsch,.1985),但是这一定义还有必要扩展,即 电磁的影响而缓解症状。Haygarth在第一天给5 除了物质之外,还应该包括方法(Shapiro& 个病人使用木头仿造的金属棍治疗,发现四个人 Morris,.1978;Wickramasekera,.1985),比如安慰剂 病情缓解。下一天使用真正的金属棍进行治疗得 外科手术、安慰剂针灸或者开关未打开的治疗仪 到相同的结果,也是四个人报告了病情的缓解。 器等(Hrobjartsson&Gotzsche,200l:Moerman& 他说:“医学上要学习的重要一课是要了解心灵的 热情(Passions of the mind))对身体状态和疾病会产 Jonas,2000).Brody(1980)提出安慰剂是专门设计 生神奇而强大的影响,这一点在治疗中常常被忽 用于模拟医学治疗的一种干预条件,确信使用的 略。”他进一步写到,“实验结果清晰表明,想象引 时候不会对所考察的条件产生特异性治疗。他认 起的希望和信任有多么大的神奇效应”(de Craen 为,安慰剂效应是指由治疗的象征性意义而不是 etal.,1999)。尽管他没有明确提出安慰剂效应的 特定的药物学或生理学特性引起的心理生理变 概念,但显然他已经有了与现代安慰剂效应相似 化。Body强调安慰剂的象征意义,强调对治疗环 的观点。 境的模拟。近期Stewart-.Williams和Podd(2O04) 20世纪初,德国医生Adolf Bingle做了大规 对安慰剂效应的概念做了进一步的补充,他们提 模的临床试验来评价白喉抗毒素血清(Diphtherria 出,安慰剂效应是在人或动物身上产生的真正的 antitoxin serum)在治疗白喉中的特定效应。Bingle 心理生理效应,这种效应应该归因于接受某种物 关心的是,到底是血清中的抗毒素在起作用,还 质或方法的治疗,而不是这种物质或方法的内在 是不包含抗毒素的血清在起作用。他将937名患 效力。 ?1994-2015 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
1116 心 理 科 学 进 展 第 19 卷 神经机制已经成为研究者关注的科学研究目标。 在这一过程中, 安慰剂效应的实验设计思想也 在不断发展。 1 安慰剂研究的历史 安慰剂(Placebo, 拉丁语, I shall please)这个 词在 14 世纪首次使用, 来自于葬礼上雇佣的哭丧 者祷文, 其含义与现代的安慰剂含义相差甚远。 在 1785 年第二版 New Medicum Dictionay 中, 安 慰剂被描述为一种无特定效应的方法或药物, 这 一定义虽然有了医学上的含义, 但仍然不同于现 代安慰剂的含义。1817 年, 修订后的 Quincy’s Lexicon-Medicum 中, 安慰剂被定义为用于取悦 患者而不是使患者受益的任何药物的总称, 这一 定义与现在的含义比较贴近(de Craen, Kaptchuk, Tijssen, & Kleijnen, 1999)。 20 世纪以前, 在临床医学上判断某种治疗是 否有效, 大都依据权威医生提供的病理推理, 而 不是建立在有安慰剂控制的实验研究基础之上。 但在这一时期, 仍然有一些人在检验某种药物或 治疗的效果时进行了安慰剂的控制, 这些开创性 的工作为现代安慰剂的研究奠定了基础。1801 年, John Haygarth 首次报告了安慰剂控制(Placebocontrolled)的实验结果。当时常用的一种治疗疾病 的方法是将金属棍(Metallic rods, 称为 Perkins tractor)放在身体上, 认为人体可以通过接受金属 电磁的影响而缓解症状。Haygarth 在第一天给 5 个病人使用木头仿造的金属棍治疗, 发现四个人 病情缓解。下一天使用真正的金属棍进行治疗得 到相同的结果, 也是四个人报告了病情的缓解。 他说:“医学上要学习的重要一课是要了解心灵的 热情(Passions of the mind)对身体状态和疾病会产 生神奇而强大的影响, 这一点在治疗中常常被忽 略。”他进一步写到, “实验结果清晰表明, 想象引 起的希望和信任有多么大的神奇效应” (de Craen et al., 1999)。尽管他没有明确提出安慰剂效应的 概念, 但显然他已经有了与现代安慰剂效应相似 的观点。 20 世纪初, 德国医生 Adolf Bingle 做了大规 模的临床试验来评价白喉抗毒素血清(Diphtherria antitoxin serum)在治疗白喉中的特定效应。Bingle 关心的是, 到底是血清中的抗毒素在起作用, 还 是不包含抗毒素的血清在起作用。他将 937 名患 者按奇偶顺序依次分成两组——白喉抗毒素血清 组和不含抗毒素的血清组, 然后评价疗效。他最 后得出结论, 使用正常马的血清和使用抗毒素血 清所得治疗效果相似(Kaptchuk, 1998)。应该说, 这个实验设计已经非常接近有安慰剂控制的实 验。在 1938 年, Diehl 等人介绍了他们的实验控制, 安慰剂这个概念被首次用于实验处理方面。研究 者报告说:“安慰剂组的被试接受与实验组看起来 完全相同的处理, 但接受的是安慰剂而不是疫苗, 即所吃的胶囊中是乳糖而不是疫苗, 两组接受完 全相同的指导语”。这个实验目的在于检验一种疫 苗是否具有预防感冒的作用, 设置了接受疫苗组 和接受安慰剂治疗组, 结果发现安慰剂组没有接 受疫苗治疗, 却获得与接收疫苗治疗效果相当的 结果。显然, 这个实验已经基本具备了控制安慰 剂效应的条件, 并获得了具有现代意义的安慰剂 效应(de Craen et al., 1999)。 2 安慰剂效应的定义 随着对安慰剂效应的认识越来越深入, 人们 对其逐渐给出了比较科学的定义。最初内科医生 给患者的糖丸被定义为安慰剂, 这是最狭窄的一 种定义, 后来将安慰剂的含义拓宽为“假装进行 活性药物治疗(Active treatment)的任何物质, 但 实际上对要干预的条件没有任何药物学的影响” (Kirsch, 1985), 但是这一定义还有必要扩展, 即 除了物质之外 , 还应该包括方法 (Shapiro & Morris, 1978; Wickramasekera, 1985), 比如安慰剂 外科手术、安慰剂针灸或者开关未打开的治疗仪 器等(Hróbjartsson & Gøtzsche, 2001; Moerman & Jonas, 2000)。Brody (1980)提出安慰剂是专门设计 用于模拟医学治疗的一种干预条件, 确信使用的 时候不会对所考察的条件产生特异性治疗。他认 为, 安慰剂效应是指由治疗的象征性意义而不是 特定的药物学或生理学特性引起的心理生理变 化。Brody 强调安慰剂的象征意义, 强调对治疗环 境的模拟。近期 Stewart-Williams 和 Podd (2004) 对安慰剂效应的概念做了进一步的补充, 他们提 出, 安慰剂效应是在人或动物身上产生的真正的 心理生理效应, 这种效应应该归因于接受某种物 质或方法的治疗, 而不是这种物质或方法的内在 效力
第8期 张文彩等:安慰剂效应研究实验设计的历史和发展 1117 3 影响安慰剂效应研究的因素 状的观察也会出现错误,病人的病情没有缓解但 他以为好转了,从而出现虚报误差。不管是医生 为了探测到真实的安慰剂效应,实验设计中 对患者的症状作出的诊断还是患者报告自己的症 应该排除的混淆因素包括自然历史因素、平均数 状,这种误差在医学决策中普遍存在。虚报误差 的回归和虚报误差等。 可以尽可能通过客观测量来消除,比如客观的激 3.1自然历史(Natural history) 素和脑激活等客观指标的测量来判断虚报误差是 许多病理条件随时间的推进会发生症状的自 否存在。 然变化和波动,这就是症状的自然历史变化 因此,在缺乏控制的安慰剂效应实验中,所 (Fields&Levine,.1984),也就是说,即便没有施 报告的“改善率”可能会归因于上面提到的各种混 加任何治疗和干预,病情也可能会出现缓解。如 淆因素,而非安慰剂处理。这样,在进行安慰剂效 果被试恰好在病情出现缓解之前这一时间点服用 应研究过程中,根据具体的实验目的采取严格的 了安慰剂,他就会相信安慰剂是一种有效的治 实验设计,是排除可能干扰因素的必要条件。 疗。显然这并不能用安慰剂效应来解释,因为此 时的病情恢复无论如何也会发生,与服不服用安 4实验设计的发展 慰剂没有关系。所以为了说明安慰剂效应,就必 4.1双盲随机设计(Randomized and double-blind 须在实验设计中考虑设置自然历史条件,从而将 design) 自然历史因素和安慰剂干预因素区别开来。 对于临床药物实验而言,设置安慰剂条件的 3.2平均数的回归(Regression to the mean) 目的在于检验某种药物的疗效。其逻辑是若想证 随着测量次数的增加,越到后面的测量,测 明某种药物有确定的疗效,其治疗作用必须显著 量变量越接近变量分布的中心,即平均数。这一 好于安慰剂。临床实验必须充分考虑患者的知情 现象称为平均数的回归。平均数的回归是所有测 同意权,即告诉所有患者他们可能接受真正的药 量的变量受随机误差影响都会表现出的数学特 物,也可能接受没有疗效的安慰剂,二者各占 性。即便没有生物和心理因素作为中介的安慰剂 50%的几率,将被试按双盲随机原则分为两组, 效应存在,后面的测量值因平均数的回归倾向也 活性药物治疗组(active therapy group)或安慰剂治 会变低(Davis.,2002)。如果被试在疼痛强度最高 疗组。活性药物治疗组中给被试施加的是真正的 的时候接受第一次临床测量,那么第二次的痛觉 药物,安慰剂组给的是看起来跟真正药物相同的 测量可能会偏低。这样,两次测量表现出来的差 安慰剂。根据双盲设计,医生和患者都不知道自 异并不能归因于他们接受的任何干预。因为临床 己接受的是药物还是安慰剂。活性药物治疗的疗 实验中平均数的回归常常与安慰剂效应同时出现, 效必须显著大于安慰剂治疗,才能证明这种药物 只有将接受安慰剂治疗的被试与不接受安慰剂治 具有确定的疗效。这种方法因不存在对患者的欺 疗的被试进行比较,才能发现可归因于安慰剂处 骗,从而克服了临床实验的的伦理问题,被认为 理的效应到底有多大。 是临床试验的黄金原则。但需要强调的是,双盲 3.3症状改善的虚报误差(False positive errors) 实验中包括活性药物治疗组和安慰剂治疗组,只 虚报误差是患者和医生都可能会发生的错误, 能比较活性药物和安慰剂治疗的疗效大小,却无 通过信号检测论可以解释这一点。信号检测论是 法说明安慰剂效应本身到底有多大。只有在上面 一种心理物理法,是关于人们在不确定的情况下 两组的基础上再增加自然历史组,才可以排除自 如何作出决定的理论。在探测模糊信号时,可能 然历史、平均数的回归和虚报误差等干扰因素, 会把没有出现的信号判断为有信号,这种错误称 才能够正确评估安慰剂效应的大小。Beecher 为虚报(Allan&Siegel,2002)。症状强度的模糊性 (1955)在他的文章中回顾了15篇相关的研究.他 同样会使患者出现虚报误差,例如医生告诉他有 得出结论说26%58%(平均35%)的患者在实施安 一种药物治疗他的病特别有效,患者在服用了这 慰剂之后症状显著缓解。但因为其中13篇都不包 种药物之后可能感觉症状减轻了,实际上,症状 括自然历史组,安慰剂组中症状缓解的被试实际 没有缓解但他误以为症状缓解了。医生有时对症 上也可以归因于疾病的自然历史变化,从而使得 ?1994-2015 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 8 期 张文彩等: 安慰剂效应研究实验设计的历史和发展 1117 3 影响安慰剂效应研究的因素 为了探测到真实的安慰剂效应, 实验设计中 应该排除的混淆因素包括自然历史因素、平均数 的回归和虚报误差等。 3.1 自然历史(Natural history) 许多病理条件随时间的推进会发生症状的自 然变化和波动 , 这就是症状的自然历史变化 (Fields & Levine, 1984), 也就是说, 即便没有施 加任何治疗和干预, 病情也可能会出现缓解。如 果被试恰好在病情出现缓解之前这一时间点服用 了安慰剂, 他就会相信安慰剂是一种有效的治 疗。显然这并不能用安慰剂效应来解释, 因为此 时的病情恢复无论如何也会发生, 与服不服用安 慰剂没有关系。所以为了说明安慰剂效应, 就必 须在实验设计中考虑设置自然历史条件, 从而将 自然历史因素和安慰剂干预因素区别开来。 3.2 平均数的回归(Regression to the mean) 随着测量次数的增加, 越到后面的测量, 测 量变量越接近变量分布的中心, 即平均数。这一 现象称为平均数的回归。平均数的回归是所有测 量的变量受随机误差影响都会表现出的数学特 性。即便没有生物和心理因素作为中介的安慰剂 效应存在, 后面的测量值因平均数的回归倾向也 会变低(Davis, 2002 )。如果被试在疼痛强度最高 的时候接受第一次临床测量, 那么第二次的痛觉 测量可能会偏低。这样, 两次测量表现出来的差 异并不能归因于他们接受的任何干预。因为临床 实验中平均数的回归常常与安慰剂效应同时出现, 只有将接受安慰剂治疗的被试与不接受安慰剂治 疗的被试进行比较, 才能发现可归因于安慰剂处 理的效应到底有多大。 3.3 症状改善的虚报误差(False positive errors) 虚报误差是患者和医生都可能会发生的错误, 通过信号检测论可以解释这一点。信号检测论是 一种心理物理法, 是关于人们在不确定的情况下 如何作出决定的理论。在探测模糊信号时, 可能 会把没有出现的信号判断为有信号, 这种错误称 为虚报(Allan & Siegel, 2002)。症状强度的模糊性 同样会使患者出现虚报误差, 例如医生告诉他有 一种药物治疗他的病特别有效, 患者在服用了这 种药物之后可能感觉症状减轻了, 实际上, 症状 没有缓解但他误以为症状缓解了。医生有时对症 状的观察也会出现错误, 病人的病情没有缓解但 他以为好转了, 从而出现虚报误差。不管是医生 对患者的症状作出的诊断还是患者报告自己的症 状, 这种误差在医学决策中普遍存在。虚报误差 可以尽可能通过客观测量来消除, 比如客观的激 素和脑激活等客观指标的测量来判断虚报误差是 否存在。 因此, 在缺乏控制的安慰剂效应实验中, 所 报告的“改善率”可能会归因于上面提到的各种混 淆因素, 而非安慰剂处理。这样, 在进行安慰剂效 应研究过程中, 根据具体的实验目的采取严格的 实验设计, 是排除可能干扰因素的必要条件。 4 实验设计的发展 4.1 双盲随机设计(Randomized and double-blind design) 对于临床药物实验而言, 设置安慰剂条件的 目的在于检验某种药物的疗效。其逻辑是若想证 明某种药物有确定的疗效, 其治疗作用必须显著 好于安慰剂。临床实验必须充分考虑患者的知情 同意权, 即告诉所有患者他们可能接受真正的药 物, 也可能接受没有疗效的安慰剂, 二者各占 50%的几率, 将被试按双盲随机原则分为两组, 活性药物治疗组(active therapy group)或安慰剂治 疗组。活性药物治疗组中给被试施加的是真正的 药物, 安慰剂组给的是看起来跟真正药物相同的 安慰剂。根据双盲设计, 医生和患者都不知道自 己接受的是药物还是安慰剂。活性药物治疗的疗 效必须显著大于安慰剂治疗, 才能证明这种药物 具有确定的疗效。这种方法因不存在对患者的欺 骗, 从而克服了临床实验的的伦理问题, 被认为 是临床试验的黄金原则。但需要强调的是, 双盲 实验中包括活性药物治疗组和安慰剂治疗组, 只 能比较活性药物和安慰剂治疗的疗效大小, 却无 法说明安慰剂效应本身到底有多大。只有在上面 两组的基础上再增加自然历史组, 才可以排除自 然历史、平均数的回归和虚报误差等干扰因素, 才能够正确评估安慰剂效应的大小。Beecher (1955)在他的文章中回顾了 15 篇相关的研究, 他 得出结论说 26%~58%(平均 35%)的患者在实施安 慰剂之后症状显著缓解。但因为其中 13 篇都不包 括自然历史组, 安慰剂组中症状缓解的被试实际 上也可以归因于疾病的自然历史变化, 从而使得
1118 心理科学进展 第19卷 这一结论缺乏科学依据而广受批评。 范式关注治疗是由医生启动还是由仪器启动。公 4.z欺骗设计(Deceptive design) 开范式是经典的常规治疗情境,患者可以意识到 实际上,在临床双盲随机试验中只发现较小 治疗正在进行,治疗效应是治疗本身的特异性效 的安慰剂效应,原因可能是公开告诉患者接受真 应和安慰剂效应之和。在隐藏范式中,通过事先 实药物的几率只有50%。但是,当研究目的就是 编好的程序,在预先定好的时间进行计算机控制 探讨安慰剂的作用有多大的时候,安慰剂实施的 的静脉注射,房间里没有医生或护士,患者并不 信息直接是“你将要接受非常有效的药物”,而非 知道注射的开始和结束,这种条件下被试体验到 50%几率接受治疗,此时更大的安慰剂效应就表 的治疗效应归于药物的特异反应而不是安慰剂效 现出来。 应。因此,公开药物注射和隐蔽药物注射之差就 Kirsch和Weixel(I988)比较了咖啡安慰剂在 可以测量到安慰剂效应(Colloca&Benedetti, 双盲实施组、欺骗实施组和自然历史组对心理和 2005)。 生理活动的影响,并且设置了咖啡安慰剂的不同 这一范式在某些特定的实验情境具有很重要 剂量水平。双盲实施组,模拟符合伦理的研究环 的意义。例如,Benedetti,,Amanzio和Maggi(199S) 境(见上面的双盲随机临床研究设计),告诉被试 对93个胸廓切开术患者采用双盲随机方法进行 会有50%的几率饮用真正的咖啡或去咖啡因的咖 实验,即使用公开注射药物,发现缩胆囊素的拮 啡:欺骗实施组,模拟临床实践的临床治疗环境 抗剂丙谷胺(Proglumide)的止痛作用大于安慰剂 (因为医生在真实的治疗环境中会告诉患者要接 作用,安慰剂的作用大于无任何处理。然而,进一 受的治疗是有效的,不会让患者产生质疑),告诉 步使用公开-隐藏范式却证明这一结论是错误的。 被试要饮用知名品牌的咖啡;自然历史组,不饮 实验表明:当隐蔽注射丙谷胺,去除了安慰剂效 用任何饮料。结果发现,欺骗实施组表现出符合 应,就根本不会产生止痛效应;而公开注射丙谷 预期的安慰剂效应,平均脉搏率和信任水平(对饮 胺所产生的止痛效应则远远大于安慰剂的作用, 用的饮料是真正咖啡的信任水平评价)显著高于 说明丙谷胺的作用似乎只在安慰剂发挥作用的通 双盲实施组。比较欺骗实施组与自然历史组的差 路中产生放大效应,但其本身并没有直接的止痛 值和双盲实施组与自然历史组的差值,以观察脉 作用。这一检验药物效力的新方法对临床实验设 搏率、收缩压和心境等指标的差值随剂量水平发 计有重要的作用。例如,只有药物隐性施加才可 生的变化,结果发现两组的差值在这些指标上都 确定药物动力效果,这时没有任何的心理污染, 一致表现出相反趋势的变化,这些数据表明双 这就为安慰剂控制实验提供了一个很好的选择。 盲随机的研究环境与通过欺骗模拟的临床真实 同样,Benedetti(1996)的研究发现,丙谷胺只能促 情境也许并不相同。如果双盲组的实验情境产生 进安慰剂反应者的安慰剂止痛,不能促进安慰剂 的心理生理效应与欺骗实施组的临床环境产生 不反应者的安慰剂止痛(安慰剂反应者指的是对 的效应相反,也许过去普遍使用双盲实验情境 安慰剂治疗有明显反应的个体,比如他们在安慰 来评估药物疗效的方法并不合适。这样,研究者 剂止痛条件下体验到疼痛强度显著下降,而安慰 对双盲随机设计的方法是否能代表临床治疗情 剂不反应者则无此反应)。安慰剂反应者相对于不 境提出了质疑。 反应者产生了更多的内源性阿片物质,可能表明 4.3公开隐藏设计范式(Open-hidden paradigm) 内源性阿片物质的产生是丙谷胺发挥作用的前 任何医学治疗都有两个成分:治疗的特异效 提。Colloca和Benedetti(2005)把这个实验现象叫 应(如特定药物引起的特定反应)和治疗的背景效 做临床实验中的测不准原则(Principle of 应(或称安慰剂效应)有人提出一个研究安慰剂效 uncertainty),这是借用的Heisenberg在物理学中 应的有趣模型,称为公开-隐藏范式(Amanzio& 提出的测不准原则这一术语。物理学中,因测量 Benedetti,1999;Amanzio,Pollo,Maggi,& 行为本身诱发的动力素乱使所测量变量的绝对值 Benedetti,2001;Benedetti et al.,2003;Colloca, 变得不确定。在药物研究中,临床实验中被试意 Lopiano,Lanotte,Benedetti,2004:Levine 识到自己服用了某种药物,这种心理活动本身已 Gordon,.1984),尝试分离这两种效应。公开隐藏 经使生理活动发生变化,心理因素引起的变化与 ?1994-2015 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
1118 心 理 科 学 进 展 第 19 卷 这一结论缺乏科学依据而广受批评。 4.2 欺骗设计(Deceptive design) 实际上, 在临床双盲随机试验中只发现较小 的安慰剂效应, 原因可能是公开告诉患者接受真 实药物的几率只有 50%。但是, 当研究目的就是 探讨安慰剂的作用有多大的时候, 安慰剂实施的 信息直接是“你将要接受非常有效的药物”, 而非 50%几率接受治疗, 此时更大的安慰剂效应就表 现出来。 Kirsch 和 Weixel (1988)比较了咖啡安慰剂在 双盲实施组、欺骗实施组和自然历史组对心理和 生理活动的影响, 并且设置了咖啡安慰剂的不同 剂量水平。双盲实施组, 模拟符合伦理的研究环 境(见上面的双盲随机临床研究设计), 告诉被试 会有 50%的几率饮用真正的咖啡或去咖啡因的咖 啡; 欺骗实施组, 模拟临床实践的临床治疗环境 (因为医生在真实的治疗环境中会告诉患者要接 受的治疗是有效的, 不会让患者产生质疑), 告诉 被试要饮用知名品牌的咖啡; 自然历史组, 不饮 用任何饮料。结果发现, 欺骗实施组表现出符合 预期的安慰剂效应, 平均脉搏率和信任水平(对饮 用的饮料是真正咖啡的信任水平评价)显著高于 双盲实施组。比较欺骗实施组与自然历史组的差 值和双盲实施组与自然历史组的差值, 以观察脉 搏率、收缩压和心境等指标的差值随剂量水平发 生的变化, 结果发现两组的差值在这些指标上都 一致表现出相反趋势的变化, 这些数据表明双 盲随机的研究环境与通过欺骗模拟的临床真实 情境也许并不相同。如果双盲组的实验情境产生 的心理生理效应与欺骗实施组的临床环境产生 的效应相反, 也许过去普遍使用双盲实验情境 来评估药物疗效的方法并不合适。这样, 研究者 对双盲随机设计的方法是否能代表临床治疗情 境提出了质疑。 4.3 公开隐藏设计范式(Open-hidden paradigm) 任何医学治疗都有两个成分:治疗的特异效 应(如特定药物引起的特定反应)和治疗的背景效 应(或称安慰剂效应)。有人提出一个研究安慰剂效 应的有趣模型, 称为公开-隐藏范式 (Amanzio & Benedetti, 1999; Amanzio, Pollo, Maggi, & Benedetti, 2001; Benedetti et al., 2003; Colloca, Lopiano, Lanotte, & Benedetti, 2004; Levine & Gordon, 1984), 尝试分离这两种效应。公开隐藏 范式关注治疗是由医生启动还是由仪器启动。公 开范式是经典的常规治疗情境, 患者可以意识到 治疗正在进行, 治疗效应是治疗本身的特异性效 应和安慰剂效应之和。在隐藏范式中, 通过事先 编好的程序, 在预先定好的时间进行计算机控制 的静脉注射, 房间里没有医生或护士, 患者并不 知道注射的开始和结束, 这种条件下被试体验到 的治疗效应归于药物的特异反应而不是安慰剂效 应。因此, 公开药物注射和隐蔽药物注射之差就 可以测量到安慰剂效应 (Colloca & Benedetti, 2005)。 这一范式在某些特定的实验情境具有很重要 的意义。例如, Benedetti, Amanzio 和 Maggi (1995) 对 93 个胸廓切开术患者采用双盲随机方法进行 实验, 即使用公开注射药物, 发现缩胆囊素的拮 抗剂丙谷胺(Proglumide)的止痛作用大于安慰剂 作用, 安慰剂的作用大于无任何处理。然而, 进一 步使用公开-隐藏范式却证明这一结论是错误的。 实验表明:当隐蔽注射丙谷胺, 去除了安慰剂效 应, 就根本不会产生止痛效应; 而公开注射丙谷 胺所产生的止痛效应则远远大于安慰剂的作用, 说明丙谷胺的作用似乎只在安慰剂发挥作用的通 路中产生放大效应, 但其本身并没有直接的止痛 作用。这一检验药物效力的新方法对临床实验设 计有重要的作用。例如, 只有药物隐性施加才可 确定药物动力效果, 这时没有任何的心理污染, 这就为安慰剂控制实验提供了一个很好的选择。 同样, Benedetti (1996)的研究发现, 丙谷胺只能促 进安慰剂反应者的安慰剂止痛, 不能促进安慰剂 不反应者的安慰剂止痛(安慰剂反应者指的是对 安慰剂治疗有明显反应的个体, 比如他们在安慰 剂止痛条件下体验到疼痛强度显著下降, 而安慰 剂不反应者则无此反应)。安慰剂反应者相对于不 反应者产生了更多的内源性阿片物质, 可能表明 内源性阿片物质的产生是丙谷胺发挥作用的前 提。Colloca 和 Benedetti (2005)把这个实验现象叫 做临床实验中的测不准原则 (Principle of uncertainty), 这是借用的 Heisenberg 在物理学中 提出的测不准原则这一术语。物理学中, 因测量 行为本身诱发的动力紊乱使所测量变量的绝对值 变得不确定。在药物研究中, 临床实验中被试意 识到自己服用了某种药物, 这种心理活动本身已 经使生理活动发生变化, 心理因素引起的变化与
第8期 张文彩等:安慰剂效应研究实验设计的历史和发展 1119 要测量的药物影响混在一起,使单纯药物作用的 对真实的药物处理是否具有调节作用。尽管平衡 测定变得更加困难。使用传统的实验设计不可能 设计设定了更为全面的研究条件,但也包含了对 避免临床实验中测不准的特性。而公开隐蔽范式 被试的欺骗,实验的伦理价值受到一定损失。 排除了治疗的背景效应,因此也去除了治疗的安 此外,在Keltner等(2006)的研究中使用了类 慰剂预期效应,很大程度上克服了临床实验中的 似的平衡设计来研究疼痛预期的脑机制,实验中 这种缺陷。 设定两种热痛刺激水平(高和低)和两种疼痛预期 4.4平衡设计(Balanced design) 水平(高和低)。结果发现,当高强度的热痛刺激伴 除了欺骗设计和公开隐藏设计之外以外,研 随高强度的预期时,痛觉区如丘脑、脑岛和第二 究者提出了另一种改进的实验设计.平衡设计。平 躯体感觉皮层等区域表现出显著的MRI激活, 衡的安慰剂研究设计包括被试的预期(或信念)和 当高强度的热痛刺激伴随低强度的预期时,这些 实际接受的处理这两个自变量。Thomas(1987)使 区域的激活显著下降,提示言语预期对疼痛具有 用平衡设计研究了安慰剂预期和医生的诊断态度 调节作用。Keltner的研究提示,也可以采用类似 在疾病恢复中的作用。他们选择200个疼痛、咳 的平衡设计来研究安慰剂效应的脑机制。 嗽、鼻塞和疲劳但无生理上异样的被试,实际上 对他们的病情并不能做出明确的诊断。将被试分 5安慰剂效应本身作为研究目标的实 验设计 为四组:积极诊断并接受安慰剂治疗组,给患者 明确的诊断并告诉他过几天病情就会好些,服药 临床药物检验中,对安慰剂效应进行控制成 之后会好的更快,并给他们服用安慰剂;积极诊 为检验某种药物疗效的不可或缺的步骤。在相当 断但不接受安慰剂治疗组,给患者明确的诊断并 一部分临床实验中,药物治疗某种疾病的效应强 告诉他过几天就会好些,但不需要服药治疗;消 度并不能超过安慰剂效应的强度,这间接说明安 极诊断并接受安慰剂治疗组,告诉患者无法判断 慰剂效应的强大。安慰剂效应的强度到底有多大, 他患何种疾病,服药之后不知会不会缓解病情, 最终决定安慰剂效应本身是否有价值成为研究者 并给他们服用安慰剂:消极诊断但不接受安慰剂 关注的目标。 治疗组,告诉患者无法判断他患何种疾病,因此 5.1安慰剂效应的强度到底有多大 无法给他提供药物治疗。结果发现,两周以后,积 安慰剂效应的强度到底有多大,最终决定安 极诊断组的被试要比消极诊断组的被试恢复地更 慰剂效应本身是否有价值成为研究者关注的目 快,而在有无安慰剂治疗处理上无显著差异。这 标。Hrobjartsson和Gotzsche(2001)对安慰剂效应 一平衡设计的研究说明医患关系在疾病的恢复中 的强度进行了元分析.他们的研究当中包括了114 发挥重要的作用。 个双盲随机室验。结果发现,在32个使用人数作 Flaten,Simonsen和Olsen(1999)的研究中采 为因变量的实验中,没有发现显著的安慰剂效 用了平衡设计,包括四个实验条件:被试被告知 应。在另外82个实验使用平均数作为因变量的实 所接受的药物是肌肉松弛剂,并接受肌肉松弛剂; 验中,发现了安慰剂效应,但这种效应随着样本 被试被告知所接受的药物是肌肉松弛剂,但接受 的增加而减小;数据合并之后,在主观报告上发 的是安慰剂:被试被告知所接受的药物是肌肉兴 现了显著的安慰剂效应,但在客观测量上没有发 奋剂,但接受的是肌肉松弛剂;被试被告知所接 现显著的安慰剂效应。对27个痛觉实验单独进行 受的药物是肌肉兴奋剂,但接受的是安慰剂。结 分析,发现安慰剂效应可使疼痛下降0.065。最后 果表明,那些告诉接受药物是肌肉兴奋剂的被试 作者得出结论说,尽管在主观报告和疼痛研究中 比那些告诉是肌肉松弛剂的被试报告出更高的肌 发现了较弱的安慰剂作用,但因在平均数作为因 肉紧张程度,表明被试的预期(被告知是肌肉兴奋 变量的实验中和客观测量上没有显著的安慰剂效 剂)干扰了肌肉松弛剂的药效。可以看出,平衡设 应,所以不支持安慰剂有强大的临床效应这一观 计可进行多种比较以获得更加全面的信息,不仅 点。他们的数据不仅质疑安慰剂效应的强度和普 可以检验药物的效应,也可以检验言语预期的效 遍性,作者还进一步说在主观报告上观察到的显 应,并可进一步检验二者的交互效应一言语预期 著的安慰剂效应可能只是患者的报告偏向,他们 ?1994-2015 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 8 期 张文彩等: 安慰剂效应研究实验设计的历史和发展 1119 要测量的药物影响混在一起, 使单纯药物作用的 测定变得更加困难。使用传统的实验设计不可能 避免临床实验中测不准的特性。而公开隐蔽范式 排除了治疗的背景效应, 因此也去除了治疗的安 慰剂预期效应, 很大程度上克服了临床实验中的 这种缺陷。 4.4 平衡设计(Balanced design) 除了欺骗设计和公开隐藏设计之外以外, 研 究者提出了另一种改进的实验设计-平衡设计。平 衡的安慰剂研究设计包括被试的预期(或信念)和 实际接受的处理这两个自变量。Thomas (1987)使 用平衡设计研究了安慰剂预期和医生的诊断态度 在疾病恢复中的作用。他们选择 200 个疼痛、咳 嗽、鼻塞和疲劳但无生理上异样的被试, 实际上 对他们的病情并不能做出明确的诊断。将被试分 为四组:积极诊断并接受安慰剂治疗组, 给患者 明确的诊断并告诉他过几天病情就会好些, 服药 之后会好的更快, 并给他们服用安慰剂; 积极诊 断但不接受安慰剂治疗组, 给患者明确的诊断并 告诉他过几天就会好些, 但不需要服药治疗; 消 极诊断并接受安慰剂治疗组, 告诉患者无法判断 他患何种疾病, 服药之后不知会不会缓解病情, 并给他们服用安慰剂; 消极诊断但不接受安慰剂 治疗组, 告诉患者无法判断他患何种疾病, 因此 无法给他提供药物治疗。结果发现, 两周以后, 积 极诊断组的被试要比消极诊断组的被试恢复地更 快, 而在有无安慰剂治疗处理上无显著差异。这 一平衡设计的研究说明医患关系在疾病的恢复中 发挥重要的作用。 Flaten, Simonsen 和 Olsen (1999)的研究中采 用了平衡设计, 包括四个实验条件:被试被告知 所接受的药物是肌肉松弛剂, 并接受肌肉松弛剂; 被试被告知所接受的药物是肌肉松弛剂, 但接受 的是安慰剂; 被试被告知所接受的药物是肌肉兴 奋剂, 但接受的是肌肉松弛剂; 被试被告知所接 受的药物是肌肉兴奋剂, 但接受的是安慰剂。结 果表明, 那些告诉接受药物是肌肉兴奋剂的被试 比那些告诉是肌肉松弛剂的被试报告出更高的肌 肉紧张程度, 表明被试的预期(被告知是肌肉兴奋 剂)干扰了肌肉松弛剂的药效。可以看出, 平衡设 计可进行多种比较以获得更加全面的信息, 不仅 可以检验药物的效应, 也可以检验言语预期的效 应, 并可进一步检验二者的交互效应—言语预期 对真实的药物处理是否具有调节作用。尽管平衡 设计设定了更为全面的研究条件, 但也包含了对 被试的欺骗, 实验的伦理价值受到一定损失。 此外, 在 Keltner 等(2006)的研究中使用了类 似的平衡设计来研究疼痛预期的脑机制, 实验中 设定两种热痛刺激水平(高和低)和两种疼痛预期 水平(高和低)。结果发现, 当高强度的热痛刺激伴 随高强度的预期时, 痛觉区如丘脑、脑岛和第二 躯体感觉皮层等区域表现出显著的 fMRI 激活, 当高强度的热痛刺激伴随低强度的预期时, 这些 区域的激活显著下降, 提示言语预期对疼痛具有 调节作用。Keltner 的研究提示, 也可以采用类似 的平衡设计来研究安慰剂效应的脑机制。 5 安慰剂效应本身作为研究目标的实 验设计 临床药物检验中, 对安慰剂效应进行控制成 为检验某种药物疗效的不可或缺的步骤。在相当 一部分临床实验中, 药物治疗某种疾病的效应强 度并不能超过安慰剂效应的强度, 这间接说明安 慰剂效应的强大。安慰剂效应的强度到底有多大, 最终决定安慰剂效应本身是否有价值成为研究者 关注的目标。 5.1 安慰剂效应的强度到底有多大 安慰剂效应的强度到底有多大, 最终决定安 慰剂效应本身是否有价值成为研究者关注的目 标。Hróbjartsson 和 Gøtzsche (2001)对安慰剂效应 的强度进行了元分析。他们的研究当中包括了 114 个双盲随机室验。结果发现, 在 32 个使用人数作 为因变量的实验中, 没有发现显著的安慰剂效 应。在另外 82 个实验使用平均数作为因变量的实 验中, 发现了安慰剂效应, 但这种效应随着样本 的增加而减小; 数据合并之后, 在主观报告上发 现了显著的安慰剂效应, 但在客观测量上没有发 现显著的安慰剂效应。对 27 个痛觉实验单独进行 分析, 发现安慰剂效应可使疼痛下降 0.065。最后 作者得出结论说, 尽管在主观报告和疼痛研究中 发现了较弱的安慰剂作用, 但因在平均数作为因 变量的实验中和客观测量上没有显著的安慰剂效 应, 所以不支持安慰剂有强大的临床效应这一观 点。他们的数据不仅质疑安慰剂效应的强度和普 遍性, 作者还进一步说在主观报告上观察到的显 著的安慰剂效应可能只是患者的报告偏向, 他们