是由学习时间的分配不同而造成的,还是由总的学习时间不同所导致。第二,被试对学习材料的 保持时间间隔不同。所有的被试都在周五接受检侧,因而每组被试从学习检测之间的时间间隔发 生了变化。第三组成绩最好,这有可能是因为,他们学习材料的时间与检测时间相隔最短,遗忘 得较少。因此,在这个实验中,被试假定的自变量“学习时间的分配”遭到了“总的学习时间 和“保持时间间隔”的混淆。 表2-1存在混滑的有关学习时间分配的实验设计 周一 周二 周三 周四 周五 第一组 3小时 测验 第二组 3小时 3小时 测验 第三组 3小时 3小时 3小时 测珍 这个例子中的混看错误是相当明显的,但在大多数情况下,可能发生的混淆是相当隐蔽的。 所以,实验者要有科学严谨的思维,要提防潜在的混淆因素,并学会运用适当的方式控制它们。 做到这一点,并非易事。对任何一个实验来说,理想中需要控制的变量是相当多的。实际中能够 控制的变量往往无法满足理想的需要。例如,在上述这个有关学习的简单的实验中,就有许多变 量应该控制。每个人在一天中的不同时段的学习效率可能不同,最好控制。温度也很重要,如果 太热,容易打瞌睡,降低学习热情和效率。还有,每个人的智力情况会直接影响学习结果,这不 容忽视。还有许多会影响实验结果的因素。实验者总是想尽可能地控制那些有显著影响的变量, 并希望未控制的因素对自变量的混淆尽可能小。 自变量产生的效应越小,仔细控制无关变量就越重要。下面介绍一些影响实验结果的因素, 在实验中必须加以控制 1.实验者效应。实验者做实验是为了验证自己提出的有关因果关系的假设,在实验中,他的 动作、表情和语言等可能有意无意地对被试有所暗示,从而导致引起的实验结果有利于证实他的 假设。这种效应最初是心理学家在一匹马的表演中发现的。二十世纪初,流传着这样一件事: 个数学教员训练了一匹聪明的马,这匹马叫“汉斯”,它能通过敲击前蹄来回答算术题。这引起 了心理学家的兴趣 经过研究发现,这匹马能够解答算术题,根本不是因为它具备思维能力,而是他对主人及观 众的动作和表情非常敏感。每当汉斯完成正确回答所要求的敲击数时,主人就会在无意中轻微地 点一下头,或放松面部紧张的肌肉。因此,马的行为是由他的训练者或观众未意识到的微妙的交 流方式控制的。但当时,这个发现没有引起心理学界的足移重视。直到罗森塔尔在用人类被试及 动物被试完成一系列有关实验者效应的实验研究后,才知道这个效应在心理实验中存在的普遍 性。实验者效应与科学实验是格格不入的,克服实验者效应的一个重要方法就是采用双盲实验。 2.安慰剂效应。这个效应最初是在医学研究中发现的。病人在接受一种药物的治疗后,尽管 这种药不能医治患者的病,但患者的病情还是有所好转。后来,心理学家们专门作了研究,分别 通过静脉注射、肌肉注射和口服三种方式将葡萄糖稀释液注入病体内。结果表明,静脉注射的疗 -14
是由学习时间的分配不同而造成的,还是由总的学习时间不同所导致。第二,被试对学习材料的 保持时间间隔不同。所有的被试都在周五接受检测,因而每组被试从学习检测之间的时间间隔发 生了变化。第三组成绩最好,这有可能是因为,他们学习材料的时间与检测时间相隔最短,遗忘 得较少。因此,在这个实验中,被试假定的自变量“学习时间的分配”遭到了“总的学习时间” 和“保持时间间隔”的混淆。 表2-1 存在混淆的有关学习时间分配的实验设计 周一 周二 周三 周四 周五 第一组 3小时 —— —— —— 测验 第二组 3小时 3小时 —— —— 测验 第三组 3小时 3小时 3小时 —— 测验 这个例子中的混淆错误是相当明显的,但在大多数情况下,可能发生的混淆是相当隐蔽的。 所以,实验者要有科学严谨的思维,要提防潜在的混淆因素,并学会运用适当的方式控制它们。 做到这一点,并非易事。对任何一个实验来说,理想中需要控制的变量是相当多的。实际中能够 控制的变量往往无法满足理想的需要。例如,在上述这个有关学习的简单的实验中,就有许多变 量应该控制。每个人在一天中的不同时段的学习效率可能不同,最好控制。温度也很重要,如果 太热,容易打瞌睡,降低学习热情和效率。还有,每个人的智力情况会直接影响学习结果,这不 容忽视。还有许多会影响实验结果的因素。实验者总是想尽可能地控制那些有显著影响的变量, 并希望未控制的因素对自变量的混淆尽可能小。 自变量产生的效应越小,仔细控制无关变量就越重要。下面介绍一些影响实验结果的因素, 在实验中必须加以控制。 1.实验者效应。实验者做实验是为了验证自己提出的有关因果关系的假设,在实验中,他的 动作、表情和语言等可能有意无意地对被试有所暗示,从而导致引起的实验结果有利于证实他的 假设。这种效应最初是心理学家在一匹马的表演中发现的。二十世纪初,流传着这样一件事:一 个数学教员训练了一匹聪明的马,这匹马叫“汉斯”,它能通过敲击前蹄来回答算术题。这引起 了心理学家的兴趣。 经过研究发现,这匹马能够解答算术题,根本不是因为它具备思维能力,而是他对主人及观 众的动作和表情非常敏感。每当汉斯完成正确回答所要求的敲击数时,主人就会在无意中轻微地 点一下头,或放松面部紧张的肌肉。因此,马的行为是由他的训练者或观众未意识到的微妙的交 流方式控制的。但当时,这个发现没有引起心理学界的足够重视。直到罗森塔尔在用人类被试及 动物被试完成一系列有关实验者效应的实验研究后,才知道这个效应在心理实验中存在的普遍 性。实验者效应与科学实验是格格不入的,克服实验者效应的一个重要方法就是采用双盲实验。 2.安慰剂效应。这个效应最初是在医学研究中发现的。病人在接受一种药物的治疗后,尽管 这种药不能医治患者的病,但患者的病情还是有所好转。后来,心理学家们专门作了研究,分别 通过静脉注射、肌肉注射和口服三种方式将葡萄糖稀释液注入病体内。结果表明,静脉注射的疗 - 14 -
效明显大于肌肉注射的疗效,而肌肉注射的疗效又大于口服的疗效。这实际上是病人的心理因素 所导致的效应。 安慰剂效应在医疗实践和心理治疗实践中应该是有利的,但在医学研究和心理学研究中却是 应该控制的。控制安慰剂效应的一个较好的方法是,建立控制组。 3.顺序效应。这在心理学实验中非常常见。后发生的行为往往受到先前发生的行为经验的影 响。例如,在学习实验中,先学习甲材料,然后测试,再学习乙材料,再测试。结果通常是甲材 料的学习成绩比乙材料的好,即使甲、乙材料的难度相等。这是因为,先学的甲材料对乙材料的 学习产生了干扰作用。当然,后发生的行为也可能对先前行为有干扰或促进作用。总之,由于实 验的先后顺序不同,实验结果往往会受到污染。对于顺序效应,如果只有两种顺序,可以通过每 个顺序各分配一半被试米控制。但如果顺序不止两个,就需要更为精心和复杂的设计。 在心理学实验中,还存在许多无关变量引起的效应,如系列效应、练习效应、疲劳效应、期 望效应和习惯效应等。控制无关变量的方法有很多,但使变量保持不变是排除无关因素的最主要 的方法。另外,统计方法也能控制无关变量。但要记住,使变量保持恒定是控制无关变量的最直 接的实验技术。许多实验失败,就是因为没有足够地控制无关因素,结果这些因素就发生了不规 则的变化,污染了实验结果 (三)观测因变量 实验的第三个部分是,观测可能受自变量影响的行为。因变量就是实验中观测到的行为结果 例如,在有关电视暴力对儿童攻击性的影响的研究中,因变量是观测到的某种形式的攻击性。在 上述学习分配的实验中,因变量是学习测验的成绩。在心理实验中,因变量总是反应或行为方面 的变化。一般来说,实验者可以从反应的正确性、反应的速度、反应的难度、反应的次数和概率 以及反应的强度和大小幅度五个方面来度量因变量。但在度量的时候,要注意以下几点 1.考虑操作定义。任何实验的可靠性及其发现有价值的因果关系的可能性,在一定程度上都 取决于实验者观测什么行为作为因变量。还是以电视暴力对儿童攻击性影响的研究为例。我们知 道,该实验的因变量是儿童的攻击性。但如果从经验的角度来观测攻击性,就显得比较困难,而 且不严谨。因为“攻击性”这个术语没有得到界定。什么样的行为算是有攻击性的行为,如果这 一点很含糊的话,可能整个实验结果的可信度都要受到质疑。这就提醒我们,考虑操作定义。在 实验设计中,一个很关键的部分就是,观测什么样的行为作为因变量。也就是说 ,因变量必须有 明确的操作定义。否则,实验将无法重复,其可靠性和科学性也就不复存在。 2.观测的稳定性。衡量好因变量的一个标准是它的稳定性。如果准确重复一个实验,即相同 的被试、相同的自变量等等,那么测得的因变量的情况也相同。但有时,我们观测因变量的方法 有缺陷,不稳定的现象就会发生。比如,研究训练方法对运动员百米赛跑成绩的影响。如果第 天测用方法的训练效成时,运动员是顺风而跑:第一天测用方法的效应时,运动员知是逆风而跑 那么测得的成绩就缺乏信度,无从比较。只有当风向和风速恒定时,测得的运动员的成绩才有可 能是可靠的。这其实也是上述要控制的无关变量中的一种一保持观测条件的恒定性。 3.观测的范围。观测因变量的环境保持恒定,这避免了无关因素的干扰,避免了实验失败 但有时,实验的失败是出对因变量的观测范围不当引起的。例如,在运用信号检测论的实验中, 实验者呈现的信噪材料过于简单,被试的击中率多半达100%:或者,材料的难度过大,被试的 击中率平均不到10%。前者我们称为“天花板效应”,后者是“地板效应”。在这两种效应中, -15
效明显大于肌肉注射的疗效,而肌肉注射的疗效又大于口服的疗效。这实际上是病人的心理因素 所导致的效应。 安慰剂效应在医疗实践和心理治疗实践中应该是有利的,但在医学研究和心理学研究中却是 应该控制的。控制安慰剂效应的一个较好的方法是,建立控制组。 3.顺序效应。这在心理学实验中非常常见。后发生的行为往往受到先前发生的行为经验的影 响。例如,在学习实验中,先学习甲材料,然后测试,再学习乙材料,再测试。结果通常是甲材 料的学习成绩比乙材料的好,即使甲、乙材料的难度相等。这是因为,先学的甲材料对乙材料的 学习产生了干扰作用。当然,后发生的行为也可能对先前行为有干扰或促进作用。总之,由于实 验的先后顺序不同,实验结果往往会受到污染。对于顺序效应,如果只有两种顺序,可以通过每 个顺序各分配一半被试来控制。但如果顺序不止两个,就需要更为精心和复杂的设计。 在心理学实验中,还存在许多无关变量引起的效应,如系列效应、练习效应、疲劳效应、期 望效应和习惯效应等。控制无关变量的方法有很多,但使变量保持不变是排除无关因素的最主要 的方法。另外,统计方法也能控制无关变量。但要记住,使变量保持恒定是控制无关变量的最直 接的实验技术。许多实验失败,就是因为没有足够地控制无关因素,结果这些因素就发生了不规 则的变化,污染了实验结果 (三)观测因变量 实验的第三个部分是,观测可能受自变量影响的行为。因变量就是实验中观测到的行为结果。 例如,在有关电视暴力对儿童攻击性的影响的研究中,因变量是观测到的某种形式的攻击性。在 上述学习分配的实验中,因变量是学习测验的成绩。在心理实验中,因变量总是反应或行为方面 的变化。一般来说,实验者可以从反应的正确性、反应的速度、反应的难度、反应的次数和概率 以及反应的强度和大小幅度五个方面来度量因变量。但在度量的时候,要注意以下几点。 1.考虑操作定义。任何实验的可靠性及其发现有价值的因果关系的可能性,在一定程度上都 取决于实验者观测什么行为作为因变量。还是以电视暴力对儿童攻击性影响的研究为例。我们知 道,该实验的因变量是儿童的攻击性。但如果从经验的角度来观测攻击性,就显得比较困难,而 且不严谨。因为“攻击性”这个术语没有得到界定。什么样的行为算是有攻击性的行为,如果这 一点很含糊的话,可能整个实验结果的可信度都要受到质疑。这就提醒我们,考虑操作定义。在 实验设计中,一个很关键的部分就是,观测什么样的行为作为因变量。也就是说,因变量必须有 明确的操作定义。否则,实验将无法重复,其可靠性和科学性也就不复存在。 2.观测的稳定性。衡量好因变量的一个标准是它的稳定性。如果准确重复一个实验,即相同 的被试、相同的自变量等等,那么测得的因变量的情况也相同。但有时,我们观测因变量的方法 有缺陷,不稳定的现象就会发生。比如,研究训练方法对运动员百米赛跑成绩的影响。如果第一 天测甲方法的训练效应时,运动员是顺风而跑;第二天测甲方法的效应时,运动员却是逆风而跑, 那么测得的成绩就缺乏信度,无从比较。只有当风向和风速恒定时,测得的运动员的成绩才有可 能是可靠的。这其实也是上述要控制的无关变量中的一种——保持观测条件的恒定性。 3.观测的范围。观测因变量的环境保持恒定,这避免了无关因素的干扰,避免了实验失败。 但有时,实验的失败是出对因变量的观测范围不当引起的。例如,在运用信号检测论的实验中, 实验者呈现的信噪材料过于简单,被试的击中率多半达 100%;或者,材料的难度过大,被试的 击中率平均不到 10%。前者我们称为“天花板效应”,后者是“地板效应”。在这两种效应中, - 15 -
由于选择测量的因变量对被试来说过于简单或过于困难,所以观测不到更好的成绩或更差的成 绩。反映不了因变量的变化,也就阳碍了对自变量效果的体现。 对于实验的变量,很重要的一点是,实验者要意识到,任何一个因素都可能是自变量,也可 能是无关变量,它还可能成为因变量。这取决于当前所要研究的问题是什么。比如焦虑这个因素 实验者可以告诉被试,他们将体验轻微的电击或强烈的电击,然后问被试是愿意单独等待还是与 别人一同等待接受电击。在这个实验中,实验者通过不同强度的电击引起了被试不同程度的焦虑 焦虑在此是受操纵的自变量。在有些实验中,焦虑是需要控制保持恒定的因素。例如,实验者对 不同年龄被试的言语表达能力感兴趣。同样是要求被试阅读一段材料,然后用简洁的话把主要内 容表达出来,但如果有的被试是在与实验者一对一的情境下完成这一任务,有的则是接受当众考 验,那么结果可能就受到污染。因为在不同的情境下,被试的焦虑水平不同。当然,焦虑还可以 作为因变量得到观测。例如,要考察不同类型的测验(如多重选择、作文等)对学生焦虑水平的影 响,其中的因变量就是学生的焦虑表现。除此之外,焦虑还可以作为一种人格特征,有的人焦虑 水平高一些,有的人低一些。这就涉及到我们下面要讨论的内容 三、选择被试变量 前面我们所说的自变量是指研究者能够直接操纵的某些因素。在这样的实验中,研究者比轻 的是自己创设并控制的实验条件下的结果。然而,有许多实验并非如此,比较是在某些特征不同 的几组人之间进行的。自然的、不受操纵的组间变量就是被试变量。它们指参与实验的被试已经 具备的某些特征,如性别、年龄、智力、身体障碍或心理障碍,以及某些人格特征。如果研究者 要用被试变量,那么他们就不能直接操纵自变量,而必须根据研究所需,选择己经具备这些特征 的被试。从而形成不同的实验条件以待比较。 为了说明操纵变量与被试变量之间的区别,我们一起来构想一个研究。如果我们要研究焦虑 对人们学习迷宫的影响,我们可以有两种做法。 是直接操纵“焦虑”这个自变量。我们可以创设 情境,让一组被试在一大群旁观者面前走迷宫,从而引起他们的焦虑:另一组被试在走迷宫时则 没有旁观者,这样他们就不会因旁观者的存在而感到有压力。如此一来,焦虑这个自变量就被人 为地区分出两个水平。另外,我们还可以通过被试变量来研究这个问题。先让被试接受有关焦虑 顿向的人格测验,根据测验结果,选择两组焦虑水平不同的被试。 一组为焦虑型的,另一组为放 松型的。很明显,由被试变量造成的情境和通过操纵自变量形成的焦虑情境有很大区别。当焦虑 作为被试变量时,主试不能任意地将被试分配到创设的高焦虑组或低焦虑组,而必须根据他们己 经具备的特征对他们进行归类,从而得到高焦虑组和低焦虑组。 武德沃斯最初运用“自变量”这个术语时,是将它定义为实验者能够直接操纵的变量。对于 被试变量,由于实验者有选择权,能在一定程度上控制它,所以后来有人将被试变量作为自变量 的一个特例。这是“自变量”涵义的一次拓展。尽管如此,人们仍然认为,只有操纵自变量的 究才是严格意义上的实验,人们称之为“真实验”。而将被试变量作为自变量的研究有时则被称 为“准实验”。事实上,许多实验都是既要操纵变量又要用到被试变量。有被试变量参与的研究 不是真正意义上的“实验”,所以,研究者在下结论的时候要格外注意。 前面我们已经多次强调,心理学的研究目的或者说心理实验的目的是为了解释行为和思想, 也就是说,我们希望了解为什么有些行为会发生。如果研究者操纵变量,那么他们能简单地得出 行为的因果关系:但如果他们选用被试变量,则不能作出因果推论。因为在这两种情况下,研究 -16
由于选择测量的因变量对被试来说过于简单或过于困难,所以观测不到更好的成绩或更差的成 绩。反映不了因变量的变化,也就阻碍了对自变量效果的体现。 对于实验的变量,很重要的一点是,实验者要意识到,任何一个因素都可能是自变量,也可 能是无关变量,它还可能成为因变量。这取决于当前所要研究的问题是什么。比如焦虑这个因素。 实验者可以告诉被试,他们将体验轻微的电击或强烈的电击,然后问被试是愿意单独等待还是与 别人一同等待接受电击。在这个实验中,实验者通过不同强度的电击引起了被试不同程度的焦虑, 焦虑在此是受操纵的自变量。在有些实验中,焦虑是需要控制保持恒定的因素。例如,实验者对 不同年龄被试的言语表达能力感兴趣。同样是要求被试阅读一段材料,然后用简洁的话把主要内 容表达出来,但如果有的被试是在与实验者一对一的情境下完成这一任务,有的则是接受当众考 验,那么结果可能就受到污染。因为在不同的情境下,被试的焦虑水平不同。当然,焦虑还可以 作为因变量得到观测。例如,要考察不同类型的测验(如多重选择、作文等)对学生焦虑水平的影 响,其中的因变量就是学生的焦虑表现。除此之外,焦虑还可以作为一种人格特征,有的人焦虑 水平高一些,有的人低一些。这就涉及到我们下面要讨论的内容。 三、选择被试变量 前面我们所说的自变量是指研究者能够直接操纵的某些因素。在这样的实验中,研究者比较 的是自己创设并控制的实验条件下的结果。然而,有许多实验并非如此,比较是在某些特征不同 的几组人之间进行的。自然的、不受操纵的组间变量就是被试变量。它们指参与实验的被试已经 具备的某些特征,如性别、年龄、智力、身体障碍或心理障碍,以及某些人格特征。如果研究者 要用被试变量,那么他们就不能直接操纵自变量,而必须根据研究所需,选择已经具备这些特征 的被试。从而形成不同的实验条件以待比较。 为了说明操纵变量与被试变量之间的区别,我们一起来构想一个研究。如果我们要研究焦虑 对人们学习迷宫的影响,我们可以有两种做法。一是直接操纵"焦虑"这个自变量。我们可以创设 情境,让一组被试在一大群旁观者面前走迷宫,从而引起他们的焦虑;另一组被试在走迷宫时则 没有旁观者,这样他们就不会因旁观者的存在而感到有压力。如此一来,焦虑这个自变量就被人 为地区分出两个水平。另外,我们还可以通过被试变量来研究这个问题。先让被试接受有关焦虑 顿向的人格测验,根据测验结果,选择两组焦虑水平不同的被试。一组为焦虑型的,另一组为放 松型的。很明显,由被试变量造成的情境和通过操纵自变量形成的焦虑情境有很大区别。当焦虑 作为被试变量时,主试不能任意地将被试分配到创设的高焦虑组或低焦虑组,而必须根据他们己 经具备的特征对他们进行归类,从而得到高焦虑组和低焦虑组。 武德沃斯最初运用“自变量”这个术语时,是将它定义为实验者能够直接操纵的变量。对于 被试变量,由于实验者有选择权,能在一定程度上控制它,所以后来有人将被试变量作为自变量 的一个特例。这是“自变量”涵义的一次拓展。尽管如此,人们仍然认为,只有操纵自变量的研 究才是严格意义上的实验,人们称之为“真实验”。而将被试变量作为自变量的研究有时则被称 为“准实验”。事实上,许多实验都是既要操纵变量又要用到被试变量。有被试变量参与的研究 不是真正意义上的“实验”,所以,研究者在下结论的时候要格外注意。 前面我们已经多次强调,心理学的研究目的或者说心理实验的目的是为了解释行为和思想, 也就是说,我们希望了解为什么有些行为会发生。如果研究者操纵变量,那么他们能简单地得出 行为的因果关系;但如果他们选用被试变量,则不能作出因果推论。因为在这两种情况下,研究 - 16 -
者对情境的控制程度是不同的。操纵变量,可以使自变量先于行为发生,行为可能会随自变量的 不同而变化,重要的是,它假设可能存在的混淆因素都已得到控制,而实验的结果可以对行为作 出最合理的解释。换句话说,如果你改变某些因素,并且成功地控制了其他因素,使之保持稳定, 那么结果就只能是被操纵和改变的因素所引起的。在不存在混淆的实验研究中。组与组之间除】 被操纵的因素有所不同,其他各方面都必须等同,即使有差异,也是随机的。然而,在运用被试 变量时,虽然实验者通过选择具备某种特性的被试,也能改变某些因素,但却不能使其他因素保 持稳定。比如,选择焦虑倾向性不同的两组被试作为自变量,这并不能确保他们在其他方面是相 同的,如自信水平。而后者在很大程度上可能影响研究结果。在这样的情况下,尽管自变量也是 先于因变量发生,并且因变量随自变量的不同而改变,但由于未能控制所有的无关因素,我们还 是不能消除其他可能的因果解释。所以,在这类研究中,即使各组被试的行为反应有差异,我们 也不能贸然地肯定,这些差异是由选定的被试变量造成的,而只能说“观测到的各组间的行为不 同”,或者“某组比某组更可能作出什么样的行为”,然后推测可能的原因。 四、多自变量和多因变量 (一)多自变量 多自变量是指在 一个实验中包含两个或两个以上的自变量。它不是指同一自变量的多个水 平。在心理学杂志上,只有一个自变量的实验研究是很罕见的。多数实验是同时操作两到四个自 变量。前面在谈到自变量的时候,我们己经说过,多个自变量比单个自变量有明品的优热。下面 我们就来具体探讨一下。 首先,效率高。同时操纵两个自变量的实验比分别做两个单自变量的实验的效率高。也就是 说,事半功倍,花同样的时间,做双倍的事情。 其次,实验的控制较年。通时操纵多个自变量,将分散的多个单变量实验种合在同一个实验 中,实验者更易于控制和稳定某些无关变量。如被试的条件是一样的,时间条件一样,许多外界 环境也一样,如温度、思府和气候等 第三,实验结果的普遍性。由多个自变量的实验获得的结果适合于解释多种情况下的行为, 这就比多个单独实验所概括的结果更有价值。例如,我们想要知道两种奖励办法中哪种促进了学 生的学习。第一种奖励是对正确完成规定的学习项目给予物质奖励:第二种奖励是让学生提前下 课。我们可以洗择一门课程,考察这两种方法对学生学习这门功课的作用。但如果要把研究结果 作为一项规定运用到学校中去,我们还必须考察两种方法的作用在大多数学生的学习中是否都是 一致的。如果,我们将课程作为第二个自变量,把奖励方法与不同课程结合在同一个实验中,要 比进行两个连续的单自变量的实验更有说服力。同时,当一个自变量产生的效果在第二个自变量 的每一个水平上不一样时,交互作用就发生了。这是多自变量实哈的另一个优点。 第四,有利于研究变量之间的相互关系,即交互作用。在多自变量的实验中,不仅每一自变 量存在各自的效应,而且常常是一个自变量的效应依赖于另一个自变量的水平,这在单自变量实 验中是无法揭示的。通过交互作用,多自变量实验能更真实地体现事物之间的关系。下面,我们 举例说明。 我国学者杨治良(1981)曾做过一个实验,目的是了解年龄对再认能力的影响。第一个自变量 是年龄,这里我们以其实验中的初中学生年龄组和大学生年龄组为例(其实验中含有多个年龄水 平的实验组)。第二个自变量是实验材料。这里,我们选取具体事物图形组和词组(原实验有三个 -17
者对情境的控制程度是不同的。操纵变量,可以使自变量先于行为发生,行为可能会随自变量的 不同而变化,重要的是,它假设可能存在的混淆因素都已得到控制,而实验的结果可以对行为作 出最合理的解释。换句话说,如果你改变某些因素,并且成功地控制了其他因素,使之保持稳定, 那么结果就只能是被操纵和改变的因素所引起的。在不存在混淆的实验研究中。组与组之间除了 被操纵的因素有所不同,其他各方面都必须等同,即使有差异,也是随机的。然而,在运用被试 变量时,虽然实验者通过选择具备某种特性的被试,也能改变某些因素,但却不能使其他因素保 持稳定。比如,选择焦虑倾向性不同的两组被试作为自变量,这并不能确保他们在其他方面是相 同的,如自信水平。而后者在很大程度上可能影响研究结果。在这样的情况下,尽管自变量也是 先于因变量发生,并且因变量随自变量的不同而改变,但由于未能控制所有的无关因素,我们还 是不能消除其他可能的因果解释。所以,在这类研究中,即使各组被试的行为反应有差异,我们 也不能贸然地肯定,这些差异是由选定的被试变量造成的,而只能说“观测到的各组间的行为不 同”,或者“某组比某组更可能作出什么样的行为”,然后推测可能的原因。 四、多自变量和多因变量 (一)多自变量 多自变量是指在一个实验中包含两个或两个以上的自变量。它不是指同一自变量的多个水 平。在心理学杂志上,只有一个自变量的实验研究是很罕见的。多数实验是同时操作两到四个自 变量。前面在谈到自变量的时候,我们已经说过,多个自变量比单个自变量有明显的优势。下面 我们就来具体探讨一下。 首先,效率高。同时操纵两个自变量的实验比分别做两个单自变量的实验的效率高。也就是 说,事半功倍,花同样的时间,做双倍的事情。 其次,实验的控制较好。通过操纵多个自变量,将分散的多个单变量实验融合在同一个实验 中,实验者更易于控制和稳定某些无关变量。如被试的条件是一样的,时间条件一样,许多外界 环境也一样,如温度、湿度和气候等。 第三,实验结果的普遍性。由多个自变量的实验获得的结果适合于解释多种情况下的行为, 这就比多个单独实验所概括的结果更有价值。例如,我们想要知道两种奖励办法中哪种促进了学 生的学习。第一种奖励是对正确完成规定的学习项目给予物质奖励;第二种奖励是让学生提前下 课。我们可以选择一门课程,考察这两种方法对学生学习这门功课的作用。但如果要把研究结果 作为一项规定运用到学校中去,我们还必须考察两种方法的作用在大多数学生的学习中是否都是 一致的。如果,我们将课程作为第二个自变量,把奖励方法与不同课程结合在同一个实验中,要 比进行两个连续的单自变量的实验更有说服力。同时,当一个自变量产生的效果在第二个自变量 的每一个水平上不一样时,交互作用就发生了。这是多自变量实验的另一个优点。 第四,有利于研究变量之间的相互关系,即交互作用。在多自变量的实验中,不仅每一自变 量存在各自的效应,而且常常是一个自变量的效应依赖于另一个自变量的水平,这在单自变量实 验中是无法揭示的。通过交互作用,多自变量实验能更真实地体现事物之间的关系。下面,我们 举例说明。 我国学者杨治良(1981)曾做过一个实验,目的是了解年龄对再认能力的影响。第一个自变量 是年龄,这里我们以其实验中的初中学生年龄组和大学生年龄组为例(其实验中含有多个年龄水 平的实验组)。第二个自变量是实验材料。这里,我们选取具体事物图形组和词组(原实验有三个 - 17 -
材料组)。该实验采用再认法,把被试识记过的材料和没有识记过的材料混在一起,要求被试把 两种材料区分开来。同时,将信号检测论方法用于再认实验,采用'作为再认能力的指标,即 因变量。 4 认能 4 43 39 初中 大学 年龄大小 48 4.6 认能力 具体图画 分 材料性质 图2-3两个自变量(年龄大小和材料性质分别对再认能力”的影响) 从图2-3中可以看出:第一,在该实验条件下,初中学生的再认能力较强:第二,个体对具 体图画的再认能力较强。然而,两个自变量的效应是分别表现的。初中学生的再认能力指标既包 括了对具体图画的再认,也包括了对词的再认。大学生的情况也一样。但对具体图画的再认能力 指标既包括了初中学生的能力,又包括了大学生的能力。同样,词的再认能力指标也是如此。 如果把同样的实验结果,用一张图表现出来,即把两个自变量的效应融合在同一张图中,我 们就可以看到,实际情况并非这样简单。图2-4显示了交互作用的发生。 -18
材料组)。该实验采用再认法,把被试识记过的材料和没有识记过的材料混在一起,要求被试把 两种材料区分开来。同时,将信号检测论方法用于再认实验,采用 d′作为再认能力的指标,即 因变量。 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 初 中 大 学 再认能力 d‘ 年龄大小 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 初 中 大 学 再认能力 d‘ 年龄大小 再认能力 d‘ 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 具体图画 词 材料性质 再认能力 d‘ 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 具体图画 词 材料性质 再认能力 d‘ 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 4.8 4.7 4.6 4.5 4.4 4.3 4.2 4.1 4 3.9 具体图画 词 材料性质 图 2-3 两个自变量(年龄大小和材料性质分别对再认能力 d’的影响) 从图 2-3 中可以看出:第一,在该实验条件下,初中学生的再认能力较强;第二,个体对具 体图画的再认能力较强。然而,两个自变量的效应是分别表现的。初中学生的再认能力指标既包 括了对具体图画的再认,也包括了对词的再认。大学生的情况也一样。但对具体图画的再认能力 指标既包括了初中学生的能力,又包括了大学生的能力。同样,词的再认能力指标也是如此。 如果把同样的实验结果,用一张图表现出来,即把两个自变量的效应融合在同一张图中,我 们就可以看到,实际情况并非这样简单。图 2-4 显示了交互作用的发生。 - 18 -