第六章测量调查法 教育调査的研究对象通常是学生,研究主题常常围绕学生的发展与学业,收集的资料会 涉及学生的心理能力、人格特质、学业成就、态度倾向等个体的内在特征。这些特征仅靠观 察、访谈、问卷等方法来收集,不一定合适。因此,调査中经常需要运用标准化的测验、量 表作为收集资料工具。教育研究者不但要了解测量量表的性质,也要熟悉测量量表的编制和 实施 第一节什么是测量调查法 教育测量的涵义 (一)测量的定义 测量就是按规则给对象或事件赋值。通俗地说,就是根据一定的规则,给事物分派数字。 1、2、3、4、5这些数字本身是没有数量或质量意义的,只是个符号。当我们规定1代表学 业成绩的最低等级“不及格”:2代表“及格”:3代表“中等”:4代表“良好”:5代表“优 秀”,这时1、2、3、4、5才具有实际意义,数字按规则被赋予了意义 根据测量的定义,任何测量必须具备以下几个要素 (1)测量客体。指测量的对象。测量的客体可以是人,也可以是教育研究中的事物或 现象 (2)测量内容。指测量客体的属性和特征。测量内容可以是外显的,如学生的性别 年龄、身高、体重等,也可以是内隐的,如学习兴趣、动机、态度、价值观等 (3)测量规则。指测量的法则或方法。也就是说,要构建一套如何分派数字或符号的 准则,按准则对测量内容进行规范化、标准化的操作。 (4)测量工具。指测量的指标体系。进行测量通常要借助标准化测验或量表这类工具 对测量客体的属性和特征进行测定,没有工具,测量难以进行。 (二)教育测量的定义 从广义来说,教育测量是根据一定的客观标准,依据一定的规则,对教育领域中的事物 或现象予以数量化描述。从狭义来说,教育测量是对学生经过某些学科的学习和训练之后, 所获得的知识、技能的测量。 测量在教育、教学过程中应用广泛,对学生的发展需要评价,对学业成绩需要评价。任 何个体、任何学科、任何学校都会用到测量。通过测量,可以对教学过程进行连续的、即时 的评价,评价的结果又可以促进教育教学过程的变革。 教育测量在教育研究应用中有两种基本形式。(1)直接选取某个测验作为收集资料的工 具,测量结果就是研究的成果。例如,测定学生的智商、诊断学业情况、升级考证等。(2) 教育测量与其他研究方法结合使用,作为研究组合中的一部分。例如,对小学生识字量与语 文学业成绩的相关性进行研究,需要利用识字量表对小学生识字量进行测量,然后再求与语 文学业成绩的相关
第六章 测量调查法 教育调查的研究对象通常是学生,研究主题常常围绕学生的发展与学业,收集的资料会 涉及学生的心理能力、人格特质、学业成就、态度倾向等个体的内在特征。这些特征仅靠观 察、访谈、问卷等方法来收集,不一定合适。因此,调查中经常需要运用标准化的测验、量 表作为收集资料工具。教育研究者不但要了解测量量表的性质,也要熟悉测量量表的编制和 实施。 第一节 什么是测量调查法 一、教育测量的涵义 (一)测量的定义 测量就是按规则给对象或事件赋值。通俗地说,就是根据一定的规则,给事物分派数字。 1、2、3、4、5 这些数字本身是没有数量或质量意义的,只是个符号。当我们规定 1 代表学 业成绩的最低等级“不及格”;2 代表“及格”;3 代表“中等”;4 代表“良好”;5 代表“优 秀”,这时 1、2、3、4、5 才具有实际意义,数字按规则被赋予了意义。 根据测量的定义,任何测量必须具备以下几个要素。 (1)测量客体。指测量的对象。测量的客体可以是人,也可以是教育研究中的事物或 现象。 (2)测量内容。指测量客体的属性和特征。测量内容可以是外显的,如学生的性别、 年龄、身高、体重等,也可以是内隐的,如学习兴趣、动机、态度、价值观等。 (3)测量规则。指测量的法则或方法。也就是说,要构建一套如何分派数字或符号的 准则,按准则对测量内容进行规范化、标准化的操作。 (4)测量工具。指测量的指标体系。进行测量通常要借助标准化测验或量表这类工具 对测量客体的属性和特征进行测定,没有工具,测量难以进行。 (二)教育测量的定义 从广义来说,教育测量是根据一定的客观标准,依据一定的规则,对教育领域中的事物 或现象予以数量化描述。从狭义来说,教育测量是对学生经过某些学科的学习和训练之后, 所获得的知识、技能的测量。 测量在教育、教学过程中应用广泛,对学生的发展需要评价,对学业成绩需要评价。任 何个体、任何学科、任何学校都会用到测量。通过测量,可以对教学过程进行连续的、即时 的评价,评价的结果又可以促进教育教学过程的变革。 教育测量在教育研究应用中有两种基本形式。(1)直接选取某个测验作为收集资料的工 具,测量结果就是研究的成果。例如,测定学生的智商、诊断学业情况、升级考证等。(2) 教育测量与其他研究方法结合使用,作为研究组合中的一部分。例如,对小学生识字量与语 文学业成绩的相关性进行研究,需要利用识字量表对小学生识字量进行测量,然后再求与语 文学业成绩的相关
、教育测量的可能性 在教育研究过程中,有很多变量是抽象的、模糊的。这些模糊观念是否可以转化为可认 知的、可测量的概念呢?是否都可以测量呢?美国心理学家桑代克( Thorndike E.L.)在 1918年断言:凡物的存在必有其数量。1923年,美国测量学者麦柯尔( McCall w.A.)认 为:凡有数量的东西都可以测量。这就为教育领域中抽象的心理属性测量奠定了理论基础 下面对话是巴比( Earl babbie)在《社会研究方法》一书中所用的一个例子①。这个例子有 助于我们理解抽象的概念是否可以测量,以及如何测量。 我:社会科学家可以对任何存在的事物进行测量 你:哈!我赌你做不到 我:你告诉我要测量什么吧,我可以告诉你如何去测量它。 你:好吧,怎样测量“偏见"。 我:不错的选择。不过,我不愿意把时间浪费在一些根本不存在的事物上。你说,社 会上真的有偏见吗? 你:当然!谁都知道有偏见。谁都知道!如果你够聪明的话,我想你也知道。 傻瓜也知道。 我:从前每个人都认为地球是平的。我想知道的是,你怎么知道就真的存在偏 见 你:好了,好了!你似乎不会“观察"。好了,“我看见过偏见。 我:你到底看到了什么?偏见是怎样存在的呢? 你:我认识一个生意人,他说他永远也不会让女人做主管,因为他认为女人不 着边际,而且没有理性。看吧!这个例子不错吧! 我:太好了。看起来,这就是所谓的偏见,所以可以假设偏见是存在的。现在 我们要对偏见进行测量,准备好了没有? (美〕巴比著:邱泽奇译,《社会研究方法》(上册),华夏出版社2000年版,第150-151页
二、教育测量的可能性 在教育研究过程中,有很多变量是抽象的、模糊的。这些模糊观念是否可以转化为可认 知的、可测量的概念呢?是否都可以测量呢?美国心理学家桑代克(Thorndike E.L.)在 1918 年断言:凡物的存在必有其数量。1923 年,美国测量学者麦柯尔(McCall W.A.)认 为:凡有数量的东西都可以测量。这就为教育领域中抽象的心理属性测量奠定了理论基础。 下面对话是巴比(Earl Babbie)在《社会研究方法》一书中所用的一个例子①。这个例子有 助于我们理解抽象的概念是否可以测量,以及如何测量。 我:社会科学家可以对任何存在的事物进行测量。 你:哈!我赌你做不到。 我:你告诉我要测量什么吧,我可以告诉你如何去测量它。 你:好吧,怎样测量“偏见”。 我:不错的选择。不过,我不愿意把时间浪费在一些根本不存在的事物上。你说,社 会上真的有偏见吗? 你:当然!谁都知道有偏见。谁都知道!如果你够聪明的话,我想你也知道。 傻瓜也知道。 我:从前每个人都认为地球是平的。我想知道的是,你怎么知道就真的存在偏 见? 你:好了,好了!你似乎不会“观察”。好了,“我看见过偏见。” 我:你到底看到了什么?偏见是怎样存在的呢? 你:我认识一个生意人,他说他永远也不会让女人做主管,因为他认为女人不 着边际,而且没有理性。看吧!这个例子不错吧! 我:太好了。看起来,这就是所谓的偏见,所以可以假设偏见是存在的。现在 我们要对偏见进行测量,准备好了没有? ① (美)巴比著;邱泽奇译,《社会研究方法》(上册),华夏出版社 2000 年版,第 150-151 页
你:准备好了。 我:我们一起到商业圈去,静悄悄地访问一些生意人,问问他们雇用员工的标 准是什么。凡是有人表示永远不会让女人担任主管,因为女人不可理喻 不着边际的,我们就认为他有偏见。如果是相反的情形,我们就认定他没 有偏见。当我们完成了所有的访谈之后,再将所得到的资料(有偏见的或 是无偏见的)加以分类。 你:等等!这并不是一个测量偏见的好方法!我们忽视了很多其他的偏见!因 为这样做的结果只包括了对女性的偏见。 我:我明白你的意思。但你的例子只是证明了女性的偏见。我们最好再来研究 下,偏见真的存在吗 你:当然存在的。我刚才说的是众多偏见的例子之一。还有成千上万的例子咧! 我:那你就再说几个来听听 你:好吧,试试这个。某天夜里,我在校园里无意中听到有两个人—个是 白人,一个是黑人—争论政治问题。最后,白人非常气愤,就用带有强 烈种族歧视的话辱骂黑人,“你们这些人都应该被送回到你们原来的地方 (非洲)去『这个例子听起来够带偏见意味了吧。 我:我的天哪!这个例子真的证明偏见是存在的。我们又要对偏见进行测量了。 我们俩每天晚上分开巡视校园,看看是否有白人使用低俗的种族歧视言语 并且说着“你们全部都 你:慢着!这个例子也不一定能测量偏见。虽然会说那种话的人一定有偏见 但是有偏见的人却不一定都说那种话。如果到校园巡视,就会忽视那些不 说那种话的人
你:准备好了。 我:我们一起到商业圈去,静悄悄地访问一些生意人,问问他们雇用员工的标 准是什么。凡是有人表示永远不会让女人担任主管,因为女人不可理喻、 不着边际的,我们就认为他有偏见。如果是相反的情形,我们就认定他没 有偏见。当我们完成了所有的访谈之后,再将所得到的资料(有偏见的或 是无偏见的)加以分类。 你:等等!这并不是一个测量偏见的好方法!我们忽视了很多其他的偏见!因 为这样做的结果只包括了对女性的偏见。 我:我明白你的意思。但你的例子只是证明了女性的偏见。我们最好再来研究 一下,偏见真的存在吗? 你:当然存在的。我刚才说的是众多偏见的例子之一。还有成千上万的例子咧! 我:那你就再说几个来听听。 你:好吧,试试这个。某天夜里,我在校园里无意中听到有两个人——一个是 白人,一个是黑人——争论政治问题。最后,白人非常气愤,就用带有强 烈种族歧视的话辱骂黑人,“你们这些人都应该被送回到你们原来的地方 (非洲)去!”这个例子听起来够带偏见意味了吧。 我:我的天哪!这个例子真的证明偏见是存在的。我们又要对偏见进行测量了。 我们俩每天晚上分开巡视校园,看看是否有白人使用低俗的种族歧视言语, 并且说着“你们全部都……” 你:慢着!这个例子也不一定能测量偏见。虽然会说那种话的人一定有偏见, 但是有偏见的人却不一定都说那种话。如果到校园巡视,就会忽视那些不 说那种话的人
我:所有这些又回到了开始的问题上。偏见真的存在吗?还是你一直在蒙我? 你:不,偏见确实存在! 我:哦,我倒有些不确定了。你只说服了我,商人在雇用女员工时有偏见,原 因是你曾经见到过,而且,我相信你说的。你也说服了我,有些人用不雅 的名称来称呼黑人,并要他们全部回非洲去。但是我还是不确定,偏见到 底存不存在?我想我该寻根探底,这样,我才能向你证明我能测量它。老 实说,我已经开始怀疑偏见到底存不存在了。我的意思是,你看过偏见确 实存在吗?偏见有颜色吗?重量多少?位于哪儿? 你:你到底在说些什么呀?你听不懂我的话吗?真不知道你有没有脑子! 引用这段对话的目的就是为了证明偏见是个抽象的概念,本质上说根本就不存在。虽然 谁也没有摸过偏见的实体,也不知道偏见长得什么样、有多大、是什么颜色,但我们却在谈 论偏见。而且,偏见可以通过具体的事例或指标(对女员工的态度、对黑人的态度)将抽象 的概念和现实世界联系起来,使偏见可以测量。当人们提到偏见时,我们头脑里就会产生一 种印象,就会把以前经历过的有关事件和资料联系起来。这些资料是别人告知的偏见的意义 和自己观察到的偏见的例子。当双方在某一点上对偏见达成共识时,理解就会产生。上面的 对话涉及以下几个基本要点 观念是头脑中的印象 观念是头脑中表达“印象”的术语。人们把这种“印象”当作工具,概括观察的和经验 的具有共性的事物。如果没有这些观念,人们就不可能进行交流,因为头脑中的印象是不可 以直接用来交流的,人们无法直接展示头脑中的印象 2.概念是一组观念,是达成共识的结果 人们可以通过概念进行交流。“偏见”这个概念是大家使用这个术语的人的观念的集合 偏见本身并不存在于真实世界中,也不能直接被观察、被测量。它是我们创造出来的一个术 语。有了概念人们可以互相交流,达成共识。 3.可以测量的是概念所概括的事物 人们交流所使用的术语通常是模糊的和会意的,只是有一个大致的了解。指出概念的具 体含义,区分概念的不同维度就是概念化的过程。概念化就是使模糊印象清晰化。概念化的 最终产品就是一组具体指标。指标被用来说明概念的属性,指标是可以测量的 在科学研究中,一个抽象的、含义模糊不清的术语,可以转换成具体可测量的指标。这 种转换有以下几个步骤 概念化
我:所有这些又回到了开始的问题上。偏见真的存在吗?还是你一直在蒙我? 你:不,偏见确实存在! 我:哦,我倒有些不确定了。你只说服了我,商人在雇用女员工时有偏见,原 因是你曾经见到过,而且,我相信你说的。你也说服了我,有些人用不雅 的名称来称呼黑人,并要他们全部回非洲去。但是我还是不确定,偏见到 底存不存在?我想我该寻根探底,这样,我才能向你证明我能测量它。老 实说,我已经开始怀疑偏见到底存不存在了。我的意思是,你看过偏见确 实存在吗?偏见有颜色吗?重量多少?位于哪儿? 你:你到底在说些什么呀?你听不懂我的话吗?真不知道你有没有脑子! 引用这段对话的目的就是为了证明偏见是个抽象的概念,本质上说根本就不存在。虽然 谁也没有摸过偏见的实体,也不知道偏见长得什么样、有多大、是什么颜色,但我们却在谈 论偏见。而且,偏见可以通过具体的事例或指标(对女员工的态度、对黑人的态度)将抽象 的概念和现实世界联系起来,使偏见可以测量。当人们提到偏见时,我们头脑里就会产生一 种印象,就会把以前经历过的有关事件和资料联系起来。这些资料是别人告知的偏见的意义 和自己观察到的偏见的例子。当双方在某一点上对偏见达成共识时,理解就会产生。上面的 对话涉及以下几个基本要点。 1.观念是头脑中的印象 观念是头脑中表达“印象”的术语。人们把这种“印象”当作工具,概括观察的和经验 的具有共性的事物。如果没有这些观念,人们就不可能进行交流,因为头脑中的印象是不可 以直接用来交流的,人们无法直接展示头脑中的印象。 2.概念是一组观念,是达成共识的结果 人们可以通过概念进行交流。“偏见”这个概念是大家使用这个术语的人的观念的集合。 偏见本身并不存在于真实世界中,也不能直接被观察、被测量。它是我们创造出来的一个术 语。有了概念人们可以互相交流,达成共识。 3.可以测量的是概念所概括的事物 人们交流所使用的术语通常是模糊的和会意的,只是有一个大致的了解。指出概念的具 体含义,区分概念的不同维度就是概念化的过程。概念化就是使模糊印象清晰化。概念化的 最终产品就是一组具体指标。指标被用来说明概念的属性,指标是可以测量的。 在科学研究中,一个抽象的、含义模糊不清的术语,可以转换成具体可测量的指标。这 种转换有以下几个步骤: 概念化
抽象性定义 操作性定义 具体测量指标 根据以上所述,只要我们能找到指标,世界上所有事物都是可以测量的。但是,事情没 有这样简单,因为不同的研究者对同一个抽象概念的理解和认识往往会有很大的差异。即使 是“素质”这样常用的概念,10个人可能会有10种解释。从概念到具体的测量方法还有很 长的路要走,还有很多工作要做。例如,要测量学生的语文水平,用什么工具去测量呢?全 世界有无数各式各样的试卷,怎么办?在无法选择的时候,最后可能会以30分钟的听写测 验就代表了语文水平。这样显然没有达到原定的目的。又如,智力这个变量可以描述得很深 奥,可以有多种意义和解释,但如何测量?似乎不可能将智力的所有方面都测量到,一般主 要测量记忆能力,解数学题的能力、逻辑推理能力、语言表达能力等 要把抽象概念转换成操作性定义,把不可观测的事物转换成可观测的指标,需要谨慎地 设计测量工具,尽可能全面反映概念的意义。例如,测量学生写作能力时,出的测试题目是 “评论李白诗句的特点”、“论述纳米材料的优缺点”或“论伊拉克战争发展态势”,这些题 目似乎是在测验学生的相关知识,而不像是在考学生的写作能力 测量调查的类型 (一)根据行为目标和测验内容分类 1.智力测验。测被试的智力高低,其结果常以智商(IQ)来表示。其中比较著名的有 斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表( WISC-CR)、瑞文推理测验等。 2.能力倾向测验。测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发 展倾向。如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。 3.成就测验。测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水平。 如识字量、阅读、算术测验等。成就测验可以是学科成就测验或综合成就测验 4.人格测验。测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理 特征。较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQ-R)卡特尔 16项人格因素测验(16PF)等。 (二)根据测验对象分类 1.个别测验。指主试与被试一对一进行的测验。个别测验的可靠性比较高,主试能有 效地观察控制被试的行为反应。但是,个别测验费时费力,短时间内难以获得大量的资料, 并且对主试的要求较高 2.团体测验。指一个主试能同时对许多被试进行的测验。团体测验节省人力与时间, 在短时间内能收集到大量的资料,效率较高。但是,被试的反应不容易控制,并且测验效果 不及个别测验可靠。 (三)根据测验材料分类 1.语言、文字测验。指测验内容是以语言、文字形式构成,被试要用语言、文字作答, 主要是纸笔测验。语言、文字测验实施比较容易,在学校系统广泛应用,适宜于进行团体测
抽象性定义 操作性定义 具体测量指标 根据以上所述,只要我们能找到指标,世界上所有事物都是可以测量的。但是,事情没 有这样简单,因为不同的研究者对同一个抽象概念的理解和认识往往会有很大的差异。即使 是“素质”这样常用的概念,10 个人可能会有 10 种解释。从概念到具体的测量方法还有很 长的路要走,还有很多工作要做。例如,要测量学生的语文水平,用什么工具去测量呢?全 世界有无数各式各样的试卷,怎么办?在无法选择的时候,最后可能会以 30 分钟的听写测 验就代表了语文水平。这样显然没有达到原定的目的。又如,智力这个变量可以描述得很深 奥,可以有多种意义和解释,但如何测量?似乎不可能将智力的所有方面都测量到,一般主 要测量记忆能力,解数学题的能力、逻辑推理能力、语言表达能力等。 要把抽象概念转换成操作性定义,把不可观测的事物转换成可观测的指标,需要谨慎地 设计测量工具,尽可能全面反映概念的意义。例如,测量学生写作能力时,出的测试题目是 “评论李白诗句的特点”、“论述纳米材料的优缺点”或“论伊拉克战争发展态势”,这些题 目似乎是在测验学生的相关知识,而不像是在考学生的写作能力。 三、测量调查的类型 (一)根据行为目标和测验内容分类 1.智力测验。测被试的智力高低,其结果常以智商(IQ)来表示。其中比较著名的有: 斯坦福——比纳智力测验、韦克斯勒儿童智力测验量表(WISC-CR)、瑞文推理测验等。 2.能力倾向测验。测被试潜在的某种能力,以了解其发展的可能性,预测个人能力发 展倾向。如音乐、美术、体育、创造力、想象力、记忆力等方面的能力倾向测验。 3.成就测验。测被试经某种形式的学习或训练后对知识、技能的掌握程度或熟练水平。 如识字量、阅读、算术测验等。成就测验可以是学科成就测验或综合成就测验。 4.人格测验。测被试的需要、动机、兴趣、态度、气质、性格、人际关系等人格心理 特征。较为著名的有明尼苏达多相个性测验(MMPI)、艾森克人格问卷(EPQ-R)卡特尔 16 项人格因素测验(16PF)等。 (二)根据测验对象分类 1.个别测验。指主试与被试一对一进行的测验。个别测验的可靠性比较高,主试能有 效地观察控制被试的行为反应。但是,个别测验费时费力,短时间内难以获得大量的资料, 并且对主试的要求较高。 2.团体测验。指一个主试能同时对许多被试进行的测验。团体测验节省人力与时间, 在短时间内能收集到大量的资料,效率较高。但是,被试的反应不容易控制,并且测验效果 不及个别测验可靠。 (三)根据测验材料分类 1.语言、文字测验。指测验内容是以语言、文字形式构成,被试要用语言、文字作答, 主要是纸笔测验。语言、文字测验实施比较容易,在学校系统广泛应用,适宜于进行团体测