实习四心理测量与评价 一、心理测验简介 (一)概念 心理测量(psychological testing)是对人的心理或行为的一种测量、量化和描述的技术, 是用心理学技术和方法来评估人的心理状态、心理差异及行为表现,并且确定其性质与程度。 心理测验主要是为取得人的某种心理品质的动态指标,便于对该心理品质进行比较、鉴 别和评估。测评者可根据测验结果,对个体或群体心理行为的发生、发展与转归形成假说或 诊断界定,为选择心理干预策略、制订心理治疗计划提供必要的依据。心理测验主要用于能 力评价、人才选用、教育评价、临床心理诊断、行为评定、干预效果评估等方面。 心理测验通常是在一种标准情景下进行的,施测与评分有其相应的规则,所以也叫标准 化测验。心理测验的结果一定要加以描述才有实际意义,一般采用数量化方式,各种形式的 标准分及百分位都是一些量数。有些描述指标采用划类,但一般这种划类都是由量数范围划 界而来。不过,人的心理活动是极为复杂而不断变化的过程,儿童青少年的心理行为本身又 处于发展阶段,反映人心理活动的行为千差万别,实际上是不可能全部测量得到。因此,心 理测验获得的结果只是一个相对指标,并且对他人的心理行为进行观察与评估,本身也是心 理测验者的行为,受到测验者自身的态度、动机、观察方式、方法、经验等的影响,这使得 心理测验有时难以消除主观因素的干扰。因此,心理测验人员对他人行为进行评估时,必需 具备相关的理论知识、技术、操作技能和严格的客观态度。这对儿童青少年进行心理测验而 言,尤其重要。 心理测验所使用的各种工具,通常称为量表(scale),一般是通过慎重选择的那些能够 反映人的心理行为特点的问题或任务,以标准化的方法组合编制而成的。一个有效的测验, 不管它是什么类型的测验,都必须具备满足标准化(standardization)、常模(norm)、信度 (reliability)和效度(validity)等几个基本要求。 (二)种类 心理测验按测验目的、测验性质、测验方法、测试组织形式等不同,大致分为以下几类: 1.按测验目的可分: (1)①智力测验(intelligence test):用以测量智力,如斯坦福-比奈智力量表 (Stanford-.Binet intelligence scale,S-B)、韦克斯勒智力量表(Wechsler intelligence scale)、 瑞文测验联合型(combined raven's test CRT)、绘人测验等。 (2)人格测验(personality test):测定个性品质,如明尼苏达多相人格调查表(Minnesota
1 实习四 心理测量与评价 一、心理测验简介 (一) 概念 心理测量(psychological testing)是对人的心理或行为的一种测量、量化和描述的技术, 是用心理学技术和方法来评估人的心理状态、心理差异及行为表现,并且确定其性质与程度。 心理测验主要是为取得人的某种心理品质的动态指标,便于对该心理品质进行比较、鉴 别和评估。测评者可根据测验结果,对个体或群体心理行为的发生、发展与转归形成假说或 诊断界定,为选择心理干预策略、制订心理治疗计划提供必要的依据。心理测验主要用于能 力评价、人才选用、教育评价、临床心理诊断、行为评定、干预效果评估等方面。 心理测验通常是在一种标准情景下进行的,施测与评分有其相应的规则,所以也叫标准 化测验。心理测验的结果一定要加以描述才有实际意义,一般采用数量化方式,各种形式的 标准分及百分位都是一些量数。有些描述指标采用划类,但一般这种划类都是由量数范围划 界而来。不过,人的心理活动是极为复杂而不断变化的过程,儿童青少年的心理行为本身又 处于发展阶段,反映人心理活动的行为千差万别,实际上是不可能全部测量得到。因此,心 理测验获得的结果只是一个相对指标,并且对他人的心理行为进行观察与评估,本身也是心 理测验者的行为,受到测验者自身的态度、动机、观察方式、方法、经验等的影响,这使得 心理测验有时难以消除主观因素的干扰。因此,心理测验人员对他人行为进行评估时,必需 具备相关的理论知识、技术、操作技能和严格的客观态度。这对儿童青少年进行心理测验而 言,尤其重要。 心理测验所使用的各种工具,通常称为量表(scale),一般是通过慎重选择的那些能够 反映人的心理行为特点的问题或任务,以标准化的方法组合编制而成的。一个有效的测验, 不管它是什么类型的测验,都必须具备满足标准化(standardization)、常模(norm)、信度 (reliability)和效度(validity)等几个基本要求。 (二)种类 心理测验按测验目的、测验性质、测验方法、测试组织形式等不同,大致分为以下几类: 1.按测验目的可分: (1)①智力测验(intelligence test):用以测量智力,如斯坦福-比奈智力量表 (Stanford-Binet intelligence scale,S-B)、韦克斯勒智力量表(Wechsler intelligence scale)、 瑞文测验联合型(combined raven’s test CRT)、绘人测验等。 (2)人格测验(personality test):测定个性品质,如明尼苏达多相人格调查表(Minnesota
multiphasic personality inventory MMPI)、艾森克人格问卷(Eysenck personality questionnaire EPQ)、16项人格特性量表(16PF)等。 (3)神经心理测验(neuropsychological test):研究脑与行为的关系,测量脑损伤引起 心理变化及其特点,如H-R成套神经心理测验、视觉保持测验、利脑测验、触觉辨别测验 等。 (4)特种技能测验(special ability test):检测人的特殊才能,如音乐、机械操作、绘 画、文书等多种特殊能力。 (5)适应性行为评定:评定心理社会适应能力,如社会成就量表、智残评定量表、儿 童行为量表等。 2.按测验性质可分: (1)①言语测验:以言语来提出刺激,受试者用言语作出反应。大部分心理测验属于 此类。 (2)非言语测验:即操作测验,用操作或语言提出刺激,受试者用操作来作出反应。 (3)语言与操作混合测验:结合了述两方面的测试内容,如韦氏智力量表属此类测验。 3.按测验方法可分: (1)问卷(questionnaire):采用文字问答形式,用于行为和态度的评估。 (2)作业测验:以图形或其他类符号形式,让受试者作出特定反应。 (3)投射测验(projective test):用无结构性、无固定意义的测试题,引起受试者反应, 借以考察其人格特征和品质,如罗夏墨迹测验、主题统觉测验等。 4.按测验组织形式可分 (1)个体测验:测试人与受试者人面对面进行。诊断性测验多属此类。 (2)团体测验:一个测试人同时对多个受试者进行测试。以班级等团体为对象的教育 心理测量多以该形式进行。 (三)、测验的实施原则 1.根据目的选择测验任何心理测验都有一定目的性和适用范围,有相应的信度与效 度。应根据实际需要慎重考虑选用何种测验认真取舍。盲目滥用会对受试者乃至家庭、学校 和社会造成不良影响。 2.与受试者建立友好信任关系若不能取得受试者信任,营造温馨和谐的环境,受试 者(尤其是儿童)常无法表现出其真实反应,导致测试结果不准确。 3.正确解释结果所有心理测验获得的结果都是相对的。对此应做具体分析判断,作
2 multiphasic personality inventory MMPI)、艾森克人格问卷(Eysenck personality questionnaire EPQ)、16 项人格特性量表(16PF)等。 (3)神经心理测验(neuropsychological test):研究脑与行为的关系,测量脑损伤引起 心理变化及其特点,如 H-R 成套神经心理测验、视觉保持测验、利脑测验、触觉辨别测验 等。 (4)特种技能测验(special ability test):检测人的特殊才能,如音乐、机械操作、绘 画、文书等多种特殊能力。 (5)适应性行为评定:评定心理社会适应能力,如社会成就量表、智残评定量表、儿 童行为量表等。 2.按测验性质可分: (1)①言语测验:以言语来提出刺激,受试者用言语作出反应。大部分心理测验属于 此类。 (2)非言语测验:即操作测验,用操作或语言提出刺激,受试者用操作来作出反应。 (3)语言与操作混合测验:结合了述两方面的测试内容,如韦氏智力量表属此类测验。 3.按测验方法可分: (1)问卷(questionnaire):采用文字问答形式,用于行为和态度的评估。 (2)作业测验:以图形或其他类符号形式,让受试者作出特定反应。 (3)投射测验(projective test):用无结构性、无固定意义的测试题,引起受试者反应, 借以考察其人格特征和品质,如罗夏墨迹测验、主题统觉测验等。 4.按测验组织形式可分 (1)个体测验:测试人与受试者人面对面进行。诊断性测验多属此类。 (2)团体测验:一个测试人同时对多个受试者进行测试。以班级等团体为对象的教育 心理测量多以该形式进行。 (三)、测验的实施原则 1.根据目的选择测验 任何心理测验都有一定目的性和适用范围,有相应的信度与效 度。应根据实际需要慎重考虑选用何种测验认真取舍。盲目滥用会对受试者乃至家庭、学校 和社会造成不良影响。 2.与受试者建立友好信任关系 若不能取得受试者信任,营造温馨和谐的环境,受试 者(尤其是儿童)常无法表现出其真实反应,导致测试结果不准确。 3.正确解释结果 所有心理测验获得的结果都是相对的。对此应做具体分析判断,作
恰当解释。儿童少年正在旺盛成长,其神经系统发育有很大伸缩性和代偿性,不能单凭一两 次测试结果就轻易下定论。 4.资格认定和职业道德心理测验是严肃而科学的工作。心理测验者应该具备本科以 上的专业学历,接受严格训练,经考核获得相应资格,才可开展这方面的工作。应严格遵守 职业道德,充分尊重受试者正当权利益。公正有据报告测验结果,不可用测验搞不正之风。 5.保密测试结果涉及受试者的权益与隐私。未经许可不能随便向他人或单位公布。 测验工具、测验程序、记录纸、指导语等应由专人保管,不随意泄露。 (四)实施测验的技术要求 1.测试场所房间不宜太大,墙壁四周无装饰物,光线明亮柔和,安静,桌椅高低大 小适宜。主试者与受试者面对面或相邻而坐,测试开始后避免他人进出。 2.主试人首先要与受试儿童建立友好信任的关系,根据其年龄、性别、性格和当时 情绪,及时调整交流方式。为消除受试儿童紧张情绪,可从日常生活开始提问,待其平静后 再测试。测试中应保持充分耐心,随时对受试儿表示关心、友好和尊重。当对方有抵触或轻 易放弃时,要鼓励其建立信心,不能有藐视性表示。严格按测验要求(如指导语、时间控制、 记分、观察记录等)进行。不要单纯为测试而测试。善于观察记录受试儿的行为表现和情绪 状态,注意力集中程度,对指导语是否理解,有无影响测试的外来因素等。观察要认真仔细, 又不能干扰测验进程。要有技巧地回答儿童提出的问题,保持中性态度,不给予肯定或否定 回答。例如可说“这是不准说答案的呀”,“方法很多,各人有各人做法”等。 3.受试儿年龄越小,注意力的集中时间和耐心越有限。应视实际情况允许适当休息、 喝水、走动、上厕所等。为保持小儿的良好动机,适时加以赞扬鼓励,如可结合操作,以自 然流露的方式赞扬:“不错”、“加油啊”,“这题很难,你再大一点才能学会”“这个题我也做 错过”等。不必每道题都用同一口气称赞:同样的赞语不能保持对小儿的鼓励作用。测验应 保持一定速度和流畅性,即不能无视其提问,又要控制谈话时间。交谈不宜太长或话题不着 边,过于催促或哄劝都会影响儿童作出自然反应。较大年龄儿童测试时,尽量避免家长、老 师在旁:年龄小者可允许父母亲一人在旁,但要告诚不给孩子任何指导或暗示。 二、几种常用的心理测验 (一)韦克斯勒智力量表: 由美国心理学家韦克斯勒编制,共有三套量表,即韦氏成人智力量表(WS),适用于 16岁以上成人:韦氏学龄儿童智力量表(WI$C),适用于6~16岁:韦氏学龄前及学龄初期
3 恰当解释。儿童少年正在旺盛成长,其神经系统发育有很大伸缩性和代偿性,不能单凭一两 次测试结果就轻易下定论。 4.资格认定和职业道德 心理测验是严肃而科学的工作。心理测验者应该具备本科以 上的专业学历,接受严格训练,经考核获得相应资格,才可开展这方面的工作。应严格遵守 职业道德,充分尊重受试者正当权利益。公正有据报告测验结果,不可用测验搞不正之风。 5.保密 测试结果涉及受试者的权益与隐私。未经许可不能随便向他人或单位公布。 测验工具、测验程序、记录纸、指导语等应由专人保管,不随意泄露。 (四)实施测验的技术要求 1.测试场所 房间不宜太大,墙壁四周无装饰物,光线明亮柔和,安静,桌椅高低大 小适宜。主试者与受试者面对面或相邻而坐,测试开始后避免他人进出。 2.主试人 首先要与受试儿童建立友好信任的关系,根据其年龄、性别、性格和当时 情绪,及时调整交流方式。为消除受试儿童紧张情绪,可从日常生活开始提问,待其平静后 再测试。测试中应保持充分耐心,随时对受试儿表示关心、友好和尊重。当对方有抵触或轻 易放弃时,要鼓励其建立信心,不能有藐视性表示。严格按测验要求(如指导语、时间控制、 记分、观察记录等)进行。不要单纯为测试而测试。善于观察记录受试儿的行为表现和情绪 状态,注意力集中程度,对指导语是否理解,有无影响测试的外来因素等。观察要认真仔细, 又不能干扰测验进程。要有技巧地回答儿童提出的问题,保持中性态度,不给予肯定或否定 回答。例如可说“这是不准说答案的呀”,“方法很多,各人有各人做法”等。 3.受试儿 年龄越小,注意力的集中时间和耐心越有限。应视实际情况允许适当休息、 喝水、走动、上厕所等。为保持小儿的良好动机,适时加以赞扬鼓励,如可结合操作,以自 然流露的方式赞扬:“不错”、“加油啊”,“这题很难,你再大一点才能学会”“这个题我也做 错过”等。不必每道题都用同一口气称赞;同样的赞语不能保持对小儿的鼓励作用。测验应 保持一定速度和流畅性,即不能无视其提问,又要控制谈话时间。交谈不宜太长或话题不着 边,过于催促或哄劝都会影响儿童作出自然反应。较大年龄儿童测试时,尽量避免家长、老 师在旁;年龄小者可允许父母亲一人在旁,但要告诫不给孩子任何指导或暗示。 二、几种常用的心理测验 (一)韦克斯勒智力量表: 由美国心理学家韦克斯勒编制,共有三套量表,即韦氏成人智力量表(WAIS),适用于 16 岁以上成人;韦氏学龄儿童智力量表(WISC),适用于 6~16 岁;韦氏学龄前及学龄初期
智力量表(WPPIS),适用于3~6岁半儿童。这套量表相互独立又相互衔接,可以连续评定 3岁幼儿至70多岁老人的智力水平。通常评价智商(intelligence quotient,IQ)进行智力诊 断。 韦氏智力量表在世界范围得到广泛应用,有多个翻译版和修订版。我国儿少卫生领域使 用较多的是林传鼎等(1979年)根据韦氏儿童智力量表修订版(WISC-R,1973)调整部分 内容及顺序,并实现中文标准化的“韦氏儿童智力量表中国修订版”(WISC-CR)。1984年, 龚耀先主持全国标准化常模修订工作,对量表内容作进一步调整修改,制定出城市和农村两 套版本的测评工具。 目前国际上最新版本的韦氏量表的组成部分见实习4-1。各量表由言语测验和操作测验 两部分组成,各包括56六个分测验。言语分测验有常识、类同、算术、词汇、理解和背 数等:操作分测验有填图、图片排列、积木、拼图、译码和迷津等。测试时两者交替进行。 各附有2~3个备用测验,如背数和迷津等。它们不用于计算智商。仅供某分测验出现失误或 失败时的替代性应用。测试中根据记分标准记录原始分数,再按受试儿年龄换算成量表分, 进而计算智商。量表各分测验中题目按难度递增,顺序排列:每个分测验的起始点取决于受 试儿的实足年龄。测试中按顺序将某分测验的题目展现给儿童,直到他的答错题到了一定程 度为止。回答时间有严格限制,若回答迅速可得奖励分数。完成全部测试约需50-70分钟。 量表测出的智力商数(IQ)平均值为100分,标准差为15分。分下列等级:130以上, 非常优秀:120~129,优秀:110-119,中上:90~109,中:80-89,中下:70-79,临界: 69以下,智力低下。言语IQ和操作IQ间、各分测验间的显著差异和因子分析后的分值, 都为诊断提供重要补充信息。目前,国内己有量表的计算机分析软件与结果解释:但有关解 释应由专业心理工作者进行。 实习表4-1最新版韦氏三套测验的主要组成部分 WPPSI-R WISC.-Ⅲ WAIS-R (3~7岁3个月) (6岁~16岁11个月) (16~74岁) 操 物件组装 填图 填图 作 几何构图 编码 图形排列 项 积木构图 图形排列 积木构图 目 迷宫 积木构图 物件组装 填图 物件组装 数字符号 (动物归类) (符号) (迷宫)
4 智力量表(WPPIS),适用于 3~6 岁半儿童。这套量表相互独立又相互衔接,可以连续评定 3 岁幼儿至 70 多岁老人的智力水平。通常评价智商(intelligence quotient ,IQ)进行智力诊 断。 韦氏智力量表在世界范围得到广泛应用,有多个翻译版和修订版。我国儿少卫生领域使 用较多的是林传鼎等(1979 年)根据韦氏儿童智力量表修订版(WISC-R,1973)调整部分 内容及顺序,并实现中文标准化的“韦氏儿童智力量表中国修订版”(WISC-CR)。1984 年, 龚耀先主持全国标准化常模修订工作,对量表内容作进一步调整修改,制定出城市和农村两 套版本的测评工具。 目前国际上最新版本的韦氏量表的组成部分见实习 4-1。各量表由言语测验和操作测验 两部分组成,各包括 5~6 六个分测验。言语分测验有常识、类同、算术、词汇、理解和背 数等;操作分测验有填图、图片排列、积木、拼图、译码和迷津等。测试时两者交替进行。 各附有 2~3 个备用测验,如背数和迷津等。它们不用于计算智商。仅供某分测验出现失误或 失败时的替代性应用。测试中根据记分标准记录原始分数,再按受试儿年龄换算成量表分, 进而计算智商。量表各分测验中题目按难度递增,顺序排列;每个分测验的起始点取决于受 试儿的实足年龄。测试中按顺序将某分测验的题目展现给儿童,直到他的答错题到了一定程 度为止。回答时间有严格限制,若回答迅速可得奖励分数。完成全部测试约需 50~70 分钟。 量表测出的智力商数(IQ)平均值为 100 分,标准差为 15 分。分下列等级:130 以上, 非常优秀;120~129,优秀;110~119,中上;90~109,中;80~89,中下;70~79,临界; 69 以下,智力低下。言语 IQ 和操作 IQ 间、各分测验间的显著差异和因子分析后的分值, 都为诊断提供重要补充信息。目前,国内已有量表的计算机分析软件与结果解释;但有关解 释应由专业心理工作者进行。 实习表 4-1 最新版韦氏三套测验的主要组成部分 WPPSI-R WISC--Ⅲ WAIS-R (3~7 岁 3 个月) (6 岁~16 岁 11 个月) (16~74 岁) 操 物件组装 填图 填图 作 几何构图 编码 图形排列 项 积木构图 图形排列 积木构图 目 迷宫 积木构图 物件组装 填图 物件组装 数字符号 (动物归类) (符号) (迷宫)
言常识 常识 常识 语理解 相似性 数字广度 项算术 算术 词汇 目词汇 词汇 算术 相似性 理解 理解 (句子) (数字广度) 相似性 注:表中括弧内的项目为补充测验 (二)瑞文测验联合型(Combined Raven's Test CRT): 是一种非文字的智力测验,由J.C.Raven1938年创建。内容为标准型渐进矩阵图,共有 A、Ab、B、C、D、E六个单元共计72幅图构成。每题由一张抽象图案或一系列无意义的 图形构成方阵,要求受试者从下图6块(或8小块)选择用截片中选择一块正确的,匹配给 整体结构图片。本测验侧重于测量儿童少年的抽象推理能力和类比能力。矩阵的结构越来越 复杂,难度逐渐递增,要求的思维操作也从形象观察到抽象推理。20世纪80年代我国正式 引进该测验并进行全国常模修订,适用年龄扩大到5岁~5岁:可个别测试,也可做团体测 试:全部测试需30~40分钟。有简单指导语,只要在A单元开始时说明,待受试者理解后 即可施测。量表儿童常模分城市、农村版两套,评分为二级评分:答对得1分,否则0分, 最高为72分。计分时先将所得分相加得原始分,再根据儿童实足年龄换算成量表分,最后 求Z值、百分位和智商。 瑞文测验具有一般言语文字智力测验所没有的特殊功能,可在语言交流不便情况下进 行,适用于跨文化比较研究,省时省力,是大规模智力筛查的理想工具。国内已开发出“瑞 文测验计算机软件”,使其应用更臻完善。 (三)艾森克个性问卷(Eysenck Personality Questionnaire EPQ): 由英国心理学家艾森克编制的个性问卷。分成人和儿童两套,分别调查16岁以上成人 和7~15岁儿童的个性类型。我国的儿童EPQ修订版共有88项问题,分布于E(内外倾, 25项)、N(情绪稳定性,23项)、L(效度量表,22项)和P(精神质,18项)四个维度 量表上。受试者根据每道问题回答“是”或“不是”。问卷上有指导语,要求先读懂再答。 各量表的项目数即是它们的最高分:没有或绝少有人得最高分,也没有或绝少得0分。得分 在性别、年龄别T分表上换算成T分,然后通过量表剖析图进行分析。一般而言,P维度上 得分很高者,个性特征孤僻古怪、缺乏同情心、适应环境不良、对人抱敌意、喜恶作剧、喜 欢捣乱、富有进攻性。E维度高分者,个性特征外向,喜交际、爱冒险、好动、倾向进攻、 5
5 言 常识 常识 常识 语 理解 相似性 数字广度 项 算术 算术 词汇 目 词汇 词汇 算术 相似性 理解 理解 (句子) (数字广度) 相似性 注:表中括弧内的项目为补充测验 (二)瑞文测验联合型(Combined Raven’s Test CRT): 是一种非文字的智力测验,由 J.C.Raven1938 年创建。内容为标准型渐进矩阵图,共有 A、Ab、B、C、D、E 六个单元共计 72 幅图构成。每题由一张抽象图案或一系列无意义的 图形构成方阵,要求受试者从下图 6 块(或 8 小块)选择用截片中选择一块正确的,匹配给 整体结构图片。本测验侧重于测量儿童少年的抽象推理能力和类比能力。矩阵的结构越来越 复杂,难度逐渐递增,要求的思维操作也从形象观察到抽象推理。20 世纪 80 年代我国正式 引进该测验并进行全国常模修订,适用年龄扩大到 5 岁~75 岁;可个别测试,也可做团体测 试;全部测试需 30~40 分钟。有简单指导语,只要在 A 单元开始时说明,待受试者理解后 即可施测。量表儿童常模分城市、农村版两套,评分为二级评分:答对得 1 分,否则 0 分, 最高为 72 分。计分时先将所得分相加得原始分,再根据儿童实足年龄换算成量表分,最后 求 Z 值、百分位和智商。 瑞文测验具有一般言语文字智力测验所没有的特殊功能,可在语言交流不便情况下进 行,适用于跨文化比较研究,省时省力,是大规模智力筛查的理想工具。国内已开发出“瑞 文测验计算机软件”,使其应用更臻完善。 (三)艾森克个性问卷(Eysenck Personality Questionnaire EPQ): 由英国心理学家艾森克编制的个性问卷。分成人和儿童两套,分别调查 16 岁以上成人 和 7~15 岁儿童的个性类型。我国的儿童 EPQ 修订版共有 88 项问题,分布于 E(内外倾, 25 项)、N(情绪稳定性,23 项)、L(效度量表,22 项)和 P(精神质,18 项)四个维度 量表上。受试者根据每道问题回答“是”或“不是”。问卷上有指导语,要求先读懂再答。 各量表的项目数即是它们的最高分;没有或绝少有人得最高分,也没有或绝少得 0 分。得分 在性别、年龄别 T 分表上换算成 T 分,然后通过量表剖析图进行分析。一般而言,P 维度上 得分很高者,个性特征孤僻古怪、缺乏同情心、适应环境不良、对人抱敌意、喜恶作剧、喜 欢捣乱、富有进攻性。E 维度高分者,个性特征外向,喜交际、爱冒险、好动、倾向进攻