目表(见第三章),分别列出所要测验的各单元教材内容在考题中应占的百分比和所要 求的各种行为的反应在全部反应中的百分比。另一个表是测验武题分类表,根据各单元 教材内容列出试题,并注明该题所要求的行为反应及其应占的百分比。然后对照这两个 表,根据各个部分相符合的程度判断内容效度的高低。 (二)效标关联效度 又称经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验的效度 高低的。 效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲测量的特性的 变量,作为检定效度的参照尺度 效标关联效度又可分为同时效度和预测效度。 同时效度指测验与当前效标之间的关系程度:预测效度指测验与将来的效标之间的 关联程度。如用全国高考的成绩作为效标来检验高中毕业会考的成绩,计算两者的相关 系数就是会考的同时效度:而用大学一年级的成绩作为效标来检验高考的成绩,两者的 相关系数就是高考的预测效度。 效标是用来衡量测验效度的尺度。具体而言,效标是辨别真伪的尺度,当事物满足 该原则要求时,才能存在。效标是不能违反的。当然,标准可以提高,也可以降低。效 标不仅随着测验的种类不同而不同,也可能随时间而改变。 选择效标是件闲难而重要的事情。通常数育侧验所依循的效标,可采用各学料成结 和教师的评定结果:智力测验的效标,可采用学科成绩、教师评判的结果、学生总成绩 受教育年限、年龄以及其他相关事物:能力倾向性则验的效标,可采用特殊果程或特殊 训练的成绩等:职业兴趣测验的效标,可采用从业人员实际服务成绩或记录:人格测验 的效标,根难找到,只能按馆制者的主观标准判断,成以被试以后的行为或临床资料作 为效标。 效标关联效度的计算主要通过计算相关系数求得,可用积差相关、二列相关或点二 列相关、四格相关和多元相关系数等。(参见有关教育统计学教材)。 (三)结构效度 指一个测量能实际测量出理论上的概念或心理特性的程度。它的目的在于用心理学 的概念来说明分析测验分数的意义,也就是说从心理学的理论观点就测验的结果加以解 释和深讨。 结构效度的研究是较困难和有争议的,至今从概念上和数学上作了部分解释。确定 一个测量的结构效度之所以困难,是因为效标、构想不是直接可测的,因而不能计算测 量与效标的相关。 结构效度确定的方法如下: 首先从某一结构理论出发,导出各项关于心理功能或行为的基本假设 据此编制测验: 然后由果溯因,以相关、实验和因素分析的方法,检验测验结果是否符合心理学上 的理论见解。 例如,从现代智力理论,可以推断四项主要功能上的假设:(1)智力随年龄增长: 16
16 目表(见第三章),分别列出所要测验的各单元教材内容在考题中应占的百分比和所要 求的各种行为的反应在全部反应中的百分比。另一个表是测验试题分类表,根据各单元 教材内容列出试题,并注明该题所要求的行为反应及其应占的百分比。然后对照这两个 表,根据各个部分相符合的程度判断内容效度的高低。 (二)效标关联效度 又称经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验的效度 高低的。 效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲测量的特性的 变量,作为检定效度的参照尺度。 效标关联效度又可分为同时效度和预测效度。 同时效度指测验与当前效标之间的关系程度;预测效度指测验与将来的效标之间的 关联程度。如用全国高考的成绩作为效标来检验高中毕业会考的成绩,计算两者的相关 系数就是会考的同时效度;而用大学一年级的成绩作为效标来检验高考的成绩,两者的 相关系数就是高考的预测效度。 效标是用来衡量测验效度的尺度。具体而言,效标是辨别真伪的尺度,当事物满足 该原则要求时,才能存在。效标是不能违反的。当然,标准可以提高,也可以降低。效 标不仅随着测验的种类不同而不同,也可能随时间而改变。 选择效标是件困难而重要的事情。通常教育测验所依循的效标,可采用各学科成绩 和教师的评定结果;智力测验的效标,可采用学科成绩、教师评判的结果、学生总成绩、 受教育年限、年龄以及其他相关事物;能力倾向性测验的效标,可采用特殊课程或特殊 训练的成绩等;职业兴趣测验的效标,可采用从业人员实际服务成绩或记录;人格测验 的效标,很难找到,只能按编制者的主观标准判断,或以被试以后的行为或临床资料作 为效标。 效标关联效度的计算主要通过计算相关系数求得,可用积差相关、二列相关或点二 列相关、四格相关和多元相关系数等。(参见有关教育统计学教材)。 (三)结构效度 指一个测量能实际测量出理论上的概念或心理特性的程度。它的目的在于用心理学 的概念来说明分析测验分数的意义,也就是说从心理学的理论观点就测验的结果加以解 释和探讨。 结构效度的研究是较困难和有争议的,至今从概念上和数学上作了部分解释。确定 一个测量的结构效度之所以困难,是因为效标、构想不是直接可测的,因而不能计算测 量与效标的相关。 结构效度确定的方法如下: 首先从某一结构理论出发,导出各项关于心理功能或行为的基本假设; 据此编制测验; 然后由果溯因,以相关、实验和因素分析的方法,检验测验结果是否符合心理学上 的理论见解。 例如,从现代智力理论,可以推断四项主要功能上的假设:(1)智力随年龄增长;
(2)智商是相对稳定的:(3)智力受遗传影响:(4)智力与学业成就有密切关系 因此,在根据上述的假设编制智力测验后,就要从上述四个方面进行检验。由此可见, 结构效度是由累积的证据来评价,不可能有单一的结构效度指标。 确定一个测量的结构效度需要两个重要步骤。首先,必须指出,这个测量和所用理 论上认为应与之有关的其它测量,有显著的相关。其次,必须指出,必须指出这个测量 与所有理论上认为不应与之有关的其它测量,没有明显相关。 四、提高效度的办法 (一)各种效度的要求 不同测验对效度系数有不同要求。例如,智力测验分数与教师对学生的等级评定之 间的效度系数一般在0.3一0.5的范围内:相同科目的标准测验成绩与教师对学生名次排 列之间的相关系数一般应达到0.60一0.70之间:两种不同的智力测验或标准测验之间的 相关系数应达到0.60一0.80,才能符合要求。 对效度系数大小的要求,也受原始与获得效标的测验之间的相似性制约。若二者不 相似,则效度系数偏低:若相似,则效度系数会高些。 (二)影响效度的因素 1、测脸组成方面:测颗的性能是影响测验效度的因素之一,如侧验的取材、长度 辨别力、难度及其编排方式等都和效度有关。 2、测验实施方面: 一个测验的效度要保证,主试应活当控制训验情培,尊留测验 守则的各项规定实施。 3、被试主观状态方面:被试的动机、兴趣、情绪、态度和身体健康及是否充分合 作与尽力而为等都能影响结果的可靠性和正确性。 4、估计效度所依循的效标:选择适当的效标是统计效度的先决条件。如因所选效 标不当,以致测验的效度不能显出,则测验的价值可能被淹没。一个测验因其所采用的 效标不同,其效度可能大相径庭。从统计观点来看,一个效标关联效度受下列三个因素 影响:(1)测验信度:(2)效标变量测量的信度:(3)侧验变量和效标变量之间直正的 相关程度。 5、样本方面:效度确认所依据的样本,必须能代表某一测验所拟应用的全体对象。 ·个测验应用于不同的对象,由于他们在性别上、年龄上、教育程度上以及经验背景上 的差别,其测验功能不一致,效度也随之而异。样本规模大小对效度也有影响。样本的 异质性也会影响测验的效度系数。 总之,为了增进测验的效度,必须要求测验编制和实施程度的标准化,注意被试在 测验情境中的行为反应,并顾及适当样本和效标的选择,以建立符合测验目的和功能的 效度。 (三)提高效度的办法 1、控制系统误差。 2、精心编制量表。首先,测验内容要确实能反映测验目的:其次,题目表述必须 清楚、简明,所用字、词、句能为学生理解,内容应能引起被试者的兴趣,排列则易到 难,但前面的题目不应暗示后面的答案:再次,题目难度合适,有足够区分度:最后试
17 (2)智商是相对稳定的;(3)智力受遗传影响;(4)智力与学业成就有密切关系。 因此,在根据上述的假设编制智力测验后,就要从上述四个方面进行检验。由此可见, 结构效度是由累积的证据来评价,不可能有单一的结构效度指标。 确定一个测量的结构效度需要两个重要步骤。首先,必须指出,这个测量和所用理 论上认为应与之有关的其它测量,有显著的相关。其次,必须指出,必须指出这个测量 与所有理论上认为不应与之有关的其它测量,没有明显相关。 四、提高效度的办法 (一)各种效度的要求 不同测验对效度系数有不同要求。例如,智力测验分数与教师对学生的等级评定之 间的效度系数一般在 0.3—0.5 的范围内;相同科目的标准测验成绩与教师对学生名次排 列之间的相关系数一般应达到 0.60—0.70 之间;两种不同的智力测验或标准测验之间的 相关系数应达到 0.60-0.80,才能符合要求。 对效度系数大小的要求,也受原始与获得效标的测验之间的相似性制约。若二者不 相似,则效度系数偏低;若相似,则效度系数会高些。 (二)影响效度的因素 1、测验组成方面:测题的性能是影响测验效度的因素之一,如测验的取材、长度、 辨别力、难度及其编排方式等都和效度有关。 2、测验实施方面:一个测验的效度要保证,主试应适当控制测验情境,遵照测验 守则的各项规定实施。 3、被试主观状态方面:被试的动机、兴趣、情绪、态度和身体健康及是否充分合 作与尽力而为等都能影响结果的可靠性和正确性。 4、估计效度所依循的效标:选择适当的效标是统计效度的先决条件。如因所选效 标不当,以致测验的效度不能显出,则测验的价值可能被淹没。一个测验因其所采用的 效标不同,其效度可能大相径庭。从统计观点来看,一个效标关联效度受下列三个因素 影响:(1)测验信度;(2)效标变量测量的信度;(3)测验变量和效标变量之间真正的 相关程度。 5、样本方面:效度确认所依据的样本,必须能代表某一测验所拟应用的全体对象。 一个测验应用于不同的对象,由于他们在性别上、年龄上、教育程度上以及经验背景上 的差别,其测验功能不一致,效度也随之而异。样本规模大小对效度也有影响。样本的 异质性也会影响测验的效度系数。 总之,为了增进测验的效度,必须要求测验编制和实施程度的标准化,注意被试在 测验情境中的行为反应,并顾及适当样本和效标的选择,以建立符合测验目的和功能的 效度。 (三)提高效度的办法 1、控制系统误差。 2、精心编制量表。首先,测验内容要确实能反映测验目的;其次,题目表述必须 清楚、简明,所用字、词、句能为学生理解,内容应能引起被试者的兴趣,排列则易到 难,但前面的题目不应暗示后面的答案;再次,题目难度合适,有足够区分度;最后试
卷印刷清楚,无错误和遗漏,并力求精美 3、妥香组织侧验。 4、护充样木的容量和代表性 5、合理处理效度和信度的关系。信度是效度的必要条件。虽然信度高的测验效度 不一定高,但效度高的测验,信度却一定比较高。效度和信度的关系是:效度的最大值 等信度的平方根。但是,既要有高效度同时又要有高信度是不大可能的。例如,同质性 测验(量表的所有题目测验相同的因素)信度较高,但对预测来说,效度却很低。非同 质性测验(其测验内容测量不同因素)预测效度高,但是信度却比较低。所以,要提高 预测效度的一个重要办法,是增加非同质性,即增加新因素。在处理信度和效度的关系 上,首先要保证高的效度。 6、适当增加测验的长度 增加测验长度可以提高信度,而效度的最大值又与信度有关,所以可以提高效度。 增加测验长度对信度的影响大于对效度的影响。具体关系见教材P49表 第三节难度 一、概念 难度指测验试题的难易程度 在教育测量中,客观题的难度一般用正确回答试题的人数与参加测验的总人数的比 值来表示。 即P=RN。R为答对的人数,N为参加测验的人数。 因此,这里难度实际代表的是易度。 难度是试题对学生知识和能力水平的适合程度的指标。试题难度不但对题目的区分 度有影响,而且对试卷的信度和效度也有较大影响 很明显,难度是一个相对概念,难度的高低与被试的水平直接相关。一种测量对这 一组被试是高难度的,可能对另一组被试是低难度的。也就是说,难度是由参与测量的 被试群体的整体水平决定的。 二、 难度的计算 (一)基本公式 1、客观题:P=RN 2、主观题:P=平均得分此题的满分 (二)用极端分组法计算试题难度 当考生人数较多时,用基本公式计算需要对所有考生得分进行统计,工作量大,而 且常常出错,且需要所有学生的得分。如果条件不具备,则无法计算了。这时可以用极 端分组法,无论是客观题还是主观题都可以使用。 1、用极瑞分组法计算客观题的难度 具体步骤如下:(1)先按测验总分的高低,按由高到低依次排列试卷:(2)从得分 最高的一分试卷开始向下依次选出全部试卷的27%作为高分组:(3)从得分最低的一份 试卷向上依次选出全部试卷的27%作为低分组:(4)按下列公式计算难度。 18
18 卷印刷清楚,无错误和遗漏,并力求精美。 3、妥善组织测验。 4、扩充样本的容量和代表性。 5、合理处理效度和信度的关系。信度是效度的必要条件。虽然信度高的测验效度 不一定高,但效度高的测验,信度却一定比较高。效度和信度的关系是:效度的最大值 等信度的平方根。但是,既要有高效度同时又要有高信度是不大可能的。例如,同质性 测验(量表的所有题目测验相同的因素)信度较高,但对预测来说,效度却很低。非同 质性测验(其测验内容测量不同因素)预测效度高,但是信度却比较低。所以,要提高 预测效度的一个重要办法,是增加非同质性,即增加新因素。在处理信度和效度的关系 上,首先要保证高的效度。 6、适当增加测验的长度 增加测验长度可以提高信度,而效度的最大值又与信度有关,所以可以提高效度。 增加测验长度对信度的影响大于对效度的影响。具体关系见教材 P49 表。 第三节 难度 一、概念 难度指测验试题的难易程度。 在教育测量中,客观题的难度一般用正确回答试题的人数与参加测验的总人数的比 值来表示。 即 P=R/N。R 为答对的人数,N 为参加测验的人数。 因此,这里难度实际代表的是易度。 难度是试题对学生知识和能力水平的适合程度的指标。试题难度不但对题目的区分 度有影响,而且对试卷的信度和效度也有较大影响。 很明显,难度是一个相对概念,难度的高低与被试的水平直接相关。一种测量对这 一组被试是高难度的,可能对另一组被试是低难度的。也就是说,难度是由参与测量的 被试群体的整体水平决定的。 二、难度的计算 (一)基本公式 1、客观题:P=R/N 2、主观题:P=平均得分/此题的满分 (二)用极端分组法计算试题难度 当考生人数较多时,用基本公式计算需要对所有考生得分进行统计,工作量大,而 且常常出错,且需要所有学生的得分。如果条件不具备,则无法计算了。这时可以用极 端分组法,无论是客观题还是主观题都可以使用。 1、用极端分组法计算客观题的难度 具体步骤如下:(1)先按测验总分的高低,按由高到低依次排列试卷;(2)从得分 最高的一分试卷开始向下依次选出全部试卷的 27%作为高分组;(3)从得分最低的一份 试卷向上依次选出全部试卷的 27%作为低分组;(4)按下列公式计算难度
P=(PH+PL)2 其中P:为高分组难度,P为低分组难度。高低分组的难度按基本公式计算。 2、用极端分组法计算主观题的难度 论文式试题一般不能简单地判定对与错或通过与不通过,难度计算比较复杂。具体 步骤如下:(1)按测验得分排列试卷,确定高分组与低分组,各占总人数25%(具体办 法同前):(2)分别为高分组与低分组编制每道试题的分析表:(3)按下列公式计算难 度。 P=(XH+X1-2nl)/2n(H-L)这里公式的意义应搞清楚! 其中X代表高分组得分总和,X代表低分组得分总和,n代表总人数的25%,H 为这道题的最高得分,L为这道题的最低得分。 三、难度对测验的影响 1、测验难度景影响测验分数的分布形态 难度过大或过小,都会造成测验分数的偏态分布。难度值越接近0,测验的难度就 越大,正确回答试题的人数就越少,测验分数就越是集中在低分段,其分数分布呈正偏 态:相反,难度值越接近1,其难度越小,正确回答试题的人就越多,测验分数集中在 高分段,分数分布呈现负偏态。 2、测验难度影响测验分数的离散程度 测验难度直接影响测验分数的离散程度,因为难度过大或过小,测验分数的分布都 呈偏态分布,亦即测验分数都分布在高分段或低分段,这样,测验分数的离散程度就变 小。而这一定符合考生的实际情况,因为考生的差异是客观存在的。只有难度适中,其 分数的分布范围才有可能达到最大。 3、测验难度影响测验的鉴别能力 指难度与区分度的关系,在区分度里再说。 四、测验的适宜程度 从难度公式,我们得出P的取值一般在0与1之间。当P=1时困难程度最小(即 所有考生都回答正确):当P=0时困难程度最大(即所有考生都回答错误)。 在常模参照性则验中要求试题难度适中,即大多数顾目的难度在03一07之间,少 数题目可在这一范围之两边且题数(或题分)大体相当,使整个试卷的平均难度为0.5 左右(0.45一0.55)之间。只有适中的题目难度,才能使试题产生区分不同程度考生的 最大效果,也才能使考生得分呈正态分布。而对全部考生都会或不会的都应删去。 对于其它类型的测验,目的不同对难度的要求不同,如选拔性的测验难度就应小, 而选择补习功课的学生困难就应大 五、控制题目难度的方法 般说来影响题目难度的主要因素有:(1)考查知识点的多少:(2)考查能力的复 杂程度或层次的高低:(3)考生对题目的熟悉程度(如本来比较容易的题目会因考生均 未注意而造成很难,或者本来较难的题目会因考生普遍练习而变得容易):(4)命题的 技巧性(如同一问颜,可以命得很容易,也可以命得很难)。 控制题目因素除了以上因素,还可以通过其它方法来控制。在平常教学考试中,由
19 P=(PH+PL)/2 其中 PH 为高分组难度,PL 为低分组难度。高低分组的难度按基本公式计算。 2、用极端分组法计算主观题的难度 论文式试题一般不能简单地判定对与错或通过与不通过,难度计算比较复杂。具体 步骤如下:(1)按测验得分排列试卷,确定高分组与低分组,各占总人数 25%(具体办 法同前);(2)分别为高分组与低分组编制每道试题的分析表;(3)按下列公式计算难 度。 P=(XH+XL-2nl)/ 2n(H- L) 这里公式的意义应搞清楚! ............ 其中 XH 代表高分组得分总和,XL 代表低分组得分总和,n 代表总人数的 25%,H 为这道题的最高得分,L 为这道题的最低得分。 三、难度对测验的影响 1、测验难度影响测验分数的分布形态 难度过大或过小,都会造成测验分数的偏态分布。难度值越接近 0,测验的难度就 越大,正确回答试题的人数就越少,测验分数就越是集中在低分段,其分数分布呈正偏 态;相反,难度值越接近 1,其难度越小,正确回答试题的人就越多,测验分数集中在 高分段,分数分布呈现负偏态。 2、测验难度影响测验分数的离散程度 测验难度直接影响测验分数的离散程度,因为难度过大或过小,测验分数的分布都 呈偏态分布,亦即测验分数都分布在高分段或低分段,这样,测验分数的离散程度就变 小。而这一定符合考生的实际情况,因为考生的差异是客观存在的。只有难度适中,其 分数的分布范围才有可能达到最大。 3、测验难度影响测验的鉴别能力 指难度与区分度的关系,在区分度里再说。 四、测验的适宜程度 从难度公式,我们得出 P 的取值一般在 0 与 1 之间。当 P=1 时困难程度最小(即 所有考生都回答正确);当 P=0 时困难程度最大(即所有考生都回答错误)。 在常模参照性测验中要求试题难度适中,即大多数题目的难度在 0.3—0.7 之间,少 数题目可在这一范围之两边且题数(或题分)大体相当,使整个试卷的平均难度为 0.5 左右(0.45—0.55)之间。只有适中的题目难度,才能使试题产生区分不同程度考生的 最大效果,也才能使考生得分呈正态分布。而对全部考生都会或不会的都应删去。 对于其它类型的测验,目的不同对难度的要求不同,如选拔性的测验难度就应小, 而选择补习功课的学生困难就应大。 五、控制题目难度的方法 一般说来影响题目难度的主要因素有:(1)考查知识点的多少;(2)考查能力的复 杂程度或层次的高低;(3)考生对题目的熟悉程度(如本来比较容易的题目会因考生均 未注意而造成很难,或者本来较难的题目会因考生普遍练习而变得容易);(4)命题的 技巧性(如同一问题,可以命得很容易,也可以命得很难)。 控制题目因素除了以上因素,还可以通过其它方法来控制。在平常教学考试中,由
于老师对学生的情况比较了解,因而主要凭经验来控制难度,使之与老师的教学难度相 适应。而在大规模的测试中,就要通过预测难度来掌握。首先由命题人员根据上述因索 估计一个难度:然后通过测试看这个估计的准确的程度,分析原因,进而提高评估能力。 经过预测取得难度的题目可以进入题库,以备后用。 第四节区分度 一、概念 区分度指测验对考生实际水平的区分程度,用符号D来表示。具有良好的区分度的 测验,实际水平高的应该得高分,实际水平低的应该得低分,所以区分度又叫鉴别力。 它是评价试题质量,筛选试题的主要指标和依据。 风分又分为正区分(D0)、零风分(D=0)和负区分(D0),正区分又叫积极区 分,负区分又叫消极区分。 任何测验的目的之一,就是希望能够鉴别考生的实际水平。这实际上也是测验的信 度和效度在题目上的具体要求。区分度的高低直接影响到测验的信度和效度。 (一)区分度和难度、信度的关系 1962年RL艾伯发表了一个表,内容为假定全部试题的难度均为0.50时预测的信 度系数。提出要达到理想的测验信度,提高区分度是一个好方法。(表见P55页) (二)区分度与难度的关系 见教材P56,说明难度适中,可使区分度达到最大值 二、区分度的计算 (一)用极端分组法计算 1、客观题区分度的计算 用这种方法计算区分度与计算难度的方法基本相同,只是最后一步按下列公式计算 D=PH-PL 其中P指高分组的难度,PL指低分组的难度。 2、主观题区分度的计算 主观题的区分度计算与客观题不同。首先,在分组方面,高分组和低分组各取25% 的总人数,然后按下列公式计算 D=(XH-XL)/n (H-L) 其中XH代表高分组得分总数,X表示低分组得分总数,n表示总人数的25%,H 表示这道题的最高得分,L代表这道题的最低得分。 (二)用内部一致性系数计算区分度 用极端分组法分析测验项目的区分度虽然计算简便、易于理解,但所得结果不精确, 通常只在教师编制的课堂测验中使用。在标准化或大规模的测验中,多采用相关法分析 试题区分度。 计算区分度可以采用点二列相关、二列相关、中相关系数等方法计算(有关方法参 见教育统计学)。点二列相关适用于客观题区分度:二列相关适用于计算多重选择题区 分度:相关系数适用于二个变量都是二分名义变量的区分度
20 于老师对学生的情况比较了解,因而主要凭经验来控制难度,使之与老师的教学难度相 适应。而在大规模的测试中,就要通过预测难度来掌握。首先由命题人员根据上述因素 估计一个难度;然后通过测试看这个估计的准确的程度,分析原因,进而提高评估能力。 经过预测取得难度的题目可以进入题库,以备后用。 第四节 区分度 一、概念 区分度指测验对考生实际水平的区分程度,用符号 D 来表示。具有良好的区分度的 测验,实际水平高的应该得高分,实际水平低的应该得低分,所以区分度又叫鉴别力。 它是评价试题质量,筛选试题的主要指标和依据。 区分又分为正区分(D>0)、零区分(D=0)和负区分(D<0),正区分又叫积极区 分,负区分又叫消极区分。 任何测验的目的之一,就是希望能够鉴别考生的实际水平。这实际上也是测验的信 度和效度在题目上的具体要求。区分度的高低直接影响到测验的信度和效度。 (一)区分度和难度、信度的关系 1962 年 R.L.艾伯发表了一个表,内容为假定全部试题的难度均为 0.50 时预测的信 度系数。提出要达到理想的测验信度,提高区分度是一个好方法。(表见 P55 页) (二)区分度与难度的关系 见教材 P56,说明难度适中,可使区分度达到最大值。 二、区分度的计算 (一)用极端分组法计算 1、客观题区分度的计算 用这种方法计算区分度与计算难度的方法基本相同,只是最后一步按下列公式计算 D=PH-PL 其中 PH 指高分组的难度,PL 指低分组的难度。 2、主观题区分度的计算 主观题的区分度计算与客观题不同。首先,在分组方面,高分组和低分组各取 25% 的总人数,然后按下列公式计算 D=(XH-XL)/ n(H-L) 其中 XH 代表高分组得分总数,XL 表示低分组得分总数,n 表示总人数的 25%,H 表示这道题的最高得分,L 代表这道题的最低得分。 (二)用内部一致性系数计算区分度 用极端分组法分析测验项目的区分度虽然计算简便、易于理解,但所得结果不精确, 通常只在教师编制的课堂测验中使用。在标准化或大规模的测验中,多采用相关法分析 试题区分度。 计算区分度可以采用点二列相关、二列相关、Φ相关系数等方法计算(有关方法参 见教育统计学)。点二列相关适用于客观题区分度;二列相关适用于计算多重选择题区 分度;Φ相关系数适用于二个变量都是二分名义变量的区分度