第三节模糊综合模型 模糊数学是研究模糊现象的有力工具。在教学评估中,模糊综合评判 和模糊综合评审这两个模型已得到越来越广泛的应用。 、模糊综合评判模型及其应用 在教学评估中,为了充分体现目标制定者的意图,全面综合地考虑各 相关因素对评估目标的影响,增强所得数量指标的客观可比性,有时需要 应用模糊综合评判模型 1.模糊综合评判模型的数学表述 设B为等级模糊向量,A为m维因素模糊向量,R为模糊关系 矩阵,b,(为不超过B维数的自然数)为B的分量,则称 B= AoR 为模糊综合评判模型,记为M(;,*)。 这里“。”表示两个模糊知阵根“乘”,“”表示抽象的乘法, 表示抽象的加法,且 m),分别是A与R的元素。 如果对抽象乘法“*”和抽象加法“+”作出具体现定,就可以 得到几个常用的具体形式的模型。 (1)突出最优因素的模型 如果规定ab=a∧b=min(a,b),a+b=aVb=m(a,b),则
第三节 模糊综合模型 模糊数学是研究模糊现象的有力工具。在教学评估中,模糊综合评判 和模糊综合评审这两个模型已得到越来越广泛的应用。 一、模糊综合评判模型及其应用 在教学评估中,为了充分体现目标制定者的意图,全面综合地考虑各 相关因素对评估目标的影响,增强所得数量指标的客观可比性,有时需要 应用模糊综合评判模型。 1.模糊综合评判模型的数学表述 表示抽象的加法,且 得到几个常用的具体形式的模型。 (1)突出最优因素的模型 (a,b),则
b=max [min(al, ri), min(a2, r2j)., min(am, rmi)] 此时记模型M(*,+)为M(∧,V)。 这个模型充分考虑了对有突出景编向的最优因素。这里的A不是 权向量,因而不会造成因权化A使a1的值很小而导致;被掩盖,使 b的值失真;即使被考虑的因素个数较少,也不会造成由于把A作权 向量使主要因素起单因素控制而使评判失去综合意义的不良后果。用突出 最优因素的模型进行教学评估时,由于已作了同一化处理,尽管不同学生 的优因素不同,但仍然可比,同时还可以发现对同一成绩起主要作用的优 因素。 (2)突出最劣因素的模型 如果规定ab=b3,ab=a∧b=min(a,b),则 b=mn(t,穿,“), 此时记模型M(,+为M(乘幂,∧)。 从计算b的方法可以看到,m与b已不再是具体意义下的隶属度,而 成为新的评估指标,所求出的是突出最劣因素。将此模型用于教学评估, 有利于发现学生当前学习中存在的主要问题,以及主要问题中最突出的劣 因素 (3)综合评判模型 如果规定*为普通意义的乘法,+为普通意义的加法,则 其中∑a1=1,a1>0 此时记模型M(,*)为M(,+)
bj=max[min(a1,r1j),min(a2,r2j)…,min(am,rmj)], 向量使主要因素起单因素控制而使评判失去综合意义的不良后果。用突出 最优因素的模型进行教学评估时,由于已作了同一化处理,尽管不同学生 的优因素不同,但仍然可比,同时还可以发现对同一成绩起主要作用的优 因素。 (2)突出最劣因素的模型 从计算 bj的方法可以看到,rij与 bj已不再是具体意义下的隶属度,而 成为新的评估指标,所求出的是突出最劣因素。将此模型用于教学评估, 有利于发现学生当前学习中存在的主要问题,以及主要问题中最突出的劣 因素. (3)综合评判模型
显然,A是模糊权向量,b是按权求和的结果。由于A事先 可以 给定,从而求出的b值反映了指标b的整体综合水平。 模型M(,+)的上述三种具体形式各有其独特的用途,可以根 据评估目的予以选用。为了提高评估的准确性,往往多次使用模型M(·, 十)构成所谓多级综合评判。有时为了充分考虑突出最优、最劣因素对整 个评估的影响,还要对用模型M(·,+)评估的结果进行适当修正,这就 需要进行所谓二级指标评判 下面以某地九所中学联合举行的高中数学测试(试题见附件三)的成 绩为例,分别阐述多级综合评判和二级指标评判在教学评估中的应用。 2.多级综合评判应用举例 首先,应用模糊综合评判模型的关键是构造评价矩阵R,合理地 制定模糊因素向量 根据考试目标构造向量A,通常用如下的试题目标筹级结构: d 了解 f1 基础知识 33理解红2 双基 技能知识背景f 基本技能 d 02) 技能本身f4 试题目标等级一 知识背景f5 在数学领域中 技能背景f6 d2灵活运用 转化构造)方式 数学化 ay在实际问题中4 数学问题求解fg 规定A=(d1,d12),A=(d21,d2,d23,d24),A ε,…,dεs)分别表示第一、第二、第三级考试目标构造向量,其中dk 表示第i级的第k个以其前一级为总体的权,背景知识为所测目标的知识 载体,规定f;,f2,…,fs为试题的背景与能力要素。在测验之前只要将 da3,ds按权要求确定,就可利用
可以 给定,从而求出的 bj值反映了指标 bj的整体综合水平。 据评估目的予以选用。为了提高评估的准确性,往往多次使用模型 M(·, +)构成所谓多级综合评判。有时为了充分考虑突出最优、最劣因素对整 个评估的影响,还要对用模型 M(·,+)评估的结果进行适当修正,这就 需要进行所谓二级指标评判。 下面以某地九所中学联合举行的高中数学测试(试题见附件三)的成 绩为例,分别阐述多级综合评判和二级指标评判在教学评估中的应用。 2.多级综合评判应用举例 =(d31, d32,…,d39)分别表示第一、第二、第三级考试目标构造向量,其中 dik 表示第 i 级的第 k 个以其前一级为总体的权,背景知识为所测目标的知识 载体,规定 f1,f2,…,f9为试题的背景与能力要素。在测验之前只要将 d11,d12,…,d38,d39按权要求确定,就可利用
A(1=1,2,3)把相应测验按卷面直接求和的C类分转化为具有 客观 意义的A类分(A类分将在后文中定义),A类分能在目标确立下为分数的 比较提供客观的依据。 根据高中数学测试所企求评估的内容和目的,并对构成试题及其评分 标准的分析,可以认为本次测试是以考察T1目标为主的测试,而且T1目 标下的D、D2目标要求相当,但D1目标侧重f2,D2目标明显侧重于f4 考察T2目标时,主要是考察T2下的D3目标(D4只占整卷的6分),D3日目标 又以考察f为核心,f6和frs均服从于f,对于T2下的D4目标,结合中学 数学教学大纲和整套试题分析,其侧重点在f8。由此分析取定高中数学测 试的目标等级为:d1=0.6,d12=0.4,d1=d2=0.5,d3=0.65,d24= 0.35,d31=0.2,d32=0.8,d3=0.4,d34=0.6,d3s=0.2。d36=0.3,d37 0.5,d38=0.6,d39=0.4 其次,在分级权重表确定后,可按以下步骤进行多级评判 (1)确定试题的背景与能力要素 将试题的各题按照解答所涉及到的背景与能力要素中足码最大的所 在类来确定背景知识所在的类。对于客观试题由于不能细分各要素所占的 分数,此时对正确解答该题所必须的背景与能力要素均赋给满分值;在陈 述性试题中,由于各要素之间的衔接作用,有的知识或技能具有双重身份, 对于具有双重乃至多重身份的知识或技能,按同一分值分别记入不同的要 素中。例如在统计各题的f时,把从该题第一个技能后的有关技能、知 识所占的分数全部归入f7中。最后将各题的f7的分数合在一起,即可得 到试题背景与能力要素f的满分数。按此统计高中数学测试背景与能力 要素值得f,这里,f1包括第1~3、11、12、14题,计18分;f2包括第 2、3、14~17题,计18分;f3与f4的题相同,均包括第4~9、13、18、 19、21、22题,根据选定的评分标准可统计出f3=33分,f4=32分;fs、 f6、f的题相同,均包括第23~26题,类似统计f3与f4可得f=12分, f3=28分,fn=17分;f8与fs包括的题也相同,均为第10、20题,统计 得f8=6分,fg=6分。应该指出的是,统计f与所选定的评分标准有关 此处统计的f都应以给定的评分标准为依据。 (2)统计被试按背景与能力要素的得分率 统计时对客观试题答对者,则对所涉及的要素均赋满分:相反,则全 赋零分。取考分C1为52,C2为82,C3为83的三名被试分别作为被试1、 被试2、被试3,其背景与能力要素得分率如表5-8
客观 意义的 A 类分(A 类分将在后文中定义),A 类分能在目标确立下为分数的 比较提供客观的依据。 根据高中数学测试所企求评估的内容和目的,并对构成试题及其评分 标准的分析,可以认为本次测试是以考察 T1目标为主的测试,而且 T1目 标下的 D1、D2目标要求相当,但 D1目标侧重 f2,D2目标明显侧重于 f4; 考察 T2目标时,主要是考察 T2下的 D3目标(D4只占整卷的 6 分),D3目标 又以考察 f7为核心,f6和 f5均服从于 f7,对于 T2下的 D4目标,结合中学 数学教学大纲和整套试题分析,其侧重点在 f8。由此分析取定高中数学测 试的目标等级为:d11=0.6,d12=0.4,d21=d22=0.5,d23=0.65,d24= 0.35,d31=0.2,d32=0.8,d33=0.4,d34=0.6,d35=0.2。d36=0.3,d37 =0.5,d38=0.6,d39=0.4。 其次,在分级权重表确定后,可按以下步骤进行多级评判。 (1)确定试题的背景与能力要素 将试题的各题按照解答所涉及到的背景与能力要素中足码最大的所 在类来确定背景知识所在的类。对于客观试题由于不能细分各要素所占的 分数,此时对正确解答该题所必须的背景与能力要素均赋给满分值;在陈 述性试题中,由于各要素之间的衔接作用,有的知识或技能具有双重身份, 对于具有双重乃至多重身份的知识或技能,按同一分值分别记入不同的要 素中。例如在统计各题的 f7时,把从该题第一个技能后的有关技能、知 识所占的分数全部归入 f7中。最后将各题的 f7 的分数合在一起,即可得 到试题背景与能力要素 f7的满分数。按此统计高中数学测试背景与能力 要素值得 fi,这里,f1包括第 1~3、11、12、14 题,计 18 分;f2包括第 2、3、14~17 题,计 18 分;f3与 f4的题相同,均包括第 4~9、13、18、 19、21、22 题,根据选定的评分标准可统计出 f3=33 分,f4=32 分;f5、 f6、f7的题相同,均包括第 23~26 题,类似统计 f3与 f4可得 f5=12 分, f3=28 分,f7=17 分;f8与 f9包括的题也相同,均为第 10、20 题,统计 得 f8=6 分,f9=6 分。应该指出的是,统计 fi与所选定的评分标准有关, 此处统计的 fi都应以给定的评分标准为依据。 (2)统计被试按背景与能力要素的得分率 统计时对客观试题答对者,则对所涉及的要素均赋满分;相反,则全 赋零分。取考分 C1为 52,C2为 82,C3为 83 的三名被试分别作为被试 1、 被试 2、被试 3,其背景与能力要素得分率如表 5-8
表5-83名被试青景与能力要素得分率 得分率 f1f2f:fff与 被试1 0640630.5002102900 被试2 110.73072107908200.50 被试3 08308308208107508907111 (3)求综合指标数 利用模糊综合多级评判求综合指标数的过程可用矩阵运算表述: Dix=(d31 d32)(fix f2x)T D2x=(d33 d34)(f3x f4x)T, D3x=(d35 d36 d37)(fox fox fnx)T, D4x=(d38 d3g)(fax fox)T, Tix=(d21 d22)(D1x D2xT, T2x=(d23 d24)(D3x Dax)T, rx=(d11 d12)(T1x T2x)T, 其中ⅹ为被试编号数,fⅸ表示被试x在第f要素的得分率,rx为被试x的 多级综合评判结果 通过计算,得r1=0.6094,r2=0.7934,r3=0.8342。 (4)结果分析 对于已经求出的r1、r2、r3,使用A类分数(A=100rx称为考生x的 A类分数),则A1=60.94,A2=79.34,A3=83.42。A1竟高出C1近9分 A2低于C2不到2分,但A3稍高于C3,按C类分数认为不及格的被试1, 但按A类分数可认为及格,被试2的A2不如C2反映的好,被试3的A3比 C3反映的好。造成这种现象的原因是对被试求C类分的方法造成的,这个 方法对各相关内容的重要程度的区别未能得到充分体现。在本例所给出的 目标系统中分析被试1,其d31,d32,da,da权所对应的背景与能力要素 得分率均超过0.6,而其他权的背景与能力要素得分率均很低,由于强调 双基,因而最终评分对被试1有利,同时也说明被试1基本达到本次考试 的目标要求:被试3的两类分数非常接近,可以认为A3就是C3所反映的
(3)求综合指标数 利用模糊综合多级评判求综合指标数的过程可用矩阵运算表述: D1x=(d31 d32)(f1x f2x)T, D2x=(d33 d34)(f3x f4x)T, D3x=(d35 d36 d37)(f5x f6x f7x)T, D4x=(d38 d39)(f8x f9x)T, T1x=(d21 d22)(D1x D2x)T, T2x=(d23 d24)(D3x D4x)T, rx=(d11 d12)(T1x T2x)T, 其中 x 为被试编号数,fix表示被试 x 在第 fi要素的得分率,rx为被试 x 的 多级综合评判结果。 通过计算,得 r1=0.6094,r2=0.7934,r3=0.8342。 (4)结果分析 对于已经求出的 r1、r2、r3,使用 A 类分数(Ax=100rx 称为考生 x 的 A 类分数),则 A1=60.94,A2=79.34,A3=83.42。A1竟高出 C1近 9 分, A2低于 C2不到 2 分,但 A3稍高于 C3,按 C 类分数认为不及格的被试 1, 但按 A 类分数可认为及格,被试 2 的 A2不如 C2反映的好,被试 3 的 A3比 C3反映的好。造成这种现象的原因是对被试求 C 类分的方法造成的,这个 方法对各相关内容的重要程度的区别未能得到充分体现。在本例所给出的 目标系统中分析被试 1,其 d31,d32,d33,d34权所对应的背景与能力要素 得分率均超过 0.6,而其他权的背景与能力要素得分率均很低,由于强调 双基,因而最终评分对被试 1 有利,同时也说明被试 1 基本达到本次考试 的目标要求;被试 3 的两类分数非常接近,可以认为 A3就是 C3所反映的