第15卷第6期 智能系统学报 Vol.15 No.6 2020年11月 CAAI Transactions on Intelligent Systems Nov.2020 D0L:10.11992tis.201909015 相似度三支决策模糊粗糙集模型的决策代价研究 曾婷只,唐孝2,谭阳2,丁本香2 (1.四川师范大学数学科学学院,四川成都610066,2.四川师范大学智能信息与量子信息研究所,四川成都 610066) 摘要:在三支决策模糊粗糙集模型中,一些学者基于相似度三支决策模糊粗糙集模型建立了目标函数来得到 最优阈值对(,B)的计算方法,但在该过程的研究中,学者并没有在相似度三支决策模糊粗糙集模型中讨论关 于决策代价的描述问题。基于模糊信息系统用新的函数来描述决策代价成为计算阈值对(α,B)的一种方法, 首先,在模糊信息系统中,通过建立一个描述决策代价的函数,将模糊信息系统中的模糊数与三支决策的决策 代价联系在一起:然后对隶属频率进行拟合,得到了三支决策中决策代价的数值描述;最后,通过两个实例说 明了该方法的可行性和适用性。 关键词:三支决策;模糊粗糙集;决策代价:模糊数;阈值对;属性值:区间值;多重集 中图分类号:TP18:023文献标志码:A文章编号:1673-4785(2020)06-1068-11 中文引用格式:曾婷,唐孝,谭阳,等.相似度三支决策模糊粗糙集模型的决策代价研究.智能系统学报,2020,15(6): 1068-1078. 英文引用格式:ZENG Ting,.TANG Xiao,TAN Yang,et al.Decision costs of the similarity three-way decision-theoretic fuzzy rough set model[J].CAAI transactions on intelligent systems,2020,15(6):1068-1078. Decision costs of the similarity three-way decision-theoretic fuzzy rough set model ZENG Ting2,TANG Xiao2,TAN Yang 2,DING Benxiang'2 (1.School of Mathematical Science,Sichuan Normal University,Chengdu 610066,China;2.Institute of Intelligent Information and Quantum Information,Sichuan Normal University,Chengdu 610066,China) Abstract:In the three-way decision-theoretic fuzzy rough set model,several scholars established the objective function based on the similarity three-way decision-theoretic fuzzy rough set model to derive the method for calculating the op- timal threshold pair(a,B).However,during this research,the authors did not discuss the description of the decision costs in the similarity three-way decision-theoretic fuzzy rough set model.The new function describing the decision costs is used in the method for calculating the threshold pair(a,B)based on the fuzzy information system.First,in the fuzzy information system,the fuzzy number is associated with the decision costs of three-way decisions by establishing a function describing the decision costs.Then,the numerical description of the decision costs of three-way decisions is obtained by fitting the membership frequency.Finally,two examples are given to illustrate the feasibility and applicabil- ity of the method. Keywords:three-way decisions;fuzzy rough set;decision costs;fuzzy number:threshold pair;attribute value;interval value;multiset 模糊集用隶属函数描述对象的隶属程度来刻 画对象间的不可区分关系来对对象进行分类。模 画模糊边界的不分明性。粗糙集用上、下近似刻 糊集和粗糙集都是处理不完全、不确定性信息的 收稿日期:2019-09-06 重要数学工具,同时都推广了经典集合论处理不 基金项目:四川省科技计划资助项目(2019YJ0529):四川省教 确定性和不精确性问题。两者既有相似性又有区 育厅重点项目(18ZA0410). 通信作者:唐孝.E-mail:18242087@qq.com 别,因此不能互相包含、互相取代,很多人就试图
DOI: 10.11992/tis.201909015 相似度三支决策模糊粗糙集模型的决策代价研究 曾婷1,2,唐孝1,2,谭阳1,2,丁本香1,2 (1. 四川师范大学 数学科学学院,四川 成都 610066; 2. 四川师范大学 智能信息与量子信息研究所,四川 成都 610066) (α, β) (α, β) 摘 要:在三支决策模糊粗糙集模型中,一些学者基于相似度三支决策模糊粗糙集模型建立了目标函数来得到 最优阈值对 的计算方法,但在该过程的研究中,学者并没有在相似度三支决策模糊粗糙集模型中讨论关 于决策代价的描述问题。基于模糊信息系统用新的函数来描述决策代价成为计算阈值对 的一种方法, 首先,在模糊信息系统中,通过建立一个描述决策代价的函数,将模糊信息系统中的模糊数与三支决策的决策 代价联系在一起;然后对隶属频率进行拟合,得到了三支决策中决策代价的数值描述;最后,通过两个实例说 明了该方法的可行性和适用性。 关键词:三支决策;模糊粗糙集;决策代价;模糊数;阈值对;属性值;区间值;多重集 中图分类号:TP18;O23 文献标志码:A 文章编号:1673−4785(2020)06−1068−11 中文引用格式:曾婷, 唐孝, 谭阳, 等. 相似度三支决策模糊粗糙集模型的决策代价研究 [J]. 智能系统学报, 2020, 15(6): 1068–1078. 英文引用格式:ZENG Ting, TANG Xiao, TAN Yang, et al. Decision costs of the similarity three-way decision-theoretic fuzzy rough set model[J]. CAAI transactions on intelligent systems, 2020, 15(6): 1068–1078. Decision costs of the similarity three-way decision-theoretic fuzzy rough set model ZENG Ting1,2 ,TANG Xiao1,2 ,TAN Yang1,2 ,DING Benxiang1,2 (1. School of Mathematical Science, Sichuan Normal University, Chengdu 610066, China; 2. Institute of Intelligent Information and Quantum Information, Sichuan Normal University, Chengdu 610066, China) Abstract: In the three-way decision-theoretic fuzzy rough set model, several scholars established the objective function based on the similarity three-way decision-theoretic fuzzy rough set model to derive the method for calculating the optimal threshold pair (α, β). However, during this research, the authors did not discuss the description of the decision costs in the similarity three-way decision-theoretic fuzzy rough set model. The new function describing the decision costs is used in the method for calculating the threshold pair (α, β) based on the fuzzy information system. First, in the fuzzy information system, the fuzzy number is associated with the decision costs of three-way decisions by establishing a function describing the decision costs. Then, the numerical description of the decision costs of three-way decisions is obtained by fitting the membership frequency. Finally, two examples are given to illustrate the feasibility and applicability of the method. Keywords: three-way decisions; fuzzy rough set; decision costs; fuzzy number; threshold pair; attribute value; interval value; multiset 模糊集用隶属函数描述对象的隶属程度来刻 画模糊边界的不分明性。粗糙集用上、下近似刻 画对象间的不可区分关系来对对象进行分类。模 糊集和粗糙集都是处理不完全、不确定性信息的 重要数学工具,同时都推广了经典集合论处理不 确定性和不精确性问题。两者既有相似性又有区 别,因此不能互相包含、互相取代,很多人就试图 收稿日期:2019−09−06. 基金项目:四川省科技计划资助项目 (2019YJ0529);四川省教 育厅重点项目 (18ZA0410). 通信作者:唐孝. E-mail:18242087@qq.com. 第 15 卷第 6 期 智 能 系 统 学 报 Vol.15 No.6 2020 年 11 月 CAAI Transactions on Intelligent Systems Nov. 2020
第6期 曾婷,等:相似度三支决策模糊粗糙集模型的决策代价研究 ·1069· 将粗糙集和模糊集进行融合。20世纪90年代, Liu等2为决策理论粗糙集中的阈值参数优化建 Dubois等1-将粗糙集和模糊集结合在一起,提出 立了理论和系统的框架,并且提出了一种基于优 了描述不确定性的模糊粗糙集模型。在概率近似 化的通用方法来确定具有各种语义的决策理论粗 空间上,Sun等1提出了粗糙近似模糊概念。 糙集的阈值对。 Yao等基于贝叶斯决策近似概念的含义提出了 在模糊决策粗糙集模型中,大多数研究是以 模糊粗糙集。Zhao等)在模糊概率近似空间和 总体决策代价最小化为目标,得出计算最优阈值 区间值模糊概率近似空间的框架下研究了决策粗 对(α,)的方法,其中决策代价是专家给出的,并 糙集。 没有进行进一步的研究。而衷锦仪等)基于区 基于决策粗糙集,Yao提出了三支决策。通 间值模糊决策粗糙集模型,得出了计算决策代价 过推广贝叶斯决策理论得到了三支决策粗糙集, 的方法。本文采用了属性值来描述决策代价,用 其考虑的是粗糙集三个成对互不相交的区域,即 对象间的曼哈顿距离表示决策代价函数,得出最 正域、负域和边界域。之后,Liang等提出了一 优阈值对(a,B)。 系列新的三支决策模型,比如区间值粗糙集三支 决策、双重犹豫模糊粗糙集三支决策,基于点算 1决策粗糙集模型 子的直觉模糊粗糙集的三支决策1等。最近, 本节介绍了多重集的相关概念和基于模糊数 Feng等o基于多粒度模糊近似空间和隶属度算 的决策粗糙集模型,该模型用区间值来刻画损失 子,将三支决策和变精度粗糙集结合在一起,提 代价得到更为紧凑的阈值对(α,β)的上、下近似。 出了1型变精度多粒度决策模糊粗糙集模型。随 1.1多重集 着研究的深入,Deng等川推广了三支近似模糊集 定义118设一个非空论域U,在U上的一 决策模型,提出可变的决策理论公式,通过最小 个多重集M上定义函数CM:U→N,其中N是自 化决策代价计算阈值对(α,B)。杨雯琳等]建立 然数集,CM(x)是x的重数,Hx∈U。 了基于相似度的三支决策模糊粗糙集最优模型来 函数CM称为有限函数,表示每个元素出现 计算阈值对(@,B)。衷锦仪等]基于区间值决策 的次数。μ(U)表示U上的所有多重集族。如果 粗糙集模型,从模糊数学的角度得出了更为紧凑 Yx∈U,CM(x)=0,则M是一个空的多重集,记为 的阈值对(a,B的上、下近似。对于多重集值,Zhao O。多重集有多种表示方式,M=(x,x,x,y,y,),M= 等提出了多重集决策粗糙集模型和多重集模 糊决策粗糙集模型来计算损失函数的期望代价。 Cw(eU.Cw(eN,)M=∑国(U是 Liang等l1将精确值的损失函数概念推广到三角 限集)或M=「C田U是无限集)。 模糊决策粗糙集上来计算决策损失。Lin6基于 约束满意度提出了一种解决模糊线性关系的方 定义2 在(O,1)上,多重集M={(x, 法,该方法被其他学者用于研究阈值对(α,)。 CM(x)x∈[O,1,CM(x)∈NbM的长度定义为:IMp= 目前,三支决策已经得到了广泛的应用,而且 决策粗糙集理论是求解三支分类的经典理论 ,p≥1 之一。因此,三支决策相关的研究成果包括了不 常用的长度有:曼哈顿长度,即IM,=∑Cw()· 同数据模型的决策粗糙集推广,例如:基于代价 敏感度量的概率粗糙集三支决策1、模糊集三 欧几里得长度,即M2 v(x)-x ;无限长度, 支决策1、区间集三支决策201、邻域三支决策2 即IMl。=max{CM(x)·x。 等。不同模型阈值对确定的方法可能是不同的。 1.2基于模糊数的决策粗糙集模型 邢航2提出的基于构造性覆盖算法的三支决策 Yao等基于贝叶斯决策过程,提出决策理 模型可以根据样本的分布特征自动形成三个域, 论粗糙集模型,该模型利用状态集O={A,A}和 相比于基于决策粗糙集的三支决策模型,基于构 动作集a={a,a,a,}来描述决策过程,其中状态集 造性覆盖算法的三支决策模型不必人为决定关键 O={A,A}中的元素分别表示某事件属于A和不 参数,能自动形成三个域,使得如何获得决策粗 属于A,动作集a={a,ah,a,}中的元素分别表示将 糙集理论模型中损失函数、阈值的取值问题得以 对象x划分到正域、边界域和负域。 解决。徐健锋等2)提出了一种基于三支决策代 对象x采取3个行动之一引起的实际代价 价目标函数间逻辑关系的新型阈值计算方法。 R(a.[x]),R(a[x]),R(a,[x)分别为
将粗糙集和模糊集进行融合。20 世纪 90 年代, Dubois 等 [1-2] 将粗糙集和模糊集结合在一起,提出 了描述不确定性的模糊粗糙集模型。在概率近似 空间上, Sun 等 [ 3 ] 提出了粗糙近似模糊概念。 Yao 等 [4] 基于贝叶斯决策近似概念的含义提出了 模糊粗糙集。Zhao 等 [5] 在模糊概率近似空间和 区间值模糊概率近似空间的框架下研究了决策粗 糙集。 (α, β) (α, β) (α, β) (α, β) 基于决策粗糙集,Yao[6] 提出了三支决策。通 过推广贝叶斯决策理论得到了三支决策粗糙集, 其考虑的是粗糙集三个成对互不相交的区域,即 正域、负域和边界域。之后,Liang 等 [7] 提出了一 系列新的三支决策模型,比如区间值粗糙集三支 决策、双重犹豫模糊粗糙集三支决策[8] ,基于点算 子的直觉模糊粗糙集的三支决策[ 9 ] 等。最近, Feng 等 [10] 基于多粒度模糊近似空间和隶属度算 子,将三支决策和变精度粗糙集结合在一起,提 出了 1 型变精度多粒度决策模糊粗糙集模型。随 着研究的深入,Deng 等 [11] 推广了三支近似模糊集 决策模型,提出可变的决策理论公式,通过最小 化决策代价计算阈值对 。杨雯琳等[12] 建立 了基于相似度的三支决策模糊粗糙集最优模型来 计算阈值对 。衷锦仪等[13] 基于区间值决策 粗糙集模型,从模糊数学的角度得出了更为紧凑 的阈值对 的上、下近似。对于多重集值,Zhao 等 [14] 提出了多重集决策粗糙集模型和多重集模 糊决策粗糙集模型来计算损失函数的期望代价。 Liang 等 [15] 将精确值的损失函数概念推广到三角 模糊决策粗糙集上来计算决策损失。Lin[16] 基于 约束满意度提出了一种解决模糊线性关系的方 法,该方法被其他学者用于研究阈值对 。 目前,三支决策已经得到了广泛的应用,而且 决策粗糙集理论[17] 是求解三支分类的经典理论 之一。因此,三支决策相关的研究成果包括了不 同数据模型的决策粗糙集推广,例如:基于代价 敏感度量的概率粗糙集三支决策[18-19] 、模糊集三 支决策[8] 、区间集三支决策[20] 、邻域三支决策[21] 等。不同模型阈值对确定的方法可能是不同的。 邢航[22] 提出的基于构造性覆盖算法的三支决策 模型可以根据样本的分布特征自动形成三个域, 相比于基于决策粗糙集的三支决策模型,基于构 造性覆盖算法的三支决策模型不必人为决定关键 参数,能自动形成三个域,使得如何获得决策粗 糙集理论模型中损失函数、阈值的取值问题得以 解决。徐健锋等[23] 提出了一种基于三支决策代 价目标函数间逻辑关系的新型阈值计算方法。 Liu 等 [24] 为决策理论粗糙集中的阈值参数优化建 立了理论和系统的框架,并且提出了一种基于优 化的通用方法来确定具有各种语义的决策理论粗 糙集的阈值对。 (α, β) (α, β) 在模糊决策粗糙集模型中,大多数研究是以 总体决策代价最小化为目标,得出计算最优阈值 对 的方法,其中决策代价是专家给出的,并 没有进行进一步的研究。而衷锦仪等[13] 基于区 间值模糊决策粗糙集模型,得出了计算决策代价 的方法。本文采用了属性值来描述决策代价,用 对象间的曼哈顿距离表示决策代价函数,得出最 优阈值对 。 1 决策粗糙集模型 (α, β) 本节介绍了多重集的相关概念和基于模糊数 的决策粗糙集模型,该模型用区间值来刻画损失 代价得到更为紧凑的阈值对 的上、下近似。 1.1 多重集 U U M CM : U → N N CM (x) x ∀x ∈ U 定义 1 [18] 设一个非空论域 ,在 上的一 个多重集 上定义函数 ,其中 是自 然数集, 是 的重数, 。 CM µ(U) U ∀x ∈ U,CM (x) = 0 M Ø M = (x, x, x, y, y,· · ·) M = {(x,CM (x))|x ∈ U,CM (x) ∈ N } M = ∑ x∈U CM (x) x U M = ∫ x∈U CM (x) x U 函数 称为有限函数,表示每个元素出现 的次数。 表示 上的所有多重集族。如果 ,则 是一个空的多重集,记为 。多重集有多种表示方式, , , ( 是 有 限集) 或 ( 是无限集)。 µF ([0,1]) M = {(x, CM (x))|x ∈ [0,1],CM (x) ∈ N } M ∥M∥p = ∑ x CM (x)· x p 1 p , p ⩾ 1 定义 2 [ 1 4 ] 在 上,多重集 , 的长度定义为: 。 ∥M∥1 = ∑ x CM (x)· x ∥M∥2 = ∑ x CM (x)· x 2 1 2 ∥M∥℘ = maxx {CM (x)· x} 常用的长度有:曼哈顿长度,即 ; 欧几里得长度,即 ;无限长度, 即 。 1.2 基于模糊数的决策粗糙集模型 O = { A,A C } a = {ae ,ab,ar} O = { A,A C } A A a = {ae ,ab,ar} x Yao 等 [4] 基于贝叶斯决策过程,提出决策理 论粗糙集模型,该模型利用状态集 和 动作集 来描述决策过程,其中状态集 中的元素分别表示某事件属于 和不 属于 ,动作集 中的元素分别表示将 对象 划分到正域、边界域和负域。 x R(ae |[x]),R(ab |[x]),R(ar |[x]) 对象 采取 3 个行动之一引起的实际代价 分别为 第 6 期 曾婷,等:相似度三支决策模糊粗糙集模型的决策代价研究 ·1069·
·1070· 智能系统学报 第15卷 1)R(al[x])=pP(Al[x])+P(Acx]) 设决策代价入.的梯形模糊数为M.,即 2)R(a,l)=p·P(I)+dm·P(AcI[x) Mep=(11,r12,r3,r4) 3)R(a,l[x])=ApP(Al[x])+mP(AC[x]) Mp=(21,r2,23,24) 式中:p、p、p分别表示当x∈A采取行动 Mp=(31,r32,3,4) ae、a、a,时的决策代价;n、m、m分别表示当 Mn=(S11,S12,513,514) xA采取行动a。、ab、a,时的决策代价;P(A)) Mm=(521,522,523,524) 表示x∈A的条件概率,P(ACI[x)表示x生A的条 Mnm=(S31,S32,S33,S34) 件概率。 可以得到α、B的模糊分布为 所以,总体决策代价为R=》a=∑, 1 1 1 1 P(4I[)+m·P(ACI[x)。 1+24- 1+23-厘'1+2- 1+21-4 S31-524 S32-S23 S33-S22 534-S21 根据贝叶斯决策准则,要使总体决策代价达 到最小,则需要采取行动的实际代价最小,即决 1 1 1 1 B= 策规则为: 1+4-2'1+3-2'1+2-2'1+1-☒ S21-S14 S22-S13 523-S12 S24-S11 1)如果R(a.lx)≤R(abl[x)且R(a.l[x)≤R(a,l 设M=(,r2,n,r)是梯形模糊数,a=(a1,a2 [x),则采取接受决策; a,a4),B=(b,b2,b3,ba),用模糊满意度16来比较两 2)如果R(al[x)≤R(ax)且R(a[x)≤R(a,l 个模糊数的大小,-水平截集的左右断点分别记 [),则采取延迟决策: 为a吃、a、片、,则a吃=a2n+a1(1-),ag=a7+ 3)如果R(a,I[x)≤R(a.I[x)且R(a,I[)≤R(al a4(1-,P%=b2n+b1(1-),f=b+b,(1-o [x),则采取拒绝决策。 可以计算出阈值对(α,)为 入am-hn 2 基于三支决策模糊粗糙集模型的 (Aar-Amn)+(Abp-Aap) 决策代价 Aon-Arm (Am-Am)+(Arp-Abp) 在文献[12]中只是给出了最优阈值对(α,β) 定义31设论域U上的模糊数为F,如果F 关于决策代价的表示,并没有讨论决策代价的问 的隶属度函数:U→0,1】表示为 题。文献[14]在多重集中用了重数刻画决策代 0,x<r 价,那么在三支决策的模糊粗糙集模型中也可以 x-r1 2-n1’ r1≤x<r2 用属性值来刻画决策代价。对比文献[13]计算决 1,r2≤x<T3 策代价的方法,本文用对象间的曼哈顿距离表示 4-X r3≤x<T4 决策代价函数,再进行模糊统计,提出了一种基 r4-r3 0,x≥r4 于相似度三支决策模糊粗糙集模型的计算决策代 则称M=,2,3,r)为梯形模糊数。 价的方法。 设一组决策代价,=ndp=n,dp= 定义4设模糊信息系统2=(U,A,V,f),A= p,,dm=[n,],m=,d],dm=[n,6设 {a1,a2,…,am}是属性集,U={x1,x2,,n}是对象集, 入,为某个状态决策动作的决策代价,模糊统计方 V=(Vala∈A}=()mxm是属性值集,V.是一个隶属函 法如下: 数值,则每个对象在每个属性下相对于其他对象的 1)设在一次统计中,n位专家给出了n个区 >vij-ve 间值=[,]: 距离为dis= 其中i=1,2,…,n,j= 2)找出n个区间值中的最小值dm和最大值 la,以为起点,a为终点■二为长度 k 1,2,,m,则对象对相应属性的距离D=(dis)n (k∈N),作k个区间的划分; 常用的距离有: 3)计算每个区间的隶属频率了=%其中加为随 机选择的样本总数,m为区间样本覆盖入.的频数; ∑- 4)以实数x为横坐标,隶属频率为纵坐标,绘 曼哈顿距离:dis 出L.的模糊分布曲线。 u-vo 5)对该模糊分布左右两边的曲线进行直线拟 合,得到一个梯形分布函数。 欧氏距离:dis房,=
1)R(ae |[x]) = λep · P(A|[x])+λen · P ( A C |[x] ) 2)R(ab |[x]) = λbp · P(A|[x])+λbn · P ( A C |[x] ) 3)R(ar |[x]) = λrp · P(A|[x])+λrn · P ( A C |[x] ) λep、λbp、λrp x ∈ A ae、ab、ar λen、λbn、λrn x < A ae、ab、ar P(A|[x]) x ∈ A P ( A C |[x] ) x < A 式中: 分别表示当 采取行动 时的决策代价; 分别表示当 采取行动 时的决策代价; 表示 的条件概率, 表示 的条 件概率。 R = ∑ x∈U R(a|x ) = ∑ x∈U λap· P(A|[x])+λan · P ( A C |[x] ) 所以,总体决策代价为 。 根据贝叶斯决策准则,要使总体决策代价达 到最小,则需要采取行动的实际代价最小,即决 策规则为: R(ae |[x]) ⩽ R(ab |[x]) R(ae |[x]) ⩽ R(ar | [x]) 1) 如果 且 ,则采取接受决策; R(ab |[x]) ⩽ R(ae |[x]) R(ab |[x]) ⩽ R(ar | [x]) 2) 如果 且 ,则采取延迟决策; R(ar |[x]) ⩽ R(ae |[x]) R(ar |[x]) ⩽ R(ab| [x]) 3) 如果 且 ,则采取拒绝决策。 (α, β) ( λan −λbn (λan −λbn)+ ( λbp −λap), λbn −λrn (λbn −λrn)+ ( λrp −λbp) ) 可以计算出阈值对 为 。 U F F µF : U → [0,1] 定义 3 [13] 设论域 上的模糊数为 ,如果 的隶属度函数 表示为 µF 0, x < r1 x−r1 r2 −r1 , r1 ⩽ x < r2 1, r2 ⩽ x < r3 r4 − x r4 −r3 , r3 ⩽ x < r4 0, x ⩾ r4 则称 M = (r1,r2,r3,r4) 为梯形模糊数。 λep = [ λ L ep, λU ep] , λbp= [ λ L bp, λU bp] , λrp = [ λ L rp, λU rp] , λen = [ λ L en, λU en ] , λbn = [ λ L bn, λU bn ] , λrn = [ λ L rn, λU rn ] λ∗∗ 设一组决策代价 。设 为某个状态决策动作的决策代价,模糊统计方 法如下: n n λ∗∗ = [ λ L ∗∗, λU ∗∗ ] 1) 设在一次统计中, 位专家给出了 个区 间值 ; n λmin λmax λmin λmax λmax −λmin k k ∈ N ∗ k 2) 找出 个区间值中的最小值 和最大值 ,以 为起点, 为终点, 为长度 ( ),作 个区间的划分; f = m n n m λ∗∗ 3) 计算每个区间的隶属频率 ,其中 为随 机选择的样本总数, 为区间样本覆盖 的频数; x λ∗∗ 4) 以实数 为横坐标,隶属频率为纵坐标,绘 出 的模糊分布曲线。 5) 对该模糊分布左右两边的曲线进行直线拟 合,得到一个梯形分布函数。 设决策代价 λ∗∗ 的梯形模糊数为 M∗∗,即 Mep = (r11,r12,r13,r14) Mbp = (r21,r22,r23,r24) Mrp = (r31,r32,r33,r34) Men = (s11,s12,s13,s14) Mbn = (s21,s22,s23,s24) Mrn = (s31,s32,s33,s34) 可以得到 α、β 的模糊分布为 α= 1 1+ r24 −r11 s31 − s24 , 1 1+ r23 −r12 s32 − s23 , 1 1+ r22 −r13 s33 − s22 , 1 1+ r21 −r14 s34 − s21 β= 1 1+ r34 −r21 s21 − s14 , 1 1+ r33 −r22 s22 − s13 , 1 1+ r32 −r23 s23 − s12 , 1 1+ r31 −r24 s24 − s11 M = (r1,r2,r3,r4) α = (a1,a2, a3,a4), β = (b1,b2,b3,b4) η α L η、α U η 、β L η、β U η α L η = a2η+a1 (1−η),α U η = a3η+ a4 (1−η), βL η = b2η+b1 (1−η), βU η = b3η+b4 (1−η) 设 是梯形模糊数, ,用模糊满意度[16] 来比较两 个模糊数的大小, -水平截集的左右断点分别记 为 ,则 。 2 基于三支决策模糊粗糙集模型的 决策代价 在文献 [12] 中只是给出了最优阈值对 (α, β) 关于决策代价的表示,并没有讨论决策代价的问 题。文献 [14] 在多重集中用了重数刻画决策代 价,那么在三支决策的模糊粗糙集模型中也可以 用属性值来刻画决策代价。对比文献 [13] 计算决 策代价的方法,本文用对象间的曼哈顿距离表示 决策代价函数,再进行模糊统计,提出了一种基 于相似度三支决策模糊粗糙集模型的计算决策代 价的方法。 Ω = (U,A,V, f) A = {a1,a2,· · ·,am} U = {x1, x2,· · ·, xn} V = {Va |a ∈ A} = ( vi j) n×m Va disi j = ∑n k=1 vi j −vk j p n 1/p i = 1,2,··· ,n, j = 1,2,· · ·,m D = ( disp i j) n×m 定义 4 设模糊信息系统 , 是属性集, 是对象集, 是属性值集, 是一个隶属函 数值,则每个对象在每个属性下相对于其他对象的 距离为 ,其中 ,则对象对相应属性的距离 。 常用的距离有: dis1 i j = ∑n k=1 vi j −vk j n 曼哈顿距离: dis2 i j = vuuuut∑n k=1 vi j −vk j 2 n 欧氏距离: ·1070· 智 能 系 统 学 报 第 15 卷
第6期 曾婷,等:相似度三支决策模糊粗糙集模型的决策代价研究 ·1071· 切比雪夫距离:dis号=max1cn{-g} 表1所示。其中,对象集合U={x,2,…,x8,属性 定义5在2=(U,A,Vf)中,决策代价函数 集合A={a1,a2,,a4,YaeA,Yx∈U,对象的隶属 入,:D→入(D),入.为决策动作的决策代价: 度为ua(x)∈0,1]。 1)接受决策:(D)=1-D。 表1模糊信息系统 2)延迟决策:6(D)=0.5-D。 Table 1 Fuzzy information system 3)拒绝决策:,(D)=D。 U a a3 a 当采取接受决策时,需要付出的决策代价为 岁 0.1 0.8 0.9 0.8 产生错误决策的决策代价,入(D)=1-D;当采取 X2 1.0 0.1 0.3 0.2 延迟决策时,未做任何决策,保留了对象的不确 X3 0.6 0.3 0.8 0.4 定性,,(D)=0.5-D外:当采取拒绝决策时,需要付 X4 0.1 0.6 0.9 0.6 出的决策代价为入,(D)=D。 0.2 0.9 0.9 0.5 模糊统计方法如下: X6 0.5 0.2 0.7 0.3 设某个决策动作的决策代价组入.=(!,,,), x 0.3 0.9 0.5 0.7 X表示第I个属性的决策代价。 % 1.0 0.6 0.2 0.1 1)在一个模糊信息系统2=(U,A,Vf)中,计 计算每个对象在每个属性下相对于其他对象 算每个对象在每个属性下相对于其他对象的距 ∑w- ∑w- k=1 离(此处用曼哈顿距离dis好= l= 一),得到关 的曼哈顿距离dis,= 8 其中,i=1,2,… 1 于决策代价的曼哈顿距离D=(dis),其中i= 8;j=1,2,…,4,得到的关于决策代价的曼哈顿距 1,2,…,:j=1,2,…,m; 离D=(ds)如表2所示。 2)计算决策代价函数入.(D): 表2曼哈顿距离 3)找出n个值中的最小值mm和最大值dmax, Table 2 Manhattan distance 以1m-6-二出为起点,m+6+如为 对象 0 a a3 a 2k 2k 终点,-血为区间长度kEN),划分为k+1 0.3750 0.3000 0.2500 0.3500 k 0.5250 0.4500 0.3750 0.2750 个区间,其中6为邻域值: 专 0.3250 0.3250 0.2250 0.2000 4)计算每个动作在不同属性下的隶属频率 X4 0.3750 0.2500 0.2500 0.2250 f=m,其中n为随机选择的样本总数,m为区间 0.3250 0.3500 0.2500 0.2000 样本覆盖某个值的6邻域的频数: X6 0.3000 0.3750 0.2250 0.2250 5)以实数x为横坐标,隶属频率为纵坐标,对 0.3000 0.3500 0.2750 0.2750 点进行曲线拟合,取决策动作在每个属性下曲线 李 0.5250 0.2500 0.4500 0.3500 最高点的横坐标,得到一个不同属性下的决策代 计算当采取接受决策时的决策代价入(D)= 价组: 1-D,则得到接受决策的决策代价如表3所示。 6)某个决策动作的决策代价即为 表3接受决策的决策代价 Table 3 Decision costs of accepting the decision 对象 a a ds a4 X1 0.6250 0.7000 0.7500 0.6500 3实例分析 2 0.4750 0.5500 0.6250 0.7250 岁 0.6750 0.6750 0.7750 0.8000 实验采用的配置如下:CPU为Intel(R)Celer- 0.6250 0.7500 07500 0.7750 on(R)CPU1007U@1.5GHz,4.0GB内存,软件 0.6750 0.6500 0.7500 0.8000 是64位MATLAB R2014a. X6 0.7000 0.6250 0.7750 0.7750 基于文献[12]的模糊信息系统实例来分析本 0.7000 0.6500 0.7250 0.7250 文基于三支决策模糊粗糙集模型的决策代价。 0.4750 0.7500 0.5500 0.6500 例1卫=(U,A,Vf)是一个模糊信息系统,如
dism i j = max1⩽k⩽n { vi j −vk j } 切比雪夫距离: Ω = (U,A,V, f) λ∗ : D → λ∗ (D) λ∗ 定义 5 在 中,决策代价函数 , 为决策动作的决策代价: 1) 接受决策: λe (D) = 1− D。 2) 延迟决策: λb (D) = |0.5− D|。 3) 拒绝决策: λr (D) = D。 λe (D) = 1− D λb (D) = |0.5− D| λr (D) = D 当采取接受决策时,需要付出的决策代价为 产生错误决策的决策代价, ;当采取 延迟决策时,未做任何决策,保留了对象的不确 定性, ;当采取拒绝决策时,需要付 出的决策代价为 。 模糊统计方法如下: λ∗ = ( λ 1 ∗ , λ2 ∗ ,· · ·, λm ∗ ) λ l ∗ l 设某个决策动作的决策代价组 , 表示第 个属性的决策代价。 Ω = (U,A,V, f) dis1 i j = ∑n k=1 vi j −vk j n D = ( dis1 i j) n×m i = 1,2,· · ·,n;j = 1,2,· · ·,m 1) 在一个模糊信息系统 中,计 算每个对象在每个属性下相对于其他对象的距 离 (此处用曼哈顿距离 ),得到关 于决策代价的曼哈顿距离 ,其中 ; 2) 计算决策代价函数 λ∗ (D) ; n λmin λmax λmin −δ− λmax −λmin 2k λmax +δ+ λmax −λmin 2k λmax −λmin k k ∈ N ∗ k+1 δ 3) 找出 个值中的最小值 和最大值 , 以 为起点, 为 终点, 为区间长度 ( ),划分为 个区间,其中 为邻域值; f = m n n m δ 4) 计算每个动作在不同属性下的隶属频率 ,其中 为随机选择的样本总数, 为区间 样本覆盖某个值的 邻域的频数; 5) 以实数 x 为横坐标,隶属频率为纵坐标,对 点进行曲线拟合,取决策动作在每个属性下曲线 最高点的横坐标,得到一个不同属性下的决策代 价组; 6) 某个决策动作的决策代价即为 λ∗ = vuuuuut∑m l=1 λ l ∗ 2 m 3 实例分析 实验采用的配置如下:CPU 为 Intel(R) Celeron(R) CPU 1007U @ 1.5 GHz,4.0 GB 内存,软件 是 64 位 MATLAB R2014a。 基于文献 [12] 的模糊信息系统实例来分析本 文基于三支决策模糊粗糙集模型的决策代价。 例 1 Ω = (U,A,V, f) 是一个模糊信息系统,如 U = {x1, x2,· · ·, x8} A = {a1,a2,· · ·,a4} ∀a ∈ A,∀x ∈ U µa (x) ∈ [0,1] 表 1 所示。其中,对象集合 ,属性 集合 , ,对象的隶属 度为 。 表 1 模糊信息系统 Table 1 Fuzzy information system U\A a1 a2 a3 a4 x1 0.1 0.8 0.9 0.8 x2 1.0 0.1 0.3 0.2 x3 0.6 0.3 0.8 0.4 x4 0.1 0.6 0.9 0.6 x5 0.2 0.9 0.9 0.5 x6 0.5 0.2 0.7 0.3 x7 0.3 0.9 0.5 0.7 x8 1.0 0.6 0.2 0.1 dis1 i j = ∑8 k=1 vi j −vk j 8 i = 1,2,· · ·, 8;j = 1,2,· · ·,4 D = ( dis1 i j) 8×4 计算每个对象在每个属性下相对于其他对象 的曼哈顿距离 ,其中, ,得到的关于决策代价的曼哈顿距 离 如表 2 所示。 表 2 曼哈顿距离 Table 2 Manhattan distance 对象 a1 a2 a3 a4 x1 0.3750 0.300 0 0.2500 0.350 0 x2 0.5250 0.450 0 0.3750 0.275 0 x3 0.3250 0.325 0 0.2250 0.200 0 x4 0.3750 0.250 0 0.2500 0.225 0 x5 0.3250 0.350 0 0.2500 0.200 0 x6 0.3000 0.375 0 0.2250 0.225 0 x7 0.3000 0.350 0 0.2750 0.275 0 x8 0.5250 0.250 0 0.4500 0.350 0 λe (D) = 1− D 计算当采取接受决策时的决策代价 ,则得到接受决策的决策代价如表 3 所示。 表 3 接受决策的决策代价 Table 3 Decision costs of accepting the decision 对象 a1 a2 a3 a4 x1 0.6250 0.700 0 0.7500 0.650 0 x2 0.4750 0.550 0 0.6250 0.725 0 x3 0.6750 0.675 0 0.7750 0.800 0 x4 0.6250 0.750 0 07500 0.775 0 x5 0.6750 0.650 0 0.7500 0.800 0 x6 0.7000 0.625 0 0.7750 0.775 0 x7 0.7000 0.650 0 0.7250 0.725 0 x8 0.4750 0.750 0 0.5500 0.650 0 第 6 期 曾婷,等:相似度三支决策模糊粗糙集模型的决策代价研究 ·1071·
·1072· 智能系统学报 第15卷 接受决策的决策代价在属性a下的最小值 0.9 决策代价频率 中子 为0.475,最大值为0.7,取6=0.15,以0.3125为起 0.8 隶属频率拟合 点,0.8625为终点,0.025为区间长度,划分为 0.7 0.6 22个区间。接受决策属性a1的决策代价频率分 布如表4所示。 0.5 0.4 表4属性a1决策代价频率分布 0.3 Table 4 Attribute a decision costs frequency distribution 0.2 序号 区间 频数 频率 1 [0.3125,0.3375] 2 0.2500 01.450.500.550.600.650.700.750.800.85 决策代价X, 2 [0.3375,0.3625] 2 0.2500 3 [0.3625,0.3875] 2 0.2500 图2接受决策属性2频率分布拟合曲线 4 [0.3875,0.4125] 0.2500 Fig.2 Accept the decision attribute az frequency distribu tion fitting curve 5 [0.4125,0.4375] 0.2500 6 [0.4375,0.4625] 2 0.2500 0.9 7 0.4625,0.4875] 4 0.5000 决策代价频率 0.8 隶属频率拟合 8 [0.4875,0.5125] 4 0.5000 部0.7 9 [0.5125,0.5375] 6 0.7500 10 [0.5375,0.5625] 1.0000 11 [0.5625,0.58751 1.0000 [0.5875,0.6125 1.0000 置a3 3 [0.6125,0.6375] 8 1.0000 0.2 14 [0.6375,0.66251 6 0.7500 0.1 .40 0.500.600.70 0.800.90 15 [0.6625,0.6875] 6 0.7500 决策代价X 16 [0.6875,0.7125] 6 0.7500 [0.7125,0.7375] 图3接受决策属性☑3频率分布拟合曲线 17 6 0.7500 Fig.3 Accept the decision attribute a3 frequency distribu 18 [0.7375,0.7625] 6 0.7500 tion fitting curve 19 [0.7625,0.7875] 6 0.7500 20 [0.7875,0.8125 0.5000 1.0 决策代价频率 [0.8125,0.8375] 0.5000 0.9 隶属频率拟合 3 0.8375,0.86251 0.2500 解0.8 0.7 以决策代价x1为横坐标,隶属频率为纵坐 毫06 标,对点进行曲线拟合,接受决策的决策代价在 属性a1下的隶属频率拟合曲线如图1所示。图2~4 分别是接受决策在属性a2、a、a4下的隶属频率 0.3 拟合曲线。 0.2 .550.600.650.700.750.800.850.90 1.0 决策代价X ·决策代价频率 09 ·隶属频率拟合 图4接受决策属性a4频率分布拟合曲线 0.8 Fig.4 Accept the decision attribute a4 frequency distribu 0.7 tion fitting curve 0.6 以上各个拟合曲线取最高点的横坐标作为该 0.4 决策动作不同属性下的决策代价,得到接受决策 0.3 在属性a、a2、a、a4下的决策代价分别为0.6347、 0.29 0.6738、0.737、0.7465,因此接受决策的决策代价 0.30.40.50.60.70.80.9 决策代价X 组为=(0.6347,0.6738,0.7370,0.7465)。同理,对 延迟决策和拒绝决策按照以上步骤处理,得到延 图1接受决策属性a1频率分布拟合曲线 Fig.1 Accept the decision attribute a frequency distribu- 迟决策的决策代价组为=(0.1459,0.1741,0.2378 tion fitting curve 0.2465),拒绝决策的决策代价组为,=(0.3653
a1 δ = 0.15 a1 接受决策的决策代价在属性 下的最小值 为 0.475,最大值为 0.7,取 ,以 0.312 5 为起 点 ,0.862 5 为终点,0.025 为区间长度,划分为 22 个区间。接受决策属性 的决策代价频率分 布如表 4 所示。 表 4 属性 a1 决策代价频率分布 Table 4 Attribute a1 decision costs frequency distribution 序号 区间 频数 频率 1 [0.312 5,0.337 5] 2 0.250 0 2 [0.337 5,0.362 5] 2 0.250 0 3 [0.362 5,0.387 5] 2 0.250 0 4 [0.387 5,0.412 5] 2 0.250 0 5 [0.412 5,0.437 5] 2 0.250 0 6 [0.437 5,0.462 5] 2 0.250 0 7 [0.462 5,0.487 5] 4 0. 5000 8 [0.487 5,0.512 5] 4 0.500 0 9 [0.512 5,0.537 5] 6 0.750 0 10 [0.537 5,0.562 5] 8 1.000 0 11 [0.562 5,0.587 5] 8 1.000 0 12 [0.587 5,0.612 5] 8 1.000 0 13 [0.612 5,0.637 5] 8 1.000 0 14 [0.637 5,0.662 5] 6 0.750 0 15 [0.662 5,0.687 5] 6 0.750 0 16 [0.687 5,0.712 5] 6 0.750 0 17 [0.712 5,0.737 5] 6 0.750 0 18 [0.737 5,0.762 5] 6 0.750 0 19 [0.762 5,0.787 5] 6 0.750 0 20 [0.787 5,0.812 5] 4 0.500 0 21 [0.812 5,0.837 5] 4 0.500 0 22 [0.837 5,0.862 5] 2 0.250 0 x1 a1 a2、a3、a4 以决策代价 为横坐标,隶属频率为纵坐 标,对点进行曲线拟合,接受决策的决策代价在 属性 下的隶属频率拟合曲线如图 1 所示。图 2~4 分别是接受决策在属性 下的隶属频率 拟合曲线。 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.3 0.2 0.4 0.5 0.6 0.7 0.8 0.9 1.0 决策代价 X1 属性 a1 的隶属频率 隶属频率拟合 决策代价频率 图 1 接受决策属性 a1 频率分布拟合曲线 Fig. 1 Accept the decision attribute a1 frequency distribution fitting curve 0.45 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.50 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 属性 a2 的隶属频率 决策代价 X2 隶属频率拟合 决策代价频率 图 2 接受决策属性 a2 频率分布拟合曲线 Fig. 2 Accept the decision attribute a2 frequency distribution fitting curve 0.40 0.50 0.60 0.70 0.80 0.90 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 决策代价 X3 属性 a3 的隶属频率 隶属频率拟合 决策代价频率 图 3 接受决策属性 a3 频率分布拟合曲线 Fig. 3 Accept the decision attribute a3 frequency distribution fitting curve 0.55 0.65 0.70 0.75 0.80 0.85 0.90 0.60 0.3 0.2 0.4 0.5 0.6 0.7 0.8 0.9 1.0 属性 a4 的隶属频率 决策代价 X4 隶属频率拟合 决策代价频率 图 4 接受决策属性 a4 频率分布拟合曲线 Fig. 4 Accept the decision attribute a4 frequency distribution fitting curve a1、a2、a3、a4 λe = (0.634 7,0.673 8,0.737 0,0.746 5) λb = (0.145 9,0.174 1,0.237 8, 0.246 5) λr = (0.365 3, 以上各个拟合曲线取最高点的横坐标作为该 决策动作不同属性下的决策代价,得到接受决策 在属性 下的决策代价分别为 0.6347、 0.673 8、0.737、0.746 5,因此接受决策的决策代价 组为 。同理,对 延迟决策和拒绝决策按照以上步骤处理,得到延 迟决策的决策代价组为 ,拒绝决策的决策代价组为 ·1072· 智 能 系 统 学 报 第 15 卷