第11卷第4期 智能系统学报 Vol.11 No.4 2016年8月 CAAI Transactions on Intelligent Systems Aug.2016 D0I:10.11992/is.201606016 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP.20160808.0831.026.html 基于不完备信息系统的三角模糊数决策粗糙集 李亚鸽14,杨宏志2,徐久成3 (1.郑州大学数学与统计学院,河南郑州450001;2.河南财经政法大学,河南郑州450046:3.河南师范大学计算 机与信息工程学院,河南新乡453007:4.新乡学院数学与信息科学学院,河南新乡453007) 摘要:在不完备信息系统中,针对用区间值表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结 果可能会产生过大误差的问题,将三角模糊数引入到决策粗糙集中,提出了一种基于不完备信息系统的三角模糊数 决策粗糙集。首先,定义了一种描述不完备信息的相似关系:然后,针对不完备信息系统中的缺失值,利用三角模糊 数来获取损失函数,构建了三角模糊数决策粗糙集模型:实例表明,本文提出的方法不仅能够弥补用区间数表示的 不足,而且可以突出可能性最大的主值,从而减少分类误差。 关键词:不完备信息系统:区间值:三角模糊数:决策粗糙集 中图分类号:TP18文献标志码:A文章编号:1673-4785(2016)04-0449-10 中文引用格式:李亚鸽,杨宏志,徐久成.基于不完备信息系统的三角模糊数决策粗糙集[J].智能系统学报,2016,11(4):449- 458. 英文引用格式:LI Yage,YANG Hongzhi,XU Jiucheng..Triangular fuzzy number decision-theoretic rough sets under incomplete information systems[J].CAAI Transactions on Intelligent Systems,2016,11(4):449-458. Triangular fuzzy number decision-theoretic rough sets under incomplete information systems LI Yage'4,YANG Hongzhi2,XU Jiucheng (1.School of Mathematics and Statistics,Zhengzhou University,Zhengzhou 450001,China;2.Henan University of Economics and Law,Zhengzhou,Zhengzhou 450046,China;3.College of Computer and Information Engineering,Henan Normal University,Xinx- iang 453007.China;4.Department of Mathematics and Information Science,Xinxiang University,Xinxiang 453007,China) Abstract:Aiming at the problems that when using an interval value to represent an unknown parameter in an incom- plete information system,the opportunity to obtain the value over the whole interval is considered to be equal,but the result may cause an over-large error.In order to solve this problem,a triangular fuzzy number was introduced into decision-theoretic rough sets,and a triangular fuzzy decision-theoretic rough set under incomplete information systems is proposed.Firstly,a new similarity relation was defined to describe incomplete information systems. Then,in view of the missing values,a model of triangular fuzzy number decision-theoretic rough sets was construc- ted to obtain the loss function.Finally,examples show that the proposed method not only makes up for deficiency in representation of the interval value,but also highlights the main value most likely to reduce the classification error. Keywords:incomplete information system;interval value;triangular fuzzy number;decision-theoretic rough sets 在现实生活中,由于测量误差、数据获取能力不足等原因,使得大量的信息系统都是不完备的口。 一般来说,不完备信息系统(incomplete information 收稿日期:2016-06-03.,网络出版日期:2016-08-08. systems,S)中的未知属性值有3种不同的情况。 基金项目:国家自然科学基金项目(61370169,61402153):河南省科技 一种是未知属性值是被遗漏的,但又确实存在 攻关重点项目(142102210056,162102210261):河南省高等 学校重点科研项目(16A520057). 的[)。根据这样的解释,Kryszkiewicz构建满足自反 通信作者:李亚鸽.E-mail:liyagezzu@163.com
第 11 卷第 4 期 智 能 系 统 学 报 Vol.11 №.4 2016 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2016 DOI:10.11992 / tis.201606016 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160808.0831.026.html 基于不完备信息系统的三角模糊数决策粗糙集 李亚鸽1,4 ,杨宏志2 ,徐久成3 (1.郑州大学 数学与统计学院,河南 郑州 450001; 2. 河南财经政法大学,河南 郑州 450046; 3. 河南师范大学 计算 机与信息工程学院,河南 新乡 453007; 4.新乡学院 数学与信息科学学院,河南 新乡 453007) 摘 要:在不完备信息系统中,针对用区间值表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结 果可能会产生过大误差的问题,将三角模糊数引入到决策粗糙集中,提出了一种基于不完备信息系统的三角模糊数 决策粗糙集。 首先,定义了一种描述不完备信息的相似关系;然后,针对不完备信息系统中的缺失值,利用三角模糊 数来获取损失函数,构建了三角模糊数决策粗糙集模型;实例表明,本文提出的方法不仅能够弥补用区间数表示的 不足,而且可以突出可能性最大的主值,从而减少分类误差。 关键词:不完备信息系统;区间值;三角模糊数;决策粗糙集 中图分类号: TP18 文献标志码:A 文章编号:1673-4785(2016)04-0449-10 中文引用格式:李亚鸽,杨宏志,徐久成. 基于不完备信息系统的三角模糊数决策粗糙集[ J]. 智能系统学报, 2016, 11( 4): 449- 458. 英文引用格式:LI Yage , YANG Hongzhi, XU Jiucheng. Triangular fuzzy number decision⁃theoretic rough sets under incomplete information systems[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 449-458. Triangular fuzzy number decision⁃theoretic rough sets under incomplete information systems LI Yage 1,4 , YANG Hongzhi 2 , XU Jiucheng 3 (1. School of Mathematics and Statistics, Zhengzhou University, Zhengzhou 450001, China; 2. Henan University of Economics and Law, Zhengzhou, Zhengzhou 450046, China; 3. College of Computer and Information Engineering, Henan Normal University, Xinx⁃ iang 453007, China; 4. Department of Mathematics and Information Science,Xinxiang University, Xinxiang 453007,China) Abstract:Aiming at the problems that when using an interval value to represent an unknown parameter in an incom⁃ plete information system, the opportunity to obtain the value over the whole interval is considered to be equal, but the result may cause an over⁃large error. In order to solve this problem, a triangular fuzzy number was introduced into decision⁃theoretic rough sets, and a triangular fuzzy decision⁃theoretic rough set under incomplete information systems is proposed. Firstly, a new similarity relation was defined to describe incomplete information systems. Then, in view of the missing values, a model of triangular fuzzy number decision⁃theoretic rough sets was construc⁃ ted to obtain the loss function. Finally, examples show that the proposed method not only makes up for deficiency in representation of the interval value, but also highlights the main value most likely to reduce the classification error. Keywords: incomplete information system; interval value; triangular fuzzy number; decision⁃theoretic rough sets 收稿日期:2016-06-03. 网络出版日期:2016-08-08. 基金项目:国家自然科学基金项目( 61370169, 61402153);河南省科技 攻关重点项目(142102210056, 162102210261);河南省高等 学校重点科研项目(16A520057). 通信作者:李亚鸽. E⁃mail:liyagezzu@ 163.com. 在现实生活中,由于测量误差、数据获取能力不 足等原因,使得大量的信息系统都是不完备的[1] 。 一般来说,不完备信息系统( incomplete information systems, IIS)中的未知属性值有 3 种不同的情况。 一种是 未 知 属 性 值 是 被 遗 漏 的, 但 又 确 实 存 在 的[2] 。 根据这样的解释,Kryszkiewicz 构建满足自反
.450 智能系统学报 第11卷 性和对称性的容差关系[),并研究了S中的知识 a、}分别表示接受某事件、延迟决策和拒绝某事件3 约简问题:基于容差关系,王国胤等)提出了限制 种行动。考虑到采取不同行动会产生不同的损失, 容差关系:杨习贝等给出了一种可变精度分类关 用入p、入即、入P分别表示当x属于X时,采取行动 系,对限制容差关系进行了扩展:一种是未知属性值 ap、ag、aw下的损失;用入N、入BN、入w分别表示当x不 被认为是丢失的,不允许被比较[s),据此,Stefanows-- 属于X时,采取行动ap、ag、ax下的损失。因此采取 k等构建了非对称相似关系[6),并建立了近似集的 ap、ag、aw3种行动下的期望损失可分别表示为 概念:另外一种是未知属性值被认为是暂时性缺失。 R(apI [x])=AppP(XI [x])+ApxP(XI [x]) 决策粗糙集是20世纪90年代由Yao提出的一 R(aBI[x])=入即P(XI[x])+入BNP(XI[x]) 种重要的粗糙集模型[],该理论的核心内容是通过 R(ayI [x])=ANpP(XI [x])+ANP(XI [x]) 分析比较各种决策的风险损失,找出最小风险损失 (1) 决策,以此作为把对象划分到正域、负域和边界域的 式中:[x]为样本在属性集下的等价类,P(XI[x]) 依据。贾修一等劉提出了一种基于决策风险最最 和P(一XI[x])分别表示将等价类[x]划分为X和 小化的属性约简定义,它要求在约简后的属性集合 X的概率。根据贝叶斯决策准则,需要选择期望 上所做出的决策风险小:王国胤等列对国内外有关 损失最小的行动集作为最佳行动方案,于是得到如 决策粗糙集模型进行了综述和分析:Li等1o根据决 下3条决策规则: 策者的不同风险偏好,给出了乐观决策、悲观决策与 P)若R(apI[x])≤R(agI[x])和R(apI 中性决策的多角度决策粗糙集模型:叶东毅等)提 [x])≤R(avI[x]同时成立,那么x EPOS(X): 出了基于模糊数风险最小化的拓展决策粗糙集模 B)若R(aBI[x])≤R(apI[x])和R(aB 型;此外,决策粗糙集已在邮件信息过滤系统、文本 [x])≤R(awI[x])同时成立,那么x∈BND(X): 聚类和分类、石油开采中得到了较好应用2-6。 N)若R(awI[x])≤R(apI[x])和R(awl 然而,在已有对决策粗糙集的研究中,代价敏感 [x])≤R(agI[x]同时成立,那么x∈NEG(X)。 损失函数大都由专家提供。考虑到人为判断的模糊 由于P(XI[x])+P(XI[x])=1,所以上述 性,单值损失函数存在很大误差,损失函数应具有一 规则只与概率P(X1[x])和相关的损失函数入有 定的伸缩性,为此,刘盾等提出区间决策粗糙集, 关。基于常识,做出正确决策产生的损失要小于做 讨论了用区间值来刻画损失函数:考虑到信息系统 出错误决策产生的损失,故有0≤入P≤入即<入p, 的不完备性,马兴斌等[讨论了不完备信息系统中 0≤入w≤入N<入w。基于这两个条件,从规则P) 的多重代价决策粗糙集:刘盾等1]将不完备信息引 ~)可以获得以下3个阈值: 入到区间决策粗糙集中,构建了一个混合信息知识 入pw-入N 表,用以处理S中的三支决策问题,但是这仍具有 Q= (入PN-入BN)+(入BP-入p) 一定的误差,特别地,在S中,用区间数表示一个 ABN ANN 未知参量时,整个区间内取值机会被认为是均等的, B=(AN-As)+(AP-A即 得到的结果可能会产生过大误差。而在三角模糊数 APN -ANN 区间取值中,主值a的取值机会最大,由a靠近上 Y=(Aps Ass)(Asr -m) (2) 限、下限取值可能性递减。因此,使用三角模糊数进 基于上述3个阈值,规则P)~N)可简明表示为 行不确定性值的评判,不仅能够突出取可能性最大 P)若P(XI[x])≥a且P(XI[x])≥y,则 的主值,而且可以弥补用区间数表示的不足。基于 x∈POS(X); 此,本文在S的基础上提出了使用三角模糊数来 B)若P(XI[x])≤a且P(XI[x])≥B,则 改善只用上下限表示的区间数取值,构建了三角模 x∈BND(X); 糊数决策粗糙集模型。 N')若P(XI[x])≤B且P(XI[x])≤y,则 1基础知识 x ENEG(X)。 1.2三角模糊数 1.1决策粗糙集 模糊集作为精确数值的一种扩展形式,被用于 决策粗糙集[2-2]模型利用两个状态集和3个 处理模糊、不精确和不确定性决策问题。在模糊集 行动集描述决策过程。状态集2={X,一X}分别 理论中,隶属函数是它的一个最基本元素。在隶属 表示某事件属于X和不属于X,行动集A={ap,ag, 函数中,三角模糊数是其中具有代表性的一个
性和对称性的容差关系[3] ,并研究了 IIS 中的知识 约简问题;基于容差关系,王国胤等[1] 提出了限制 容差关系;杨习贝等[4] 给出了一种可变精度分类关 系,对限制容差关系进行了扩展;一种是未知属性值 被认为是丢失的,不允许被比较[5] ,据此,Stefanows⁃ ki 等构建了非对称相似关系[6] ,并建立了近似集的 概念;另外一种是未知属性值被认为是暂时性缺失。 决策粗糙集是 20 世纪 90 年代由 Yao 提出的一 种重要的粗糙集模型[7] ,该理论的核心内容是通过 分析比较各种决策的风险损失,找出最小风险损失 决策,以此作为把对象划分到正域、负域和边界域的 依据。 贾修一等[8] 提出了一种基于决策风险最最 小化的属性约简定义,它要求在约简后的属性集合 上所做出的决策风险小;王国胤等[9] 对国内外有关 决策粗糙集模型进行了综述和分析;Li 等[10]根据决 策者的不同风险偏好,给出了乐观决策、悲观决策与 中性决策的多角度决策粗糙集模型;叶东毅等[11] 提 出了基于模糊数风险最小化的拓展决策粗糙集模 型;此外,决策粗糙集已在邮件信息过滤系统、文本 聚类和分类、石油开采中得到了较好应用[12-16] 。 然而,在已有对决策粗糙集的研究中,代价敏感 损失函数大都由专家提供。 考虑到人为判断的模糊 性,单值损失函数存在很大误差,损失函数应具有一 定的伸缩性,为此,刘盾等[17]提出区间决策粗糙集, 讨论了用区间值来刻画损失函数;考虑到信息系统 的不完备性,马兴斌等[18]讨论了不完备信息系统中 的多重代价决策粗糙集;刘盾等[19] 将不完备信息引 入到区间决策粗糙集中,构建了一个混合信息知识 表,用以处理 IIS 中的三支决策问题,但是这仍具有 一定的误差,特别地,在 IIS 中,用区间数表示一个 未知参量时,整个区间内取值机会被认为是均等的, 得到的结果可能会产生过大误差。 而在三角模糊数 区间取值中,主值 a 的取值机会最大,由 a 靠近上 限、下限取值可能性递减。 因此,使用三角模糊数进 行不确定性值的评判,不仅能够突出取可能性最大 的主值,而且可以弥补用区间数表示的不足。 基于 此,本文在 IIS 的基础上提出了使用三角模糊数来 改善只用上下限表示的区间数取值,构建了三角模 糊数决策粗糙集模型。 1 基础知识 1.1 决策粗糙集 决策粗糙集[20-21] 模型利用两个状态集和 3 个 行动集描述决策过程。 状态集 Ω = {X, ØX}分别 表示某事件属于 X 和不属于 X,行动集 A = {aP , aB , aN}分别表示接受某事件、延迟决策和拒绝某事件 3 种行动。 考虑到采取不同行动会产生不同的损失, 用 λPP 、λBP 、λNP 分别表示当 x 属于 X 时,采取行动 aP 、aB 、aN下的损失;用 λPN、λBN、λNN分别表示当 x 不 属于 X 时,采取行动 aP 、aB 、aN下的损失。 因此采取 aP 、aB 、aN3 种行动下的期望损失可分别表示为 R(aP | [x]) = λPPP(X | [x]) + λPNP(¬ X | [x]) R(aB | [x]) = λBPP(X | [x]) + λBNP(¬ X | [x]) R(aN | [x]) = λNPP(X | [x]) + λNNP(¬ X | [x]) (1) 式中:[x]为样本在属性集下的等价类,P(X | [x]) 和 P(ØX | [x])分别表示将等价类[x]划分为 X 和 ØX 的概率。 根据贝叶斯决策准则,需要选择期望 损失最小的行动集作为最佳行动方案,于是得到如 下 3 条决策规则: P) 若 R( aP | [ x]) ≤ R( aB | [ x]) 和 R( aP | [x]) ≤ R(aN | [x]同时成立,那么 x ÎPOS(X); B) 若 R( aB | [ x]) ≤ R( aP | [ x]) 和 R( aB | [x]) ≤ R(aN | [x])同时成立,那么 x ÎBND(X); N) 若 R( aN | [ x]) ≤ R( aP | [ x]) 和 R( aN | [x]) ≤ R(aB | [x]同时成立,那么 x ÎNEG(X)。 由于 P(X | [x])+P(ØX | [x])= 1,所以上述 规则只与概率 P(X | [ x])和相关的损失函数 λ 有 关。 基于常识,做出正确决策产生的损失要小于做 出错误决策产生的损失,故有 0 ≤ λPP≤ λBP <λNP , 0 ≤ λNN≤ λBN <λPN。 基于这两个条件,从规则 P) ~N)可以获得以下 3 个阈值: α = λPN - λBN (λPN - λBN) + (λBP - λPP ) β = λBN - λNN (λBN - λNN) + (λNP - λBP ) γ = λPN - λNN (λPN - λNN) + (λNP - λPP ) (2) 基于上述 3 个阈值,规则 P) ~N)可简明表示为 P′) 若 P(X | [x]) ≥ α 且 P(X | [x]) ≥ γ ,则 x ÎPOS(X); B′) 若 P(X | [x]) ≤ α 且 P(X | [x]) ≥ β, 则 x ÎBND(X); N′) 若 P(X | [x]) ≤ β 且 P(X | [x]) ≤ γ, 则 x ÎNEG(X)。 1.2 三角模糊数 模糊集作为精确数值的一种扩展形式,被用于 处理模糊、不精确和不确定性决策问题。 在模糊集 理论中,隶属函数是它的一个最基本元素。 在隶属 函数中,三角模糊数是其中具有代表性的一个。 ·450· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·451 定义2[2)实数R上的模糊数a=(L,m,u)是 a,(x)=a:(y)≠* 一个三角模糊数,其中,l、m、u为实数,且IAmAu,m a:(x)≠a:(y)Aa:(x)≠*Λa:(y)≠* 称为三角模糊数a的主值,l与u分别称为a的下界 1/v。l, 其他 和上界。 (4) 模糊数a的隶属函数的表达式可表示为 式中:|V.表示在属性a:上值域元素的个数。 0, x<I 任意两个对象x:x的相似度S(x:,x)为 x-1 l≤x≤m /m- S(xx)=∑ S.() U.(x)= (3) (5) u-x m m≤x≤u u-m 定义4不完备信息系统S=(U,AT,V,f)。 0,u>x L∈[0,1],相似关系SR为SR,的L-截集,其中L 当l=m或m=u时,三角模糊数就转变为区间 称为阈值或置信水平,即 数,由此可见区间数是三角模糊数的一个特例。在区 Vx,x,SR(x,x)台 间数取值中,上下限的各个取值可以认为是机会均等 a,∈A,S(x,x)=∑ Sa(xi,x -≥L(6) 的,而在三角模糊数区间取值中,主值α的取值机会 m 最大,而由a靠近上限、下限的取值可能性递减。 对于每一个x,的等价类[x]5=U,{为S(x, 对于任意两个模糊三角数a1=(L1,m1,41), x)≥L},其中S片是自反的、对称的,但不是传递 a2=(凸2,m2,42),根据扩展定理21相应的运算规则 的。其中,L的值可以看作决策偏好的粒度,一个较 如下: 高的值代表了一个较强的不可分辨关系。特别地, 1)a1+a1=(L1+l2,m1+m2,41+u2): 2)a1-a2=(l1-l2,m1-m2,u1-2); 如果L=1,即有5气)=∑8=1,此时。 m 3)a1a2=(L1l2,m1m2,u42): a:(x)=a:(y)≠*。在这种情况下,基于L-截集的 4)a1/a2-(l/u2,m/m2,u1/八2): 相似关系转化为等价类。如果L=0,即有 5)Aa2=(入l2,入m2,入2),A∈R且入>0。 5)=∑82=0,此时4,(),. m 2基于S的三角模糊数决策粗糙集 a(x)≠*,a:(y)≠*,x、x没有任何关系。 2.1不完备信息系统 根据相似度的定义(5),基于L截集相似关系 定义12]不完备信息系统S=(U,AT,V, (6),我们定义在S中的两个近似和3个决策区域。 f)。其中,U是一个被称为论域的对象集合;AT是 定义5不完备信息系统S=(U,AT,V,f)。 非空有限的属性集合:对于Va∈AT,有a:U→V, x∈U,令0<B≤a≤1,基于L-截集相似关系的 其中V,是属性α的值域(包括遗漏型空值和缺失型 下、上近似为 空值)。属性值域集合V=U.erV。,f为信息函数, SRa.B(x)={x∈U1Pr(xI[x]5)≥a} 对于a∈A,x∈U,有f(x,a)∈Vn。在本文中,S (7) 中所有的未知值都被认为是被遗漏的。 SRB (x)={xEUI Pr(I [x])>B) 2.2相似度及相关知识 (8) 在S=(U,AT,V,f)中,V=V{*},*表示 相对应的3个决策区域分别为 未知的值。陈圣兵等25]在不完备信息系统中,分析 P0Sa,e)(x)={x∈U1Pr(x|[x]5R)≥a 并讨论了空值相等的概率问题。基于文献[25],我 BND'B (x)={xE UI B Pr(xI [x]SR)<a) 们提出了在不完备信息系统中相似度的概念。 NEG(x)={x∈UIPr(xI[x])≤By 定义3不完备信息系统IS=(U,AT,V, (9) f)。U={x1,x2,…,xn}为n个对象的集合,A= 2.3整数值排序法 {a1,a2,…,am}为m个属性的集合。x,x,由 整数值排序法是通过把模糊数直接转化成单个 a:确定的相似度关系S。(x:,x)为 实数,然后依据实数大小来判定模糊数的次序。这种 S(xi,x)= 排序方法,涉及到决策者的风险偏好。根据Kumar
定义 2 [22] 实数 R 上的模糊数 a = (l, m, u)是 一个三角模糊数,其中,l、m、u 为实数,且 lλmλu,m 称为三角模糊数 a 的主值,l 与 u 分别称为 a 的下界 和上界。 模糊数 a 的隶属函数的表达式可表示为 Ua(x) = 0, x < l x - l m - l , l ≤ x ≤ m u - x u - m , m ≤ x ≤ u 0, u > x ì î í ï ï ï ï ï ï ïï (3) 当 l = m 或 m = u 时,三角模糊数就转变为区间 数,由此可见区间数是三角模糊数的一个特例。 在区 间数取值中,上下限的各个取值可以认为是机会均等 的,而在三角模糊数区间取值中,主值 a 的取值机会 最大,而由 a 靠近上限、下限的取值可能性递减。 对于任意两个模糊三角数 a1 = ( l 1 , m1 , u1 ), a2 = (l 2 , m2 , u2 ),根据扩展定理[24]相应的运算规则 如下: 1) a1 +a1 = (l 1 + l 2 , m1 +m2 , u1 +u2 ); 2) a1 -a2 = (l 1 -l 2 , m1 -m2 , u1 -u2 ); 3) a1 a2 = (l 1 l 2 , m1 m2 , u1 u2 ); 4) a1 / a2 = (l 1 / u2 , m1 / m2 , u1 / l 2 ); 5) λ a2 = (λ l 2 , λ m2 , λ u2 ), λ ÎR 且λ > 0。 2 基于 IIS 的三角模糊数决策粗糙集 2.1 不完备信息系统 定义 1 [23] 不完备信息系统 IIS = (U, AT, V , f )。 其中,U 是一个被称为论域的对象集合;AT 是 非空有限的属性集合;对于"a ÎAT,有 a: U ®Va , 其中 Va是属性 a 的值域(包括遗漏型空值和缺失型 空值)。 属性值域集合 V = Ua Î AT Va ,f 为信息函数, 对于"a ÎA,x ÎU,有 f ( x, a) ÎVa 。 在本文中,IIS 中所有的未知值都被认为是被遗漏的。 2.2 相似度及相关知识 在 IIS = (U, AT, V, f )中,V = Va È{*},*表示 未知的值。 陈圣兵等[25 ]在不完备信息系统中,分析 并讨论了空值相等的概率问题。 基于文献[25],我 们提出了在不完备信息系统中相似度的概念。 定义 3 不完备信息系统 IIS = (U, AT, V, f )。U = { x1 , x2 , …, xn } 为 n 个对象的集合,A = { a1 ,a2 , …, am }为 m 个属性的集合。 "xi, xj, 由 ai确定的相似度关系 Sai (xi,xj) 为 Sai (xi,xj) = 1, ai (x) = ai (y) ≠ ∗ 0, ai (x) ≠ ai (y) ∧ ai (x) ≠ ∗ ∧ ai (y) ≠ ∗ 1 / Vai , 其他 ì î í ï ï ï ï (4) 式中: Vai 表示在属性 ai上值域元素的个数。 任意两个对象 xi、xj的相似度 S(xi, xj)为 S xi,xj ( ) = ∑ Sai xi,xj ( ) m (5) 定义 4 不完备信息系统 IIS = (U, AT, V,f )。 "L Î[0, 1],相似关系 SRA L为 SRA的 L⁃截集,其中 L 称为阈值或置信水平,即 "xi, xj,SRA L (xi, xj) Û "aiÎA, S(xi, xj) = ∑a i ∈A Sai xi,xj ( ) m ≥ L (6) 对于每一个 xi的等价类 [xi] L SR = Uxi { xj |S(xi, xj ) ≥ L },其中 SI L A 是自反的、对称的,但不是传递 的。 其中,L 的值可以看作决策偏好的粒度,一个较 高的值代表了一个较强的不可分辨关系。 特别地, 如果 L = 1,即有 S(xi,xj) = ∑ Sa(xi,xj) m = 1, 此时, ai(x)= ai( y) ¹∗。 在这种情况下,基于 L⁃截集的 相似 关 系 转 化 为 等 价 类。 如 果 L = 0, 即 有 S(xi,xj) =∑ Sa(xi,xj) m = 0,此时,ai ( x) ¹ai ( y), ai ( x)¹*, ai(y) ¹∗, xi、 xj没有任何关系。 根据相似度的定义(5),基于 L⁃截集相似关系 (6),我们定义在 IIS 中的两个近似和 3 个决策区域。 定义 5 不完备信息系统 IIS = (U, AT, V, f )。 "x ÎU,令 0 < β ≤ α ≤ 1, 基于 L⁃截集相似关系的 下、上近似为 SR L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≥ α} (7) SR L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) > β} (8) 相对应的 3 个决策区域分别为 POS L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≥ α} BND L (α,β ) (x) = x ∈ U | β < Pr x | [x] L SR { ( ) < α} NEG L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≤ β} (9) 2.3 整数值排序法 整数值排序法是通过把模糊数直接转化成单个 实数,然后依据实数大小来判定模糊数的次序。 这种 排序方法,涉及到决策者的风险偏好。 根据 Kumar 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·451·
452 智能系统学报 第11卷 A[2]的研究结论,三角模糊数r(a)的排序函数为 R(axI[x])≤R(aBI[x])同时成立,那么x∈ r(a)=0.5[p(l+m)+(1-p)(m+u)] NEG(X)。 (10) 在本文,我们选取整数值排序方法来研究三角 式中:P是决策者的风险偏好指数,反映出决策者的 模糊数决策粗糙集。基于式(10),各期望损失值可 乐观程度。在式(10)中p值越大意味着决策者越 以分别计算得到 乐观,即悲观决策者会高估损失值,而乐观决策者则 r(R(apI [x]S))=r(App)Pr(XI [x]sR)+ 会低估损失值。特别地,当p=0和p=1时,r(a) r(ApN)(1-Pr(XI [x]s) 的值分别代表了悲观决策者和乐观决策者的观点。 r(R(agI [x]5R))=r(App)Pr(XI [x]sB)+ 2.4基于IS的三角模糊数决策粗糙集的模型实现 r(入w)(1-Pr(XI[x]sR) 根据贝叶斯决策过程,运用三角模糊数,不同状 r(R(axI [x]sR))=r(ANp)Pr(XI [x]sB)+ 态对应的三角模糊数损失值如表1所示。 r(ANN)(1-Pr(XI [x]sR) 表1不同状态下对应的三角模糊数损失值 其中 Table 1 The triangular fuzzy numbers loss values of different states r(App)=0.5[p(lpp mpp)+(1-p)(upp mpp) X(P) X(P) r(Apx)=0.5[p(lpN mps)+(1-p)(upN mpN) a。入pp=(Lpp,mp,up)ApN=(lpx,mpw,upx) r(入Bp)=0.5[p(lBp+mBr)+(1-p)(up+mgr)] da Aup (lp,map,uup)Asx (lax,max,uax) r(ABx)=0.5[p(LBN mgx)+(1-p)(uBs mgx) ax Axp =(Isp,mxp,UxP)Axx (Isx,mss uxx) r(Asp)=0.5[p(lsp msp)+(1-p)(usp msp) 在表1中,入pp=(lpp,mm,upr)、A即=(lP, r(ANx)=0.5[p(lNN msx)+(1 -p)(uNN msx) m即,u即)、p=(Lp,mP,up)分别表示当x属于 故得到如下3条决策规则: X时,采取行动ap、aB、ax下的损失;用入w=(lpN, P2)若r(R(apI[x]SR))≤r((aBI[x])) mpN,upN)、入gN=(LgN,mgN,ugN)、入w=(lN,mw, 和r(R(apI[x]))≤r(R(awI[x]))同时成 uN)分别表示当x不属于X时,采取行动ap、aga、 立,那么xeP0S(X); 下的损失。根据决策粗糙集的基本条件,假定损失 B2)若r(R(aBI[x]))≤r(R(apI[x]5)) 值满足以下条件: 和r(R(agI[x]))≤r(R(awI[x]5))同时成 lp≤LgP<lp mpp≤m<mNp 立,那么x∈BND(X): upp≤ugp<upp INN≤ln<lpw N2)若r(R(awI[x]5))≤r(R(apI[x])) mN≤mgN<mPN UNN≤uBN<upN 和r(R(awI[x]))≤r(R(aaI[x]))同时成 因此采取ap、aB、aw3种行动下的期望损失可 立,那么x ENEG(X)。 分别表示为 由此,可推导出三角模糊数决策粗糙集的3个 R(apI [x])=AppP(XI [x])+ApP(XI [x]) 阈值,其结果为 R(agI [x])=AgpP(XI [x])+ABxP(XI [x]) (r(dw)-r(入N)) R(aNI [x])=ANpP(XI [x])+ANNP(XI[x]) (r(入N)-r(入BN))+(r(ABP)-r(入P)) (11) (r(AgN)-r(Asx)) 根据贝叶斯决策准则,需要选择期望损失最小 B=(r(a)-r(A)+(r(A)-r八即)) 的行动集作为最佳行动方案,于是可得到如下3条 (r(入pN)-r(AN)) 决策规则: Y=(r(m)-r(Ass))(r(sr)-r(m) P,)若R(apI[x])≤R(aBI[x])和 (12) R(apl[x])≤R(awI[x])同时成立,那么x∈ 考虑到决策者的风险态度,基于决策粗糙集依 POS(X); 次提出乐观决策模型、中性决策模型和悲观决策模 B,)若R(agI[x])≤R(apI[x])和 型。类似于Li,Zhou的思想o),在整数值排序方法 中决策者的风险态度指数是三角模糊数排序的重要 R(agI[x])≤R(awI[x])同时成立,那么x∈ BND(X); 要素,它会影响到阈值的取值。特别地,当p=1,对 于乐观决策者,其阈值可以表达为 N,)若R(awI[x])≤R(apI[x])和
A [26]的研究结论,三角模糊数 r(a)的排序函数为 r(a) = 0.5[ρ(l + m) + (1 - ρ)(m + u)] (10) 式中: ρ 是决策者的风险偏好指数,反映出决策者的 乐观程度。 在式(10) 中 ρ 值越大意味着决策者越 乐观,即悲观决策者会高估损失值,而乐观决策者则 会低估损失值。 特别地,当 ρ = 0 和 ρ = 1 时,r(a) 的值分别代表了悲观决策者和乐观决策者的观点。 2.4 基于 IIS 的三角模糊数决策粗糙集的模型实现 根据贝叶斯决策过程,运用三角模糊数,不同状 态对应的三角模糊数损失值如表 1 所示。 表 1 不同状态下对应的三角模糊数损失值 Table 1 The triangular fuzzy numbers loss values of different states X(P) ¬ X(P) ap λPP = (lPP ,mPP ,uPP ) λPN = (lPN ,mPN ,uPN ) aB λBP = (lBP ,mBP ,uBP ) λBN = (lBN ,mBN ,uBN ) aN λNP = (lNP ,mNP ,uNP ) λNN = (lNN ,mNN ,uNN ) 在表 1 中, λPP = ( lPP , mPP , uPP )、 λBP = ( lBP , mBP , uBP )、 λNP = (lNP , mNP , uNP )分别表示当 x 属于 X 时,采取行动 aP 、 aB 、aN下的损失;用 λPN = ( lPN, mPN, uPN)、 λBN = (lBN, mBN, uB N)、 λNN = (lNN, mNN, uNN )分别表示当 x 不属于 X 时,采取行动 aP 、 aB 、aN 下的损失。 根据决策粗糙集的基本条件,假定损失 值满足以下条件: lPP ≤ lBP < lNP mPP ≤ mBP < mNP uPP ≤ uBP < uPP lNN ≤ lBN < lPN mNN ≤ mBN < mPN uNN ≤ uBN < uPN 因此采取 aP 、aB 、aN 3 种行动下的期望损失可 分别表示为 R(aP | [x]) = λPPP(X | [x]) + λPNP(¬ X | [x]) R(aB | [x]) = λBPP(X | [x]) + λBNP(¬ X | [x]) R(aN | [x]) = λNPP(X | [x]) + λNNP(¬ X | [x]) (11) 根据贝叶斯决策准则,需要选择期望损失最小 的行动集作为最佳行动方案,于是可得到如下 3 条 决策规则: P1 ) 若 R aP ( | [x] ) ≤ R aB ( | [x] ) 和 R aP ( | [x] ) ≤ R aN ( | [x] ) 同时成立,那么 x Î POS(X); B1 ) 若 R aB ( | [x] ) ≤ R aP ( | [x] ) 和 R aB ( | [x] ) ≤ R aN ( | [x] ) 同时成立,那么 x Î BND(X); N1 ) 若 R aN ( | [x] ) ≤ R aP ( | [x] ) 和 R aN ( | [x] ) ≤ R aB ( | [x] ) 同时成立,那么 x Î NEG(X)。 在本文,我们选取整数值排序方法来研究三角 模糊数决策粗糙集。 基于式(10),各期望损失值可 以分别计算得到 r(R aP | [x] L SR ( ) ) = r(λPP )Pr(X | [x]SR L ) + r(λPN)(1 - Pr(X | [x]SR L ) r(R aB | [x] L SR ( ) ) = r(λBP )Pr(X | [x]SR L ) + r(λBN)(1 - Pr(X | [x]SR L ) r(R aN | [x] L SR ( ) ) = r(λNP )Pr(X | [x]SR L ) + r(λNN)(1 - Pr(X | [x]SR L ) 其中 r λPP ( ) = 0.5[ρ lPP + mPP ( ) + (1 - ρ) uPP + mPP ( ) ] r λPN ( ) = 0.5[ρ lPN + mPN ( ) + (1 - ρ) uPN + mPN ( ) ] r λBP ( ) = 0.5[ρ lBP + mBP ( ) + (1 - ρ) uBP + mBP ( ) ] r λBN ( ) = 0.5[ρ lBN + mBN ( ) + (1 - ρ) uBN + mBN ( ) ] r λNP ( ) = 0.5[ρ lNP + mNP ( ) + (1 - ρ) uNP + mNP ( ) ] r λNN ( ) = 0.5[ρ lNN + mNN ( ) + (1 - ρ) uNN + mNN ( ) ] 故得到如下 3 条决策规则: P2 )若 r(R aP | [x] L SR ( ) ) ≤ r(R aB | [x] L SR ( ) ) 和 r(R aP | [x] L SR ( ) ) ≤ r(R aN | [x] L SR ( ) ) 同时成 立,那么 x ÎPOS(X); B2 )若 r(R aB | [x] L SR ( ) ) ≤ r(R aP | [x] L SR ( ) ) 和 r(R aB | [x] L SR ( ) ) ≤ r(R aN | [x] L SR ( ) ) 同时成 立,那么 x ÎBND(X); N2 )若 r(R aN | [x] L SR ( ) ) ≤ r(R aP | [x] L SR ( ) ) 和 r(R aN | [x] L SR ( ) ) ≤ r(R aB | [x] L SR ( ) ) 同时成 立,那么 x ÎNEG(X)。 由此,可推导出三角模糊数决策粗糙集的 3 个 阈值,其结果为 α = (r λPN ( ) - r λBN ( ) ) (r λPN ( ) - r λBN ( ) ) + (r λBP ( ) - r λPP ( ) ) β = (r λBN ( ) - r λNN ( ) ) (r λBN ( ) - r λNN ( ) ) + (r λNP ( ) - r λBP ( ) ) γ = (r λPN ( ) - r λNN ( ) ) (r λPN ( ) - r λNN ( ) ) + (r λNP ( ) - r λPP ( ) ) (12) 考虑到决策者的风险态度,基于决策粗糙集依 次提出乐观决策模型、中性决策模型和悲观决策模 型。 类似于 Li、Zhou 的思想[10] ,在整数值排序方法 中决策者的风险态度指数是三角模糊数排序的重要 要素,它会影响到阈值的取值。 特别地,当 ρ = 1, 对 于乐观决策者,其阈值可以表达为 ·452· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 .453· (LpN+mpN)-(LBN+mB) a=1 ((les +mpx)-(lBN mBN)+(lap mgp)-(lpp mpp)) (lBN mBs)-(lNN mNs) B=(s+ms)-(+m)+(s+msr)-(s+m)) (lps mpx)-(INx mxx) =ps mps)-(s +msx)+(sr mr)-(le +mr)) 当P=0,对于悲观决策者,其阈值可以表达为 (mpN upN)-(mBN uBN) a= (mpN ups)-(mBN +ugs)+(mgp ugp)-(mpp +upp)) (mBN UBN)-(mNN UNN) B=((mgs ug)(m+(mr usr)-(mar+ue)) (mpw+upw)-(mN+uN) Y=((mps+ups)-(m++(mar us)-(mm un) 鉴于Yao2)的讨论结果,首先考虑决策规则诊断决策表S=<U,A=CUD>为例1),来说明 (B)中存在α>8的情况,即 基于S的三角模糊数决策粗糙集决策过程。U= r(入p)-r(入p)r(Ap)-r(入p) {x,2,x3,x4,x5,x6,x7,xg,xg,x10}分别是10 r(Aps)-r(ABx)r(ABx)-r(Asx) 位病人的编号,条件属性集C={a1,a2,a3,a4, 该条件蕴含着0≤B<Q≤1,此时,通过权衡可 a5,a6,a,}分别表示以上病人的7种症状:温度、咳 以得到以下简化规则。 嗽、流鼻涕、头疼、恶心、有痰、肌肉疼。决策属性集 P'2)若Pr(XI[x])≥a,则x∈POS(X); D={X,一X},其中X表示病人患有流感,一X表示 B'2)若B<Pr(XI[x])<a,则x∈BND(X); 病人没有患有流感。病人患病的实际情况如表2。 N'2)若Pr(XI[x])≤B,则x∈NEG(X)。 表2病人患病的实际情况 对于乐观决策者,此时p=1,所对应的三支决 Table 2 The status of the illness patients 策规则为 a d2 as as a6 OP'2)若Pr(KI[x]5)≥a,则x∈POS(X): 3 OB'2)若B<Pr(XI[x])<a,则x∈BND(X): X2 2 2 ON',)若Pr(XI[x])≤B,则x∈NEG(X)。 3 2 2 2 1 2 对于悲观决策者,此时p=0,所对应的三支决 2 2 1 3 策规则为 2 2 1 2 PP'2)若Pr(XI[x])≥a,则x∈POS(X); 2 2 PB'2)若B<Pr(XI[x]5)<a,则x∈ 2 3 BND(X); 1 PN'2)若Pr(XI[x])≤B,则x∈NEG(X)。 此外,为了保证研究的完备性,决策规则(B)还 有另一种情况,即: X10 3 2 2 3 r(AB即)-r(ApP)、r(AP)-r(A即) 为描述方便,在表2中,根据医生的经验,对每 r(ApN)-r(ABN)r(ABN)-r(ANN) 个属性所对应值的大小有如下定义: 该条件蕴含着0≤a<y<B≤1,此时,通过 温度a1:1代表高,2代表较高,3代表正常: 权衡可以得到以下简化规则: 咳嗽a2:1代表是,2代表不是: P3)若Pr(X1[x]5)≥y,则xEPOS(X); 流鼻涕a3:1代表是,2代表不是: N3)若Pr(XI[x])≤y,则x∈NEG(X)。 头疼a4:1代表很严重,2代表有点严重,3代表 不严重; 3案例分析 恶心a5:1代表是,2代表不是; 医学诊断是一种根据病人现有症状来判断所得 有痰a6:1代表有,2代表没有; 疾病类列的决策过程,在下面的讨论中,以医学流感 肌肉疼a,:1代表很严重,2代表有点严重,3代
a = lPN + mPN ( ) - lBN + mBN ( ) lPN + mPN ( ) - lBN + mBN ( ) + lBP + mBP ( ) - lPP + mPP ( ( ) ) β = lBN + mBN ( ) - lNN + mNN ( ) lBN + mBN ( ) - lBN + mNN ( ) + lBN + mNP ( ) - lBN + mBP ( ( ) ) γ = lPN + mPN ( ) - lNN + mNN ( ) lPN + mPN ( ) - lNN + mNN ( ) + lNP + mNP ( ) - lPP + mPP ( ( ) ) 当 ρ = 0, 对于悲观决策者,其阈值可以表达为 a = mPN + uPN ( ) - mBN + uBN ( ) mPN + uPN ( ) - mBN + uBN ( ) + mBP + uBP ( ) - mPP + uPP ( ( ) ) β = mBN + uBN ( ) - mNN + uNN ( ) mBN + uBN ( ) - mNN + uNN ( ) + mNP + uNP ( ) - mBP + uBP ( ( ) ) γ = mPN + uPN ( ) - mNN + uNN ( ) mPN + uPN ( ) - mNN + uNN ( ) + mNP + uNP ( ) - mPP + uPP ( ( ) ) 鉴于 Yao [27] 的讨论结果,首先考虑决策规则 (B)中存在 α >β 的情况,即 r λBP ( ) - r λPP ( ) r λPN ( ) - r λBN ( ) < r λNP ( ) - r λBP ( ) r λBN ( ) - r λNN ( ) 该条件蕴含着 0 ≤ β <α ≤1, 此时,通过权衡可 以得到以下简化规则。 P′2 ) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); B′2 ) 若 β <Pr X | [x] L SR ( ) <α, 则 x ÎBND(X); N′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 对于乐观决策者,此时 ρ = 1, 所对应的三支决 策规则为 OP′2) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); OB′2 ) 若 β <Pr X | [x] L SR ( ) <α, 则 x ÎBND(X); ON′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 对于悲观决策者,此时 ρ = 0,所对应的三支决 策规则为 PP′2 ) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); PB′2 ) 若 β < Pr X | [x] L SR ( ) < α, 则 x Î BND(X); PN′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 此外,为了保证研究的完备性,决策规则(B)还 有另一种情况,即: r λBP ( ) - r λPP ( ) r λPN ( ) - r λBN ( ) ≥ r λNP ( ) - r λBP ( ) r λBN ( ) - r λNN ( ) 该条件蕴含着 0 ≤ α < γ < β ≤ 1, 此时,通过 权衡可以得到以下简化规则: P3 ) 若 Pr X | [x] L SR ( ) ≥ γ ,则 x ÎPOS(X); N3 ) 若 Pr X | [x] L SR ( ) ≤ γ ,则 x ÎNEG(X)。 3 案例分析 医学诊断是一种根据病人现有症状来判断所得 疾病类列的决策过程,在下面的讨论中,以医学流感 诊断决策表 S = <U, A = C ∪ D >为例[ 1 9 ] ,来说明 基于 IIS 的三角模糊数决策粗糙集决策过程。 U = {x1 , x2 , x3 , x4 , x5 , x6 , x7 , x8 , x9 , x10 }分别是 10 位病人的编号,条件属性集 C = { a1 , a2 , a3 , a4 , a5 , a6 , a7 }分别表示以上病人的 7 种症状:温度、咳 嗽、流鼻涕、头疼、恶心、有痰、肌肉疼。 决策属性集 D = {X, ØX},其中 X 表示病人患有流感,ØX 表示 病人没有患有流感。 病人患病的实际情况如表 2。 表 2 病人患病的实际情况 Table 2 The status of the illness patients U a1 a2 a3 a4 a5 a6 a7 x1 1 1 ∗ 1 1 1 3 x2 3 2 2 3 2 2 ∗ x3 2 ∗ 2 2 1 2 2 x4 2 1 2 ∗ 1 1 3 x5 2 1 1 2 1 ∗ 2 x6 2 2 2 ∗ 2 2 ∗ x7 1 1 2 1 ∗ 2 3 x8 1 1 ∗ 1 1 ∗ 3 x9 2 1 1 1 1 1 ∗ x10 3 2 ∗ 2 2 2 3 为描述方便,在表 2 中,根据医生的经验,对每 个属性所对应值的大小有如下定义: 温度 a1 :1 代表高,2 代表较高,3 代表正常; 咳嗽 a2 :1 代表是,2 代表不是; 流鼻涕 a3 :1 代表是,2 代表不是; 头疼 a4 :1 代表很严重,2 代表有点严重,3 代表 不严重; 恶心 a5 :1 代表是,2 代表不是; 有痰 a6 :1 代表有,2 代表没有; 肌肉疼 a7 :1 代表很严重,2 代表有点严重,3 代 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·453·