第2卷第6期 智能系统学报 Vol.2 Na6 2007年12月 CAAI Transactions on Intelligent Systems Dec.2007 粒计算研究综述 王国胤12,张清华2,胡军13 (1.重庆邮电大学计算机科学与技术研究所,重庆400065;2.西南交通大学信息科学与技术学院,四川成都610031; 3.西安电子科技大学电子工程学院,陕西西安710071) 摘要:粒计算(granular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了 所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算 研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关 系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模 型、动态粒计算模型、自主粒计算模型粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题 关键词:粒计算;数据挖掘,智能信息处理;粗糙集,模糊集;商空间 中图分类号:TP18文献标识码:A文章编号:1673-4785(2007)060008-19 An overvie w of granular computing WANG Guo-yin'2,ZHANG Qing-hua'2,HU Jun'3 (1.Institute of Computer Science&Technology,Chongqing University of Posts and Telecommunications,Chongqing 400065, China;2.School of Information Science Technology,Southwest Jiaotong University,Chengdu 610031,China;3.School of Electronic Engineering,Xidian University,Xi'an 710071,China) Abstract:In the field of computational intelligence,granular computing(GrC)is a new way to simulate hu- man thinking to help solve complicated problems.GrC involves all the theories,methodologies and tech- niques of granularity,providing a powerful tool for the solution of complex problems,massive data min- ing,and fuzzy information processing.In this paper,first the current situation and the development pros- pects of GrC are introduced,then the fundamental and existing problems related to GrC are presented and its basic models and methods summarized.Finally,some future research topics about GrC are presented, such as,uniform granular computing model,granulation of complex problem space,transformation be- tween granule spaces,efficient granular computing algorithm,novel granular computing model,dynamic granular computing model,data-driven granular computing model,fuzzy granular computing method,and the applications of granular computing models,etc. Keywords granular computing;data mining;intelligent information processing;rough sets;fuzzy sets; quotient space 自Zadeh1979年发表论文“Fuzzy sets and im- 控制中的“不确定性”、区间分析里的“区间数运算”、 formation granularity'”以来,研究人员对信息粒 以及DS证据理论中的“证据”都与信息粒密切相 度化的思想产生了浓厚的兴趣.Zadeh认为很多领 关.Hobss在1985年直接用“粒度(granularity)”作 域都存在信息粒的概念,只是在不同领域中的表现 为论文题目发表论文),讨论了粒的分解和合并,以 形式不同.自动机与系统论中的“分解与划分”、最优 及如何得到不同大小的粒,并提出了产生不同大小 粒的模型.Lin在1988年提出邻域系统并研究了邻 收稿日期:2007-04-02. 基金项目:国家自然科学基金资助项目(60573068):重庆市教委 域系统与关系数据库之间的关系31.1996年,他在 科学技术研究资助项目(3060517) UC-Berkeley大学访问时,向Zadeh提出作“granu- 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.htp://www.cnki.net
收稿日期 :2007204202. 基金项目 :国家自然科学基金资助项目(60573068) ;重 庆 市 教 委 科 学 技 术 研 究 资 助 项 目( KJ060517) . 第 2 卷第 6 期 智 能 系 统 学 报 Vol. 2 №. 6 2007 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2007 粒计算研究综述 王国胤1 ,2 ,张清华1 ,2 ,胡 军1 ,3 (1. 重庆邮电大学 计算机科学与技术研究所 ,重庆 400065 ; 2. 西南交通大学 信息科学与技术学院 ,四川 成都 610031 ; 3. 西安电子科技大学 电子工程学院 ,陕西 西安 710071) 摘 要 :粒计算(granular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法. 它覆盖了 所有有关粒度的理论、方法和技术 ,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具. 首先回顾了粒计算 研究和发展状况 ,介绍了粒计算的基本组成和问题 ,综述了粒计算的基本模型和方法 ,并讨论了它们之间的相互关 系 ,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模 型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题. 关键词 :粒计算 ;数据挖掘 ;智能信息处理 ;粗糙集 ;模糊集 ;商空间 中图分类号 : TP18 文献标识码 :A 文章编号 :167324785 (2007) 0620008219 An overview of granular computing WAN G Guo2yin 1 ,2 ,ZHAN G Qing2hua 1 ,2 , HU J un 1 ,3 (1. Institute of Computer Science & Technology , Chongqing University of Posts and Telecommunications , Chongqing 400065 , China ;2. School of Information Science & Technology , Southwest Jiaotong University , Chengdu 610031 ,China ; 3. School of Electronic Engineering , Xidian University , Xi’an 710071 ,China) Abstract :In t he field of comp utational intelligence , granular comp uting ( GrC) is a new way to simulate hu2 man t hinking to help solve complicated problems. GrC involves all the t heories , met hodologies and tech2 niques of granularity , providing a powerf ul tool for t he solution of complex problems , massive data min2 ing , and f uzzy information processing. In t his paper , first t he current sit uation and t he development pros2 pects of GrC are introduced , t hen t he f undamental and existing problems related to GrC are presented and its basic models and met hods summarized. Finally , some f uture research topics about GrC are p resented , such as , uniform granular comp uting model , granulation of complex problem space , transformation be2 tween granule spaces , efficient granular comp uting algorit hm , novel granular comp uting model , dynamic granular comp uting model , data2driven granular comp uting model , f uzzy granular comp uting met hod , and t he applications of granular comp uting models , etc. Keywords :granular comp uting ; data mining ; intelligent information processing ; rough sets; f uzzy sets ; quotient space 自 Zadeh 1979 年发表论文“Fuzzy sets and in2 formation granularity”以来[1 ] ,研究人员对信息粒 度化的思想产生了浓厚的兴趣. Zadeh 认为很多领 域都存在信息粒的概念 ,只是在不同领域中的表现 形式不同. 自动机与系统论中的“分解与划分”、最优 控制中的“不确定性”、区间分析里的“区间数运算”、 以及 D2S 证据理论中的“证据”都与信息粒密切相 关. Hobss 在 1985 年直接用“粒度 (granularity) ”作 为论文题目发表论文[2 ] ,讨论了粒的分解和合并 ,以 及如何得到不同大小的粒 ,并提出了产生不同大小 粒的模型. Lin 在 1988 年提出邻域系统并研究了邻 域系统与关系数据库之间的关系[3 ] . 1996 年 ,他在 UC2Berkeley 大学访问时 ,向 Zadeh 提出作“granu2 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第6期 王因胤,等:粒计算研究综述 lar computing”的研究,Zadeh称之为“granular 认识和推广,2003年张铃和张钹将模糊概念与商空 mathematics'”,Lin改称为“granular computing”,并 间理论结合,提出模糊商空间理论,为粒计算提供了 缩写成GC.他发表了一系列关于粒计算与邻域系 新的数学模型和工具,并成功应用于数据挖掘等领 统的论文o1,主要是研究二元关系(邻域系统、 域3135).2002年苗夺谦等人[361对知识的粒计算进 Rough集和信任函数)下的粒计算模型,论述基于 行探讨,引入属性的重要度,并在求最小属性约简方 邻域系统的粒计算在粒结构、粒表示和粒应用等方 面得到应用.王飞跃等人3刃对词计算和语言动力学 面的问题,讨论了粒计算中的模糊集和粗糙集方法, 进行了探讨,以词计算为基础,对问题进行动态描 并将粒计算方法引入数据挖掘和机器发现.依据人 述、分析和综合,提出了设计、控制和评估的语言动 们在解决问题时能从不同的粒度世界去分析和观察 力学系统.王国胤等人.提出了基于容差关系的 同一问题,并且很容易地从一个粒度世界转到另一 粒计算模型,利用属性值上的容差关系给出了不完 个粒度世界,张钱和张铃在1990年针对复杂问题求 备信息系统的粒表示、粒运算规则和粒分解算法,同 解,建立了一种复杂问题求解的商结构形式化体系, 时结合粗糙集中的属性约简问题,提出了不完备信 给出了一套解决信息融合、启发式搜索路径规划和 息系统在粒表示下属性必要性的判定条件,对粒计 推理等问题的理论和算法1.),1997年,Zadeh进 算方法在规则提取方面进行了探索.郑征等人5.4列 一步指出],世上有3个基本概念构成人类认知的 提出了相容粒度空间模型,并在图像纹理识别和数 基础:粒化、组织及因果关系.其中,粒化是整体分解 据挖掘中取得了成功,他们认为,人类具有根据具体 为部分,组织是部分结合为整体,而因果关系则涉及 的任务特性把相关数据和知识泛化或者特化成不同 原因与结果间的联系.物体的粒化产生一系列的粒 程度、不同大小的粒的能力,以及进一步根据这些粒 子,每个粒子即为一簇点(物体),这些点难以区别, 和粒之间的关系进行问题求解的能力.卜东波等 或相似、或接近、或以某种功能结合在一起.一般来 人4s1从信息粒度的角度剖析聚类和分类技术,试图 说,粒化在本质上是分层次的,时间可粒化为年、月、 使用信息粒度原理的框架来统一聚类和分类,指出 日、小时、分、秒就是大家熟悉的例子 从信息粒度的观点来看,聚类是在一个统一的粒度 在Lin的研究基础上,Yao结合邻域系统对粒 下进行计算,而分类却是在不同的粒度下进行计算 计算进行了详细的研究4.161,发表了一系列研究成 并根据粒度原理设计了一种新的分类算法,大规模 果72!,并将它应用于知识挖掘等领域,建立了概 中文文本分类的应用实践表明,这种分类算法有较 念之间的if-then规则与粒度集合之间的包含关系, 强的泛化能力.Zhang等人9.so1对粒神经网络进行 提出利用由所有划分构成的格求解一致分类问题, 了探讨,并在高效知识发现中得到很好的应用.李道 为数据挖掘提供了新的方法和视角,结合粗糙集理 国等人5川研究了基于粒向量空间的人工神经网络 论,Yao探讨了粒计算方法在机器学习、数据分析、 模型,在一定程度上提高了人工神经网络的时效性、 数据挖掘、规则提取、智能数据处理和粒逻辑等方面 知识表达的可理解性.杜伟林等人52]根据概念格[53] 的应用.Yao给出了粒计算的3种观点22]: 与粒度划分在概念聚类的过程中都是基于不同层次 1)从哲学角度看,粒计算是一种结构化的思想 的概念结构来进行分类表示,而且粒度划分本身构 方法; 成一个格结构的特点,研究了概念格与粒度划分格 2)从应用角度看,粒计算是一个通用的结构化 在概念描述与概念层次转换之间的联系,通过对概 问题求解方法; 念的分层递阶来进行概念的泛化与例化,使概念在 3)从计算角度看,粒计算是一个信息处理的典 递阶方面忽略不必要的冗余信息.YagerIs4探讨了 型方法 基于粒计算的学习方法和应用.Lin51在2006年粒 随着粒计算研究的发展,近年来国内外又有很 计算国际会议上提出了新的研究思路“infrastruc- 多学者加入到了粒计算研究的领域.为了探讨粗糙 tures for AFengineering”.同时,Bargiela和Pe 集理论在各种环境下的应用,Skowron2s.刃以包含 dryczls61也从各个侧面对粒计算的根源和实质进行 度概念来研究粒近似空间上的Rough下近似和 了详细的探讨和总结.Yager指出,发展信息粒的操 Rough上近似.刘清I28.01在Rough逻辑的基础上, 作方法是当前粒计算研究的一个重要任务5 提出了粒-逻辑的概念(G逻辑),构造了这种逻辑 1 的近似推理系统,并应用于医疗诊断.近几年来,在 粒计算的基本组成 掀起粒计算研究的热潮中,商空间理论被人们广泛 粒计算的基本组成主要包括3部分:粒子粒层 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
lar comp uting”的研 究 , Zadeh 称 之为“granular mat hematics”,Lin 改称为“granular comp uting”,并 缩写成 GrC. 他发表了一系列关于粒计算与邻域系 统的论文[4 - 10 ] ,主要是研究二元关系 (邻域系统、 Rough 集和信任函数) 下的粒计算模型 ,论述基于 邻域系统的粒计算在粒结构、粒表示和粒应用等方 面的问题 ,讨论了粒计算中的模糊集和粗糙集方法 , 并将粒计算方法引入数据挖掘和机器发现. 依据人 们在解决问题时能从不同的粒度世界去分析和观察 同一问题 ,并且很容易地从一个粒度世界转到另一 个粒度世界 ,张钹和张铃在 1990 年针对复杂问题求 解 ,建立了一种复杂问题求解的商结构形式化体系 , 给出了一套解决信息融合、启发式搜索、路径规划和 推理等问题的理论和算法[11 - 12 ] . 1997 年 ,Zadeh 进 一步指出[13 ] ,世上有 3 个基本概念构成人类认知的 基础 :粒化、组织及因果关系. 其中 ,粒化是整体分解 为部分 ,组织是部分结合为整体 ,而因果关系则涉及 原因与结果间的联系. 物体的粒化产生一系列的粒 子 ,每个粒子即为一簇点 (物体) ,这些点难以区别 , 或相似、或接近、或以某种功能结合在一起. 一般来 说 ,粒化在本质上是分层次的 ,时间可粒化为年、月、 日、小时、分、秒就是大家熟悉的例子. 在 Lin 的研究基础上 , Yao 结合邻域系统对粒 计算进行了详细的研究[14 - 16 ] ,发表了一系列研究成 果[17 - 22 ] ,并将它应用于知识挖掘等领域 ,建立了概 念之间的 if2t hen 规则与粒度集合之间的包含关系 , 提出利用由所有划分构成的格求解一致分类问题 , 为数据挖掘提供了新的方法和视角. 结合粗糙集理 论 , Yao 探讨了粒计算方法在机器学习、数据分析、 数据挖掘、规则提取、智能数据处理和粒逻辑等方面 的应用. Yao 给出了粒计算的 3 种观点[22 ] : 1) 从哲学角度看 ,粒计算是一种结构化的思想 方法 ; 2) 从应用角度看 ,粒计算是一个通用的结构化 问题求解方法 ; 3) 从计算角度看 ,粒计算是一个信息处理的典 型方法. 随着粒计算研究的发展 ,近年来国内外又有很 多学者加入到了粒计算研究的领域. 为了探讨粗糙 集理论在各种环境下的应用 ,Skowron [23 - 27 ] 以包含 度概念来研究粒近似空间上的 Rough 下近似和 Rough 上近似. 刘清[ 28 - 30 ]在 Rough 逻辑的基础上 , 提出了粒 - 逻辑的概念( G2逻辑) ,构造了这种逻辑 的近似推理系统 ,并应用于医疗诊断. 近几年来 ,在 掀起粒计算研究的热潮中 ,商空间理论被人们广泛 认识和推广 ,2003 年张铃和张钹将模糊概念与商空 间理论结合 ,提出模糊商空间理论 ,为粒计算提供了 新的数学模型和工具 ,并成功应用于数据挖掘等领 域[31 - 35 ] . 2002 年苗夺谦等人[36 ] 对知识的粒计算进 行探讨 ,引入属性的重要度 ,并在求最小属性约简方 面得到应用. 王飞跃等人[ 37 ]对词计算和语言动力学 进行了探讨 ,以词计算为基础 ,对问题进行动态描 述、分析和综合 ,提出了设计、控制和评估的语言动 力学系统. 王国胤等人[38 - 44 ]提出了基于容差关系的 粒计算模型 ,利用属性值上的容差关系给出了不完 备信息系统的粒表示、粒运算规则和粒分解算法 ,同 时结合粗糙集中的属性约简问题 ,提出了不完备信 息系统在粒表示下属性必要性的判定条件 ,对粒计 算方法在规则提取方面进行了探索. 郑征等人[45 - 47 ] 提出了相容粒度空间模型 ,并在图像纹理识别和数 据挖掘中取得了成功 ,他们认为 ,人类具有根据具体 的任务特性把相关数据和知识泛化或者特化成不同 程度、不同大小的粒的能力 ,以及进一步根据这些粒 和粒之间的关系进行问题求解的能力. 卜东波等 人[48 ]从信息粒度的角度剖析聚类和分类技术 ,试图 使用信息粒度原理的框架来统一聚类和分类 ,指出 从信息粒度的观点来看 ,聚类是在一个统一的粒度 下进行计算 ,而分类却是在不同的粒度下进行计算 , 并根据粒度原理设计了一种新的分类算法 ,大规模 中文文本分类的应用实践表明 ,这种分类算法有较 强的泛化能力. Zhang 等人[49 - 50 ]对粒神经网络进行 了探讨 ,并在高效知识发现中得到很好的应用. 李道 国等人[ 51 ]研究了基于粒向量空间的人工神经网络 模型 ,在一定程度上提高了人工神经网络的时效性、 知识表达的可理解性. 杜伟林等人[52 ]根据概念格[53 ] 与粒度划分在概念聚类的过程中都是基于不同层次 的概念结构来进行分类表示 ,而且粒度划分本身构 成一个格结构的特点 ,研究了概念格与粒度划分格 在概念描述与概念层次转换之间的联系 ,通过对概 念的分层递阶来进行概念的泛化与例化 ,使概念在 递阶方面忽略不必要的冗余信息. Yager [54 ] 探讨了 基于粒计算的学习方法和应用. Lin [55 ] 在 2006 年粒 计算国际会议上提出了新的研究思路“infrastruc2 t ures for AI2engineering”. 同 时 , Bargiela 和 Pe2 drycz [56 ] 也从各个侧面对粒计算的根源和实质进行 了详细的探讨和总结. Yager 指出 ,发展信息粒的操 作方法是当前粒计算研究的一个重要任务[ 57 ] . 1 粒计算的基本组成 粒计算的基本组成主要包括 3 部分 :粒子、粒层 第 6 期 王国胤 ,等 :粒计算研究综述 ·9 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·10· 智能系统学报 第2卷 和粒结构」 以及在一个层次结构中的不同层次.虽然一个粒子 1.1粒子 在某个粒层上被视为一个整体,但粒子内部元素(子 粒子是构成粒计算模型的最基本元素5.s),是 粒子)的结构在问题求解时也很重要,因为它能提供 粒计算模型的原语.一个粒可以被解释为许多小颗 粒子更为详细的特性.而在同一层上的粒子之间也 粒构成的一个大个体,现实生活中,粒子无处不在, 具有某种特殊的结构,它们可能是相互独立,或者部 如在地图上观察洲、国家、海洋、大陆和山脉等是一 分包含.如果同一粒层上的粒子之间的独立性越好 些粗的粒子(大的粒子),观察省、市、区等是一些中 可能问题求解后合并起来越方便;反之,如果粒子之 等的粒子,而观察街道、饭店、机场等是一些相对较 间的相关性越好,则问题求解后的合并工作相对越 小的粒子.一个粒子可以被同时看作是由内部属性 繁杂.粒子网的层次结构是对整个问题空间的概括, 描述的个体元素的集合,以及由它的外部属性所描 它的复杂性在一定程度上决定了问题求解的复杂 述的整体.一个粒子的存在仅仅在一个特定的环境 程度 中才有意义.一个粒子的元素可以是粒子,一个粒子 也可以是另外一个粒子的元素.而衡量粒子“大小” 2粒计算的基本问题 的概念是粒度,一般来讲,对粒子进行“量化”时用粒 粒计算中存在2个最基本的问题,即粒化和粒 度来反映粒化的程度5) 的计算.问题空间的粒化是指将问题空间分解为许 1.2粒层 多子空间,或是基于有用的信息和知识将问题空间 按照某个实际需求的粒化准则得到的所有粒子 中的个体聚集成不同的类,这些类称之为粒.粒中的 的全体构成一个粒层,是对问题空间的一种抽象化 元素可以理解为对应概念的实例.可以把粒计算和 描述.根据某种关系或算子,问题空间产生相应的粒 概念生成、知识发现和数据挖掘联系起来,因为概念 子.同一层的粒子内部往往具有相同的某种性质或 生成的目的之一是对具有某些概念的粒的表示、特 功能.由于粒化的程度不同,导致同一问题空间会产 征化、描述和解释,而知识发现和数据挖掘就是在粒 生不同的粒层.粒层的内部结构是指在该粒层上的 之间建立关联和因果等联系 各个粒子组成的论域的结构,即粒子之间的相互关 2.1粒化 系.在问题求解中,选择最合适的粒层对于问题求解 粒化是问题求解空间的一个构造性过程,它可 尤为关键,因为,在不同粒层求解同一问题的复杂度 以简单理解为在给定粒化准则下得到一个粒层的过 往往不同.在高一级粒层上的粒子能够分解成为下 程,是粒计算基础单元的构建,包括粒子、粒视图、粒 一级粒层上的多个粒子(增加一些属性),在低一级 网和层次结构.在不同的粒化准则下就得到多个粒 粒层上的多个粒子可以合并成高一级粒层上的粒子 层,进而得到粒层的网络结构.通常的粒化方法有自 (忽略一些属性).粒计算模型的主要目标是能够在 顶而下通过分解粗粒子得到细粒子的方法,和自底 不同粒层上进行问题求解,且不同粒层上的解能够 向上将细粒子通过合并得到粗粒子的方法.粒化过 相互转化. 程是粒计算的必要过程.问题空间的粒化过程主要 1.3粒结构 涉及粒化准则、粒化算法(方法)粒子和粒结构的表 一个粒化准则对应一个粒层,不同的粒化准则 示(描述)以及粒子和粒结构的定性(定量)描述等问 对应多个粒层,它反应了人们从不同角度、不同侧面 题).粒化准则主要是语义方面的问题,解决为什 来观察问题、理解问题、求解问题.所有粒层之间的 么2个对象能放进同一个粒子内的问题.它是根据 相互联系构成一个关系结构,称为粒结构2】.粒结 实际问题求解的具体需求和具体精度要求得到的 构给出了一个系统或者问题的结构化描述.通过从 粒化准则的一个基本要求是忽略掉那些无关紧要的 系统思维、复杂系统理论和层次结构理论(技术)中 细节,从而达到降低问题求解复杂度的目的.粒化方 得到的启发至少需要确定一个粒结构网2)中3个 法面对实际问题,回答如何对问题空间进行粒化,采 层次的结构:粒子的内部结构、粒子集结构和粒子网 用什么算法或工具实现粒层的构造,它属于算法方 的层次结构.粒子集的集体结构可以看作是全部层 面的问题.如在粗糙集理论中,如何对对象集进行划 次结构中一个层次或者一个粒度视图中的结构.它 分产生粒层,如何高效实现属性的约简等问题.粒子 本身可以看作是粒的内部连接网络.对于同一个系 的结构描述主要是用粒化方法得到的粒子,如何用 统或者同一个问题,许多解释和描述可能是同时存 形式化的语言表述出来,以便后面进行计算.例如在 在的.所以,粒结构需要被模型化为多种层次结构, 粗糙集理论模型中,粒子的表示可能是一个子集而 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.ne
和粒结构. 111 粒 子 粒子是构成粒计算模型的最基本元素[58 - 59 ] ,是 粒计算模型的原语. 一个粒可以被解释为许多小颗 粒构成的一个大个体 ,现实生活中 ,粒子无处不在 , 如在地图上观察洲、国家、海洋、大陆和山脉等是一 些粗的粒子(大的粒子) ,观察省、市、区等是一些中 等的粒子 ,而观察街道、饭店、机场等是一些相对较 小的粒子. 一个粒子可以被同时看作是由内部属性 描述的个体元素的集合 ,以及由它的外部属性所描 述的整体. 一个粒子的存在仅仅在一个特定的环境 中才有意义. 一个粒子的元素可以是粒子 ,一个粒子 也可以是另外一个粒子的元素. 而衡量粒子“大小” 的概念是粒度 ,一般来讲 ,对粒子进行“量化”时用粒 度来反映粒化的程度[59 ] . 112 粒 层 按照某个实际需求的粒化准则得到的所有粒子 的全体构成一个粒层 ,是对问题空间的一种抽象化 描述. 根据某种关系或算子 ,问题空间产生相应的粒 子. 同一层的粒子内部往往具有相同的某种性质或 功能. 由于粒化的程度不同 ,导致同一问题空间会产 生不同的粒层. 粒层的内部结构是指在该粒层上的 各个粒子组成的论域的结构 ,即粒子之间的相互关 系. 在问题求解中 ,选择最合适的粒层对于问题求解 尤为关键 ,因为 ,在不同粒层求解同一问题的复杂度 往往不同. 在高一级粒层上的粒子能够分解成为下 一级粒层上的多个粒子 (增加一些属性) ,在低一级 粒层上的多个粒子可以合并成高一级粒层上的粒子 (忽略一些属性) . 粒计算模型的主要目标是能够在 不同粒层上进行问题求解 ,且不同粒层上的解能够 相互转化. 113 粒结构 一个粒化准则对应一个粒层 ,不同的粒化准则 对应多个粒层 ,它反应了人们从不同角度、不同侧面 来观察问题、理解问题、求解问题. 所有粒层之间的 相互联系构成一个关系结构 ,称为粒结构[20 ] . 粒结 构给出了一个系统或者问题的结构化描述. 通过从 系统思维、复杂系统理论和层次结构理论 (技术) 中 得到的启发至少需要确定一个粒结构网[20 ] 中 3 个 层次的结构 :粒子的内部结构、粒子集结构和粒子网 的层次结构. 粒子集的集体结构可以看作是全部层 次结构中一个层次或者一个粒度视图中的结构. 它 本身可以看作是粒的内部连接网络. 对于同一个系 统或者同一个问题 ,许多解释和描述可能是同时存 在的. 所以 ,粒结构需要被模型化为多种层次结构 , 以及在一个层次结构中的不同层次. 虽然一个粒子 在某个粒层上被视为一个整体 ,但粒子内部元素(子 粒子) 的结构在问题求解时也很重要 ,因为它能提供 粒子更为详细的特性. 而在同一层上的粒子之间也 具有某种特殊的结构 ,它们可能是相互独立 ,或者部 分包含. 如果同一粒层上的粒子之间的独立性越好 , 可能问题求解后合并起来越方便 ;反之 ,如果粒子之 间的相关性越好 ,则问题求解后的合并工作相对越 繁杂. 粒子网的层次结构是对整个问题空间的概括 , 它的复杂性在一定程度上决定了问题求解的复杂 程度. 2 粒计算的基本问题 粒计算中存在 2 个最基本的问题 ,即粒化和粒 的计算. 问题空间的粒化是指将问题空间分解为许 多子空间 ,或是基于有用的信息和知识将问题空间 中的个体聚集成不同的类 ,这些类称之为粒. 粒中的 元素可以理解为对应概念的实例. 可以把粒计算和 概念生成、知识发现和数据挖掘联系起来 ,因为概念 生成的目的之一是对具有某些概念的粒的表示、特 征化、描述和解释 ,而知识发现和数据挖掘就是在粒 之间建立关联和因果等联系. 211 粒 化 粒化是问题求解空间的一个构造性过程 ,它可 以简单理解为在给定粒化准则下得到一个粒层的过 程 ,是粒计算基础单元的构建 ,包括粒子、粒视图、粒 网和层次结构. 在不同的粒化准则下就得到多个粒 层 ,进而得到粒层的网络结构. 通常的粒化方法有自 顶而下通过分解粗粒子得到细粒子的方法 ,和自底 向上将细粒子通过合并得到粗粒子的方法. 粒化过 程是粒计算的必要过程. 问题空间的粒化过程主要 涉及粒化准则、粒化算法(方法) 、粒子和粒结构的表 示(描述) 以及粒子和粒结构的定性(定量) 描述等问 题[59 ] . 粒化准则主要是语义方面的问题 ,解决为什 么 2 个对象能放进同一个粒子内的问题. 它是根据 实际问题求解的具体需求和具体精度要求得到的. 粒化准则的一个基本要求是忽略掉那些无关紧要的 细节 ,从而达到降低问题求解复杂度的目的. 粒化方 法面对实际问题 ,回答如何对问题空间进行粒化 ,采 用什么算法或工具实现粒层的构造 ,它属于算法方 面的问题. 如在粗糙集理论中 ,如何对对象集进行划 分产生粒层 ,如何高效实现属性的约简等问题. 粒子 的结构描述主要是用粒化方法得到的粒子 ,如何用 形式化的语言表述出来 ,以便后面进行计算. 例如在 粗糙集理论模型中 ,粒子的表示可能是一个子集. 而 · 01 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第6期 王因胤,等:粒计算研究综述 ·11 在概念格理论中,粒子的表述就是一个概念,它包括 间3),基于概念格产生概念信息粒和概念知识 概念的外延(一个对象子集)和内涵(一个属性子集) 粒],基于邻域系统产生邻域粒子1等等 2部分.粒结构的描述往往形式多样,在商空间理论 总之,粒计算是一个多准则学科,它从许多领域 模型中,粒结构是一种分层递阶的结构,在概念格模 中获得其基本的思想、准则和方法,是基于不同层次 型中,粒结构是一种Hasse图.粒子和粒结构的定 粒度和细节的问题求解的一般性理论.在粒计算的 性、定量描述主要指粒子和粒结构的大小(主要是指 “大伞”下进行统一的研究,可以发现不同学科之间 粒度的结果)和复杂性度量.当前,成功的粒化方法 原理的关联,它与具体的学科研究是相互独立 往往都是以将解空间形成划分空间为主要的目标, 的,.一旦掌握了粒计算中的结构化思维和结构化 这样便于将子空间上的解合成原问题空间的解,商 问题求解的抽象思想,就可以很容易地在任何领域 空间理论就是这样一个成功的实例.当然,如果用某 中运用 种粒化方法形成的解空间不是划分(如覆盖),这将 3粒计算的主要模型与理论方法 增加合成的复杂度 2.2粒的计算 3.1词计算模型 以粒子为运算对象进行问题的求解或推理,是 高标准的精确表达,普遍存在于数学、化学、工 狭义的粒计算.粒计算可以通过系统访问粒结构来 程学和另外一些“硬”科学之中,而不精确表达却普 解决问题,包括在层次结构中向上和向下2个方向 遍存在于社会、心理、政治、历史、哲学、语言、人类 的交互,以及在同一层次内的移动,主要分为2 学、文学、文艺及相关的领域中.针对复杂且非明 种51:同一粒层上粒子之间相互转换和推理,不同 晰定义的现象,无法用精确的数学方法来描述,但可 粒层上粒子之间的转换或推理.不同粒层之间的联 以用一些程度词语,如不很可能、十分不可能、极不 系可以由映射来表示,在不同粒层上同一问题以不 可能等,来对某些模糊概念进行修饰.尽管普通的精 同的粒度、不同的细节表示,粒层之间的映射就建立 确方法(如数学)在某些科学领域应用相当广泛,也 了同一问题的不同细节描述之间的关系.商空间理 一直尝试着应用到人文学科中,但人们在长期的实 论模型就是通过自然投影建立了分层递阶的商空间 践中已经清楚地认识到精确的方法应用到人文学科 链式结构.粒计算的主要特点是同一问题的解可以 有很大的局限性.面对巨大而又复杂的人文学科系 在不同粒层之间自由转化.正是基于这一点,人们才 统,区别于传统方法的新方法模糊计算方法被 能用粒计算方法高效地实现复杂问题的求解.模糊 Zadeh提出.在人类的认识中,粒的模糊性直接源于 商空间上的分层递阶结构可以通过模糊等价关系的 无区别相似性、接近性以及功能性等这些概念的模 截关系建立相应的转化联系;粗糙集理论中的划分 糊性.人类具有在不精确性、部分知识、部分确定以 粒度可以通过属性的增加或删减来控制;而概念格 及部分真实的环境下作出合理决策这一不同寻常的 理论模型中的概念粒子的相互转化可以通过改变概 能力,而模糊信息粒化正是这种能力的基础.在模糊 念的内涵来实现.这些转化虽然方式不同,但一个共 逻辑中,模糊信息粒化是语言变量、模糊“if-then”规 同的特点是在转化的过程中,问题求解的重要性质 则以及模糊图的基础 必须能在不同粒层上表现出来,这也是评价粒化方 词计算(computing with words)是用词语代替 法好坏的一个重要指标.如果在粒化后粒层之间的 数进行计算及推理的方法62!.如何利用语言进行推 相互转化过程中,某些重要属性不能体现出来,这不 理判断,这就要进行词计算.信息粒化为词计算提供 但不利于问题的求解,反而会导致问题求解过程发 了前提条件,词计算在信息粒度、语言变量和约束概 散,从而增加问题求解的复杂度.商空间理论模型中 念上产生了自己的理论与方法,意在解决模糊集合 的“保真”和“保假”原理使得粒化后形成的商空间具 论的数值化隶属度函数表示法的局限性、表达的概 有“保序”性,使得问题求解的搜索空间大大减少,复 念缺乏前后联系、逻辑表达和算子实现的复杂性等 杂度由相乘变为相加 问题,使它们能够更符合人类的思维特点.词计算有 粒计算的2个基本问题中,粒化是关键,它直接 狭义和广义2个方面的概念.狭义的模糊词计算理 决定粒计算的成功与否.因此,粒化方法是人们研究 论是指利用通常意义下的数学概念和运算(如加、 的热点问题.目前,粒化方法很多,如基于等价关系 减、乘、除等)构造的带有语义的模糊数值型的词计 的划分产生粒子),基于模糊集产生模糊信息 算的理论体系;广义的词计算理论统指用词进行推 粒口,基于模糊等价关系截集产生分层递阶粒空 理、用词构建原型系统和用词编程,前者是后者的基 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
在概念格理论中 ,粒子的表述就是一个概念 ,它包括 概念的外延(一个对象子集) 和内涵(一个属性子集) 2 部分. 粒结构的描述往往形式多样 ,在商空间理论 模型中 ,粒结构是一种分层递阶的结构 ,在概念格模 型中 ,粒结构是一种 Hasse 图. 粒子和粒结构的定 性、定量描述主要指粒子和粒结构的大小(主要是指 粒度的结果) 和复杂性度量. 当前 ,成功的粒化方法 往往都是以将解空间形成划分空间为主要的目标 , 这样便于将子空间上的解合成原问题空间的解 ,商 空间理论就是这样一个成功的实例. 当然 ,如果用某 种粒化方法形成的解空间不是划分 (如覆盖) ,这将 增加合成的复杂度. 212 粒的计算 以粒子为运算对象进行问题的求解或推理 ,是 狭义的粒计算. 粒计算可以通过系统访问粒结构来 解决问题 ,包括在层次结构中向上和向下 2 个方向 的交互 ,以及在同一层次内的移动 ,主要分为 2 种[59 ] :同一粒层上粒子之间相互转换和推理 ,不同 粒层上粒子之间的转换或推理. 不同粒层之间的联 系可以由映射来表示 ,在不同粒层上同一问题以不 同的粒度、不同的细节表示 ,粒层之间的映射就建立 了同一问题的不同细节描述之间的关系. 商空间理 论模型就是通过自然投影建立了分层递阶的商空间 链式结构. 粒计算的主要特点是同一问题的解可以 在不同粒层之间自由转化. 正是基于这一点 ,人们才 能用粒计算方法高效地实现复杂问题的求解. 模糊 商空间上的分层递阶结构可以通过模糊等价关系的 截关系建立相应的转化联系 ;粗糙集理论中的划分 粒度可以通过属性的增加或删减来控制 ;而概念格 理论模型中的概念粒子的相互转化可以通过改变概 念的内涵来实现. 这些转化虽然方式不同 ,但一个共 同的特点是在转化的过程中 ,问题求解的重要性质 必须能在不同粒层上表现出来 ,这也是评价粒化方 法好坏的一个重要指标. 如果在粒化后粒层之间的 相互转化过程中 ,某些重要属性不能体现出来 ,这不 但不利于问题的求解 ,反而会导致问题求解过程发 散 ,从而增加问题求解的复杂度. 商空间理论模型中 的“保真”和“保假”原理使得粒化后形成的商空间具 有“保序”性 ,使得问题求解的搜索空间大大减少 ,复 杂度由相乘变为相加. 粒计算的 2 个基本问题中 ,粒化是关键 ,它直接 决定粒计算的成功与否. 因此 ,粒化方法是人们研究 的热点问题. 目前 ,粒化方法很多 ,如基于等价关系 的划分产生粒子[17 ] , 基于模糊集产生模糊信息 粒[1 ] ,基于模糊等价关系截集产生分层递阶粒空 间[35 ] ,基于概念格产生概念信息粒和概念知识 粒[60 ] ,基于邻域系统产生邻域粒子[3 ]等等. 总之 ,粒计算是一个多准则学科 ,它从许多领域 中获得其基本的思想、准则和方法 ,是基于不同层次 粒度和细节的问题求解的一般性理论. 在粒计算的 “大伞”下进行统一的研究 ,可以发现不同学科之间 原理的关联 , 它与具体的学科研究是相互独立 的[59 ] . 一旦掌握了粒计算中的结构化思维和结构化 问题求解的抽象思想 ,就可以很容易地在任何领域 中运用. 3 粒计算的主要模型与理论方法 311 词计算模型 高标准的精确表达 ,普遍存在于数学、化学、工 程学和另外一些“硬”科学之中 ,而不精确表达却普 遍存在于社会、心理、政治、历史、哲学、语言、人类 学、文学、文艺及相关的领域中[61 ] . 针对复杂且非明 晰定义的现象 ,无法用精确的数学方法来描述 ,但可 以用一些程度词语 ,如不很可能、十分不可能、极不 可能等 ,来对某些模糊概念进行修饰. 尽管普通的精 确方法(如数学) 在某些科学领域应用相当广泛 ,也 一直尝试着应用到人文学科中 ,但人们在长期的实 践中已经清楚地认识到精确的方法应用到人文学科 有很大的局限性. 面对巨大而又复杂的人文学科系 统 ,区别于传统方法的新方法 ———模糊计算方法被 Zadeh 提出. 在人类的认识中 ,粒的模糊性直接源于 无区别、相似性、接近性以及功能性等这些概念的模 糊性. 人类具有在不精确性、部分知识、部分确定以 及部分真实的环境下作出合理决策这一不同寻常的 能力 ,而模糊信息粒化正是这种能力的基础. 在模糊 逻辑中 ,模糊信息粒化是语言变量、模糊“if2then”规 则以及模糊图的基础. 词计算(comp uting with words) 是用词语代替 数进行计算及推理的方法[62 ] . 如何利用语言进行推 理判断 ,这就要进行词计算. 信息粒化为词计算提供 了前提条件 ,词计算在信息粒度、语言变量和约束概 念上产生了自己的理论与方法 ,意在解决模糊集合 论的数值化隶属度函数表示法的局限性、表达的概 念缺乏前后联系、逻辑表达和算子实现的复杂性等 问题 ,使它们能够更符合人类的思维特点. 词计算有 狭义和广义 2 个方面的概念. 狭义的模糊词计算理 论是指利用通常意义下的数学概念和运算 (如加、 减、乘、除等) 构造的带有语义的模糊数值型的词计 算的理论体系 ;广义的词计算理论统指用词进行推 理、用词构建原型系统和用词编程 ,前者是后者的基 第 6 期 王国胤 ,等 :粒计算研究综述 · 11 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·12 智能系统学报 第2卷 础631.模糊逻辑在词计算中起中心作用,它可以近 (linguistic dynamic systems,LDS),并通过融合几 似地被认为与词计算相同21.在词计算中存在2个 个不同领域的概念和方法),提出基于词计算的语 核心问题:模糊约束的表现问题和模糊约束的繁殖 言动力学系统的计算理论框架,根据这个计算理论 问题,它们是模糊信息粒化的基本准则 框架,利用常规或传统数值动力学系统中己有的成 信息粒化(information granulation)是粒化的 熟概念和方法,对语言动力学系统进行动力学分析、 一种形式.在众多的信息粒化中,非模糊粒化的方法 设计控制和性能评估.这些研究的目的是建立连接 很多,如将问题求解空间形成划分空间,每个粒子都 人类的语言知识表示与计算机的数字知识表示的桥 是精确的.但这种粒化方法不能解决很多现实问题, 梁,成为下一代智能化人机交互的理论基础之一 如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖 总之,词计算理论和方法对于复杂信息系统的 子等粒子,这些粒子之间没有明确的分界线,它们都 模糊推理和控制非常重要,但由于自身的局限性,它 是模糊的粒子.模糊信息粒化是传统信息粒化的一 必须和其他理论体系相结合,才能更有效地处理复 种推广.模糊信息粒化理论I6.6s1(theory of fuzzy 杂信息 information granulation,TFIG建立在模糊逻辑和 3.2粗糙集模型 信息粒化方法基础之上,是从人类利用模糊信息粒 一个对象属于某个集合的程度随着属性粒度的 化方式中获得的启发,其方法的实质是数学 不同而不同,为了更好地刻画集合边界的模糊性,波 Zadeh指出6),除模糊逻辑外,没有一种方法 兰学者Pawlak3]在20世纪80年代提出了粗糙集 能提供概念框架及相关技术,它能在模糊信息粒化 理论,其本质思想是利用不可分辨关系(等价关系) 起主导作用.继Zadeh之后,许多学者开始了有关词 来建立论域的一个划分,得到不区分的等价类(即不 计算的研究工作,Wang61编写了词计算一书.广义 同属性粒度下的概念粒),从而建立一个近似空间 词计算理论的研究工作,中国刚刚起步,李征等 (由不同大小的概念粒形成).在近似空间上,用2个 人676通过研究模糊控制器的结构,认为模糊控制 精确的集合(上近似集和下近似集)来逼近一个边界 实际上是应用了信息粒化和词计算技术,但却只是 模糊的集合如果近似空间的粒度较粗,被近似的集 应用了该技术的初级形式,而基于信息粒化和词计 合的边界域较宽,而如果近似空间的粒度较细,被近 算(IGCW)的模糊控制系统,将具有更强的信息处 似集合的边界域较窄 理和推理判断能力,是对人类智能更高程度的模拟. 给定集合X上的一个划分等价于在X上给定 他们指出,基于信息粒化和词计算的模糊控制系统 一个等价关系R.X/R表示U上由R导出的所有等 是通过信息粒化和重组、多层次的思维决策,动态地 价类,[x]r表示包含元素x的等价类,其中x∈U. 改变下层控制器的参数和推理方法或控制规则,因 Pawlak称之为在论域上给定了一个知识基(X,R) 而使控制器具有变结构和多模态的特性.信息太多 然后讨论一个一般的概念X(U中的一个子集)如何 会延误推理计算的时间,给系统带来不必要的处理 用知识基中的知识来表示.对那些无法用(X,中 任务;而信息太少,则会降低推理结果的完善性.因 的集合的并来表示的集合,借用拓扑中的内核和闭 此,提出了合理重新组织信息的研究课题.随着近年 包的概念,引入下近似和上近似的概念:R.X)= 来智能信息处理的不断深入与普及,特别是处理复 {xU[x]R∈X?和R(X)=fx∈U川[x]R∩X卡 杂系统分析与评估时的迫切需要,人们越来越发现 .当R.(X)≠R°()时,就称X为粗糙集,从而 排除自然语言的代价太大了,首先,从应用角度来 创立了“粗糙集理论”.粗糙集理论是一种软计算方 看,人类已习惯于用自然语言描述和分析事物,特别 法.软计算(soft computing)概念是由模糊集创始人 是涉及社会、政治、经济和管理中的复杂过程.人类 Zadea提出的,6s.传统的计算方法即所谓硬计 可以方便地利用以自然语言表示的前提进行推理和 算,使用精确、固定和不变的算法来表达和解决问 计算,并得到用自然语言表达的结果;其次,从理论 题:而软计算的指导原则是利用所允许的不精确、不 角度来看,不利用自然语言,现有的理论很难甚至不 确定性和部分真实性得到易于处理、鲁棒性强和成 能够处理感性信息,而只能处理测度信息.感性信息 本较低的解决方案,以便更好地与现实系统相协调」 或知识通常只能用自然语言来描述,由于人类分辨 粗糙集理论的研究,己经经历了20多年的时 细节和存储信息的认知能力的内在限制,感性信息 间,无论是在系统理论、计算模型的建立和应用系统 在本质上是不精确的9.2!.Wang利用自然语言知 的研制开发上,都已经取得了很多成果,也建立了一 识和信息,建立以词计算为基础的语言动力学系统 套较为完善的粗糙集理论体系74.5).目前粗糙集理 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
础[63 ] . 模糊逻辑在词计算中起中心作用 ,它可以近 似地被认为与词计算相同[62 ] . 在词计算中存在 2 个 核心问题 :模糊约束的表现问题和模糊约束的繁殖 问题 ,它们是模糊信息粒化的基本准则. 信息粒化 (information granulation) 是粒化的 一种形式. 在众多的信息粒化中 ,非模糊粒化的方法 很多 ,如将问题求解空间形成划分空间 ,每个粒子都 是精确的. 但这种粒化方法不能解决很多现实问题 , 如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖 子等粒子 ,这些粒子之间没有明确的分界线 ,它们都 是模糊的粒子. 模糊信息粒化是传统信息粒化的一 种推广. 模糊信息粒化理论[64 - 65 ] (t heory of f uzzy information granulation ,TFIG) 建立在模糊逻辑和 信息粒化方法基础之上 ,是从人类利用模糊信息粒 化方式中获得的启发 ,其方法的实质是数学. Zadeh 指出[64 ] ,除模糊逻辑外 ,没有一种方法 能提供概念框架及相关技术 ,它能在模糊信息粒化 起主导作用. 继 Zadeh 之后 ,许多学者开始了有关词 计算的研究工作 ,Wang [66 ]编写了词计算一书. 广义 词计算理论的研究工作 ,中国刚刚起步 ,李征等 人[67 - 68 ]通过研究模糊控制器的结构 ,认为模糊控制 实际上是应用了信息粒化和词计算技术 ,但却只是 应用了该技术的初级形式 ,而基于信息粒化和词计 算 (IGCW) 的模糊控制系统 ,将具有更强的信息处 理和推理判断能力 ,是对人类智能更高程度的模拟. 他们指出 ,基于信息粒化和词计算的模糊控制系统 是通过信息粒化和重组、多层次的思维决策 ,动态地 改变下层控制器的参数和推理方法或控制规则 ,因 而使控制器具有变结构和多模态的特性. 信息太多 会延误推理计算的时间 ,给系统带来不必要的处理 任务 ;而信息太少 ,则会降低推理结果的完善性. 因 此 ,提出了合理重新组织信息的研究课题. 随着近年 来智能信息处理的不断深入与普及 ,特别是处理复 杂系统分析与评估时的迫切需要 ,人们越来越发现 排除自然语言的代价太大了. 首先 ,从应用角度来 看 ,人类已习惯于用自然语言描述和分析事物 ,特别 是涉及社会、政治、经济和管理中的复杂过程. 人类 可以方便地利用以自然语言表示的前提进行推理和 计算 ,并得到用自然语言表达的结果 ;其次 ,从理论 角度来看 ,不利用自然语言 ,现有的理论很难甚至不 能够处理感性信息 ,而只能处理测度信息. 感性信息 或知识通常只能用自然语言来描述 ,由于人类分辨 细节和存储信息的认知能力的内在限制 ,感性信息 在本质上是不精确的[69 - 72 ] . Wang 利用自然语言知 识和信息 ,建立以词计算为基础的语言动力学系统 (linguistic dynamic systems ,LDS) ,并通过融合几 个不同领域的概念和方法[37 ] ,提出基于词计算的语 言动力学系统的计算理论框架 ,根据这个计算理论 框架 ,利用常规或传统数值动力学系统中已有的成 熟概念和方法 ,对语言动力学系统进行动力学分析、 设计、控制和性能评估. 这些研究的目的是建立连接 人类的语言知识表示与计算机的数字知识表示的桥 梁 ,成为下一代智能化人机交互的理论基础之一. 总之 ,词计算理论和方法对于复杂信息系统的 模糊推理和控制非常重要 ,但由于自身的局限性 ,它 必须和其他理论体系相结合 ,才能更有效地处理复 杂信息. 312 粗糙集模型 一个对象属于某个集合的程度随着属性粒度的 不同而不同 ,为了更好地刻画集合边界的模糊性 ,波 兰学者 Pawlak [73 ]在 20 世纪 80 年代提出了粗糙集 理论 ,其本质思想是利用不可分辨关系 (等价关系) 来建立论域的一个划分 ,得到不区分的等价类(即不 同属性粒度下的概念粒) ,从而建立一个近似空间 (由不同大小的概念粒形成) . 在近似空间上 ,用 2 个 精确的集合(上近似集和下近似集) 来逼近一个边界 模糊的集合. 如果近似空间的粒度较粗 ,被近似的集 合的边界域较宽 ,而如果近似空间的粒度较细 ,被近 似集合的边界域较窄. 给定集合 X 上的一个划分等价于在 X 上给定 一个等价关系 R . X/ R 表示 U 上由 R 导出的所有等 价类 ,[ x ] R 表示包含元素 x 的等价类 ,其中 x ∈U. Pawlak 称之为在论域上给定了一个知识基 ( X , R) , 然后讨论一个一般的概念 X (U 中的一个子集) 如何 用知识基中的知识来表示. 对那些无法用 ( X , R) 中 的集合的并来表示的集合 ,借用拓扑中的内核和闭 包的概念 ,引入下近似和上近似的概念 : R - ( X) = { x ∈U| [ x ] R Α X}和 R - ( X) = { x ∈U| [ x ] R ∩X ≠ Φ} . 当 R - ( X) ≠R - ( X) 时 ,就称 X 为粗糙集 ,从而 创立了“粗糙集理论”. 粗糙集理论是一种软计算方 法. 软计算(soft comp uting) 概念是由模糊集创始人 Zadea 提出的[61 - 65 ] . 传统的计算方法即所谓硬计 算 ,使用精确、固定和不变的算法来表达和解决问 题;而软计算的指导原则是利用所允许的不精确、不 确定性和部分真实性得到易于处理、鲁棒性强和成 本较低的解决方案 ,以便更好地与现实系统相协调. 粗糙集理论的研究 ,已经经历了 20 多年的时 间 ,无论是在系统理论、计算模型的建立和应用系统 的研制开发上 ,都已经取得了很多成果 ,也建立了一 套较为完善的粗糙集理论体系[ 74 - 75 ] . 目前粗糙集理 · 21 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net