第11卷第6期 智能系统学报 Vol.11 No.6 2016年12月 CAAI Transactions on Intelligent Systems Dec.2016 D0I:10.11992/is.201612014 网络出版t地址:http:/www.cmki.net/kcms/detail/23.1538.TP.20170111.1705.008.html 从人类智能到机器实现模型—粒计算理论与方法 苗夺谦,张清华2,钱宇华3,梁吉业3,王国胤2,吴伟志4,高阳,商琳5,顾沈明,张红云 (1.同济大学嵌入式系统与服务计算教育部重点实验室,上海201804:2.重庆邮电大学计算智能重庆市重点实验室」 重庆400065:3.山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006:4.浙江海洋大学浙江省海 洋大数据挖掘与应用重点实验室,浙江舟山316022:5.南京大学软件新技术国家重点实验室,江苏南京210093)》 摘要:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次 粒结构的思维方式、复杂问题求解、信息处理模式及其相关理论、技术和工具的方法论。本文首先分析了人工智能 模拟人脑智能的粒计算模式与方法,其次总结了粗糙集、商空间、模糊集、云模型、三支决策等几种典型的粒计算基 本构架与数学模型,然后分析知识的多粒度解析表示与不确定性度量的研究现状,最后展望了粒计算求解模式在大 数据时代所面临的机遇与挑战。 关键词:人工智能:大数据:不确定性:粒计算:多粒度:粗糙集:商空间:模糊集;云模型:三支决策 中图分类号:TP391文献标志码:A文章编号:1673-4785(2016)06-0743-15 中文引用格式:苗夺谦,张清华,钱宇华,等.从人类智能到机器实现模型一粒计算理论与方法[J].智能系统学报,2016,11(6): 743-757. 英文引用格式:MIAO Duoqian,ZHANG Qinghua,QIAN Yuhua,etal.From human intelligence to machine implementation mod: el:theories and applications based on granular computing[J].CAAI Transactions on Intelligent Systems,2016,11(6):743-757. From human intelligence to machine implementation model: theories and applications based on granular computing MIAO Duoqian',ZHANG Qinghua2,QIAN Yuhua3,LIANG Jiye3,WANG Guoyin2,WU Weizhi, GAO Yang3,SHANG Lin,GU Shenming',ZHANG Hongyun' (1.Key Laboratory of Embedded System Service Computing Ministry of Education,Tongji University,Shanghai 201804,China; 2.KeyLaboratory of Computational Intelligence,Chongqing University of Posts and Telecommunications,Chongqing 400065,China; 3.Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan 030006,China;4.Key Laboratory of Oceanographic Big Data Mining and Application of Zhejiang Province,Zhejiang Ocean University, Zhoushan 316022,China;5.State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093,China) Abstract:Artificial intelligence is a new science of researching and developing theories,methods and technologies to simulate and extend the human intelligence,and is regarded as a simulation of human consciousness and thought processes.Granular computing is a novel concept and a new computing paradigm in the current area of intelligent information processing.It is also a multi-granulation methodology of relevant theories,technologies and tools,which are used to research multi-level thought modes,to solve complex problems and to develop information processing models.First,the related granular computing models or methods,by which artificial intelligence simulates human intelligence,were analyzed in this paper.Also,several classical basic structures and mathematical models on gran- ular computing were briefly summarized.Then,both multi-granulation representations and uncertainty measure- ments on knowledge were reviewed.Finally,the future opportunities and challenges of solving models using granular computing in the era of big data were discussed and prospected. Keywords:artificial intelligence;big data;uncertainty;granular computing;multi-granulation;rough sets;quo- tient space;cloud model;three-way decisions 收稿日期:2016-12-13. 基金项目:国家自然科学基金项目(61573255,61673301,61472056, 自从1956年人工智能概念的提出,人工智能已 61432011,61572091,61573321,61272021,U1435212,经发展了整整60年。无论是最早的“推理期”、之 41631179). 通信作者:苗夺谦.E-mail:dqmiao@tongji.cdu.cn
第 11 卷第 6 期 智 能 系 统 学 报 Vol.11 №.6 2016 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2016 DOI:10.11992 / tis.201612014 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20170111.1705.008.html 从人类智能到机器实现模型———粒计算理论与方法 苗夺谦1 ,张清华2 ,钱宇华3 ,梁吉业3 ,王国胤2 ,吴伟志4 ,高阳5 ,商琳5 ,顾沈明4 ,张红云1 (1.同济大学 嵌入式系统与服务计算教育部重点实验室,上海 201804; 2.重庆邮电大学 计算智能重庆市重点实验室, 重庆 400065; 3.山西大学 计算智能与中文信息处理教育部重点实验室, 山西 太原 030006; 4. 浙江海洋大学 浙江省海 洋大数据挖掘与应用重点实验室,浙江 舟山 316022; 5.南京大学 软件新技术国家重点实验室,江苏 南京 210093) 摘 要:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学, 是对人的意识、思维过程的模拟。 粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次 粒结构的思维方式、复杂问题求解、信息处理模式及其相关理论、技术和工具的方法论。 本文首先分析了人工智能 模拟人脑智能的粒计算模式与方法,其次总结了粗糙集、商空间、模糊集、云模型、三支决策等几种典型的粒计算基 本构架与数学模型,然后分析知识的多粒度解析表示与不确定性度量的研究现状,最后展望了粒计算求解模式在大 数据时代所面临的机遇与挑战。 关键词:人工智能;大数据;不确定性;粒计算;多粒度;粗糙集;商空间;模糊集;云模型;三支决策 中图分类号: TP391 文献标志码:A 文章编号:1673-4785(2016)06-0743-15 中文引用格式:苗夺谦,张清华,钱宇华,等. 从人类智能到机器实现模型———粒计算理论与方法[J]. 智能系统学报, 2016, 11(6): 743-757. 英文引用格式:MIAO Duoqian, ZHANG Qinghua, QIAN Yuhua, et al. From human intelligence to machine implementation mod⁃ el: theories and applications based on granular computing[J]. CAAI Transactions on Intelligent Systems, 2016, 11(6): 743-757. From human intelligence to machine implementation model: theories and applications based on granular computing MIAO Duoqian 1 , ZHANG Qinghua 2 , QIAN Yuhua 3 , LIANG Jiye 3 , WANG Guoyin 2 , WU Weizhi 4 , GAO Yang 5 , SHANG Lin 5 , GU Shenming 4 , ZHANG Hongyun 1 (1. Key Laboratory of Embedded System & Service Computing Ministry of Education, Tongji University, Shanghai 201804, China; 2. KeyLaboratory of Computational Intelligence, Chongqing University of Posts and Telecommunications, Chongqing 400065, China; 3. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, Shanxi University, Taiyuan 030006, China; 4. Key Laboratory of Oceanographic Big Data Mining and Application of Zhejiang Province, Zhejiang Ocean University, Zhoushan 316022, China; 5. State Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210093, China) Abstract:Artificial intelligence is a new science of researching and developing theories, methods and technologies to simulate and extend the human intelligence, and is regarded as a simulation of human consciousness and thought processes. Granular computing is a novel concept and a new computing paradigm in the current area of intelligent information processing. It is also a multi⁃granulation methodology of relevant theories, technologies and tools, which are used to research multi⁃level thought modes, to solve complex problems and to develop information processing models. First, the related granular computing models or methods, by which artificial intelligence simulates human intelligence, were analyzed in this paper. Also, several classical basic structures and mathematical models on gran⁃ ular computing were briefly summarized. Then, both multi⁃granulation representations and uncertainty measure⁃ ments on knowledge were reviewed. Finally, the future opportunities and challenges of solving models using granular computing in the era of big data were discussed and prospected. Keywords: artificial intelligence; big data; uncertainty; granular computing; multi⁃granulation; rough sets; quo⁃ tient space; cloud model; three⁃way decisions 收稿日期:2016-12-13. 基金项目:国家自然科学基金项目 ( 61573255, 61673301, 61472056, 61432011 , 61572091, 61573321, 61272021, U1435212, 41631179). 通信作者:苗夺谦. E⁃mail:dqmiao@ tongji.edu.cn. 自从 1956 年人工智能概念的提出,人工智能已 经发展了整整 60 年。 无论是最早的“推理期”、之
.744 智能系统学报 第11卷 后的“知识期”,还是目前蓬勃发展的“学习期”,这 司营销模式分析。2017年SCI二区期刊信息科学 些历史时期都产生了极为璀璨的人工智能理论与技 专辑“大数据时代基于粒计算的机器学习”[)明确 术,有力推动了信息技术的快速发展。目前,人工智 指出,除了粒计算理论和模型的研究外,收稿范围扩 能研究主要从两个方面展开:一类着重于感知机理 展到所有与粒计算相关的工业界研究成果。专辑实 的理解与模拟,包括视觉、触觉、嗅觉、听觉等动态输 际收录推荐系统、入侵检测等应用达一半之多。 入的理解与建模:另一类着重于认知机理的理解与 当前,互联网和大数据催生了领域问题的大规 模拟,重点关注人类较高层次的认知机理与信息处 模和复杂化。从人工智能角度来看,粒计算是模拟 理方法,包括人类的学习能力、求解能力、推理能力、 人类思考和解决大规模复杂问题的结构化求解模 决策能力等。 式,从实际问题的需要出发,用可行的满意近似解 1 粒计算的发展及特点 替代精确解。该理论改变了传统的计算观念,达到 对问题的简化、提高问题求解效率等目的6。事实 粒计算(granular computing)是当前人工智能领 上,粒计算不仅是人类认知的一种天然特性,也是许 域中一种新的概念和计算范式,是研究基于多层次 多智能分析任务的内在需求。揭示和模拟人类的这 粒结构的思维方式、问题求解方法、信息处理模式及 种粒计算认知机理对人工智能发展具有重要作用。 其相关理论、技术和工具的学科,属于人类较高层次 1.1粒化思维的优越性 认知机理研究的范畴。自1997年Zadeh第1次 正如张钹院士[]所指出的“人类智能的一个公 提出粒计算的概念以来,涌现出许多关于粒计算研 认特点,就是人们能从极不相同的粒度上观察和分 究的学术及应用成果。从研究水平来看,2016年国 析同一问题,并且很容易地从一个粒度世界转到另 际期刊Journal of Granular Computing2)]在Springer 一个粒度世界”。这强有力地表现了人类问题求解 创刊:国际学术会议有每年一次的CRS:国内会议 过程中具备了在多个粒度空间之间进行通信和转换 有每年一次的CRSSC-CWI-CGrC:在近年来的国家 的能力。基于多粒度的数据建模就是通过获得的信 自然科学基金申请中,粒计算理论及应用已经成为 息粒集和多个粒结构进行复杂数据分析,从中挖掘 信息学部的申请和研究热点之一)。与此同时, 可用的知识并形成有效决策。若数据建模仅使用一 Web-of-Science检索结果显示,以粒计算为主题的 个粒结构,则称其为基于单粒度的数据建模:若使用 文章除了计算机科学学科外,与多个学科具有关联 多个粒结构,则称其为基于多粒度的数据建模。 (见表1)。 “横看成岭侧成峰,远近高低各不同”,由于多粒度 表1以粒计算为主题的SCI论文学科及高引论文分布 分析从多个角度、多个层次出发分析问题,可获得对 Table 1 Distribution of disciplines and its highly cited pa- 于问题更加合理、更加满意的求解结果。总之,基于 per count on topic granular computing 多粒度原理的模拟与实现对复杂问题的机器求解具 研究领域记录数所占比例/%高引论文数 有重要指导价值。 计算机科学 1256 47.059 26 1.2多粒度结构的普遍性 工程 919 34.432 2 许多数据具有多粒度、多层次特性。比如,对于 广泛存在的生物网络数据,Nir Friedma等[s]在《Sci- 物理 285 10.678 1 ence》上发表的论文就认为在诸如复杂细胞网络、蛋 材料科学 193 7.231 1 白质互作用网络等生物数据中都广泛存在着多层 机械 189 7.081 0 次、多尺度特性。Clauset等9)在《Nature》上发表的 数学 165 6.182 0 论文也指出,在复杂社会网络中也存在天然的层次 地理科学 124 4.646 0 结构,而社会网络面临的数据自身就是广泛存在的 从研究内容看,早期粒计算的应用研究主要集 多模态数据。Ahn等uo则专门研究了大规模复杂 中在数据粒化、多粒度分析、知识发现等方面。自 数据的多尺度复杂性特性。在军事、气象等领域,由 2013年以来,有关粒计算的研究呈现出较强的应用 卫星获得的多波段遥感数据也是典型的具有多层 价值。2015年在天津召开的RSFDGrC国际会议[4) 次、多尺度特性的多模态数据山。这些都暗示着反 上,发表的有关粒计算研究成果中,超过半数有关应 映复杂的模式发现与推理决策的多模态数据必然隐 用研究,如台湾省的Kao-Yi Shen和Gwo-Hshiung 含着由这些数据所决定的局部与整体关系以及复杂 Tzeng将决策粗糙集和粒计算的方法应用于寿险公 的层次结构,即数据的多粒度/多层次特性。诸多数
后的“知识期”,还是目前蓬勃发展的“学习期”,这 些历史时期都产生了极为璀璨的人工智能理论与技 术,有力推动了信息技术的快速发展。 目前,人工智 能研究主要从两个方面展开:一类着重于感知机理 的理解与模拟,包括视觉、触觉、嗅觉、听觉等动态输 入的理解与建模;另一类着重于认知机理的理解与 模拟,重点关注人类较高层次的认知机理与信息处 理方法,包括人类的学习能力、求解能力、推理能力、 决策能力等。 1 粒计算的发展及特点 粒计算(granular computing)是当前人工智能领 域中一种新的概念和计算范式,是研究基于多层次 粒结构的思维方式、问题求解方法、信息处理模式及 其相关理论、技术和工具的学科,属于人类较高层次 认知机理研究的范畴。 自 1997 年 Zadeh [1] 第 1 次 提出粒计算的概念以来,涌现出许多关于粒计算研 究的学术及应用成果。 从研究水平来看,2016 年国 际期刊 Journal of Granular Computing [2] 在 Springer 创刊;国际学术会议有每年一次的 IJCRS;国内会议 有每年一次的 CRSSC⁃CWI⁃CGrC;在近年来的国家 自然科学基金申请中,粒计算理论及应用已经成为 信息学部的申请和研究热点之一[3] 。 与此同时, Web⁃of⁃Science 检索结果显示,以粒计算为主题的 文章除了计算机科学学科外,与多个学科具有关联 (见表 1)。 表 1 以粒计算为主题的 SCI 论文学科及高引论文分布 Table 1 Distribution of disciplines and its highly cited pa⁃ per count on topic granular computing 研究领域 记录数 所占比例/ % 高引论文数 计算机科学 1 256 47.059 26 工程 919 34.432 2 物理 285 10.678 1 材料科学 193 7.231 1 机械 189 7.081 0 数学 165 6.182 0 地理科学 124 4.646 0 从研究内容看,早期粒计算的应用研究主要集 中在数据粒化、多粒度分析、知识发现等方面。 自 2013 年以来,有关粒计算的研究呈现出较强的应用 价值。 2015 年在天津召开的 RSFDGrC 国际会议[4] 上,发表的有关粒计算研究成果中,超过半数有关应 用研究,如台湾省的 Kao⁃Yi Shen 和 Gwo⁃Hshiung Tzeng 将决策粗糙集和粒计算的方法应用于寿险公 司营销模式分析。 2017 年 SCI 二区期刊信息科学 专辑“大数据时代基于粒计算的机器学习” [5] 明确 指出,除了粒计算理论和模型的研究外,收稿范围扩 展到所有与粒计算相关的工业界研究成果。 专辑实 际收录推荐系统、入侵检测等应用达一半之多。 当前,互联网和大数据催生了领域问题的大规 模和复杂化。 从人工智能角度来看, 粒计算是模拟 人类思考和解决大规模复杂问题的结构化求解模 式, 从实际问题的需要出发, 用可行的满意近似解 替代精确解。 该理论改变了传统的计算观念,达到 对问题的简化、提高问题求解效率等目的[6] 。 事实 上,粒计算不仅是人类认知的一种天然特性,也是许 多智能分析任务的内在需求。 揭示和模拟人类的这 种粒计算认知机理对人工智能发展具有重要作用。 1.1 粒化思维的优越性 正如张钹院士[7] 所指出的“人类智能的一个公 认特点,就是人们能从极不相同的粒度上观察和分 析同一问题,并且很容易地从一个粒度世界转到另 一个粒度世界”。 这强有力地表现了人类问题求解 过程中具备了在多个粒度空间之间进行通信和转换 的能力。 基于多粒度的数据建模就是通过获得的信 息粒集和多个粒结构进行复杂数据分析,从中挖掘 可用的知识并形成有效决策。 若数据建模仅使用一 个粒结构,则称其为基于单粒度的数据建模;若使用 多个粒结构, 则称其为基于多粒度的数据建模。 “横看成岭侧成峰,远近高低各不同”,由于多粒度 分析从多个角度、多个层次出发分析问题,可获得对 于问题更加合理、更加满意的求解结果。 总之,基于 多粒度原理的模拟与实现对复杂问题的机器求解具 有重要指导价值。 1.2 多粒度结构的普遍性 许多数据具有多粒度、多层次特性。 比如,对于 广泛存在的生物网络数据,Nir Friedma 等[8] 在《Sci⁃ ence》上发表的论文就认为在诸如复杂细胞网络、蛋 白质互作用网络等生物数据中都广泛存在着多层 次、多尺度特性。 Clauset 等[9] 在《Nature》上发表的 论文也指出,在复杂社会网络中也存在天然的层次 结构,而社会网络面临的数据自身就是广泛存在的 多模态数据。 Ahn 等[10] 则专门研究了大规模复杂 数据的多尺度复杂性特性。 在军事、气象等领域,由 卫星获得的多波段遥感数据也是典型的具有多层 次、多尺度特性的多模态数据 [11] 。 这些都暗示着反 映复杂的模式发现与推理决策的多模态数据必然隐 含着由这些数据所决定的局部与整体关系以及复杂 的层次结构,即数据的多粒度/ 多层次特性。 诸多数 ·744· 智 能 系 统 学 报 第 11 卷
第6期 苗夺谦,等:从人类智能到机器实现模型一粒计算理论与方法 .745. 据异构变量之间往往具有天然的多粒度形态。不同 方法,对数据挖掘、知识发现、机器学习等领域的发 于同构变量,它们可以自然地表达为一个线性空间。 展具有重要的理论意义,同时对提高海量信息处理 比如在多模态数据中,异构变量之间由于语义的不 的效率具有实际的应用价值。需要指出的是,粒计 一致,它的知识表示和运算是挑战性问题。然而,这 算自然地具有多学科交叉的特性,粒计算的研究与 也正是人类的重要认知能力之一,人们可以从不同 发展有望推动信息科学、认知科学、数学等相关学科 的传感器收集信息并进行有效融合以形成合理推理 的深度融合,为人工智能各领域的共同繁荣、人工智 与决策。事实上,多模态数据既可以提供互补信息 能真正地成为类人智能做出贡献。 还可以提供协同信息,这是多模态数据分析的重要 2粒计算基本理论模型 优势之一。互补信息是指多种传感器观测到的相互 独立的特征信息,它可以扩展系统的性能:而协同信 随着粒计算研究工作的不断深入,人们从不同 息则指的是单一传感器无法获得,需要依靠多种传 的角度研究得到了不同的粒计算理论模型,主要有 感器协同作用才能获得的信息,它可以进一步扩大 模糊集理论模型、粗糙集理论模型、商空间理论模 系统的控制范围。从粒计算的观点来看,在不同变 型、云模型和三支决策理论模型等。粒计算理论模 量上对同一数据集获得的粒结构可能是不一样的, 型大体分为两大类:一类是以信息的粒化为目标,如 这为该数据的理解和认知提供了天然的具有互补性 模糊集理论模型:另一类则以多粒度计算为目标,如 的多粒度结构。 粗糙集理论模型、商空间理论模型、云模型和三支决 1.3认知结构的多粒度性 策理论模型。下面是它们的简单介绍。 近年来在人工智能领域最受关注的非深度学习 2.1模糊集理论模型 莫属。自20O6年Geoffrey Hinton等i]在《Science》 模糊集理论是Zadeh于1965年首先提出 期刊发表“Reducing the dimensionality of data with 的,他认为元素总是以一定的程度属于某个集合,也 neural networks”开始,深度学习的热潮从学术界席 可能以不同的程度属于几个集合。它是对经典集合 卷到了整个工业界。深度学习正是模拟人类大脑神 理论的扩展,最主要的贡献在于引入了集合中元素 经网络潜在地利用事物的底层特征到抽象特征的层 对该集合的“隶属度”,从而将经典集合理论的特征 次结构模型来认知事物的内在机制与原理,这是一 函数取值范围由{0,1}推广到区间值[0,1],将经典 种典型的多粒度结构。深度学习提供了一套丰富 二值逻辑推广至多值逻辑,而集合中元素对集合本 的、基于连接主义的建模框架,可以表达数据内在的 身的“隶属度”主要通过隶属函数来表示。“隶属 丰富的粒度关系和结构。特别是,深度学习在图像、 度”的相关定义如下: 文字、语音等领域的识别方面取得了巨大成功,这些 给定论域U上的一个模糊集F,对于任意x∈ 数据类型正是多粒度数据的重要组成部分。粒计算 U都确定了一个(x),(x)称为x对F的隶属 与深度学习有机结合[1]将是非常值得期待的研究 度。映射:up:U→[0,1],称为F的隶属函数。 方问。 隶属函数的值域为[0,1],当u(x)∈{0,1}时,模 1.4任务处理的多粒度性 糊集F就是一个普通集合。一般地,用F,表示 在实际应用中,用户需求的多粒度特性决定了 u(x)≥入的集合,称为入截集或入水平集:F= 信息处理任务的多粒度特性。比如,在视频分析领 {xlu(x)≥A,x∈U川 域,数据挖掘任务可能是面向视频主题进行分类的, 而入强截集定义为 也可能是面向主角进行分类的,也可能是面向视频 F·={xu(x)>入,x∈U明 性质进行分类的。又如,在网络大数据领域,社团发 模糊集理论中,隶属函数扮演着基石的角色。 现任务本身就是不同的粒度水平决定了发现社团的 王国胤教授[16)指出了模糊集是用不精确的方法来 规模,不同的粒度水平观测到的网络动力学行为可 刻画不确定问题,其原因在于获取隶属度值是不确 能都是有所区别的。这些都使得挖掘任务可能同时 定的。在后续的研究中将精确唯一的隶属度值进行 面向不同层次、不同粒度,这个多粒度特性要求数据 种种拓展,形成了许多新的理论体系,主要有直觉模 挖掘工具能够从多个粒度上同时探索数据隐含的模 糊集、二型模糊集、区间模糊集和Vague集等。 式,并进行有效融合,形成对事物的整体客观认识。 模糊集理论研究的是一种不确定性现象,主要 借鉴人类的这种粒计算认知机理,开展数据驱 针对于人类智能的研究,目的是使计算机能够模拟 动的人工智能研究,有望诞生新的人工智能理论与 人的智能,具有能够在不精确以及部分精确的环境
据异构变量之间往往具有天然的多粒度形态。 不同 于同构变量,它们可以自然地表达为一个线性空间。 比如在多模态数据中,异构变量之间由于语义的不 一致,它的知识表示和运算是挑战性问题。 然而,这 也正是人类的重要认知能力之一,人们可以从不同 的传感器收集信息并进行有效融合以形成合理推理 与决策。 事实上,多模态数据既可以提供互补信息 还可以提供协同信息,这是多模态数据分析的重要 优势之一。 互补信息是指多种传感器观测到的相互 独立的特征信息,它可以扩展系统的性能;而协同信 息则指的是单一传感器无法获得,需要依靠多种传 感器协同作用才能获得的信息,它可以进一步扩大 系统的控制范围。 从粒计算的观点来看,在不同变 量上对同一数据集获得的粒结构可能是不一样的, 这为该数据的理解和认知提供了天然的具有互补性 的多粒度结构。 1.3 认知结构的多粒度性 近年来在人工智能领域最受关注的非深度学习 莫属。 自 2006 年 Geoffrey Hinton 等[12] 在《 Science》 期刊发表“ Reducing the dimensionality of data with neural networks”开始,深度学习的热潮从学术界席 卷到了整个工业界。 深度学习正是模拟人类大脑神 经网络潜在地利用事物的底层特征到抽象特征的层 次结构模型来认知事物的内在机制与原理,这是一 种典型的多粒度结构。 深度学习提供了一套丰富 的、基于连接主义的建模框架,可以表达数据内在的 丰富的粒度关系和结构。 特别是,深度学习在图像、 文字、语音等领域的识别方面取得了巨大成功,这些 数据类型正是多粒度数据的重要组成部分。 粒计算 与深度学习有机结合[13] 将是非常值得期待的研究 方向。 1.4 任务处理的多粒度性 在实际应用中,用户需求的多粒度特性决定了 信息处理任务的多粒度特性。 比如,在视频分析领 域,数据挖掘任务可能是面向视频主题进行分类的, 也可能是面向主角进行分类的,也可能是面向视频 性质进行分类的。 又如,在网络大数据领域,社团发 现任务本身就是不同的粒度水平决定了发现社团的 规模,不同的粒度水平观测到的网络动力学行为可 能都是有所区别的。 这些都使得挖掘任务可能同时 面向不同层次、不同粒度,这个多粒度特性要求数据 挖掘工具能够从多个粒度上同时探索数据隐含的模 式,并进行有效融合,形成对事物的整体客观认识。 借鉴人类的这种粒计算认知机理,开展数据驱 动的人工智能研究,有望诞生新的人工智能理论与 方法,对数据挖掘、知识发现、机器学习等领域的发 展具有重要的理论意义,同时对提高海量信息处理 的效率具有实际的应用价值。 需要指出的是,粒计 算自然地具有多学科交叉的特性,粒计算的研究与 发展有望推动信息科学、认知科学、数学等相关学科 的深度融合,为人工智能各领域的共同繁荣、人工智 能真正地成为类人智能做出贡献。 2 粒计算基本理论模型 随着粒计算研究工作的不断深入,人们从不同 的角度研究得到了不同的粒计算理论模型,主要有 模糊集理论模型、粗糙集理论模型、商空间理论模 型、云模型和三支决策理论模型等。 粒计算理论模 型大体分为两大类:一类是以信息的粒化为目标,如 模糊集理论模型;另一类则以多粒度计算为目标,如 粗糙集理论模型、商空间理论模型、云模型和三支决 策理论模型。 下面是它们的简单介绍。 2.1 模糊集理论模型 模糊集理论[14] 是 Zadeh 于 1965 年首先提出 的,他认为元素总是以一定的程度属于某个集合,也 可能以不同的程度属于几个集合。 它是对经典集合 理论的扩展,最主要的贡献在于引入了集合中元素 对该集合的“隶属度”,从而将经典集合理论的特征 函数取值范围由{0,1}推广到区间值[0,1],将经典 二值逻辑推广至多值逻辑,而集合中元素对集合本 身的“隶属度” 主要通过隶属函数来表示。 “隶属 度”的相关定义如下: 给定论域 U 上的一个模糊集 F, 对于任意 x ∈ U 都确定了一个 μF(x), μF(x) 称为 x 对 F 的隶属 度[15] 。 映射: μF :U → [0,1] , 称为 F 的隶属函数。 隶属函数的值域为 [0,1], 当 μF(x) ∈{0,1} 时,模 糊集 F 就是一个普通集合。 一般地,用 Fλ 表示 μF (x) ≥ λ 的集合,称为 λ 截集或 λ 水平集: Fλ = {x μF(x) ≥ λ, x ∈ U} 而 λ 强截集定义为 Fλ + = {x μF(x) > λ, x ∈ U} 模糊集理论中,隶属函数扮演着基石的角色。 王国胤教授[16]指出了模糊集是用不精确的方法来 刻画不确定问题,其原因在于获取隶属度值是不确 定的。 在后续的研究中将精确唯一的隶属度值进行 种种拓展,形成了许多新的理论体系,主要有直觉模 糊集、二型模糊集、区间模糊集和 Vague 集等。 模糊集理论研究的是一种不确定性现象,主要 针对于人类智能的研究,目的是使计算机能够模拟 人的智能,具有能够在不精确以及部分精确的环境 第 6 期 苗夺谦,等: 从人类智能到机器实现模型———粒计算理论与方法 ·745·
·746 智能系统学报 第11卷 下给出合理决策的能力,而这一能力的基础就是对 与知识的粒度粗细存在正相关的关系:知识粒度越 信息的模糊粒化。Zadeh在文献[17]中将粒定义为 粗,它的不确定性越大(边界域越大)。在粗糙集理 一个命题,定义并讨论了模糊粒的概率分布及概率 论中,知识被表示为对特定空间上的对象的划分能 的计算方法。随着模糊集理论的不断发展完善,使 力,知识粒度被表示为对象的等价类,相同的知识称 得以模糊逻辑和信息粒化为基础的模糊信息粒化理 为不可分辨。以粗糙集理论为基础的粒计算研究, 论,-1]得以更好地实现,它们为词计算的发展提 就是对知识空间上粒的表示、转换和相互依存等问 供了前提条件。 题进行相关研究,以期得到更精确的知识表达。 2.2粗糙集理论模型 2.3商空间理论模型 波兰学者Pawlak[1]在20世界80年代提出了 张钹院士和张铃教授[20]在研究问题求解时,开 粗糙集理论,它是一种处理不精确和不确定性知识 创性地提出了商空间理论。商空间理论模型可以用 的数学工具。粗糙集理论的本质是利用不可分辨关 一个三元组(X,f,T)来表示:X表示问题论域,f表 系(等价关系R)构成对象的等价类(X/R),而所 示论域的属性,T是表示论域的拓扑结构。对于 有的等价类形成论域(U)的划分,从而建立一个近 个给定的论域X的等价关系R,可以得到一个对应 似空间。在近似空间中,通过下近似集(R(X))和 于R的商集[X],然后将[X]当成新的论域,必有 上近似集(R(X))等概念刻画知识的不确定和不 一个对应的三元组([X],[f刀,[T]),称其为对应 精确性。它们的定义为 于R的商空间。商空间理论的推理模型主要依据 R(X)={x∈UI[x]RCX} 两个重要的性质:一个是“保真原理”,指若一个命 题在两个较细粒度的商空间中是真的,则(在一定 R(X)={x∈U1[x]R∩X≠☑ 条件下)在其合成的商空间中对应的问题也是真 下近似集和上近似集把论域分成3个部分,分 的:另一个是“保假原理”,指若一个命题在粗粒度 别为正区域(POS(X))、负区域(NEG.(X))和 空间中是假的,则该命题在比它细的商空间中也一 边界域(BNDx(X)): 定为假。 POS(X)=R(X) 商空间理论的目的是研究不同商空间之间的关 NEG(X)=U-R(X) 系、商空间的分解、合成和推理规律。它将复杂问题 表示成不同粗细的粒度空间,然后构建多粒度的分 BND(X)=R(X)-R(X) 层递阶商空间结构,并通过由粗到细或由细到粗的 从图1可知,在粒度一定的情况下,假设黑线勾 方式,利用“保真原理”和“保假原理”逐层在多粒度 勒出的知识表示概念X,那么概念X的下近似集就 空间中进行多级逼近推理,最后将多粒度空间中粒 是由完全属于边界域范围内粒子组成,在图形中用 的解组合成原始问题难题或整体粒的解,从而获得 黑体部分表示:概念X的上近似集包括灰色部分和 复杂问题的解。 黑色部分组成:概念X的边界域由是灰色部分组 2.4云模型 成。那么由此可以看出,当知识粒度越小,那么下近 1995年李德毅院士在概率论和模糊数学的基 似集越大,边界越小。 础上提出隶属云和隶属云发生器[21),并进一步发展 为云模型四。云的定义如下所示: 设U是一个用精确数值表示的定量论域,C是 U上的定性概念,若定量值x∈U,且x是定性概念 C的一次随机实现,x对C的确定度u(x)∈[0,1] 是具有稳定倾向的随机数。 若u:U→[0,1],x∈U,x一u(x)则x 在论域U上的分布称为云,每一个x称为云滴。 集合的边界X的下近似的上、下近似之差 云由若干云滴组成,云滴是某个定性概念的 图1粗糙集的上下近似集与边界域图 次随机实现,多次产生的云滴可以综合反映这个定 Fig.1 Upper approximation,lower approximation and 性概念的整体特征。某个概念的整体特征可以用云 boundary region of rough set 的3个数字特征来表示,即期望Ex、熵En和超熵 图1表明,知识是有粒度的,且知识的不确定性 He。云和云的数字特征如图2所示
下给出合理决策的能力,而这一能力的基础就是对 信息的模糊粒化。 Zadeh 在文献[17]中将粒定义为 一个命题,定义并讨论了模糊粒的概率分布及概率 的计算方法。 随着模糊集理论的不断发展完善,使 得以模糊逻辑和信息粒化为基础的模糊信息粒化理 论[1,17-18]得以更好地实现,它们为词计算的发展提 供了前提条件。 2.2 粗糙集理论模型 波兰学者 Pawlak [19] 在 20 世界 80 年代提出了 粗糙集理论,它是一种处理不精确和不确定性知识 的数学工具。 粗糙集理论的本质是利用不可分辨关 系(等价关系 R ) 构成对象的等价类( X / R ),而所 有的等价类形成论域( U )的划分,从而建立一个近 似空间。 在近似空间中,通过下近似集( R_ (X) )和 上近似集( R - (X) ) 等概念刻画知识的不确定和不 精确性。 它们的定义为 R_ (X) = {x ∈ U | [x] R ⊆ X} R - (X) = {x ∈ U | [x] R ∩ X ≠ ∅} 下近似集和上近似集把论域分成 3 个部分,分 别为正区域( POSR(X) )、负区域( NEGR(X) ) 和 边界域( BNDR(X) ): POSR(X) = R_ (X) NEGR(X) = U - R - (X) BNDR(X) = R - (X) - R_ (X) 从图 1 可知,在粒度一定的情况下,假设黑线勾 勒出的知识表示概念 X, 那么概念 X 的下近似集就 是由完全属于边界域范围内粒子组成,在图形中用 黑体部分表示;概念 X 的上近似集包括灰色部分和 黑色部分组成;概念 X 的边界域由是灰色部分组 成。 那么由此可以看出,当知识粒度越小,那么下近 似集越大,边界越小。 图 1 粗糙集的上下近似集与边界域图 Fig.1 Upper approximation, lower approximation and boundary region of rough set 图 1 表明,知识是有粒度的,且知识的不确定性 与知识的粒度粗细存在正相关的关系:知识粒度越 粗,它的不确定性越大(边界域越大)。 在粗糙集理 论中,知识被表示为对特定空间上的对象的划分能 力,知识粒度被表示为对象的等价类,相同的知识称 为不可分辨。 以粗糙集理论为基础的粒计算研究, 就是对知识空间上粒的表示、转换和相互依存等问 题进行相关研究,以期得到更精确的知识表达。 2.3 商空间理论模型 张钹院士和张铃教授[20]在研究问题求解时,开 创性地提出了商空间理论。 商空间理论模型可以用 一个三元组 (X,f,T) 来表示: X 表示问题论域, f 表 示论域的属性, T 是表示论域的拓扑结构。 对于一 个给定的论域 X 的等价关系 R, 可以得到一个对应 于 R 的商集 [X], 然后将 [X] 当成新的论域,必有 一个对应的三元组 ([X], [f], [T]), 称其为对应 于 R 的商空间。 商空间理论的推理模型主要依据 两个重要的性质:一个是“保真原理”,指若一个命 题在两个较细粒度的商空间中是真的,则(在一定 条件下) 在其合成的商空间中对应的问题也是真 的;另一个是“保假原理”,指若一个命题在粗粒度 空间中是假的,则该命题在比它细的商空间中也一 定为假。 商空间理论的目的是研究不同商空间之间的关 系、商空间的分解、合成和推理规律。 它将复杂问题 表示成不同粗细的粒度空间,然后构建多粒度的分 层递阶商空间结构,并通过由粗到细或由细到粗的 方式,利用“保真原理”和“保假原理”逐层在多粒度 空间中进行多级逼近推理,最后将多粒度空间中粒 的解组合成原始问题难题或整体粒的解,从而获得 复杂问题的解。 2.4 云模型 1995 年李德毅院士在概率论和模糊数学的基 础上提出隶属云和隶属云发生器[21] ,并进一步发展 为云模型[22] 。 云的定义如下所示: 设 U 是一个用精确数值表示的定量论域, C 是 U 上的定性概念,若定量值 x ∈ U, 且 x 是定性概念 C 的一次随机实现, x 对 C 的确定度 μ(x) ∈ [0,1] 是具有稳定倾向的随机数。 若 μ:U → [0,1], ∀ x ∈U, x → μ(x) 则 x 在论域 U 上的分布称为云,每一个 x 称为云滴。 云由若干云滴组成,云滴是某个定性概念的一 次随机实现,多次产生的云滴可以综合反映这个定 性概念的整体特征。 某个概念的整体特征可以用云 的 3 个数字特征来表示,即期望 Ex、熵 En 和超熵 He。 云和云的数字特征如图 2 所示。 ·746· 智 能 系 统 学 报 第 11 卷
第6期 苗夺谦,等:从人类智能到机器实现模型一粒计算理论与方法 .747. 1.0 象的属性进行粒度变换及多粒度运算后,使得不确 0.9 0.8 定域对象的粒度由粗糙逐步细化,从而我们对不确 0.7 定域对象逐步向接受域和拒绝域转换,使得不确定 0.6 0.5 He 域的认知愈加清晰。 0.4 03 0.2 3知识的多粒度表示 0.1 04 基于单粒度的粒计算模型虽然具有粒计算的所 Ex 有要素(粒化、粒层、粒算子、粒度),但是由于只能 图2高斯云及其数字特征示意 Fig.2 Gaussian cloud and its numerical characteristics 从某个角度近似求解,潜在地丢失了复杂问题中多 角度信息对问题求解的贡献。构造以单粒度为基础 云模型作为用语言值描述的某个定性概念与其 的多粒度可以融合单粒度的信息,充分利用不同粒 数值表示之间的不确定性转换模型,可以刻画语言 度之间的关系,具有更强的表示能力。因此,知识的 值中大量存在的随机性、模糊性以及两者之间的关 多粒度表示与信息融合具有内在的一致性。 联性。它主要基于高斯混合模型从原始数据中提取 许多研究表明,多粒度表示下的求解在计算复 概念(粒化),以云滴的方式对概念进行表示(粒度 杂度、求解性能等方面具有更好的效果。文献[26] 表达),通过云的跃迁构建云模型的层次结构(粒的 研究了社会网络中的平衡转化与计算问题,实验证 层次构建),利用云模型的3个数字特征进行云运 明通过结合不同社团内部和社团之间的结构化信 算和云推理(粒计算)。作为粒计算的基本模型之 息,提出的算法MOEA/D-SB具有最小的计算代价 一,云模型具有粒计算从不同的层次、不同的角度观 (H),如图3所示。文献[27]从图像和连环画两 察和分析问题的特点,具有粒计算将复杂问题分解 个本体的结构化设计出发,实现了对纸质连环画结 成若干子问题分别求解,降低计算复杂度的特点。 构的自动分析,如图4所示。 2.5三支决策理论模型 81 三支决策理论[2-]最初是由加拿大里贾纳大 -MOEA/D-SB -·-MOEA/D-CD 学的姚一豫在粒计算和粗糙集理论的研究基础上提 --NSGA-II-CD ---MODPSO 出的。三支决策的主要思想就是将待求解问题通过 MLMSB 映射f分解为3个部分:L域、M域和R-域,然后对 ◆FEC ·■ORE2014 不同的部分采用不同的处理方法进行分析求解,它 为复杂问题求解提供了一种有效的策略与方法。根 据映射∫的不同,分为定性三支决策和定量三支决 策。在定量三支决策模型中,通过映射函数,以及引 0.2 0.40.6 0.8 1.0 入的一对阈值(α,B)(一般1≥≥B≥0),在三支 Cost coefficient w 决策空间中进行3个区域的计算,如下所示[2]: (a)GGs网络 接受域:ACP(a,)(E,A)={x∈U1E(A)(x)≥ 300 a MOEA/D-SB 250F ··-MOEA/D-CD 拒绝域:REJa(E,A)={x∈UIE(A)(x)≤B ·--NSGA-I-CD --MODPSO 不确定域:UNC((E,A)={x∈UB<E(A)<a 200 MLMSB 式中:E(A)为论域U上关于集合A二U的映射函 ·FEC 150 ■ORE2014 数。一般情况下,不确定域与M-域相对应,接受域 和拒绝域则根据实际情况与L域和R-域相对应。 1004 ◆ 三支决策理论很好地模拟了人类解决实际问题 50 “、 的思维,首先确定了接受域(即明确接受的部分)和 0.20.40.60.8 10 拒绝域(即明确拒绝的部分),然后重点研究不确定 Cost coefficient w 域的待确认部分。不确定域是不精确对象的集合, (b)War Network 对不确定域求解的目的就是降低其不精确性,实际 图3不同权重参数下无向符号社会网络转换代价 上就是对不确定域进行多粒度挖掘。不确定域的不 Fig.3 Transformation cost Hw with the parameter w 精确性主要受对象的粒度过粗影响,当我们基于对 for undirected signed network
图 2 高斯云及其数字特征示意 Fig.2 Gaussian cloud and its numerical characteristics 云模型作为用语言值描述的某个定性概念与其 数值表示之间的不确定性转换模型,可以刻画语言 值中大量存在的随机性、模糊性以及两者之间的关 联性。 它主要基于高斯混合模型从原始数据中提取 概念(粒化),以云滴的方式对概念进行表示(粒度 表达),通过云的跃迁构建云模型的层次结构(粒的 层次构建),利用云模型的 3 个数字特征进行云运 算和云推理(粒计算)。 作为粒计算的基本模型之 一,云模型具有粒计算从不同的层次、不同的角度观 察和分析问题的特点,具有粒计算将复杂问题分解 成若干子问题分别求解,降低计算复杂度的特点。 2.5 三支决策理论模型 三支决策理论[22-24] 最初是由加拿大里贾纳大 学的姚一豫在粒计算和粗糙集理论的研究基础上提 出的。 三支决策的主要思想就是将待求解问题通过 映射 f 分解为 3 个部分: L⁃域、M⁃域和R⁃域, 然后对 不同的部分采用不同的处理方法进行分析求解,它 为复杂问题求解提供了一种有效的策略与方法。 根 据映射 f 的不同,分为定性三支决策和定量三支决 策。 在定量三支决策模型中,通过映射函数,以及引 入的一对阈值 (α,β) (一般 1 ≥α≥β ≥0),在三支 决策空间中进行 3 个区域的计算,如下所示[25] : 接受域:ACP(α,β) (E,A) = { x∈U | E( A) ( x) ≥ α} 拒绝域:REJ(α,β)(E,A)= {x∈U| E(A)(x)≤β} 不确定域:UNC(α,β)(E,A)= {x∈U|β<E(A)<α} 式中: E(A) 为论域 U 上关于集合 A ⊆ U 的映射函 数。 一般情况下,不确定域与 M⁃ 域相对应,接受域 和拒绝域则根据实际情况与 L⁃ 域和 R⁃ 域相对应。 三支决策理论很好地模拟了人类解决实际问题 的思维,首先确定了接受域(即明确接受的部分)和 拒绝域(即明确拒绝的部分),然后重点研究不确定 域的待确认部分。 不确定域是不精确对象的集合, 对不确定域求解的目的就是降低其不精确性,实际 上就是对不确定域进行多粒度挖掘。 不确定域的不 精确性主要受对象的粒度过粗影响,当我们基于对 象的属性进行粒度变换及多粒度运算后,使得不确 定域对象的粒度由粗糙逐步细化,从而我们对不确 定域对象逐步向接受域和拒绝域转换,使得不确定 域的认知愈加清晰。 3 知识的多粒度表示 基于单粒度的粒计算模型虽然具有粒计算的所 有要素(粒化、粒层、粒算子、粒度),但是由于只能 从某个角度近似求解,潜在地丢失了复杂问题中多 角度信息对问题求解的贡献。 构造以单粒度为基础 的多粒度可以融合单粒度的信息,充分利用不同粒 度之间的关系,具有更强的表示能力。 因此,知识的 多粒度表示与信息融合具有内在的一致性。 许多研究表明,多粒度表示下的求解在计算复 杂度、求解性能等方面具有更好的效果。 文献[26] 研究了社会网络中的平衡转化与计算问题,实验证 明通过结合不同社团内部和社团之间的结构化信 息,提出的算法 MOEA/ D⁃SB 具有最小的计算代价 ( Hw ),如图 3 所示。 文献[27]从图像和连环画两 个本体的结构化设计出发,实现了对纸质连环画结 构的自动分析,如图 4 所示。 (a) GGS 网络 (b)War Network 图 3 不同权重参数下无向符号社会网络转换代价 Fig.3 Transformation cost Hw with the parameter w for undirected signed network 第 6 期 苗夺谦,等: 从人类智能到机器实现模型———粒计算理论与方法 ·747·