第3卷第6期 智能系统学报 Vol.3 No.6 2008年12月 CAAI Transactions on Intelligent Systems Dec.2008 二元联系数A+B的理论基础与基本算法 及在人工智能中的应用 赵克勤 (诸暨市联系数学研究所,浙江诸暨311811) 摘要:二元联系数A+B的特点是把确定性测度与不确定测度联系在一起,基本思想是把一个确定集与一个不确 定集联系在一起去研究同一个客观对象,其理论基础是集对论,概率、模糊隶属度、区间数可以转换成二元联系数, 基本算法简明实用,因而可用于不同不确定性问题的处理。 关键词:人工智能;二元联系数A+Bi;集对论;不确定测度;不确定性 中图分类号:TP18文献标识码:A文章编号:16734785(2008)060476-11 The theoretical basis and basic algorithm of binary connection A Bi and its application in AI ZHAO Ke-qin (Institute of Zhuji Connection Number,Zhuji 311811,China) Abstract:The binary connection number A+Bi connects the deterministic measure and the non-deterministic meas- ure together.Its basic idea is to combine one deterministic set and one non-deterministic set together to describe an identical research object.Its theoretical basis is set pair theory,with which the probability,the fuzzy membership and the interval number can be converted to a binary connection number,so its basic algorithm is simple and prac- tical and can be used to deal with various non-deterministic problems. Keywords:artificial intelligence;binary connection number A +Bi ;set pair theory;non-deterministic measure;un- certainty 集对分析(Set pair analysis,SPA)中的联系数已 元联系数的算法「2],又在文献[13]中对观测数据用 在包括人工智能在内的许多领域得到应用12].其 二元联系数表示时的方差分析作了研究,最近汪新 中的不少工作是应用二元联系数A+Bi(以下也简 凡又给出了一种基于二元联系数的区间型多属性决 称二元联系数或联系数).例如黄德才等把二元联 策新方法4].作者在文献[2]中把二元联系数用于 系数用于网络计划「3),高淑萍等把二元联系数用于 有关群体智能测算、不确定性推理等问题研究,给出 系统应急时的资源调度4],郭瑞林等人把其应用于 了“皮匠和尚”群体效能数学模型和“打鸟问题”的 小麦育种5),金华征等应用二元联系数创建了电网 数学模型等等.二元联系数是把研究对象的确定性 灵活规划方法[6],张清河等人把其应用于钢筋抗拉 测度与不确定性测度联系起来的一种结构函数,客 强度测量中的不确定度计算和预先危险性分 观上指示出一个相对确定的观测量(A)与所附带 析78),宋向炯把其应用于大学物理实验空气比容 的不确定性信息(B);因而与国际标准化组织 比热测定不确定度近似计算方法的改进9,吴亭把 (S0)1993年提出的《测量不确定度表示指南》 其应用于系统可靠性的计算],杨继荣把其用于机 (guide to the expression ofuncertainty in measurement, 器制造中的误差分析],王霞应用复数理论研究二 GUM)[s]以及国家技术监督局1999年颁布的《测量 不确定度评定与表示》(JJF1059-1999)[161关于测量 收稿日期:2008-03-31. 通信作者:赵克勤.E-mail:对zhaok@sohu.com, 数据应同时标出其不确定度的要求有相通之处.其
第6期 赵克勤:二元联系数A+B的理论基础与基本算法及在人工智能中的应用 ·477 物理意义则根植于“测不准原理”.由于在人工智能 里称其为是基于罗素悖论的不确定原理, 领域中,诸于数据融合、信息处理、不确定性推理、自 历史上,德国物理学家海森堡于1927年提出 然语言理解、机器制造等不少问题的深入研究和具 “测不准原理”,该原理表明:一个微观粒子的某些 体解决都与这种或那种不确定性有关;为此,本文对 物理量(如位置和动量,或方位角与动量矩,还有时 二元联系数的理论基础和基本算法,以及二元联 间和能量等),不可能同时具有确定的数值,其中一 系数与其他数系的关系作一综述,并举例说明在人 个量越确定,另一个量的不确定程度就越大.测量一 工智能中的应用,以促进人工智能和联系数学的发 对共轭量的误差的乘积必然大于常数h/2π(h是普 展。 朗克常数).“测不准原理”反映了微观粒子运动的 基本规律,是量子力学的一个基本原理,也是现代物 1二元联系数的理论基础 理学的一个重要原理.通常,人们也把海森堡的“测 1.1不确定原理 不准原理”称为“不确定原理”. 这要从集合论中的罗素悖论说起7,罗素悖论 现在要问,海森堡的“测不准原理”与上面说的 是:村上有一个理发师,贴出服务公告,宣称他为所 基于集合论的“不确定原理”是相通的吗?回答是 有不为自己理发的人理发,根据集合论,这些人能组 肯定的.这只要注意到“测不准原理”是针对微观层 成一个集合A;但由此引出一个问题,理发师自己的 次上的粒子而言;但从广义上看,“个体”相对于“全 头该由谁理发?如果他不为自己理发,那么,理发师 体”,恰好处于微观层次.从这个意义上说,前面基 属于A,但这样一来,理发师又不能给自己理发了, 于罗素悖论的“不确定原理”有其物理意义,这个物 也就是不能属于A,那么,理发师自己的头究竞该由 理意义就是海森堡的“测不准原理” 谁理发? 事实上,就认知而言,微观纯粹是相对于宏观而 上面这个理发师悖论是由英国数学家和哲学家 言的一个概念,类似于前面的“全体是宏观,个体是微 罗素(Bertrand Russell,1872-1970)于1903年发现, 观”之说在生物学中还有:个体是宏观,细胞是微观 所以也称罗素悖论 细胞是宏观,基因是微观;在物理学与化学中:肉眼见 罗素悖论的发现,说明了由德国数学家康托 到的物体是宏观,借助显微镜等仪器见到的物体是微 (Georg Cantor,1845-1918)提出的,已被作为现代数 规:大量分子聚集在一起是宏规,少量分子和单个分 学基础的集合论存在着矛盾.这个矛盾是如此地显 子是微观:年度是宏观,时刻是微观;高层是宏观,低 而易见,在构造一个普通的集合时就存在于这个集 层是微观相对于沙子来说,沙漠是宏观,但沙漠相对 合中.这震动了当时的数学界,正如著名的法国数学 于地球来说也是微观.同样,相对于太阳系来说,地球 家庞加莱(Henri Poincare,1854-1912)所坦言,“我们 是微观,但太阳系相对于河外星系来说,太阳系也可 围住了一群羊,然而在羊群中也可能围进了狼”. 以看成是微观在社会经济学中:全局是宏观,局部是 100多年来,数学家们围绕集合论中的悖论进行 微观;长远是宏观,眼前是微观;全球经济是宏观,村 了长时期的深入研究和激烈争论.在发现理发师悖论 落经济是微观在智能机器人制造中:整机是宏观,零 的前后,人们陆续发现了其他悖论,如“说谎者悖论” 件是微观;硬件是宏观,软件是微观。在机器信息处理 等,有关罗素悖论的争论和研究至今仍在继续,研究 中,信息的输入输出是宏观,在机器内部进行信息处 的核心是如何把围进去的狼从羊群中赶出去, 理是微观。人工智能理论是宏观,具体的人工智能技 有意思的是,从生态学角度看,狼羊共存是客观 术是微观,如此等等,这就意味着当把一事物在宏观 事实.从哲学角度看,对立统一是客观世界的一条基 层次上的表现与微观层次上的表现相联系作全局性 本规律,作者据此思考罗素悖论,发现罗素悖论已用 考虑时,不可避免地存在不确定性.因此,前面说的基 事实告诉人们:对于给定的客观对象O(objective 于罗素悖论的不确定原理也可以称为是“系统不确定 target)的全体所组成的集合X。,必存在着这样的个 原理”或“全局不确定原理”, 体(元素)i,它既属于X。,又不属于X。·由于这一事 1.2不确定集 实符合对立统一规律,又源自对罗素悖论的思考,这 或许是受上面所说的隐藏在罗素悖论中的“不确
478 智能系统学报 第3卷 定原理”的启发,使人们认识到在集合论中,不仅需要 观事物处于普遍联系之中”,“对立统一是客观世界 有确定集的概念,还需要有“不确定集”的概念例如 的普遍规律”的思想启发而提出的“成对原理”;这 “模糊集”等等.但由于对立统一是客观世界的普遍规 些在上面已提及.另一方面是从实际研究中得到的 律,不把不确定集与确定集联系起来作为一个整体研 认识:面对一个具体的客观对象0,不仅存在着关于 究,很难对一个不确定集作广泛和深入的分析,反之 该对象的确定的集合A,还存在着关于该对象的不 亦然.这个道理的物理意义也显而易见:设想没有参 确定的集合B;而且不确定的集合B总是与确定的 考系,即使是个质点也难以开展客观描述和深入分 集合A联系在一起,也只有把这两个集合联系起来 析.正因其如此,集对分析不把研究的着眼点放在单 同时描述这个给定的客观对象0时,才得到关于O 个不确定集上,而是把不确定集与确定集作为一个系 的一个全面的客观描述.反过来也是如此,描述给定 统来加以处理,是因为根据系统科学理论,组成系统 对象O的一个确定集A总是与关于该对象的一个 的要素与要素之间存在相互联系, 不确定集B联系在一起.换言之,当试着确定一个 1.3成对原理 集合中的元素是某种对象的全体时,必然有不能确 成对原理是指“事物或概念都是成对地存在”, 定是否应该属于这个确定集的元素在其中,例如理 例如:东西、南北、上下、宏微、刚柔、软硬、虚实、进 发师悖论中的那位理发师(全局不确定),如果你要 退、来回、大小、胜负、高低、胖瘦、好坏、美丑、善恶、 把这位理发师排除在外,那么你的研究对象又成为 阴阳等,以及作用力与反作用力、化合与分解、正电 某种“部分”的东西,所得的结论又会犯“以偏概全” 与负电、太阳与地球、月亮与星星、火箭与飞船、物质 的错误(局部不确定).总之,正如人们需要用成对 与能源、信息与知识、知识与智能、人脑与电脑,以及 的感官(两只眼睛、两只耳朵、两个鼻孔、两只手、两 正数与负数、实数与虚数、函数与图表、图像与方程、 条腿)去感知外界环境那样,对于给定的一个客观 精确解与近似解等,还有系统与环境、历史与末来、 对象,需要同时用两个集合去描述人们所要研究的 教师与学生、领导与群众、工人与农民、商人与医生、 事物.由于大脑的认知比感知高级,概念比感觉深 官员与市民、生存与发展、投资与回报、改革与创新、 刻;所以,为了客观地反映所要研究的事物,这两个 计划与市场、确定性与不确定性等等,无一例外地是 集合一般地说,必须一个是确定的集合,另一个是不 成对地存在,正是由于成对原理的制约,以至于在一 确定的集合.特殊情况下,也可以两个都是不确定 般意义上泛指某一事物时,同时在有意无意地拿与 集,或两个都是确定集,由于这样的两个集合相辅相 该事物成对的另一事物作参考,如人们在说某数是 成地描述同一个客观对象,自然应该把它们放在同 正数时,同时在有意无意拿负数作参考;在指某一事 一个研究单位中以体现出这两个集合在本来意义上 物具有不确定性时,其实在同时拿该事物与之成对 的相互联系,把这个单位形象地称之为“集对”也就 的它事物之确定性作参考;如此等等,不一而足,从 是自然的一件事情.当然,对此也可以有另外的形象 哲学的观点看,成对原理无非是关于“对立统一法 化称呼,例如“双集合”,这时的集对理论也可以称 则”、“事物相互联系原理”的一种新的表述,从数学 为“双集合理论”;但从基本概念要求从简这个角度 的角度看,成对原理的阐明意味着作为数学理论基、 看,集对这个概念显然比“双集合”更为简洁,也更 础的集合论扩充为以研究两个集合确定与不确定联 富有内涵.当然,从“双集合”出发,自然可以进一步 系及其可变与转化为主要内容的集对论成为必要; 引出“三集合”,“四集合”…“多集合”的概念,相 因为成对原理可以用集合论的语言等价地表示成 应地引出“三集合理论”,“四集合理论”…“多集 “不能独立存在概念上完全纯粹单一的集合[1 合理论”等;但这些概念或理论都得以集对这个概 1.4集对论 念为基础,因为在多集合的相互联系中,两个集合之 集对就是由两个集合所组成的一个基本单位。 间的相互联系仍然是一种最基本的联系.有关集对 为什么要给出这样一个基本单位?一是源于对集合 的理论简称集对论.刻划集对中两个集合确定性测 论中悖论的思考,尤其是对罗素悖论的思考;二是受 度与不确定性测度及其相互关系的数学工具是二元 物理学“测不准原理”的启发;三是哲学上关于“客 联系数
第6期 赵克勤:二元联系数A+Bi的理论基础与基本算法及在人工智能中的应用 ·479 1.5二元联系数与不确定量 数,其中当A>B时,A+B阮是一个假不确定二元联 数学认为,数是量的描述.据此可问,二元联系 系数,意指只有部分论域具有不确定性(如图1中 数A+B描述的量是什么量?为此,作者在文献 [A-B,A+B]这个区间),而另一部分论域是确定 [1]中给出了不确定量的概念,不确定量是在宏观 的(图1中[0,A-B]这个区间).反之,当A<B时, 上确定而在微观上不确定的量.不确定量与常量、变 A+Bi是一个真不确定二元联系数,意指整个论域 量的关系见表1. 都充满不确定性(见图2)· 表1常量、变量、不确定量在宏观与微观2个层次上的 A+Bi 确定、不确定分布 Table 1 The distribution of constant,variable,uncertain =B A+B variables on the macroscopy and microscopy 图1二元联系数A+B(A>B)在数轴上的表示 量 宏观 微观 例子 Fig.1 The binary connection number A Bi (A >B)repre- 常量 确定 确定 圆周率π sentation on the number axis 变量 不确定 确定 自由落体速度V A+Bi 不确定量 确定 不确定 粒子的动量 超不确定量 不确定 不确定 A-80 A A+B 根据表1,数学可以分为常量数学、变量数学、不 确定量数学.初等算术、初等几何属于常量数学;迪卡 图2二元联系数A+B(A<B)在数轴上的表示 Fig.2 The binary connection number A+Bi (A<B)repre- 尔的解析几何与牛顿莱布尼兹的微积分构筑的是变 sentation on the number axis 量数学的大厦;由于不确定量的不确定性与确定性在 层次上的分布正好与变量相反,提示关于不确定量的 1.7 二元联系数的集对解释 数学与关于变量的数学会有很大的不同, 从集对论的意义上说,二元联系数A+B是关 另一方面,可以看到,这里说的不确定量是在宏 于对象集O的两个映射集合的联合函数例如在罗 观层次上确定,在微观层次上不确定的量,显而易 素悖论中,设村上包括理发师在内共有100人,这是 见,这与前面所说的不确定原理相符. 研究对象,其中不能为自己理发的有99人,确定属 要指出的是,虽然二元联系数A+Bi是描述不 于理发师的服务范围(A=99),加上理发师1人不 确定量的一种数;但在作深入一个层次的分析时,又 能确定是否属于理发师的服务范围(B=1),于是得 常把A称为确定量,把B称为不确定量,A和B统 联系数A+Bi=99+1i,这个联系数的集对意义显然 称为二元联系数的联系分量,简称联系分量.考虑到 是关于“所有不为自己理发的人”这个对象集0的 确定量与不确定量的相互影响,在进一步的分析中, 两个映射集合A(确定集)与B(不确定集)的基数之 还可以在A中解析出一定的偏不确定量,与此同时 联系和 在B中解析出偏确定量,依次类推,并由此导出三 由此例可见,二元联系数A+Bi表示出确定集 元和多元联系数 A与不确定集B这两个集合基数之“联系和”,在集 1.6二元联系数在实数轴上的表示 对分析中,“联系和”一般用“⊕”表示,当这种“联 无论是从形式看,还是从含义看,二元联系数 系和”仅指代数意义上的“数值和”时,“⊕”可以改 A+B都是关于给定客观对象的一种结构函数.其中 用“+”.特别地,在集对分析中,称N=A+B为二 的A,B为非负实数,分别是确定集A的基数4(确定 元联系数A+Bi的联系范数,N的大小表示了论域 的关系数),为简洁起见,取A=A;B是不确定集B 的大小. 的基数B(具有不确定性的关系数),为简洁起见,取 综上可知,基于罗素悖论的不确定原理、成对原 B=B;i是B的系数,在[-1,1]区间取值,具体取 理、集对论以及不确定量概念等内容共同构成了二 何值要根据对研究对象作“微观”层次上的分析而 元联系数A+Bi的理论基础,当然,这个基础的某些 定,因而具有不确定性,由此进一步说明B的不确 微细结构还需要深入研究,例如,不确定量与常量、 定性.因其如此,二元联系数也被称为不确定联系 变量之间的转换等等
·480 智能系统学报 第3卷 新的天地, 2 二元联系数与不同数系的关系 2.2二元联系数与模糊隶属度的关系 2.1二元联系数与概率的关系 模糊隶属度可以转换成一个二元联系数,并由 由于概率P是一个在0~1取值的实数,因而可 此显化出一个模糊隶属度所携带的另一部分“模 以联系数化成P+(1-P)i,这是可行性.另一方面, 糊”信息. 把概率P联系数化成联系数P+(1-P)i也是必要 根据模糊集理论,设U是论域,u是U中的任 的,因为概率是从宏观层次上对随机不确定性的数学 一元素,A(u)是U的一个模糊子集,A(u)的隶属函 描述,所以显示出随机不确定性的确定性;但在微观 数4(u)的定义为:A(u)→[0,1],也就是1≥ 层次上,显示出随机不确定性其本质上的不确定性, A(u)≥0.按集对论,这里的A(u)是对A(u)的一 因此,当显示出需要同时从宏观与微观两个层次上考 个确定的描述,还应同时有一个不确定的描述[1 虑随机不确定性的程度、作用和影响时,把概率P联 4()]i,i∈[-1,1](以下同),而[1-A(u)]正 系数化成P+(1-P)i就显得完全必要,有关这方面 好是A(u)的补数;于是,对A(u)的一个完整的描 的进一步论述请参见文献[2].要指出的是,把概率用 述应当是A(u)+[1-A(u)]i,容易看出,[1- 联系数的形式表示在理论和实践上都有重要的意义, A(u)]i是A(u)所携带的另一部分“模糊”信息, 不妨来看一个例子,在经典概率论中,有一个“小概率 但按模糊集理论,这一部分“模糊”信息是作为“不 原理”,该原理是说,概率非常小的事件在某次观察中 模糊”信息对待的,至少是忽略不计,这种忽略不计 几乎是不可能发生的,比如一个人买2元钱彩票得 有时会导致模糊推理结果的不确定性达到最大,请 500万元大奖就是一个小概率事件,其概率大约是 看下例. 0.00000001,按经典概率论,因为0.00000001接近于 在模糊集理论中,认为A(u)=0.5时,uA(u) 零,几乎不可能发生;但把这个概率表示成联系数的 的模糊程度最大,因为最“模棱两可”,但没能在数 形式后得到的是0.00000001+0.99999999i,后面这 学上说明这个“最大模糊程度”.按集对论,模糊隶 个0.99999999说明这个小概率事件在一次观察中不 属度A(u)=0.5的联系数表述为0.5+0.5i,当i 发生的不确定性非常之大,这个例子一方面说明可能 在[-1,1]变动时,0.5+0.5i在[0,1]变动,其模糊 性不等于不确定性,另一方面可以在一定程度上解释 程度为1-0=1,从而从数学意义上说明了这个“最 为什么人们明知中大奖的可能性非常小,而仍然踊跃 大模糊程度”,此时作出的模糊推理结果,其不确定 购买彩票这种社会现象, 性最大 另一个有实际意义的例子是机动车的行驶安全 作为一个比较,来计算A(u)=0.9时的模糊 问题,通常而言,一辆机动车在行驶时出事故是一个 程度.按集对论,这时有联系数0.9+0.1i,当i在 小概率事件,但实际上,每一个机动车驾驶员的每次 [-1,1]变动时,0.9+0.1i在[0.8,1]变动,其模糊 出车都必须把安全放在第一位.用联系数的语言来 程度为0.2,此时作出的模糊推理结果,其不确定性 说,就是要高度重视“小概率”所附带的那个“大补 显然较小. 数”所具有的不确定性,它随时都有可能把出事故 但有时,忽略不计模糊隶属度4(w)所携带的另 的“小概率”转化为1. 一部分“模糊”信息,又会使所得结论过于“刚性”。 把概率转换成一个联系数的工作称为概率的联 把模糊隶属度转换成一个联系数的工作称为模 系数化.这一工作的意义从信息利用的角度看,无非 糊隶属度的联系数化.这一工作的意义从信息利用的 是检起了经典概率论在概率表述上所丢弃的那个补 角度看,无非是检起了模糊集理论在模糊隶属度表述 数中所含有的随机不确定信息.由于概率是概率论的 上所丢弃的那个补数中所含有的模糊不确定信息.由 基石,利用二元联系数检回这部分信息,是为概率论 于模糊隶属度是模糊集理论的基石,利用二元联系数 重新奠基的一项基础工作,应用二元联系数使概率所 检回这部分信息,是为模糊集理论重新奠基的一项基 携带的随机不确定信息完整化、系统化和客观化,其 础工作,应用二元联系数使模糊隶属度所携带的模糊 结果将为概率论及其相关学科的研究与应用开辟出 不确定信息完整化、系统化和客观化,其结果将为模