第13卷第4期 智能系统学报 Vol.13 No.4 2018年8月 CAAI Transactions on Intelligent Systems Aug.2018 D0:10.11992/tis.201706057 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180329.1555.008.html 因素空间的结构与对偶回旋定理 包研科,汪培庄,郭嗣琮 (辽宁工程技术大学智能工程与数学研究院,辽宁阜新123000】 摘要:基于概念的内涵与外延的对合性与反变关系,以及概念形成过程中概括与解析的辩证统一性,深入讨 论了因素空间的数学结构问题。系统梳理了由认知本体论原理构造出的因素空间的基本概念与核心命题,为 基于因素空间的知识发现理论与技术的研究提供了一种新的思想框架。首次提出了格上的交错自同构变换与 回旋格的概念,证明了因素空间上的对偶回旋定理,揭示出因素空间数学结构的几何表象是一个麦乌比斯环, 为阐释人类思维与概念形成过程的动力学机制提供了一个新的数学模型。 关键词:因素空间:结构:交错自同构变换:回旋格:对偶回旋定理 中图分类号:TP18:029 文献标志码:A文章编号:1673-4785(2018)040656-09 中文引用格式:包研科,汪培庄,郭嗣琼.因素空间的结构与对偶回旋定理.智能系统学报,2018,13(4):656-664. 英文引用格式:BAO Yanke,.VANG Peizhuang,GUO Sicong.Structure of factor space and the dual convolution theorem[J.CAAI transactions on intelligent systems,2018,13(4):656-664. Structure of factor space and the dual convolution theorem BAO Yanke,WANG Peizhuang,GUO Sicong (Institute of Intelligent Engineering and Mathematics,Liaoning Technical University,Fuxin 123000,China) Abstract:Based on two expressions consistency and the reverse-change relation of conceptual connotation and exten- sion,as well as the dialectical unity of summary and parsing in the concept formation process,in this paper,we present a detailed discussion of the mathematical structure of factor space.We systematically identify the basic concepts and core propositions of factor space,as constructed by the principle of cognitive ontology,and provide a new ideological frame- work for both the theoretical and technological research of knowledge discovery based on factor space.We propose nov- el concepts related to the staggered automorphism transform and the convolution lattice,prove the dual entanglement theorem of factor space,and introduce a geometrical representation of the mathematical structure of factor space as a Mobius strip,thereby establishing a new mathematical model for illustrating the dynamics mechanism of the formation of human thinking and conceptualization. Keywords:factor space;structure;staggered automorphism transform;convolution lattice;dual convolution theorem 自1982年汪培庄提出因素空间(factors 年汪培庄、李洪兴合著]《知识表示的数学理 space,FS)理论,时至今日,35年来理论与应用的 论》一书系统地论述了FS理论在知识获取、知 发展,充分展示了F$理论在解释随机性根源和 识表示、知识管理和知识利用方面的数学思想与 概率规律的数学实质,融合随机数学与模糊数学 原理。《模糊计算系统与模糊计算机》及其相 的技术方面思想的深刻性,奠定了FS理论作为 关的工程实践标志着FS理论与智能工程设计理 知识工程的思想框架的地位。 念的完美结合,其中给出的概念内涵和外延相互 FS理论的早期成果可见汪培庄文集四。1994 转换的可操作方法,实现了决策树算法和粗糙集 收稿日期:2017-06-16.网络出版日期:2018-03-29. 算法没有实现的“双向转换的目的”。其后,李洪 基金项目:国家自然科学基金项目(71371091);中国工程院 2017年重点咨询项目(2017-XZ-23). 兴1关于《因素空间理论与知识表示的数学框 通信作者:包研科.E-mail:baoyanke_257@163.com. 架》长达5年的系列讨论,不仅推进了FS理论的
DOI: 10.11992/tis.201706057 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180329.1555.008.html 因素空间的结构与对偶回旋定理 包研科,汪培庄,郭嗣琮 (辽宁工程技术大学 智能工程与数学研究院,辽宁 阜新 123000) 摘 要:基于概念的内涵与外延的对合性与反变关系,以及概念形成过程中概括与解析的辩证统一性,深入讨 论了因素空间的数学结构问题。系统梳理了由认知本体论原理构造出的因素空间的基本概念与核心命题,为 基于因素空间的知识发现理论与技术的研究提供了一种新的思想框架。首次提出了格上的交错自同构变换与 回旋格的概念,证明了因素空间上的对偶回旋定理,揭示出因素空间数学结构的几何表象是一个麦乌比斯环, 为阐释人类思维与概念形成过程的动力学机制提供了一个新的数学模型。 关键词:因素空间;结构;交错自同构变换;回旋格;对偶回旋定理 中图分类号:TP18;O29 文献标志码:A 文章编号:1673−4785(2018)04−0656−09 中文引用格式:包研科, 汪培庄, 郭嗣琮. 因素空间的结构与对偶回旋定理[J]. 智能系统学报, 2018, 13(4): 656–664. 英文引用格式:BAO Yanke, WANG Peizhuang, GUO Sicong. Structure of factor space and the dual convolution theorem[J]. CAAI transactions on intelligent systems, 2018, 13(4): 656–664. Structure of factor space and the dual convolution theorem BAO Yanke,WANG Peizhuang,GUO Sicong (Institute of Intelligent Engineering and Mathematics, Liaoning Technical University, Fuxin 123000, China) Abstract: Based on two expressions consistency and the reverse-change relation of conceptual connotation and extension, as well as the dialectical unity of summary and parsing in the concept formation process, in this paper, we present a detailed discussion of the mathematical structure of factor space. We systematically identify the basic concepts and core propositions of factor space, as constructed by the principle of cognitive ontology, and provide a new ideological framework for both the theoretical and technological research of knowledge discovery based on factor space. We propose novel concepts related to the staggered automorphism transform and the convolution lattice, prove the dual entanglement theorem of factor space, and introduce a geometrical representation of the mathematical structure of factor space as a Mobius strip, thereby establishing a new mathematical model for illustrating the dynamics mechanism of the formation of human thinking and conceptualization. Keywords: factor space; structure; staggered automorphism transform; convolution lattice; dual convolution theorem 自 1982 年汪培庄[ 1 ]提出因素空间 (factors space,FS) 理论,时至今日,35 年来理论与应用的 发展,充分展示了 FS 理论在解释随机性根源和 概率规律的数学实质,融合随机数学与模糊数学 的技术方面思想的深刻性,奠定了 FS 理论作为 知识工程的思想框架的地位。 FS 理论的早期成果可见汪培庄文集[2]。1994 年汪培庄、李洪兴合著[ 3 ]《知识表示的数学理 论》一书系统地论述了 FS 理论在知识获取、知 识表示、知识管理和知识利用方面的数学思想与 原理。《模糊计算系统与模糊计算机》[4]及其相 关的工程实践标志着 FS 理论与智能工程设计理 念的完美结合,其中给出的概念内涵和外延相互 转换的可操作方法,实现了决策树算法和粗糙集 算法没有实现的“双向转换的目的”。其后,李洪 兴 [5]关于《因素空间理论与知识表示的数学框 架》长达 5 年的系列讨论,不仅推进了 FS 理论的 收稿日期:2017−06−16. 网络出版日期:2018−03−29. 基金项目:国家自然科学基金项目 (71371091);中国工程院 2017 年重点咨询项目 (2017-XZ-23). 通信作者:包研科. E-mail:baoyanke_9257@163.com. 第 13 卷第 4 期 智 能 系 统 学 报 Vol.13 No.4 2018 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2018
第4期 包研科,等:因素空间的结构与对偶回旋定理 ·657· 发展,也奠定了FS理论在知识发现与智能工程 和关键命题,部分内容笔者根据近期研究予以必 领域广泛应用的基础。袁学海8从范畴论的角 要的重述。复述与重述不做标识,有需要了解期 度对FS的结构问题进行了深入讨论;在FS理论 间变化的读者可同文献[34]进行比对。 的应用方面,刘增良9在因素神经网络技术,军 1.1认知本体论原理 事信息战与网络战领域的研究成绩斐然。此外, 因素是认知工具,因素分析应遵循认知本体 基于S理论的专家系统+多传感器决策融合 论原理,因素空间的结构应体现和摹写人类自身 控制仿真17191、模式识别202】、安全科学2221 的认知结构与思维运动规律。 等应用领域的研究,体现了FS作为智能科学的 认知由概念表达,概念是人类思维体系中最 数学空间理论的价值和发展前景。 基本的构筑单位。概念通常由内涵与外延两个逻 在KDD问题的研究中,1998年何清2讨论了 辑术语表达。内涵往往采用“上位概念+本位属 基于FS和模糊聚类的概念形成方法,2013年汪 性”的逻辑形式描述,而外延则是概念所描述的事 培庄发表《因素空间与因素库》一文26,推动 项的集合。 FS理论在KDD领域的应用。近年来,关于FS与 认知形成的标志是概念的形成,其间的思维 数据科学的关系P7,基于FS理论的分类算法22 运动,主要由分析和综合两种思维方法构成。分 文本挖掘方法0等相关研究也有一定的进展。 析的信息加工与处理技术是解析,实现方式是将 FS理论生根于数学,反映认识论特点,是 事物拆分为更小的单元进行管理和研究,或者表 KDD和概念格生成的一种自然有效的数学方 述为“发现事物的个性特征”。综合的信息加工与 法。然而,早期奠基性工作建立在模糊数学的基 处理技术是概括,实现方式是将一些具有相同属 础上,融合了随机数学和抽象代数的思想、方法 性的事物归纳为更大的单元进行管理和研究,或 和语言;FS理论的高起点在保证数学严谨性的同 者表述为“对事物的一类属性进行综合”。 时,也为其普及推广树立了一道屏障。S的经典 对一个概念的解析称为概念分化,是下位学 定义可见文献3],此后的理论与应用研究基本上 习。对一些事物的共有属性进行概括,利用学习 遵循了这一定义的思想和描述。近年来,随着FS 者已有的认知结构形成新的概念称为概念同化, 领域应用和教学的深入,出现了对FS定义的领 是上位学习。 域适应性描述和扩展B23.2013年汪培庄在讨论 在认知科学的基本概念与原理的基础上,关 FS在数据科学中的应用问题时,对FS的定义进 于FS的认知本体论原理,本文吸收了冯嘉礼B关 行了修正」 于《思维与智能科学中的性质论方法》的一些思 为能够相对通俗地诠释FS理论的基本思想 想原理,参考了文献[36]的讨论。后续关于FS数 和原理,2015年包研科基于认知本体论原理, 学结构的讨论遵循下列认知本体论原理: 梳理了FS理论中的基本概念和术语,给出了有 1)一个因素总是特定论域上的因素,离开论 域谈论因素是没有意义的。更进一步,一个因素 别于FS经典定义的描述。这一描述充分体现了 总是特定论域上特定问题的因素,离开问题无从 汪培庄“因素是分析的维度,是变异的指标和变量 讨论因素的认知功能。论域、因素和由因素形成 名称,是矛盾的编码,是事物形成和描述的基因。 的关于问题的认知结果构成一个特定的思维空间。 以因素为轴所张成的坐标空间就是因素空间,它 2)概念的分化与同化动态平衡。在概念形成 为事物描述和思维形式提供了普适性的坐标框 过程中,思维在解析与概括的交替运用中发展。 架2的论述精神。文献[34]对FS的定义,最大的 解析强化内涵知识,促进概念分化;概括丰富外 变化是对因素的顺序关系、算符的意义给出了符 延认知,促进概念同化。在这个过程中,内涵与 合认知本体论原理的描述,形式上同经典定义有 外延存在反变关系,即内涵扩张必然减小外延, 所不同,并再次触发了对FS结构问题的思考。 反之内涵缩减将导致外延扩张。一个概念的形 本文的工作是文献[34的延续,进一步讨论 成,是一定认知阶段上分化与同化的暂时平衡。 FS的结构问题。 3)概念的内涵与外延对合,即内涵与外延所 1预备知识 描述的事项一致。在概念形成过程中,解析与概 括之间的差异是思维的技术性差异,不同技术产 为方便对本文工作的理解,作为预备知识,简 生的信息在思维运动中以概念的内涵与外延对合 要介绍文献[34]中给出的原理、概念与术语、公理 为目标纠缠运动,辩证统一
发展,也奠定了 FS 理论在知识发现与智能工程 领域广泛应用的基础。袁学海[6-8]从范畴论的角 度对 FS 的结构问题进行了深入讨论;在 FS 理论 的应用方面,刘增良[9-13]在因素神经网络技术,军 事信息战与网络战领域的研究成绩斐然。此外, 基于 FS 理论的专家系统[14-15] 、多传感器决策融合[16] 、 控制仿真[ 1 7 - 1 9 ] 、模式识别[ 2 0 - 2 1 ] 、安全科学[ 2 2 - 2 4 ] 等应用领域的研究,体现了 FS 作为智能科学的 数学空间理论的价值和发展前景。 在 KDD 问题的研究中,1998 年何清[25]讨论了 基于 FS 和模糊聚类的概念形成方法,2013 年汪 培庄发表《因素空间与因素库》一文[ 2 6 ] ,推动 FS 理论在 KDD 领域的应用。近年来,关于 FS 与 数据科学的关系[27] ,基于 FS 理论的分类算法[28-29] 、 文本挖掘方法[30-31]等相关研究也有一定的进展。 FS 理论生根于数学,反映认识论特点,是 KDD 和概念格生成的一种自然有效的数学方 法。然而,早期奠基性工作建立在模糊数学的基 础上,融合了随机数学和抽象代数的思想、方法 和语言;FS 理论的高起点在保证数学严谨性的同 时,也为其普及推广树立了一道屏障。FS 的经典 定义可见文献[3],此后的理论与应用研究基本上 遵循了这一定义的思想和描述。近年来,随着 FS 领域应用和教学的深入,出现了对 FS 定义的领 域适应性描述和扩展[32-33]。2013 年汪培庄在讨论 FS 在数据科学中的应用问题时,对 FS 的定义进 行了修正[26]。 为能够相对通俗地诠释 FS 理论的基本思想 和原理,2015 年包研科[34]基于认知本体论原理, 梳理了 FS 理论中的基本概念和术语,给出了有 别于 FS 经典定义的描述。这一描述充分体现了 汪培庄“因素是分析的维度,是变异的指标和变量 名称,是矛盾的编码,是事物形成和描述的基因。 以因素为轴所张成的坐标空间就是因素空间,它 为事物描述和思维形式提供了普适性的坐标框 架” [27]的论述精神。文献[34]对 FS 的定义,最大的 变化是对因素的顺序关系、算符的意义给出了符 合认知本体论原理的描述,形式上同经典定义有 所不同,并再次触发了对 FS 结构问题的思考。 本文的工作是文献[34]的延续,进一步讨论 FS 的结构问题。 1 预备知识 为方便对本文工作的理解,作为预备知识,简 要介绍文献[34]中给出的原理、概念与术语、公理 和关键命题,部分内容笔者根据近期研究予以必 要的重述。复述与重述不做标识,有需要了解期 间变化的读者可同文献[34]进行比对。 1.1 认知本体论原理 因素是认知工具,因素分析应遵循认知本体 论原理,因素空间的结构应体现和摹写人类自身 的认知结构与思维运动规律。 认知由概念表达,概念是人类思维体系中最 基本的构筑单位。概念通常由内涵与外延两个逻 辑术语表达。内涵往往采用“上位概念+本位属 性”的逻辑形式描述,而外延则是概念所描述的事 项的集合。 认知形成的标志是概念的形成,其间的思维 运动,主要由分析和综合两种思维方法构成。分 析的信息加工与处理技术是解析,实现方式是将 事物拆分为更小的单元进行管理和研究,或者表 述为“发现事物的个性特征”。综合的信息加工与 处理技术是概括,实现方式是将一些具有相同属 性的事物归纳为更大的单元进行管理和研究,或 者表述为“对事物的一类属性进行综合”。 对一个概念的解析称为概念分化,是下位学 习。对一些事物的共有属性进行概括,利用学习 者已有的认知结构形成新的概念称为概念同化, 是上位学习。 在认知科学的基本概念与原理的基础上,关 于 FS 的认知本体论原理,本文吸收了冯嘉礼[35]关 于《思维与智能科学中的性质论方法》的一些思 想原理,参考了文献[36]的讨论。后续关于 FS 数 学结构的讨论遵循下列认知本体论原理: 1) 一个因素总是特定论域上的因素,离开论 域谈论因素是没有意义的。更进一步,一个因素 总是特定论域上特定问题的因素,离开问题无从 讨论因素的认知功能。论域、因素和由因素形成 的关于问题的认知结果构成一个特定的思维空间。 2) 概念的分化与同化动态平衡。在概念形成 过程中,思维在解析与概括的交替运用中发展。 解析强化内涵知识,促进概念分化;概括丰富外 延认知,促进概念同化。在这个过程中,内涵与 外延存在反变关系,即内涵扩张必然减小外延, 反之内涵缩减将导致外延扩张。一个概念的形 成,是一定认知阶段上分化与同化的暂时平衡。 3) 概念的内涵与外延对合,即内涵与外延所 描述的事项一致。在概念形成过程中,解析与概 括之间的差异是思维的技术性差异,不同技术产 生的信息在思维运动中以概念的内涵与外延对合 为目标纠缠运动,辩证统一。 第 4 期 包研科,等:因素空间的结构与对偶回旋定理 ·657·
·658· 智能系统学报 第13卷 1.2基本概念 因素之间的≤关系是偏序关系,并以论域上子 基于认知本体论原理的FS的基本概念、术语 集合之间的关系为背景关系。 和符号约定如下: 5)因素f与g的析运算是因素之间交互效应的 1)论域是一个关于问题的本体论研究对象的 描述与分析工具,记为f八g,主要服务于概念分 非空可列集合,记为U。因素是定义在论域U上的 化。析因素fΛg是由f和g构造出的有更强解析力 一个满映射,记为 的新因素,定义为 f:0→ 式中:集合I,称为f的相空间(寓意必须考虑映 g(x.y)=f(g).(x.)lxl 6)因素f与g的合运算是思维过程中的信息汇 射像的分布特征),描述论域U上的一类本体论 总与认知概括工具,记为fVg,主要服务于概念同 性态。 化。合因素fVg可以理解为比因素f和g有更强概 约定两个特殊因素: 括力的新因素,定义为 ①零因素,记为o,其相空间。=NoN非空, 相态NoN用来描述所研究问题的“原始概念”或 fAgx,)=f)U80,x)∈x1, “根节点”,在论域U上关于NoN的讨论都是下位 7)因素f的补因素以及f与g的差运算是思维 学习。 过程中的信息分离工具。补因素实现视角的转 另外,约定NoN是任何一个因素f的相空间 换,记为f,定义为 1中的共有元素,寓意任何一个因素f在应用中都 g=f台Yx∈I,y∈1,8y)=U-f(x) 有被“空置”的可能,此时NoN可以表示因素f的 差运算的目的是“从一个因素中排除另一个 缺失值。 因素的干涉效应”,记为f-8,定义为 ②全因素,记为e,其相空间l同论域U对等, f-g台f∧8 即1.和U之间存在一一映射,表示因素e能够“完 1.3基本命题 全个体化”认知论域中的任何一个对象。 约定如下两个公理: 因素o和e称为非平凡因素,除此之外均为平 公理1(发现公理)oNoN)=U,e(x)=O。 凡因素。 公理2(顺序公理)o≤f≤e。 2)从某一个因素f的相空间1到论域U的幂集 注:由全元素的定义,公理(x)=O的意义是 牙(U)上的映射f称为因素f的回溯,满足 e的回溯不能在论域U发现以x标识的对象的等 Hx∈I,fx)=[xeF(U) 价类。 在前述概念(定义)和两个公理的基础上,可 式中:[x/表示由因素f的某一相态x在U限定出的 等价类;幂集牙(U)称为因素分析的背景空间。回 以证明下列命题: 溯的性质如下: 命题1(对合定理)f=8台f=80 ①Vx∈I,ffx)=xo 命题2(反变关系定理)g≤f台f≤8, ②x/U,ffr》=[ro 命题3(幂等律)fΛf=f,fVf=f。 ③x,yeI,x≠y,fx)nf0)=0。 命题4交换律)fΛg=gAf,fVg=gVf。 注:回溯是一种拟逆映射,同一般逆映射不同 命题5(结合律)fAg)Ah=fA(gAh),(fVg)V 之处在于fx)表示在论域U寻找以x标识的对象 h=fv(gvh)o 的等价类。 命题6(分配律)fA(gVh)=(fAg)VfAh),fV (gAh)=(fvg)(fvh) 3)两个因素f和g认知等效称为相等,定义为 命题7(第一吸收律)fVg≤f,fVg≤g; I=I(集合对等) f=8台 f≤gAf,8≤gΛfo f(f(u))=8(g(u)).YuEU 命题8(第二吸收律)若g≤f,则fΛg=f, 4)因素在U上的认知能力约简为描述概念分 fVg=g。反之亦真。 化的解析力和描述概念同化的概括力,并以解析 命题9第三吸收律)fV(fAg)=f,fA(fVg)=f。 力主导因素的序关系,定义 命题10(排序定理)o≤fVg≤f,g≤fΛ8≤eo 8≤f台Hx∈I,3y∈1g,使fx)Sg0y) 命题11(第一对偶律)o=e,e=o。 称为因素g小于或等于因素f,表示f比g或有更强 命题12(第二对偶律)(fAgy=fVg,(fVgy= 的解析力。 f'Ag
1.2 基本概念 基于认知本体论原理的 FS 的基本概念、术语 和符号约定如下: U U 1) 论域是一个关于问题的本体论研究对象的 非空可列集合,记为 。因素是定义在论域 上的 一个满映射,记为 f : U → If If f U 式中:集合 称为 的相空间 (寓意必须考虑映 射像的分布特征),描述论域 上的一类本体论 性态。 约定两个特殊因素: o Io = {NoN} U ①零因素,记为 ,其相空间 非空, 相态 NoN 用来描述所研究问题的“原始概念”或 “根节点”,在论域 上关于 NoN 的讨论都是下位 学习。 f If f f 另外,约定 NoN 是任何一个因素 的相空间 中的共有元素,寓意任何一个因素 在应用中都 有被“空置”的可能,此时 NoN 可以表示因素 的 缺失值。 e Ie U Ie U ②全因素,记为 ,其相空间 同论域 对等, 即 和 之间存在一一映射,表示因素 e 能够“完 全个体化”认知论域中的任何一个对象。 因素o和e称为非平凡因素,除此之外均为平 凡因素。 f If U F ↼ f f 2) 从某一个因素 的相空间 到论域 的幂集 (U) 上的映射 称为因素 的回溯,满足 ∀x ∈ If , ↼ f(x) = [x]f ∈ F (U) [x]f f x U F 式中: 表示由因素 的某一相态 在 限定出的 等价类;幂集 (U) 称为因素分析的背景空间。回 溯的性质如下: ∀x ∈ If , f( ↼ ① f(x)) = x。 ∀[x]f ⊆ U, ↼ ② f(f([x]f)) = [x]f。 ∀x, y ∈ If , x , y, ↼ f(x)∩ ↼ ③ f(y) = Ø。 ↼ f(x) U 注:回溯是一种拟逆映射,同一般逆映射不同 之处在于 表示在论域 寻找以 x 标识的对象 的等价类。 3) 两个因素 f 和 g 认知等效称为相等,定义为 f = g ⇔ If ≓ Ig(集合对等) ↼ f(f(u)) = ↼ g(g(u)),∀u ∈ U 4) 因素在 U 上的认知能力约简为描述概念分 化的解析力和描述概念同化的概括力,并以解析 力主导因素的序关系,定义 g ⩽ f ⇔ ∀x ∈ If ,∃y ∈ Ig ,使 ↼ f(x) ⊆ ↼ g(y) 称为因素 g 小于或等于因素 f , 表示 f 比 g 或有更强 的解析力。 ⩽ ⊆ 因素之间的 关系是偏序关系,并以论域上子 集合之间的关系 为背景关系。 f g f ∧g f ∧g f g 5) 因素 与 的析运算是因素之间交互效应的 描述与分析工具,记为 ,主要服务于概念分 化。析因素 是由 和 构造出的有更强解析力 的新因素,定义为 ←−−− f ∧g(x, y) = ↼ f(x)∩ ↼ g(y),∀(x, y) ∈ If × Ig f g f ∨g f ∨g f g 6) 因素 与 的合运算是思维过程中的信息汇 总与认知概括工具,记为 ,主要服务于概念同 化。合因素 可以理解为比因素 和 有更强概 括力的新因素,定义为 ←−−− f ∧g(x, y) = ↼ f(x)∪ ↼ g(y),∀(x, y) ∈ If × Ig f f g f ′ 7) 因素 的补因素以及 与 的差运算是思维 过程中的信息分离工具。补因素实现视角的转 换,记为 ,定义为 g = f ′ ⇔ ∀x ∈ If ,∃y ∈ Ig , ↼ g(y) = U − ↼ f(x) f −g 差运算的目的是“从一个因素中排除另一个 因素的干涉效应”,记为 ,定义为 f −g ⇔ f ∧g ′ 1.3 基本命题 约定如下两个公理: ↼ o(NoN) = U, ↼ 公理 1(发现公理) e(x) = Ø。 公理 2(顺序公理) o ⩽ f ⩽ e。 ↼ e(x) = Ø e U x 注:由全元素的定义,公理 的意义是 的回溯不能在论域 发现以 标识的对象的等 价类。 在前述概念 (定义) 和两个公理的基础上,可 以证明下列命题: ↼ f = ↼ 命题 1(对合定理) g ⇔ f = g。 g ⩽ f ⇔ ↼ f ⩽ ↼ 命题 2(反变关系定理) g。 命题 3(幂等律) f ∧ f = f, f ∨ f = f 。 命题 4(交换律) f ∧g = g∧ f, f ∨g = g∨ f 。 (f ∧g)∧h = f ∧(g∧h) (f ∨g)∨ h = f ∨(g∨h) 命题 5(结合律) , 。 f ∧(g∨h) = (f ∧g)∨(f ∧h) f∨ (g∧h) = (f ∨g)∧(f ∨h) 命题 6(分配律) , 。 f ∨g ⩽ f, f ∨g ⩽ g f ⩽ g∧ f,g ⩽ g∧ f 命 题 7 ( 第一吸收律 ) ; 。 g ⩽ f f ∧g = f f ∨g = g 命题 8(第二吸收律) 若 ,则 , 。反之亦真。 命题 9(第三吸收律) f ∨(f ∧g)= f, f ∧(f ∨g)= f。 命题 10(排序定理) o ⩽ f ∨g ⩽ f,g ⩽ f ∧g ⩽ e。 o = e ′ , e = o 命题 ′ 11(第一对偶律) 。 (f ∧g) ′ = f ′ ∨g ′ (f ∨g) ′ = f ′ ∧g ′ 命题 12(第二对偶律) , 。 ·658· 智 能 系 统 学 报 第 13 卷
第4期 包研科,等:因素空间的结构与对偶回旋定理 ·659· 1.4因素空间 本空间S理解为论域,而σ-代数F等价于F(S), 在一个论域U上,可以定义多个因素f, 相应概念的对应关系可作如下约定: 称为U上一个因素族,并作为一个代数系统进行讨 1)X=o表示对X的观测缺失。 论,是借助因素分析实现论域上知识发现的基础。 2)X=e表示对X的观测不能发现随机性波动 定义1设F表示定义在论域U上的所有因素 (取常数值)。 的集合,则称代数系统(E,V,A,)是论域U上一个 3)XVY表示对(X,Y)的联合概率分布F(x,y)的 因素空间,记为FS。 观测。 定义中3种代数运算V,A,的概念和性质承接 4)XAY表示(X,)对条件分布乘积F(y) 1.2和1.3节的讨论。 FrOx)的观测。 由零因素的定义,显然o∈F。由论域的可列 5)表示对1-Fx(x)的观测。 性和全因素的定义,1.=U,至少U中对象的“编 在一个论域U上的知识发现问题,通常存在 号”是一个定义在U上的全因素,即存在e∈F。 各种不同的主题T,i=1,2,…,N,每一个主题下所 定义2设f和g是论域U上两个因素,若 有可能结果的集合就是这一主题的样本空间S: U/f+U/g,则称f和g是自为因素。 相应的存在一个正则因素空间C℉S,则论域U上 定义3设以,是论域U上一个平凡因素族, 的因素空间 i≠j=1,2,…,N,f和f是自为因素,则称{f是 FS=CFS1XCFS2X·x CFS 可基因素族,记为BF。 相应的,信息系统 定义4设BF是因素空间(E,V,A,)上的一个 (U,BF)=(U,BF XBF2X...XBFN) 有限可基因素族,则称各个因素相空间的笛卡 CFS的概念有助于FS分析方法与技术体系 尔积 的建构,有助于理解因素空间同概率空间、希尔 I1XI2X…XI 伯特空间和张量空间的关系。 为定义在论域0上的一个信息系统,不妨记为 前述讨论是对因素空间宏观结构的一种公理 (U,BF。 化诠释,其意义在于为信息系统分析提供了一个 定义5设BF为因素空间(F,V,A,)中的可列 统一的语境场。 可基因素族,若 2因素空间的结构 m会1f=o且imA%f=e f∈BF,则称BF为论域U上的一个完备因素族, 21交错自同构变换与回旋格 记为CFF。 通常认为,格是认知描述与形式概念分析理 称(CFF,V,A,)为完备因素空间,简称因素空 想的代数系统B。 间,仍记为FS。 本文引进格上的交错自同构变换和回旋格的 称(U,CFF)是一个完备信息系统,记为CIS。 概念,然后给出FS对偶回旋定理,构成对FS代 在不引起误会的场合,不必刻意区分FS和 数结构的新认知。 CIS的不同,即一个因素空间既是一个完备信息 定义7设≤为非空集合L上的偏序关系, 系统。 (L,≤)为有界偏序格,其中,x,y∈L,xVy=sup{x,y以, 显然,当论域U为有限集时,存在自然数 xAy=inf{x,y以,泛下界为0,泛上界为1。 N<o,使V%1f=o且A2f=e。 若L上存在变换x,满足条件: 定义6设(S,F,P)是一个概率空间,H是定 1)x∈L,x≠0,1,t(x)=xo 义在样本空间S上的所有二阶矩随机变量的集 2)Hx,y∈L,t(xVy)=x∧y,t(xAy)=xVyo 合,H={XEX)<∞,则称(H,V,A,)为正则因素 3)x(0)=1,x(1)=0。 空间,记为CFS。 则称r为(L,s)上的交错自同构变换(staggered 引进CFS的目的是方便描述结构化数据分析 automorphism transform). 问题。文献[34]中讨论了因素概念的外延,随机 下面诠释格上交错自同构变换的几何意义。 变量是基本的数量化因素。若有限个二阶矩随机 不妨设L={x,x≠0,1,在(L,≤)中,格点是分 变量X,j=1,2…,N各自有不同的概率分布,则 层的。按组合计数C,k=1,2,·,n,同层的格点集 X,=BF,于是(S,{X以)就是一个结构化信息系 合记为 统。CFS在结构化数据分析的应用中,只需将样 =L.x=.(Vx=(v
1.4 因素空间 U {fj} N j=1 U 在一个论域 上,可以定义多个因素 , 称为 上一个因素族,并作为一个代数系统进行讨 论,是借助因素分析实现论域上知识发现的基础。 F U (F,∨,∧, ′ ) 定义 1 设 表示定义在论域 上的所有因素 的集合,则称代数系统 是论域 U 上一个 因素空间,记为 FS。 ∨,∧, 定义中 ′ 3 种代数运算 的概念和性质承接 1.2 和 1.3 节的讨论。 o ∈ F Ie ≓ U U U e ∈ F 由零因素的定义,显然 。由论域的可列 性和全因素的定义, ,至少 中对象的“编 号”是一个定义在 上的全因素,即存在 。 f g U U/ f , U/g f g 定 义 2 设 和 是论域 上两个因素,若 ,则称 和 是自为因素。 {fj} N j=1 U ∀i , j = 1,2,··· ,N fi fj {fj} N j=1 定义 3 设 是论域 上一个平凡因素族, , 和 是自为因素,则称 是 可基因素族,记为 BF。 (F,∨,∧, ′ 定义 4 设 BF 是因素空间 ) 上的一个 有限可基因素族,则称各个因素相空间的笛卡 尔积 I1 × I2 × ··· × IN U (U,BF) 为定义在论域 上的一个信息系统,不妨记为 。 (F,∨,∧, ′ 定义 5 设 BF 为因素空间 ) 中的可列 可基因素族,若 lim N→∞ V N j=1 fj = o且 lim N→∞ Λ N j=1 fj = e fj ∈ BF U CFF ,则称 BF 为论域 上的一个完备因素族, 记为 。 (CFF,∨,∧, ′ 称 ) 为完备因素空间,简称因素空 间,仍记为 FS。 称 (U,CFF) 是一个完备信息系统,记为 CIS。 在不引起误会的场合,不必刻意区分 FS 和 CIS 的不同,即一个因素空间既是一个完备信息 系统。 U N < ∞ V N j=1 fj = o Λ N j=1 fj = e 显然,当论域 为有限集时,存在自然数 ,使 且 。 F S H = {X|E(|X| 2 ) < ∞} (H,∨,∧, ′ ) 定义 6 设 (S, ,P) 是一个概率空间,H 是定 义在样本空间 上的所有二阶矩随机变量的集 合 , ,则称 为正则因素 空间,记为 CFS。 Xj , j = 1,2,··· ,N {Xj} N j=1 = (S,{Xj} N j=1 ) 引进 CFS 的目的是方便描述结构化数据分析 问题。文献[34]中讨论了因素概念的外延,随机 变量是基本的数量化因素。若有限个二阶矩随机 变量 各自有不同的概率分布,则 BF,于是 就是一个结构化信息系 统。CFS 在结构化数据分析的应用中,只需将样 本空间 S 理解为论域,而σ−代数 F 等价于 F (S), 相应概念的对应关系可作如下约定: 1) X = o表示对 X 的观测缺失。 2) X = e表示对 X 的观测不能发现随机性 波动 (取常数值)。 3) X ∨Y 表示对 (X,Y) 的联合概率分布 F(x, y) 的 观测。 X ∧Y (X,Y) FX|Y (x|y)· FY|X(y|x) 4 ) 表 示 对条件分布乘积 的观测。 5) X¯表示对 1− FX(x) 的观测。 U Ti ,i = 1,2,··· ,N S i CFSi U 在一个论域 上的知识发现问题,通常存在 各种不同的主题 ,每一个主题下所 有可能结果的集合就是这一主题的样本空间 , 相应的存在一个正则因素空间 ,则论域 上 的因素空间 FS = CFS1 ×CFS2 × ··· ×CFSN 相应的,信息系统 (U,BF) = (U,BF1 ×BF2 × ··· ×BFN) CFS 的概念有助于 FS 分析方法与技术体系 的建构,有助于理解因素空间同概率空间、希尔 伯特空间和张量空间的关系。 前述讨论是对因素空间宏观结构的一种公理 化诠释,其意义在于为信息系统分析提供了一个 统一的语境场。 2 因素空间的结构 2.1 交错自同构变换与回旋格 通常认为,格是认知描述与形式概念分析理 想的代数系统[2, 36]。 本文引进格上的交错自同构变换和回旋格的 概念,然后给出 FS 对偶回旋定理,构成对 FS 代 数结构的新认知。 ⩽ L (L,⩽) ∀x, y ∈ L x∨y = sup{x, y} x∧y = inf{x, y} 定 义 7 设 为非空集合 上的偏序关系, 为有界偏序格,其中, , , ,泛下界为 0,泛上界为 1。 若 L 上存在变换τ,满足条件: 1) ∀x ∈ L, x , 0,1,τ(x) = x。 2) ∀x, y ∈ L,τ(x∨y) = x∧y,τ(x∧y) = x∨y。 3) τ(0) = 1,τ(1) = 0。 则称τ为 (L,⩽) 上的交错自同构变换 (staggered automorphism transform)。 下面诠释格上交错自同构变换的几何意义。 L = {xj} n j=1 , xj , 0,1 (L,⩽) C k n , k = 1,2,··· ,n 不妨设 ,在 中,格点是分 层的。按组合计数 ,同层的格点集 合记为 {xj} (1) = L,{∧xj} (k) = {∧k s=1 xjs },{∨xj} (k) = {∨k s=1 xjs } 第 4 期 包研科,等:因素空间的结构与对偶回旋定理 ·659·
·660· 智能系统学报 第13卷 式中k=1,2,…,n。于是,格中的偏序关系为 素解析能力的大小主导因素的序关系,偏序格 0≤…≤{Ax}w≤…≤{x四≤…≤{Vx}W≤…≤1… (CFF,≤)受顺序公理、对合定理、反变关系定理和 (1) 排序定理的影响,同数学上经典的偏序格不尽相 在每一个层的格点集合中取一个元素,由关 同。因此,在代数格(CFF,V,A)中,虽然形式运算 系≤构成一个序链。 性质同数学经典的代数格描述一致,但内在运算 若将式(1)理解为一条定宽的纸带,从左到右 机理有所不同。 摹写式(1)中的格层与偏序关系,最左端为0,最 在布尔格(CFF,V,A,)中,结构与体系的核心 右端为1。 在于因素大小的定义和顺序公理的约定。下面引 根据交错自同构变换的3个条件,将τ的像摹 进(CFF,V,A,)上的交错自同构变换: 写在纸带(1)的反面,得到一种同≤等价(认知等 1)将因素大小的定义 效)的偏序关系≤,即纸带(1)的反面为 1≤…≤{Vx}w≤…≤{x≤…≤{Λx}W≤…≤0… f≤g台80y)Sfx) (2) 变异为 记为 g≤f台80y∈fx) (L,≤,T)=(L,) 2)将顺序公理 显然,两个偏序格(L,≤)和(L,≤)的代数格同一, o≤f≤e 均为(L,V,A)。 变异为 在格(L,V,Λ)上,由于式(1)左端的0和式 e≤f≤o (2)右端的0同一,式(1)右端的1和式(2)左端的 式中o和e的意义不变。 1同一,所以这一纸带是对合的,但是需要扭转纸 由变异式(1)可知,因素之间的关系≤和≤有 带粘合两端,粘合后一面显示0,另一面显示1。 相同的背景关系;由变异式(2)可知,≤和≤的认知 于是,L上的两种偏序关系≤和≤融合为一体,即在 意义不同,≤代表了认知的解析过程,≤代表了认 泛界点0或1处,偏序关系≤和<均“不失意”的无 知的概括过程。因此,≤和≤背景关系的一致和认 障碍连通。 知意义的不同,反映的是概念的对合性和概念分 综上所述,一个存在交错自同构变换的偏序 化、同化过程的技术差异。 格(亿,≤),其代数格(L,V,八)的几何构型是一个麦乌 3)代数运算V,A的定义不变 比斯环(mobius strip)o 在上述3个约定下,需要系统的修改、重述 定义8设≤和≤是非空集合L上的两个不同 13节涉及序关系的命题,其他命题形式不变。修 的偏序关系,若(L,≤)是有界偏序格(L,≤)上交错自 改后的相关命题如下: 同构变换的像,则称(L,≤)的代数格(L,V,A)为回旋 格(convolution lattice),其几何构型如图l。 命题2'(外延限制定理)f≤g台f≤8。 认知本体论的解释:命题2'由命题2描述概 念内涵与外延的反变关系转变为描述对外延的 限制。 命题7'(第一吸收律)fAg≤f,fΛg≤g;f≤ gVf,g≤gVf。 命题8'(第二吸收律)若g≤f,则fΛg=g, 图1回旋格的几何构型 fvg=f。反之亦真。 Fig.1 The geometry of convolution lattice 认知本体论的解释:命题7'和命题8修改了 显然,回旋格的定义当L为可列集时仍是适用 序关系与代数运算的联系规则,将因素固有的概 的。引进回旋格的概念,旨在揭示因素空间深 括功能从“隐性”表达转变为“显性”表达。 刻、丰富而有趣的性质。 命题10'(排序定理)e≤fAg≤f,g≤fVg≤o。 2.2对偶回旋定理 从命题10到命题10'实现了(CFF,V,A)从偏序 关于CFS的代数结构,文献[34]已经证明: 关系≤到偏序关系的交错自同构变换。 (CFF,≤)是一个偏序格。(CFF,V,A)是一个有界代 基于偏序关系≤的背景关系,容易证明命题 数格,满足分配律。(CFF,V,A,)是一个布尔格。 2’、命题7’、命题8和命题10',限于篇幅,不再 上述结论的建立,数学原理基于认知原理,遵 赘述证明过程。在偏序关系≤约定的结构体系 循概念内涵与外延的对合性与反变关系原理,因 上,(CF,V,,)仍是一个布尔格
式中 k = 1,2,··· ,n。于是,格中的偏序关系为 0 ⩽ ··· ⩽ {∧xj} (k) ⩽ ··· ⩽ {xj} (1) ⩽ ··· ⩽ {∨xj} (k) ⩽ ··· ⩽ 1··· (1) ⩽ 在每一个层的格点集合中取一个元素,由关 系 构成一个序链。 若将式 (1) 理解为一条定宽的纸带,从左到右 摹写式 (1) 中的格层与偏序关系,最左端为 0,最 右端为 1。 τ ⩽ ≼ 根据交错自同构变换的 3 个条件,将 的像摹 写在纸带 (1) 的反面,得到一种同 等价 (认知等 效) 的偏序关系 ,即纸带 (1) 的反面为 1 ≼ ··· ≼ {∨xj} (k) ≼ ··· ≼ {xj} (1) ≼ ··· ≼ {∧xj} (k) ≼ ··· ≼ 0··· (2) 记为 (L,⩽,τ) = (L,≼) (L,⩽) (L,≼) (L,∨,∧) 显然,两个偏序格 和 的代数格同一, 均为 。 (L,∨,∧) ⩽ ≼ ⩽ ≼ 在 格 上,由于 式 ( 1 ) 左 端 的 0 和 式 (2) 右端的 0 同一,式 (1) 右端的 1 和式 (2) 左端的 1 同一,所以这一纸带是对合的,但是需要扭转纸 带粘合两端,粘合后一面显示 0,另一面显示 1。 于是,L 上的两种偏序关系 和 融合为一体,即在 泛界点 0 或 1 处,偏序关系 和 均“不失意”的无 障碍连通。 (L,⩽) (L,∨,∧) 综上所述,一个存在交错自同构变换的偏序 格 ,其代数格 的几何构型是一个麦乌 比斯环 (mobius strip)。 ⩽ ≼ L (L,≼) (L,⩽) (L,⩽) (L,∨,∧) 定义 8 设 和 是非空集合 上的两个不同 的偏序关系,若 是有界偏序格 上交错自 同构变换的像,则称 的代数格 为回旋 格 (convolution lattice),其几何构型如图 1。 显然,回旋格的定义当 L 为可列集时仍是适用 的。引进回旋格的概念,旨在揭示因素空间深 刻、丰富而有趣的性质。 2.2 对偶回旋定理 (CFF,⩽) (CFF,∨,∧) (CFF,∨,∧, ′ ) 关于 CFS 的代数结构,文献[34]已经证明: 是一个偏序格。 是一个有界代 数格,满足分配律。 是一个布尔格。 上述结论的建立,数学原理基于认知原理,遵 循概念内涵与外延的对合性与反变关系原理,因 (CFF,⩽) (CFF,∨,∧) 素解析能力的大小主导因素的序关系,偏序格 受顺序公理、对合定理、反变关系定理和 排序定理的影响,同数学上经典的偏序格不尽相 同。因此,在代数格 中,虽然形式运算 性质同数学经典的代数格描述一致,但内在运算 机理有所不同。 (CFF,∨,∧, ′ ) (CFF,∨,∧, ′ ) 在布尔格 中,结构与体系的核心 在于因素大小的定义和顺序公理的约定。下面引 进 上的交错自同构变换: 1) 将因素大小的定义 f ⩽ g ⇔ ↼ g(y) ⊆ ↼ f(x) 变异为 g ≼ f ⇔ ↼ g(y) ⊆ ↼ f(x) 2) 将顺序公理 o ⩽ f ⩽ e 变异为 e ≼ f ≼ o 式中o和e的意义不变。 ⩽ ≼ ⩽ ≼ ⩽ ≼ ⩽ ≼ 由变异式 (1) 可知,因素之间的关系 和 有 相同的背景关系;由变异式 (2) 可知, 和 的认知 意义不同, 代表了认知的解析过程, 代表了认 知的概括过程。因此, 和 背景关系的一致和认 知意义的不同,反映的是概念的对合性和概念分 化、同化过程的技术差异。 3) 代数运算 ∨,∧ 的定义不变 在上述 3 个约定下,需要系统的修改、重述 1.3 节涉及序关系的命题,其他命题形式不变。修 改后的相关命题如下: f ≼ g ⇔ ↼ f ≼ ↼ 命题 2’(外延限制定理) g。 认知本体论的解释:命题 2’由命题 2 描述概 念内涵与外延的反变关系转变为描述对外延的 限制。 f ∧g ≼ f, f ∧g ≼ g f ≼ g∨ f,g ≼ g∨ f 命题 7’(第一吸收律) ; 。 g ≼ f f ∧g = g f ∨g = f 命题 8 ’(第二吸收律) 若 ,则 , 。反之亦真。 认知本体论的解释:命题 7’和命题 8’修改了 序关系与代数运算的联系规则,将因素固有的概 括功能从“隐性”表达转变为“显性”表达。 命题 10’(排序定理) e ≼ f ∧g ≼ f,g ≼ f ∨g ≼ o。 (CFF,∨,∧) ⩽ ≼ 从命题 10 到命题 10’实现了 从偏序 关系 到偏序关系 的交错自同构变换。 ≼ ≼ (CFF,∨,∧, ′ ) 基于偏序关系 的背景关系,容易证明命题 2’、命题 7’、命题 8’和命题 10’,限于篇幅,不再 赘述证明过程。在偏序关系 约定的结构体系 上, 仍是一个布尔格。 图 1 回旋格的几何构型 Fig. 1 The geometry of convolution lattice ·660· 智 能 系 统 学 报 第 13 卷