·42· 智能系统学报 第13卷 在此,我们要介绍1982年由以Pawlak为代表 5678 的波兰学派所提出的粗糙集(rough sets)9。粗糙集 234 56789 明确地以数据库为研究对象,他们的学派也是 678 h568 KDD(数据知识发现)的倡导者。粗糙集把重点从 123 属性值转为属性名。用属性名列表,避免了Wille 68 23 的列表困难。所列的表叫作信息系统,称为关系数 abcgh 据库的库表。他们用数学描述知识,用内外夹逼的 DC 思想来刻画概念,提出了决策的一般模型。粗糙集 是关系数据库的数学基础。 图3“生物与水”的概念格图 Fig.3 The concept lattice of"biology and water" 形式概念分析虽然与粗糙集同年提出,但却隐 需要强调两点:1)Wlle第一次给概念下了一个 藏了十余年,后来才引起粗糙集学者们的广泛重 严格的数学定义,强调了内涵与外延的对合性。内 视。Wille的严谨性触动了粗糙集作者的粗犷风格, 涵是使概念得到统一认识的语义信息,外延是检验 曾在粗糙集文献中说过:划分就是知识。按此说 信息传递是否符合客观实际的关口。若内涵与外延 法,任一集合与其余集就是一个划分,就是知识,就 不对合,信息传递就不可能可靠地反映客观现实, 有概念,这集合就应当是某个概念的外延,这就直 信息科学的根基便会动摇,所有的信息实践活动都 接违反了Wille的对合性原则。在这一点上,粗糙 将缺乏根据。2)自从他的论文发表以后,计算机就 集是有缺点的。然而粗糙集突出了属性名,就是突 开始自动生成概念,这是人工智能的一大飞跃。机 出了因素,比起形式概念分析,是一个重大的进步, 器早就可以证明定理,但机器却从未生成概念。定 可惜的是,他们并没有把属性名提到因素的高度。 理只能在已有的概念之间兜圈子,人的智能却能从 粗糙集在人工智能的应用热点是属性约简,靠的是 对比中产生新的概念,为定理制造新的猜想。 区分矩阵,每一个矩阵方格中放置的是一组属性 Wile必定明白:我们不可能也不需要使机器像人脑 名。由这个矩阵要造就一个区分函数,中间必须涉 样真正地感知世界,但只要机器能机械地按他的 及属性名的运算,可是,粗糙集没有定义属性名的 算法构建概念体系,又能保证这个体系能随时回归 运算,把它与属性值的逻辑运算混杂在一起,出现 联通到人脑,就能帮助人类大大加速智力建设!因 数学描述的漏洞,所提出的算法也过于繁杂,并没 为,信息科学虽与脑学科紧密相连,但却有独立于 有取得应用的实效。尽管存在着这些问题,粗糙集 人脑的特色,其中存在着用数学可以描述的规律。 仍取得了重要的发展o-切。 概念体系无需全部浸泡在感知的海洋里,它可以有 因素空间也在1982年由笔者提出,早期曾用 间歇地脱离实际,脱离大脑,就像我们自己的知识 于模糊智能的研究,直到2012年才与形式概念分析 并非每一步都要亲眼见到或经过大脑(理解) 及粗糙集合流。因素空间为概念生成提供了贴切的 样。关键是,只有坚持内涵与外延的对合性,机器 数学描述。人靠什么分男女?靠的是性别。靠什么 自动生成的概念才能向人脑回归和联通。没有回归 分中外?靠的是国籍。靠什么分老少?靠的是年 联通人脑能力的机器概念体系所具有的功效和价值 龄。性别、国籍和年龄都是因素。同一个人群按照 为零。 不同的因素可以做出不同的划分。它们又可以综合 Wille的工作缺陷在于:I)他的形式背景表以 起来形成更细的划分。因素是概念的划分器,要讲 属性来分列,制造了列表困难,由此导致他的算法 概念,必须从因素讲起。概念产生于比较,比较发 复杂。为了寻找对合的概念,从每一行或列开始搜 现异同。但是世界上没有绝对的异,也没有绝对的 索,再每两行或两列这样的搜索方式本身就是 同,所谓异同都是相对于一定因素而言的。因素是 指数爆炸的。他一整本书就是为了避免指数爆炸而 比较的角度和依据。风马牛不相及的东西不能进行 设立各种算法,但仍然无法摆脱N-hard陷阱。2) 比较,因为它们之间没有可比较的基础。因素就是 Wille所说的概念,都是属性的析取,只含“且”字而 比较基。若f代表颜色,a和b是有颜色的两个东西, 不含“或”字,这不是一般概念而是基本概念。对合 我们便可以用“f(@)=f(b)?”来比较a和b在颜色方面 性只对基本概念成立,带或字的概念是无法对合 的异同。若g代表吸引力,a和b是有吸引力可言的两 的。基本概念只能形成半格,所以,他说的概念格 个东西,便可以用“g(a)=g(b)?”来比较a和b在吸引 应该改为基本概念半格。 力方面的异同。总之,比较离不开因素。一个因素
a ab 5678 ad adj 568 abdf abcdf 6 56 68 acdf 678 acd 12 356 123 45678 abc 36 acde abcdef ghi ac 34 678 abg 123 abgh 23 3 abcgh acghi acgh agh ag 1234 234 34 4 7 图 3 “生物与水”的‘概念格’图 Fig. 3 The concept lattice of "biology and water" 需要强调两点:1)Wille 第一次给概念下了一个 严格的数学定义,强调了内涵与外延的对合性。内 涵是使概念得到统一认识的语义信息,外延是检验 信息传递是否符合客观实际的关口。若内涵与外延 不对合,信息传递就不可能可靠地反映客观现实, 信息科学的根基便会动摇,所有的信息实践活动都 将缺乏根据。2) 自从他的论文发表以后,计算机就 开始自动生成概念,这是人工智能的一大飞跃。机 器早就可以证明定理,但机器却从未生成概念。定 理只能在已有的概念之间兜圈子,人的智能却能从 对比中产生新的概念,为定理制造新的猜想。 Wille 必定明白:我们不可能也不需要使机器像人脑 一样真正地感知世界,但只要机器能机械地按他的 算法构建概念体系,又能保证这个体系能随时回归 联通到人脑,就能帮助人类大大加速智力建设!因 为,信息科学虽与脑学科紧密相连,但却有独立于 人脑的特色,其中存在着用数学可以描述的规律。 概念体系无需全部浸泡在感知的海洋里,它可以有 间歇地脱离实际,脱离大脑,就像我们自己的知识 并非每一步都要亲眼见到或经过大脑 (理解) 一 样。关键是,只有坚持内涵与外延的对合性,机器 自动生成的概念才能向人脑回归和联通。没有回归 联通人脑能力的机器概念体系所具有的功效和价值 为零。 ······ Wille 的工作缺陷在于:1) 他的形式背景表以 属性来分列,制造了列表困难,由此导致他的算法 复杂。为了寻找对合的概念,从每一行或列开始搜 索,再每两行或两列 这样的搜索方式本身就是 指数爆炸的。他一整本书就是为了避免指数爆炸而 设立各种算法,但仍然无法摆脱 N-hard 陷阱。2) Wille 所说的概念,都是属性的析取,只含“且”字而 不含“或”字,这不是一般概念而是基本概念。对合 性只对基本概念成立,带或字的概念是无法对合 的。基本概念只能形成半格,所以,他说的概念格 应该改为基本概念半格。 在此,我们要介绍 1982 年由以 Pawlak 为代表 的波兰学派所提出的粗糙集 (rough sets)[9]。粗糙集 明确地以数据库为研究对象,他们的学派也是 KDD(数据知识发现) 的倡导者。粗糙集把重点从 属性值转为属性名。用属性名列表,避免了 Wille 的列表困难。所列的表叫作信息系统,称为关系数 据库的库表。他们用数学描述知识,用内外夹逼的 思想来刻画概念,提出了决策的一般模型。粗糙集 是关系数据库的数学基础。 形式概念分析虽然与粗糙集同年提出,但却隐 藏了十余年,后来才引起粗糙集学者们的广泛重 视。Wille 的严谨性触动了粗糙集作者的粗犷风格, 曾在粗糙集文献中说过:划分就是知识。按此说 法,任一集合与其余集就是一个划分,就是知识,就 有概念,这集合就应当是某个概念的外延,这就直 接违反了 Wille 的对合性原则。在这一点上,粗糙 集是有缺点的。然而粗糙集突出了属性名,就是突 出了因素,比起形式概念分析,是一个重大的进步, 可惜的是,他们并没有把属性名提到因素的高度。 粗糙集在人工智能的应用热点是属性约简,靠的是 区分矩阵,每一个矩阵方格中放置的是一组属性 名。由这个矩阵要造就一个区分函数,中间必须涉 及属性名的运算,可是,粗糙集没有定义属性名的 运算,把它与属性值的逻辑运算混杂在一起,出现 数学描述的漏洞,所提出的算法也过于繁杂,并没 有取得应用的实效。尽管存在着这些问题,粗糙集 仍取得了重要的发展[10-11]。 f a b f (a) = f (b)? a b g a b g(a) = g(b)? a b 因素空间也在 1982 年由笔者提出[12] ,早期曾用 于模糊智能的研究,直到 2012 年才与形式概念分析 及粗糙集合流。因素空间为概念生成提供了贴切的 数学描述。人靠什么分男女?靠的是性别。靠什么 分中外?靠的是国籍。靠什么分老少?靠的是年 龄。性别、国籍和年龄都是因素。同一个人群按照 不同的因素可以做出不同的划分。它们又可以综合 起来形成更细的划分。因素是概念的划分器,要讲 概念,必须从因素讲起。概念产生于比较,比较发 现异同。但是世界上没有绝对的异,也没有绝对的 同,所谓异同都是相对于一定因素而言的。因素是 比较的角度和依据。风马牛不相及的东西不能进行 比较,因为它们之间没有可比较的基础。因素就是 比较基。若 代表颜色, 和 是有颜色的两个东西, 我们便可以用“ ”来比较 和 在颜色方面 的异同。若 代表吸引力, 和 是有吸引力可言的两 个东西,便可以用“ ”来比较 和 在吸引 力方面的异同。总之,比较离不开因素。一个因素 ·42· 智 能 系 统 学 报 第 13 卷
第1期 汪培庄:因素空间理论一机制主义人工智能理论的数学基础 ·43· 把事物从一个方面进行划分,多个因素把事物从多 原子概念的提取是不需要计算的,只要背景关系知 个方面进行划分。因素越多,对事物的划分就越 道了,它的每一个性状颗粒就决定一个原子概念。 细,概念产生得就越多。知识发展的生态就是概念 由原子概念用“且”字连接起来,可以生成其他 的不断分割过程。婴儿出世时只有零概念,其内涵 的所有概念,形成布尔代数,这在计算机上就可实 是零描述而外延是混沌一团的宇宙。生存需求的本 现概念的自动生成,理论上极其简单。自动生成的 能因素把母亲从万物中区分出来,在外延上进行分 概念不是怕少而是怕多,设原子概念的个数是k,则 割。人们形象地把外延称为概念的团粒。概念在何 生成的概念个数就是2*。我们需要把概念的范围缩 时不够用呢?就是目标需求的差异发生在一个概念 小,非原子概念不一定满足对合性,其中满足对合 团粒的内部,用这个概念无法区分差异,在这个时 性的概念是哪些呢? 候,认知的需求就要力求打破团粒,使之由粗变细, 定义12内涵能表为合取范式的概念叫作基 本概念。 而相应的内涵便要在原概念(称为上位概念)的内 所谓合取范式就是形如(a1Va2V…Va1)A… 涵上再增添新的划分内容。人类的知识大树这就是 A(an1Van2V…V ankiny)这样的式子,其中v与A分别代 这样一步一步形成的。每一步都是上位概念的分 表“或”与“且”。每个小括号都是析取式,最后都用 割,都要靠因素。知识的图谱必须以因素作为导引。 且字合起来。它们在因素的相空间中是拟超矩形 新因素对上位概念团粒划分的贡献可以用分辨 (联通或不联通的超矩形)。原子概念都是基本概 度来刻画,把U中任意两个不同的对象序列叫作一 念。所有基本概念的集合对合取运算封闭,形成一 个对子。能分辨的对子数目越多,分辨度就越大。 个半格,叫作基本概念半格。Wile在图2中所画的 定义10设H(U,F)=C-(4,M儿a2- 就是基本概念半格,只不过在最下面加了一个极限 d,=1-[n(1)(n(1)-1)+…+n(K)(n(K-1)]/m(m-1) 概念,它的外延是空集,内涵无限制。 (8) 定义13给定因素空间和背景关系。包含所 叫作因素f对U中对象的分辨度。 有原子概念的基本概念子半格叫作粒子半格。 现在让我们回到前面所说的背景关系R。R是 通过粒子半格的建立,能在给定因素下将上位 性状空间X中所有原子内涵所成之集,它当然是描 概念团粒细化到所有原子概念。在实际运用中,基 写内涵的。外延是论域中的事情,但是由于F是从 本概念半格中的概念还嫌多。粒子半格中不一定有 H(U,F)到R的同构映射。R又是论域的代表,所以背 最小的半格,要找的是到达原子分割步数尽可能少 景关系成了内涵与外延的重合体,这就使背景关系 的粒子半格。下面是所要求的一种基本算法,其复 R是概念生成的双料调色板。 杂度是0(m2n)。 定义11给定定性因素空间(U,X(F),设R是 基本算法1最短粒子半格算法町 因素F={f,fi,…,f的背景关系,则对任意a∈R, 1)给定U,计算每个因素对U中对象的分辨 称a=(a,[a)为原子概念,a和[a分别叫作概念a的 度; 原子内涵和原子外延;对任意ASR记[A]=U[aIa∈A, 2)选对U分辨度最大的因素∫来实现f对 T=y=(A,[A]DASR,称y=(A,[A])分别是以A,A]为 U的分类:置换对象足码即(行足码)使同类对象连 内涵和外延的概念;称T=(C,V,A,)是由(U,X(F)所 接在一起; 生成的概念布尔代数。 3)用所分出的子类U取代U,重复步骤1)和 a和a都是原子,由于F是从H(U,F)到R的同构 2),直到所有的子类都变成粒子为止,总结出粒子 映射,它们一定满足Wille的对合性。 半格。 这个定义告诉我们,对于定性因素空间而言, 例2给定表2: 表2成员状况因素表 Table 2 Member status factors 因素 1 2 3 4 5 6 78910111213141516171819 20 性别 男男男男男男男男男男女女女女女女女女女女 身高 高高高高高中中中中中中中中中中低低低低低 体重 重重重 常常常常常轻轻重重常常常常轻轻轻轻
把事物从一个方面进行划分,多个因素把事物从多 个方面进行划分。因素越多,对事物的划分就越 细,概念产生得就越多。知识发展的生态就是概念 的不断分割过程。婴儿出世时只有零概念,其内涵 是零描述而外延是混沌一团的宇宙。生存需求的本 能因素把母亲从万物中区分出来,在外延上进行分 割。人们形象地把外延称为概念的团粒。概念在何 时不够用呢?就是目标需求的差异发生在一个概念 团粒的内部,用这个概念无法区分差异,在这个时 候,认知的需求就要力求打破团粒,使之由粗变细, 而相应的内涵便要在原概念 (称为上位概念) 的内 涵上再增添新的划分内容。人类的知识大树这就是 这样一步一步形成的。每一步都是上位概念的分 割,都要靠因素。知识的图谱必须以因素作为导引。 U 新因素对上位概念团粒划分的贡献可以用分辨 度来刻画,把 中任意两个不同的对象序列叫作一 个对子。能分辨的对子数目越多,分辨度就越大。 H (U,F)= { Ck= ( uk,1 ,···,uk,n(k) )} 定义 (k=1,2,···,K) 10[4] 设 df = 1−[n(1)(n(1)−1)+···+n(K)(n(K)−1)]/m(m−1) (8) 叫作因素 f 对 U 中对象的分辨度。 R R X F H (U,F) R R R 现在让我们回到前面所说的背景关系 。 是 性状空间 中所有原子内涵所成之集,它当然是描 写内涵的。外延是论域中的事情,但是由于 是从 到 的同构映射。 又是论域的代表,所以背 景关系成了内涵与外延的重合体,这就使背景关系 是概念生成的双料调色板。 (U,X (F)) R F ∗ = {f1, f2,··· , fn} a ∈ R a = (a, [a]) a [a] α A ⊆ R [A] = ∪{[a]|a ∈ A} Γ = {γ = (A,[A])|A ⊆ R} γ = (A,[A]) A,[A] Γ = (Γ,∨,∧,¬) (U,X (F)) 定义 11[4] 给定定性因素空间 ,设 是 因素 的背景关系,则对任意 , 称 为原子概念, 和 分别叫作概念 的 原子内涵和原子外延;对任意 ,记 , ,称 分别是以 为 内涵和外延的概念;称 是由 所 生成的概念布尔代数。 a 和 [a] 都是原子,由于 F 是从 H (U,F) 到 R 的同构 映射,它们一定满足 Wille 的对合性。 这个定义告诉我们,对于定性因素空间而言, 原子概念的提取是不需要计算的,只要背景关系知 道了,它的每一个性状颗粒就决定一个原子概念。 k 2 k 由原子概念用“且”字连接起来,可以生成其他 的所有概念,形成布尔代数,这在计算机上就可实 现概念的自动生成,理论上极其简单。自动生成的 概念不是怕少而是怕多,设原子概念的个数是 ,则 生成的概念个数就是 。我们需要把概念的范围缩 小,非原子概念不一定满足对合性,其中满足对合 性的概念是哪些呢? 定义 12 内涵能表为合取范式的概念叫作基 本概念。 (a11 ∨a12 ∨ ··· ∨a1k(1))∧ ··· ∧(an1 ∨an2 ∨ ··· ∨ank(n) ) ∨ ∧ 所谓合取范式就是形如 这样的式子,其中 与 分别代 表“或”与“且”。每个小括号都是析取式,最后都用 且字合起来。它们在因素的相空间中是拟超矩形 (联通或不联通的超矩形)。原子概念都是基本概 念。所有基本概念的集合对合取运算封闭,形成一 个半格,叫作基本概念半格。Wille 在图 2 中所画的 就是基本概念半格,只不过在最下面加了一个极限 概念,它的外延是空集,内涵无限制。 定义 13 给定因素空间和背景关系。包含所 有原子概念的基本概念子半格叫作粒子半格。 O ( m 2n ) 通过粒子半格的建立,能在给定因素下将上位 概念团粒细化到所有原子概念。在实际运用中,基 本概念半格中的概念还嫌多。粒子半格中不一定有 最小的半格,要找的是到达原子分割步数尽可能少 的粒子半格。下面是所要求的一种基本算法,其复 杂度是 。 基本算法 1 最短粒子半格算法[13] 1) 给定 U,计算每个因素对 U 中对象的分辨 度; 2) 选对 U 分辨度最大的因素 f 来实现 f 对 U 的分类: 置换对象足码即(行足码)使同类对象连 接在一起; 3) 用所分出的子类 U′取代 U, 重复步骤 1)和 2),直到所有的子类都变成粒子为止,总结出粒子 半格。 例 2 给定表 2: 表 2 成员状况因素表 Table 2 Member status factors 因素 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 性别 男 男 男 男 男 男 男 男 男 男 女 女 女 女 女 女 女 女 女 女 身高 高 高 高 高 高 中 中 中 中 中 中 中 中 中 中 低 低 低 低 低 体重 重 重 重 常 常 常 常 常 轻 轻 重 重 常 常 常 常 轻 轻 轻 轻 第 1 期 汪培庄:因素空间理论——机制主义人工智能理论的数学基础 ·43·