例3癌细胞识别 在癌细胞识别问题中细胞分成四个标准类型,即;癌细胞(M),重度 核异质细胞(N),轻度核异质细胞(R),正常细胞(T) 选取表征细胞状况的七个特征: x1:核面积 核周长 x2:细胞面积 x4:细胞周长, xs:核内总光密度,x6:核内平均光密度 x:核内平均透光率 根据病理知识,反映细胞是否癌变的主要指标有以下六个,它们都是 ={x:x=(x1,x2…,x)}上的模糊集 A:核增大 B 4x)=(1+22) (a正常核面积) B:核染色增深,B(x)=(1+) C:核桨比例置,C(x)=(1+马2) D核内染色质不匀D()=1+Bx。 (x7+gx6) 核畸形E(x)=1+-B, F:细胞畸形,F(x)=[+ 上述B1B2…B是适当选取的常数 细胞识别中的几个标准类型分别定义为: M=[A∩B∩C∩(DUE)∪F N=A∩B∩C∩M R=A2∩B2∩C2∩M∩N° T=M∩N∩R 上述定义中的模糊集A2的隶属函数为A2(x)=(4(x))2。另两个模糊集B2
例 3 癌细胞识别 在 癌 细 胞 识 别 问 题 中 细 胞 分 成 四 个 标 准 类 型 ,即 :癌 细 胞 (M ) , 重 度 核异质细胞 (N) , 轻 度 核 异 质 细 胞 (R) , 正 常 细 胞 (T )。 选 取 表 征 细 胞 状 况 的 七 个 特 征 : : . : , : , : , : , : , : , 7 5 6 2 4 1 2 核内平均透光率 核内总光密度 核内平均光密度 细胞面积 细胞周长 核面积 核周长 x x x x x x x 根 据 病 理 知 识 ,反 映 细 胞 是 否 癌 变 的 主 要 指 标 有 以 下 六 个 ,它 们 都 是 X = x : x = (x1 , x2 , , x7 ) 上的模糊集: 1 2 3 2 4 6 1 2 1 2 2 5 1 2 7 6 2 4 7 1 2 1 3 1 2 5 2 1 2 1 2 1 ] ( 4 ) : , ( ) [1 ] ( 4 ) : , ( ) [1 ] ( lg ) : , ( ) [1 : , ( ) (1 ) : , ( ) (1 ) : ( ) (1 ) ( ) − − − − − − − = + − = + + = + = + = + = + x x F F x x x E E x x x x D D x x C C x x B B x a x a A A x 细胞畸形 核畸形 核内染色质不匀 核桨比例置 核染色增深 核增大 正常核面积 上 述 1 2 6 , , , 是 适当选取的常数 细 胞 识 别 中 的 几 个 标 准 类 型 分 别 定 义 为 : c c c c c c T M N R R A B C M N N A B C M M A B C D E F = = = = 2 1 2 1 2 1 [ ( )] 上 述 定 义 中 的 模 糊 集 2 1 A 的隶属函数为 2 1 A 2 1 (x) = ( A(x) ) 。另两个模糊集 2 1 B
2的隶属函数类似定义。 给定待识别细胞x∈X,设x0的核面积等七个特征值为(x0,x20,…x,)据此可算出 M(x)、N(x)、R(x0)、T(x0),最后按最大隶属度原则识别 例4冬季降雪量预报 内蒙古丰镇地区流行三条谚语:(1)夏热冬雪大,(2)秋霜晚冬雪大,(3)秋分刮西 北风冬雪大,现在根据三条谚语来预报丰镇地区冬季降雪量。 为描述“夏热”(A)、秋霜晚(A2)、秋分刮西北风(A3)等概念,在气 象现象中提取以下特征 x,:当年6~7月平均气温 x2:当年秋季初霜日期 x3:当年秋分日的风向与正西方向的夹角。 于是模糊集A1(夏热),A2(秋霜晚)、A3(秋分刮西北风)的隶属函数可分 别定义为: x1≥x A(x1)={1-2(x1-x1) x1-√2o1 <x1<x1 其中x1是丰镇地区若干年6、7月份气温的平均值,G1为方差,实际预报时取 x=19c,2σ;=0.98 A a2<x2<x2 其中x2是若干年秋季初霜日的平均值,a,是经验参数,实际预报时取x2=17(即9 月17日),a2=10(即9月10日)
2 1 C 的隶属函数类似定义。 给定待识别细胞 x0 X ,设 0 x 的核面积等七个特征值为 ( , , ) 0 7 0 2 0 1 x x x 据此可算出 ( ) 0 M x 、 ( ) 0 N x 、 ( ) 0 R x 、 ( ) 0 T x ,最后按最大隶属度原则识别。 例 4 冬季降雪量预报 内蒙古丰镇地区流行三条谚语:(1)夏热冬雪大,(2)秋霜晚冬雪大,(3)秋分刮西 北风冬雪大,现在根据三条谚语来预报丰镇地区冬季降雪量。 为描述“夏热” ( ) A1 、秋霜晚 ( ) A2 、 秋 分 刮 西 北 风 ( ) A3 等概念,在气 象 现 象 中 提 取 以 下 特 征 : 1 x :当年 6~7 月平均气温 2 x :当年秋季初霜日期 3 x :当年秋分日的风向与正西方向的夹角。 于是模糊集 A1 (夏热), A2 (秋霜晚)、 A3 (秋 分 刮 西 北 风 )的 隶 属 函 数 可 分 别定义为: − − − − = 0 2 ( ) 2 2 1 1 1 ( ) 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 1 x x x x x x x x x A x 其 中 1 x 是丰镇地区若干年 6、7 月份气温的平均值, 1 为方差,实际预报时取 x =19 c, 2 2 1 =0.98 − − = 2 2 2 2 2 2 2 2 2 2 2 2 2 0 1 ( ) x a a x x x a x a x x A x 其 中 x 2 是若干年秋季初霜日的平均值, 2 a 是经验参数,实际预报时取 x 2 =17(即 9 月 17 日), 2 a =10(即 9 月 10 日)
SInX 1800<x3<270° A3(x3)= 90°≤x3≤180 0°<x2<90° 取论域X={x|x=(x1,x2,x3)},“冬雪大”可以表示为论域X上的模糊集 C,其隶属函数为 C(x)=A1(x1)∧(A2(x2)VA3(x3) 采用阈值原则,取阈值d=0.8,测定当年气候因子x=(x1,x2,x3)。 算C(x),若C(x)≥0.8则预报当年冬季“多雪”,否则预报“少雪” 用这一方法对丰镇1959~1970年间隔12年作了预报,除1965年以外 均报对,历史拟合率为11/12。 §2-2贴近度与模式识别的间接方法 贴近度 表示两个模糊集接近程度的数量指标,称为贴近度,其严格的数学定 义如下 定义1设映射 N:F()×F(U)→[0,1 满足下列条件: (1)VA∈F(U),N(A,A) (2) VA,BEFO, N(A, B)=N(B, A (3)若A,B,C∈F(U)满足 4(x)-C(x)24(x)-B(x) x∈ 有N(AC)≤N(A 则称映射N为F(U)上的贴近度,称N(AB)为A与B的贴近度 贴近度的具体形式较多,以下介绍几种常见的贴近度公式
= cosx 0 90 0 90 180 -sinx 180 270 1 270 360 ( ) 3 3 3 3 3 3 3 3 x x x x A x 取论域 X = x | x = (x1 , x2 , x3 ) ,“ 冬 雪 大 ” 可 以 表 示 为 论 域 X 上的模糊集 C ,其隶属函数为: ( ) ( ) 1 1 C x = A x ∧ ( ( ) 2 2 A x ∨ ( )) 3 3 A x 采 用 阈 值 原 则 , 取 阈 值 d = 0.8 , 测 定 当 年 气 候 因 子 ( , , ) 1 2 3 x = x x x 。 计 算 C(x) , 若 C(x) 0.8 则 预 报 当 年 冬 季 “ 多 雪 ”, 否 则 预 报 “ 少 雪 ”。 用 这 一 方 法 对 丰 镇 1 95 9~ 1 9 7 0 年间隔 1 2 年 作 了 预 报 ,除 1965 年 以 外 均 报 对 , 历 史 拟 合 率 为 11 / 12。 §2-2 贴 近 度 与 模 式 识 别 的 间 接 方 法 一、贴近度 表 示 两 个 模 糊 集 接 近 程 度 的 数 量 指 标 ,称 为 贴 近 度 ,其 严 格 的 数 学 定 义如下: 定 义 1 设映射 N : F(U) F(U) → [0,1] 满足下列条件: ( 1 ) A F(U) , N(A, A) = 1 ( 2 ) A,B F(U) , N(A,B) = N(B, A) ( 3 ) 若 A, B,C F(U) 满 足 A(x) −C(x) A(x) − B(x) (x U) 有 N(A C) N(A B) 则称映射 N 为 F(U) 上 的 贴 近 度 , 称 N(A B) 为 A 与 B 的 贴 近 度 。 贴 近 度 的 具 体 形 式 较 多 , 以 下 介 绍 几 种 常 见 的 贴 近 度 公 式
(1) Hamming贴近度 Nn(A,B)=1-∑|4(x)-B(x 或Nn(A,B)=1- JA(x)-B(x)dx (2) Euclid贴近度 NE(A, B) (A(x)-B(x1) 成N(,B)=1-b=n(4x)-B()在 (3)格贴近度 定义7映射 N。:F(U)×F(U)→[0,1 (AB)→N2(4.B)=(AB)A(A⊙B),(或=[AoB+(A⊙B) 称为格贴近度,称N(A,B)为A与B格贴近度。其中 AB=V{4x)AB(x)∈U}(称为A与B的内积) A⊙B=^{4(x)vB(x)x∈U}(称为A与B的外积) 若U B=VA(x,AB(x) A⊙B=^{4(x1VB(x 值得注意的是,这里的格贴近度是通过定义来规定的,事实上,格贴 近度不满足定义1中(1),即N(A4)≠1 ⅤA∈F(U),A=φ,sppl≠U时,格贴近度满足定义1的(1)-(3)。另外格贴 近度的计算很方便,且用于表示相同类型模糊度的贴近度比较有效,所以 在实际应用中也常选用格贴近度来反映模糊集接近程度。 还有许多贴近度,这里不在一一介绍 贴近度主要用于模糊识别等具体问题,以上介绍的贴近度表示式各有
( 1) Ha m m i n g 贴近度 = = − − n i H i i A x B x n N A B 1 ( ) ( ) 1 ( , ) 1 或 − − = − b a H A x B x dx b a N A B ( ) ( ) ( ) 1 ( , ) 1 ( 2) E u c l i d 贴 近 度 = = − − n i E i i A x B x n N A B 1 2 ( ( ) ( )) 1 ( , ) 1 或 − − = − b a E A xi B xi dx b a N A B 2 ( ( ) ( )) 1 ( , ) 1 ( 3)格贴近度 定 义 7 映 射 N : F(U) F(U) → [0,1] g (A, B)→ Ng (A, B) = (A B) (A ⊙ c B) ,( 或 = [A B (A 2 1 + ⊙ ) ] c B ) 称 为 格 贴 近 度 , 称 N (A, B) g 为 A 与 B 格 贴 近 度 。 其 中 , A B = A(x) B(x) x U ( 称 为 A 与 B 的内积 ) A ⊙ B = A(x) B(x) x U ( 称 为 A 与 B 的外积 ) 若 U = x1 , x2 , , xn , 则 ( ( ) 1 i i n i A B = A x B x = A ⊙ ( ( ) 1 i i n i B = A x B x = 值 得 注 意 的 是 ,这 里 的 格 贴 近 度 是 通 过 定 义 来 规 定 的 ,事 实 上 ,格 贴 近 度 不 满 足 定 义 1 中 ( 1 ) , 即 Ng (A A) 1 , 但 是 , 当 AF(U), A1 = ,suppA U 时 , 格 贴 近 度 满 足 定 义 1 的 ( 1)- (3 )。 另 外 格 贴 近 度 的 计 算 很 方 便 ,且 用 于 表 示 相 同 类 型 模 糊 度 的 贴 近 度 比 较 有 效 ,所 以 在 实 际 应 用 中 也 常 选 用 格 贴 近 度 来 反 映 模 糊 集 接 近 程 度 。 还 有 许 多 贴 近 度 , 这 里 不 在 一 一 介 绍 。 贴 近 度 主 要 用 于 模 糊 识 别 等 具 体 问 题 ,以 上 介 绍 的 贴 近 度 表 示 式 各 有
优劣,具体应用时,应根据问题的实际情况,选用合适的贴近度。 二、模式识别的间接方法一一择近原则 在模式识别问题中,各标准类型(模式)一般是某个论域X上的模糊集,用模式识别 的直接方法(最大隶属度原则、阈值原则)解决问题时,其识别对象是论域X中的元素。 另有一类识别问题,其识别对象也是X上的模糊集,这类问题可以用下面的择近原则来识 别判决 择近原则:已知n个标准类型A1、A2、…、A∈F(X,B∈F(X)为待识别的对 象,N为F(X)上的贴近度,若 N(A, B)=max N(Ak, B)Ik=1,2,n) 则认为B与A最贴近,判定B属于A1一类 例5岩石类型识别 岩石按抗压强度可以分成五个标准类型:很差(A1)、差(A2)、较好(A3)、好(A4) 很好(A5)。它们都是X=[O,+∞)上的模糊集,其隶属函数如下(图2-1 A A(x)A(x) A2(x) A2(x) A1(x) 0200400 9001100 18002000x 图2-1 0≤X<10 A1(x)= (x-200) 100<x<200 ≥200 0≤x≤200 200 )= 200<x<400 (x-600) 400<x≤600 200 600<x
优 劣 , 具 体 应 用 时 , 应 根 据 问 题 的 实 际 情 况 , 选 用 合 适 的 贴 近 度 。 二、模式识别的间接方法——择近原则 在模式识别问题中,各标准类型(模式)一般是某个论域 X 上的模糊集,用模式识别 的直接方法(最大隶属度原则、阈值原则)解决问题时,其识别对象是论域 X 中的元素。 另有一类识别问题,其识别对象也是 X 上的模糊集,这类问题可以用下面的择近原则来识 别判决。 择近原则:已知 n 个标准类型 A1、 A2 、…、 A F(X ) n , B F(X ) 为待识别的对 象, N为F(X) 上的贴近度,若 N(Ai , B) = maxN(Ak , B) | k = 1,2, n 则认为 B 与 Ai 最贴近,判定 B 属于 Ai 一类。 例 5 岩石类型识别 岩石按抗压强度可以分成五个标准类型:很差( A1 )、差( A2 )、较好( A3 )、好( A4 )、 很好( A5 )。它们都是 X = [0,+) 上的模糊集,其隶属函数如下(图 2-1) 0 200 400 600 900 1100 1800 2000 图 2-1 − − = 0 200 ( 200) 100 200 100 1 1 0 x 100 ( ) 1 x A x x x − − = x x x x x x A x 0 600 ( 600) 400 600 200 1 1 200 400 0 200 200 ( ) 2 1 ( / ) 2 kg cm A ( ) 5 A x ( ) 4 A x ( ) 3 A x ( ) 2 A x ( ) 1 A x x