第二十八章灰色系统理论及其应用 客观世界的很多实际句颗,其内部的结构、参数以及特征并未全部被人们了解 人们不可能象研究白箱问邀样将其内部机理研究清楚,只能依据某种思维逻辑与推阁 来构造模型。 对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。本 介绍的方法是从灰色系统的本征灰色出发,研究在信息大量缺乏或紊乱的情况下,如何 对实际问题进行分析和解决。 §1灰色系统概论 客观世界在不断发展变化的同时,往往通过事物之间及因素之间相互制约、相 联系而构成一个整体,我们称之为系统。按事物内涵的不同,人们已建立了工程技术、 社会系统、经济系统等。人们试图对各种系统所外露出的一些特征进行分析,从而弄清 楚系统内部的运行机理。从信息的完备性与模型的构建上看,工程技术等系统具有较充 足的信息量,其发展变化规律明显,定量描述较方便,结构与参数较具体,人们称之为 米系 统诸如社会系 农业系统 生太 系统等 人们无法建立客观的 物理原型,其作用原理亦不明确,内部因素难以辨识或之间关系隐蔽,人们很难准确 解这类系统的行为特征,因此对其定量描述难度较大,带来建立模型的困难。这类系统 内部特性部分已知的系统称之为灰色系统。一个系统的内部特性全部未知,则称之为黑 色系统 区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系 运动学中物体运动的速度、加速度与其所受到的外力有关,其关系可用牛顿定律以明 的定量来闸明,因此,物体的运动便是一个白色系统。 当然,白、灰、黑是相对于一定的认识层次而言的,因而具有相对性。某人有 天去他朋友家做客,发现当外面的汽车开过来时,他朋友家的狗就躲到屋角里瑟瑟发抖 他对出赏名其妙。但对他朋友来进,狗的这种行为是可可以理解的,因为他知道,狗在前 不久曾被汽车撞伤过。显然 同样对于“狗的惧怕行为”,客人因不知内情而面临 黑箱,而主人则面临一个灰箱。 作为实际问题,灰色系统在大千世界中是大量存在的,绝对的白色或黑色系统是 很少的。随着人类认识的进步及对掌握现实世界的要求的升级,人们对社会、经济等问 题的研究往往已不满足于定性分析。尽管当代科技日新月异,发展迅速,但人们对自然 界的认识仍然是肤浅的。粮食作物的生产是 个实际的关系到人们吃饭的大问题,但同 时,它又是一个抽象的灰色系统。肥料、种子、农药、气象、土壤、劳力、水利、耕 及政策等皆是影响生产的因素,但又难以确定影响生产的确定因素,更难确定这些因素 与粮食产量的定量关系。人们只能在一定的假设条件(往往是一些经验及常识)下按照 某种逻辑推理演绎而得到模型。这种摸型并非是粮食作物生产间题在理论认识上的“翻 版”,而只能看作是人们在认识上对实际问题的一种“反映”或“逼近” 社会、经济、农业以及生态系统一般都会有不可忽略的“噪声 (即随即干扰) 现有的研究经常被“噪声”污染。受随机干扰侵蚀的系统理论主要立足于概率统计。通 过统计规律、概率分布对事物的发展进行顶测,对事物的处置进行决策。现有的系统分 -415
-415- 第二十八章 灰色系统理论及其应用 客观世界的很多实际问题,其内部的结构、参数以及特征并未全部被人们了解, 人们不可能象研究白箱问题那样将其内部机理研究清楚,只能依据某种思维逻辑与推断 来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。本章 介绍的方法是从灰色系统的本征灰色出发,研究在信息大量缺乏或紊乱的情况下,如何 对实际问题进行分析和解决。 §1 灰色系统概论 客观世界在不断发展变化的同时,往往通过事物之间及因素之间相互制约、相互 联系而构成一个整体,我们称之为系统。按事物内涵的不同,人们已建立了工程技术、 社会系统、经济系统等。人们试图对各种系统所外露出的一些特征进行分析,从而弄清 楚系统内部的运行机理。从信息的完备性与模型的构建上看,工程技术等系统具有较充 足的信息量,其发展变化规律明显,定量描述较方便,结构与参数较具体,人们称之为 白色系统;对另一类系统诸如社会系统、农业系统、生态系统等,人们无法建立客观的 物理原型,其作用原理亦不明确,内部因素难以辨识或之间关系隐蔽,人们很难准确了 解这类系统的行为特征,因此对其定量描述难度较大,带来建立模型的困难。这类系统 内部特性部分已知的系统称之为灰色系统。一个系统的内部特性全部未知,则称之为黑 色系统。 区别白色系统与灰色系统的重要标志是系统内各因素之间是否具有确定的关系。 运动学中物体运动的速度、加速度与其所受到的外力有关,其关系可用牛顿定律以明确 的定量来阐明,因此,物体的运动便是一个白色系统。 当然,白、灰、黑是相对于一定的认识层次而言的,因而具有相对性。某人有一 天去他朋友家做客,发现当外面的汽车开过来时,他朋友家的狗就躲到屋角里瑟瑟发抖。 他对此莫名其妙。但对他朋友来讲,狗的这种行为是可以理解的,因为他知道,狗在前 不久曾被汽车撞伤过。显然,同样对于“狗的惧怕行为”,客人因不知内情而面临一个 黑箱,而主人则面临一个灰箱。 作为实际问题,灰色系统在大千世界中是大量存在的,绝对的白色或黑色系统是 很少的。随着人类认识的进步及对掌握现实世界的要求的升级,人们对社会、经济等问 题的研究往往已不满足于定性分析。尽管当代科技日新月异,发展迅速,但人们对自然 界的认识仍然是肤浅的。粮食作物的生产是一个实际的关系到人们吃饭的大问题,但同 时,它又是一个抽象的灰色系统。肥料、种子、农药、气象、土壤、劳力、水利、耕作 及政策等皆是影响生产的因素,但又难以确定影响生产的确定因素,更难确定这些因素 与粮食产量的定量关系。人们只能在一定的假设条件(往往是一些经验及常识)下按照 某种逻辑推理演绎而得到模型。这种模型并非是粮食作物生产问题在理论认识上的“翻 版”,而只能看作是人们在认识上对实际问题的一种“反映”或“逼近”。 社会、经济、农业以及生态系统一般都会有不可忽略的“噪声”(即随即干扰)。 现有的研究经常被“噪声”污染。受随机干扰侵蚀的系统理论主要立足于概率统计。通 过统计规律、概率分布对事物的发展进行预测,对事物的处置进行决策。现有的系统分
析的最化方法,大都是数理统计法回归分析、方差分析、主成分分析等,回归分析是 应用最广泛的一种办法。但回归分析要求大样本,只有通过大量的数据才能得到量化的 提律,这对很多于法得到或一时缺多物据的实:际问顺的解决带来闲谁。回归分折不要求 样本有较好的分布规律,而很多实际情形并非 例如 ,我国建国以来经济方面有几 次大起大落,难以满足样本有较规律的分布要求。因此,有了大量的数据也不 一定能得 到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析。另外,回归分析 不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象。 灰色系统理论提出了一种新的分折方 一关联度分折方法。即根据因素之间发展 态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程 度。由于以发展态势为立足点,因此对样本量的多少没有过分的要求,也不需要典型的 分布规律,计算量少到甚至可用手算,且不致出现关联度的量化结果与定性分析不一到 的情况。这种方法已应用到农业经济、水利、宏观经济等各方面,都取得了较好的效果。 灰鱼系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并 利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法 但是 离散模型只能对客观系纷 天限黄高外标,应不了现在起致致远的分标、现花数的装来。尽管题 建立 ·个按时间作逐段分析的模型 系统的离散近似模型对许多工程应用来讲是有用的,但在某些研究领域中,人们却常常 希望使用微分方程模型。事实上,微分方程的系统描述了我们所希望辨识的系统内部的 物理或化学讨程的本后」 灰色系统理论首先基于对客观系统的新的认识。尽管某些系统的信息不够充分 但作为系统必然是有特定功能和有序的,只是其内在规律并未充分外露。有些随机量 无规则的干扰成分以及杂乱无章的数据列,从灰色系统的观点看,并不认为是不可捉损 的。相反地。灰色系统理论将随机量看作是在一定范围内变化的灰鱼量,按话当的九法 将原始数据讲行处理,将灰色数变换为生成数,从生成数讲而得到规律性较强的生成函 数。例如,某些系统的数据经处理后呈现出指数规律,这是由于大多数系统都是广义的 能量系统,而指数规律是能量变化的 种规律。灰色系统理论的量化基础是生成数 而突破了概率统计的局限性,使其结果不再是过去依据大量数据得到的经验性的统计規 律,而是现实性的生成律。这种使灰色系统变得尽量清渐明了的过程被称为白化。 日前,灰色系统理论己成功地应用于工程控制、经济管理、未来学研究、生态系 统及复杂多变的农业系统中,并取得了可喜的成就。灰色系统理论有可能对社会、经济 等抽象系统进行分析、建模、 预测、决策和控制,它有可能成为人们认识客观系统改 客观系统的一个新型的理论工具。 §2关联分析 大千什界里的客观事物往往现象每杂,因素整多。我们往往需要对系统讲行因素 分析,这些因素中哪些对系统来讲是主要的,哪些是次要的 哪些需要发展,哪些需 抑制,哪些是潜在的,哪些是明显的。一般来讲,这些都是我们极为关心的问圈。事实 上,因素间关联性如何、关联程度如何量化等问题是系统分析的关键和起点。 因素分析折的基本方法过去主要采取回归分析等办法。正如前一节指出的,回归分 -416
-416- 析的量化方法,大都是数理统计法如回归分析、方差分析、主成分分析等,回归分析是 应用最广泛的一种办法。但回归分析要求大样本,只有通过大量的数据才能得到量化的 规律,这对很多无法得到或一时缺乏数据的实际问题的解决带来困难。回归分析还要求 样本有较好的分布规律,而很多实际情形并非如此。例如,我国建国以来经济方面有几 次大起大落,难以满足样本有较规律的分布要求。因此,有了大量的数据也不一定能得 到统计规律,甚至即使得到了统计规律,也并非任何情况都可以分析。另外,回归分析 不能分析因素间动态的关联程度,即使是静态,其精度也不高,且常常出现反常现象。 灰色系统理论提出了一种新的分析方法—关联度分析方法,即根据因素之间发展 态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程 度。由于以发展态势为立足点,因此对样本量的多少没有过分的要求,也不需要典型的 分布规律,计算量少到甚至可用手算,且不致出现关联度的量化结果与定性分析不一致 的情况。这种方法已应用到农业经济、水利、宏观经济等各方面,都取得了较好的效果。 灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并 利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法 是采用离散模型,建立一个按时间作逐段分析的模型。但是,离散模型只能对客观系统 的发展做短期分析,适应不了从现在起做较长远的分析、规划、决策的要求。尽管连续 系统的离散近似模型对许多工程应用来讲是有用的,但在某些研究领域中,人们却常常 希望使用微分方程模型。事实上,微分方程的系统描述了我们所希望辨识的系统内部的 物理或化学过程的本质。 灰色系统理论首先基于对客观系统的新的认识。尽管某些系统的信息不够充分, 但作为系统必然是有特定功能和有序的,只是其内在规律并未充分外露。有些随机量、 无规则的干扰成分以及杂乱无章的数据列,从灰色系统的观点看,并不认为是不可捉摸 的。相反地,灰色系统理论将随机量看作是在一定范围内变化的灰色量,按适当的办法 将原始数据进行处理,将灰色数变换为生成数,从生成数进而得到规律性较强的生成函 数。例如,某些系统的数据经处理后呈现出指数规律,这是由于大多数系统都是广义的 能量系统,而指数规律是能量变化的一种规律。灰色系统理论的量化基础是生成数,从 而突破了概率统计的局限性,使其结果不再是过去依据大量数据得到的经验性的统计规 律,而是现实性的生成律。这种使灰色系统变得尽量清晰明了的过程被称为白化。 目前,灰色系统理论已成功地应用于工程控制、经济管理、未来学研究、生态系 统及复杂多变的农业系统中,并取得了可喜的成就。灰色系统理论有可能对社会、经济 等抽象系统进行分析、建模、预测、决策和控制,它有可能成为人们认识客观系统改造 客观系统的一个新型的理论工具。 §2 关联分析 大千世界里的客观事物往往现象复杂,因素繁多。我们往往需要对系统进行因素 分析,这些因素中哪些对系统来讲是主要的,哪些是次要的,哪些需要发展,哪些需要 抑制,哪些是潜在的,哪些是明显的。一般来讲,这些都是我们极为关心的问题。事实 上,因素间关联性如何、关联程度如何量化等问题是系统分析的关键和起点。 因素分析的基本方法过去主要采取回归分析等办法。正如前一节指出的,回归分
析的办法有很多欠缺,如要求大量数据、计算最大及可能出现反常情况等。为克服以上 弊病,本节采用关联度分析的办法来做系统分析。 作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较分析。 所谓发展态势比较, 也就是系统各时期有关统计数据的几何关系的比较。 例如,某地区1977~1983年总收入与养猪、养兔收入资料见表1 表1收入数据 1977197819791980198119821983 总收入 23 40 AA 48 60 养猪 10 15 16 24 38 50 养兔 3 2 12 10 22 18 20 根据表1,做曲线图1。 图1收入数据图 由上图易看出,曲线A与曲线B发展趋势比较接近,而与曲线C相差较大,因此 可以判断,该地区对总收入影响较直接的是养猪业,而不是养兔业。 很显然,几何形状越接近,关联程度也就越大。当然,直观分析对于稍微复杂些 的问题则显得难于进行。因此,需要给出一种计算方法来衡量因素间关联程度的大小 2.1数据变换技术 为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换 和处理,使其消除量纲和具有可比性。 定义1设有序列 x=(),x(2).,x(n 则称映射 -417
-417- 析的办法有很多欠缺,如要求大量数据、计算量大及可能出现反常情况等。为克服以上 弊病,本节采用关联度分析的办法来做系统分析。 作为一个发展变化的系统,关联分析实际上是动态过程发展态势的量化比较分析。 所谓发展态势比较,也就是系统各时期有关统计数据的几何关系的比较。 例如,某地区 1977~1983 年总收入与养猪、养兔收入资料见表 1。 表 1 收入数据 1977 1978 1979 1980 1981 1982 1983 总收入 养 猪 养 兔 18 20 22 40 44 48 60 10 15 16 24 38 40 50 3 2 12 10 22 18 20 根据表 1,做曲线图 1。 1977 1978 1979 1980 1981 1982 1983 0 10 20 30 40 50 60 A B C 图 1 收入数据图 由上图易看出,曲线 A 与曲线 B 发展趋势比较接近,而与曲线 C 相差较大,因此 可以判断,该地区对总收入影响较直接的是养猪业,而不是养兔业。 很显然,几何形状越接近,关联程度也就越大。当然,直观分析对于稍微复杂些 的问题则显得难于进行。因此,需要给出一种计算方法来衡量因素间关联程度的大小。 2.1 数据变换技术 为保证建模的质量与系统分析的正确结果,对收集来的原始数据必须进行数据变换 和处理,使其消除量纲和具有可比性。 定义 1 设有序列 x = (x(1), x(2),", x(n)) 则称映射
f:X→y f(x(k)=k),k=l,2,.,n 为序列x到序列y的数据变换。 1)当 =-,00 称∫是初值化变换。 2)当 f》==k,=2陶 称∫是均值化变换 3)当 f(x(k))= x(k) 称∫是百分比变换。 4)当 mn6。mm≠0 x() f(x(k)》 称∫是倍数变换 5)当 fk》=园=) Xo 其中x。为大于零的某个值,称∫是归一化变换。 6)当 -418
-418- f x k y k k n f x y ( ( )) ( ), 1,2, , : = = " → 为序列 x 到序列 y 的数据变换。 1)当 ( ), (1) 0 (1) ( ) ( ( )) = = y k x ≠ x x k f x k 称 f 是初值化变换。 2)当 ∑ = = = = n k x k n y k x x x k f x k 1 ( ) 1 ( ), ( ) ( ( )) 称 f 是均值化变换。 3)当 ( ) ( ( )) ( ) max ( ) k x k f xk yk x k = = 称 f 是百分比变换。 4)当 ( ) ( ( )) ( ), min ( ) 0 min ( ) k k x k f xk yk xk x k == ≠ 称 f 是倍数变换。 5)当 ( ) ( ) ( ( )) 0 y k x x k f x k = = 其中 0 x 为大于零的某个值,称 f 是归一化变换。 6)当
)=k-min =k) maxx(k) 称∫是极差最大值化变换。 7)当 x(k)-minx(k) f(x(k)》 max (k)-minx(k() 称∫是区间值化变换。 2.2关联分析 定义2选取参考数列 x0={x(k)川k=1,2,.,m=(x,(0),x(2),.,x(n) 其中k表示时刻。假设有m个比较数列 x={x,(k)川k=1,2,.,n=(x,(1),x,(2),.,x,(n),i=1,2,.,m 则称 5=m,0-o+omxms.0-支0 (1) o(k)-x,(k)+pmax maxo ()-x,(t) 为比较数列x对参考数列x,在k时刻的关联系数,其中P∈0,为分辨系数。称(1) 式中min min,)-x,(小、max max,()-x,()分别为两级最小差及两级最大差。 般来讲,分辨系数P越大,分耕率越大:p越小,分辨率越小。 (1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指 标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给 定义3称 为数列:,对参考数列x的关联度。 由(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,亦即把过于 分散的信息集中处理。利用关联度这个概念,我们可以对各种间题进行因素分析。考虑 -419
-419- ( ) max ( ) ( ) min ( ) ( ( )) y k x k x k x k f x k k k = − = 称 f 是极差最大值化变换。 7)当 ( ) max ( ) min ( ) ( ) min ( ) ( ( )) y k x k x k x k x k f x k k k k = − − = 称 f 是区间值化变换。 2.2 关联分析 定义 2 选取参考数列 { ( ) | 1,2, , } ( (1), (2), , ( )) x0 = x0 k k = " n = x0 x0 " x0 n 其中k 表示时刻。假设有 m 个比较数列 x {x (k) | k 1,2, , n} (x (1), x (2), , x (n)) i = i = " = i i " i ,i = 1,2,",m 则称 ( ) ( ) maxmax ( ) ( ) min min ( ) ( ) maxmax ( ) ( ) ( ) 0 0 0 0 x k x k x t x t x t x t x t x t k s s t i s s t s s t i − + − − + − = ρ ρ ξ (1) 为比较数列 i x 对参考数列 0 x 在 k 时刻的关联系数,其中 ρ ∈[0,1] 为分辨系数。称(1) 式中min min ( ) ( ) 0 x t x t s s t − 、 max max ( ) ( ) 0 x t x t s s t − 分别为两级最小差及两级最大差。 一般来讲,分辨系数 ρ 越大,分辨率越大; ρ 越小,分辨率越小。 (1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指 标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给 出 定义 3 称 ∑= = n k i i k n r 1 ( ) 1 ξ (2) 为数列 i x 对参考数列 0 x 的关联度。 由(2)易看出,关联度是把各个时刻的关联系数集中为一个平均值,亦即把过于 分散的信息集中处理。利用关联度这个概念,我们可以对各种问题进行因素分析。考虑