河南省长葛县乡镇企业产值数据(1983年-1986年)为 X=(10155,12588,23480,35388) 其増长势头很猛,1983-1986年每年平均递増516%,尤其是1984-1986年,每年平均递增 67.7%。因此普遍认为今后不可能一直保持这么高的发展速度。经过认真分析,大家认识到 增长速度高主要是基数低,而基数低的原因是过去对有利于乡镇企业发展的政策没有用足 用活,用好。要弱化序列增长趋势,就要将乡镇企业发展比较有利的现行政策因素附加到过 去的年份中去,为此,引进推论1所示的二阶弱化算子,得二阶缓冲序列 XD2=(27260,29547,32411,35388)(7.32) 计算表格如下: 表74原始数据和计算步骤表 10155 204027527260.8 12588 238186729546.8 23480 32411 35388 35388 35388 其中 x(1)d=(10155+12588+23480+35388)/(4-1+1)=2040275 (7.33) (2)d=(12588+23480+35388)(4-2+1)=2381867 (7.34) 其他同理可得 用ⅹD2建模预测得,1986-2000年该县乡镇企业每年平均递增94%,这一结果是1987 年得到的,与“八五”后半期和“九五”期间该县乡镇企业发展实际基本吻合 四、均值生成算子 在收集数据时,常常由于一些不易克服的困难导致数据序列出现空缺(也称空穴),有些 数据序列虽然完整,但由于系统行为在某个时点上发生突变而形成异常数据,剔除异常数据 就会留下空穴,如何填补空穴,自然成为数据处理过程中首先遇到的问题,均值生成是常用 的构造新数据,填补原序列空穴,生成新序列的方法 定义2.1设序列X在k出现有空穴,记为(k),即 X=(x(1)2x(2)2…x(k-1)2∞(k)2x(k+1)2…,x(H))(7.35) 则称x(k-1)和x(k+1)为(k)的界值,x(k-1)为前界,x(k+1)为后界 当∞(k)是由x(k-1)和x(k+1)生成时,称生成值x(k)为[x(k-1),x(k+1)的内点 定义242设序列 X=(x(12x(2)2……,x(k-1)(k)2x(k+1)2…,X(H))(736) 为k处有空穴(k)的序列,而(k)xx(k)=0.5x(k-1)+0.5x(k+1)称为非紧邻均值生成 数,所得序列称为非紧邻生成序列 定义243设序列X=(x(1),x(2)2…,x(H)),若 x(k)=0.5x(k-1)+0.5x(k) (7.37) l81
181 河南省长葛县乡镇企业产值数据(1983 年-1986 年)为 X = (10155,12588,23480,35388) 其增长势头很猛,1983-1986 年每年平均递增 51.6%,尤其是 1984-1986 年,每年平均递增 67.7%。因此普遍认为今后不可能一直保持这么高的发展速度。经过认真分析,大家认识到 增长速度高主要是基数低,而基数低的原因是过去对有利于乡镇企业发展的政策没有用足, 用活,用好。要弱化序列增长趋势,就要将乡镇企业发展比较有利的现行政策因素附加到过 去的年份中去,为此,引进推论 1 所示的二阶弱化算子,得二阶缓冲序列 2 XD = (27260,29547,32411,35388) (7.32) 计算表格如下: 表 7.4 原始数据和计算步骤表 号 x(k) x(k)d x(k)d^2 1 10155 20402.75 27260.85 2 12588 23818.67 29546.89 3 23480 29434 32411 4 35388 35388 35388 其中 x(1)d=(10155+12588+23480+35388)/(4-1+1)=20402.75 (7.33) x(2)d=(12588+23480+35388)/(4-2+1)=23818.67 (7.34) 其他同理可得。 用 XD 2 建模预测得,1986-2000 年该县乡镇企业每年平均递增 9.4%,这一结果是 1987 年得到的,与“八五”后半期和“九五”期间该县乡镇企业发展实际基本吻合。 四、均值生成算子 在收集数据时,常常由于一些不易克服的困难导致数据序列出现空缺(也称空穴),有些 数据序列虽然完整,但由于系统行为在某个时点上发生突变而形成异常数据,剔除异常数据 就会留下空穴,如何填补空穴,自然成为数据处理过程中首先遇到的问题,均值生成是常用 的构造新数据,填补原序列空穴,生成新序列的方法。 定义 2.4.1 设序列 X 在 k 出现有空穴,记为 ( ) k ,即 X x x x k k x k x n = − + ( (1), (2), , ( 1), ( ), ( 1), , ( )) (7.35) 则称 x k x k k x k x k ( 1) ( 1) ( ) ( 1) ( 1) − + − + 和 为 的界值, 为前界, 为后界, 当 − + − + ( ) ( 1) ( 1) ( 1) ( 1)] k x k x k x k x k 是由 和 生成时,称生成值x(k)为[ , 的内点。 定义 2.4.2 设序列 X x x x k k x k x n = − + ( (1), (2), , ( 1), ( ), ( 1), , ( )) (7.36) 为 k 处有空穴 ( ) k 的序列,而 ( ) k * = ( ) 0.5 ( 1) 0.5 ( 1) x k x k x k = − + + 称为非紧邻均值生成 数,所得序列称为非紧邻生成序列。 定义 2.4.3 设序列 X x x x n = ( (1), (2), , ( )) ,若 * ( ) 0.5 ( 1) 0.5 ( ) x k x k x k = − + (7.37)
则称x'(k)为紧邻生成数,由紧邻生成数构成的序列称为紧邻均值生成序列 五、序列的光滑性 定义2.5.1设序列X=(x(1)x(2),…,x(n),x(n+1)),Z是X的均值生 成序列: Z=(=(1)2=(2)2……,=(H)) 其中 二(k)=0.5x(k-1)+0.5x(k) (7.39) X是某一可导函数的代表序列,d为n维空间的距离函数,我们将X删去x(n+1)后所 得的序列仍记X,若Ⅹ满足 1)当k充分大时,x)<∑x0):2)maxx(k)-x(k)≥mxx(k)-=(k) 则称X为光滑序列,1,2为序列光滑条件 定义2.52称 P(h)=( k=2.3…,n (740) x(O) 为序列Ⅹ的光滑比。 定义253若序列X满足 p(k+1) <1,k=2,3… p(k) p(k)∈[0,;k=34…,n (742) E<0.5 则称X为准光滑序列。 六、级比生成算子 定义26.1设序列X=(x(1),x(2),…,x(H)),则称 k (k)= k=2,3…,n (74) (k-1) 为序列X的级比 七、累计生成算子与累减生成算子 累加生成是使灰色过程由灰变白的一种方法,它在灰色系统理论中占有极其重要的地位。 通过累加可以看出灰量积累过程的发展态势,使离乱的原始数据中蕴含的积分特性或规律充 分显露出来 定义271设X0=(x°(1),x(2)…,x(n),D为序列算子 182
182 则称 * x k( ) 为紧邻生成数,由紧邻生成数构成的序列称为紧邻均值生成序列。 五、序列的光滑性 定义 2.5.1 设序列 X x x x n x n = + ( (1), (2), , ( ), ( 1)) ,Z 是 X 的均值生 成序列: Z z z z n = ( (1), (2), , ( )) (7.38) 其中 ( ) 0.5 ( 1) 0.5 ( ) z k x k x k = − + (7.39) X * 是某一可导函数的代表序列,d 为 n 维空间的距离函数,我们将 X 删去 x n( 1) + 后所 得的序列仍记 X,若 X 满足 1)当 k 充分大时, 1 1 ( ) ( ) k i x k x i − = ;2) * * 1 1 max ( ) ( ) max ( ) ( ) k n k n x k x k x k z k − − 则称X为光滑序列,1,2 为序列光滑条件。 定义 2.5.2 称 1 1 ( ) ( ) ; 2,3 , ( ) k i x k k k n x i − = = = (7.40) 为序列X的光滑比。 定义 2.5.3 若序列X满足 ( 1) 1; 2,3 , 1 ( ) k k n k + = − (7.41) ( ) [0, ]; 3,4 , k k n = (7.42) 0.5 (7.43) 则称X为准光滑序列。 六、级比生成算子 定义 2.6.1 设序列 X x x x n = ( (1), (2), , ( )) ,则称 ( ) ( ) ; 2,3 , ( 1) x k k k n x k = = − (7.44) 为序列X的级比。 七、累计生成算子与累减生成算子 累加生成是使灰色过程由灰变白的一种方法,它在灰色系统理论中占有极其重要的地位。 通过累加可以看出灰量积累过程的发展态势,使离乱的原始数据中蕴含的积分特性或规律充 分显露出来。 定义 2.7.1 设 0 0 0 0 X x x x n = ( (1), (2), , ( )) ,D为序列算子
XD=(x(1)d,x°(2)d,…,x°(m)d) (745 其中 x(k)d=∑x(,k=123,…,n(746) 则称D为X的一次累加生成算子,记为1-AGO( Accumulating Generation Operator),称 阶算子D为X0的r次累加生成算子,记为rAGO,习惯上,我们记 XYD=X=(x(1)x(2)…,x(n) (747) X=(x(1),x(2)…,x(m) (748) 其中 (k)d (i),k=1,2,3 (749) 定义272(累减)设=(x(1),x(2),…,x(n),D为序列算子, X"D=(x(1)d,x"(2)d,…,x°(m)d) 其中 x(k)d=x(k)-x(k-1)k=1,2,3,…,n(7.51) 八、灰指数律 定义281设序列X=(x(1)2x(2)…,x(n),若对于 1.x(k)=ce;c,a≠0k=1,2…n则称X为齐次指数序列。 2.x(k)=be;c,a,b≠0,k=1,2…n,称ⅹ为齐次指数序列 定义282设序列X=(x(1)x(2)2…,X(n))若 1.Vk, o(k) m(-1∈(0,1,则称序列X具有负的灰指数规律 2.Wk,o(6)=-x(k) x(k-1∈(1,b],则称序列X具有正的灰指数规律。 3.Vk,G(k)= x(k-1abb-a=8则称序列X具有绝对灰度为6的灰指数 规律 4.δ<0.5时,称X具有准指数规律 定理281设序列X0=(x(1),x°(2),…,x(n)为非负准光滑序列,则X0的 183
183 0 0 0 0 X D x d x d x n d = ( (1) , (2) , , ( ) ) (7.45) 其中 0 0 1 ( ) ( ); 1,2,3, , k i x k d x i k n = = = (7.46) 则称D为 0 X 的一次累加生成算子,记为1-AGO(Accumulating Generation Operator),称 r 阶算子 r D 为 0 X 的 r 次累加生成算子,记为 r-AGO,习惯上,我们记 0 1 1 1 1 X D X x x x n = = ( (1), (2), , ( )) (7.47) 0 ( (1), (2), , ( )) r r r r r X D X x x x n = = (7.48) 其中 1 1 ( ) ( ); 1,2,3, , k r r i x k d x i k n − = = = (7.49) 定义 2.7.2(累减)设 0 0 0 0 X x x x n = ( (1), (2), , ( )) ,D 为序列算子, 0 0 0 0 X D x d x d x n d = ( (1) , (2) , , ( ) ) (7.50) 其中 0 0 0 x k d x k x k k n ( ) ( ) ( 1) 1,2,3, , = − − = (7.51) 八、灰指数律 定义 2.8.1 设序列 X x x x n = ( (1), (2), , ( )) ,若对于 1. ( ) ; , 0; 1,2 ak x k ce c a k n = = 则称 X 为齐次指数序列。 2. ( ) b ; , , 0; 1,2 ak x k ce c a b k n = = ,称 X 为齐次指数序列。 定义 2.8.2 设序列 X x x x n = ( (1), (2), , ( )) 若 1. ( ) , ( ) (0,1] ( 1) x k k k x k = − ,则称序列 X 具有负的灰指数规律。 2. ( ) , ( ) (1, ] ( 1) x k k k b x k = − ,则称序列 X 具有正的灰指数规律。 3. ( ) , ( ) [ , ], ( 1) x k k k a b b a x k = − = − 则称序列 X 具有绝对灰度为 的灰指数 规律。 4. 0.5 时,称 X 具有准指数规律。 定理 2.8.1 设序列 0 0 0 0 X x x x n = ( (1), (2), , ( )) 为非负准光滑序列,则 0 X 的一
次累加生成序列X具有准指数规律。 184
184 次累加生成序列 1 X 具有准指数规律
第三节灰色关联分析 对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因 素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展 过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小 灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于第 它们的理论基础不同:关联度分析基于灰色系统的灰色过程,而相关分析则基于概率论的随 机过程:第二,分析方法不同:关联分析是进行因素间时间序列的比较,而相关分析是因素 间数组的比较;第三,数据量要求不同:关联分析不要求数据太多,而相关分析则需有足够 的数据量:第四,研究重点不同:关联度分析主要研究动态过程,而相关分析则以静态研究 为主。因此,关联度分析适应性更广,在用于社会经济系统中的应用更有其独到之处。 般的抽象系统,如社会系统、经济系统、农业系统、生态系统等都包含有许多种因素, 多种因素共同作用的结果决定了该系统的发展态势。我们常常希望知道众多的因素中,哪些 是主要因素,哪些是次要因素,哪些因素对系统发展影响大,哪些因素对系统发展影响小, 哪些因素对系统发展起推动作用需加强,哪些因素对系统发展起阻碍作用需抑制 数理统计中的回归分析、方差分析、主成分分析等都是用来进行系统特征分析的方法 但数理统计中的分析方法往往需要大量数据样本,且服从某个典型分布。灰色关联分析方法 弥补了采用数理统计方法作系统分析所导致的缺憾,它对样本量的多少和样本有无规律都同 样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。 灰色关联分析的基本思想是根据序列曲线几何形状的相似程度来判断其联系是否紧密。 曲线越接近,相应序列之间关联度就越大,反之就越小。例如某地区农业总产值X。,种植 业总产值X1,畜牧业总产值X2和林业总产值x3,从1997-2002年共6年的统计数据如下 X=(18,20,22,35,41,46) (7.52) x1=(8,11,12,17,24,29 (7.53) Xx2=(3,2,7,4,11,6) (7.54) X3=(5,7,7,11,5,10) 产值散点图 199719981999200020012001 185
185 第三节 灰色关联分析 对两个系统或两个因素之间关联性大小的量度,称为关联度。它描述系统发展过程中因 素间相对变化的情况,也就是变化大小、方向及速度等指标的相对性。如果两者在系统发展 过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度就小。 灰色系统理论的关联度分析与数理统计学的相关分析是不同的,两者的区别在于第一, 它们的理论基础不同:关联度分析基于灰色系统的灰色过程,而相关分析则基于概率论的随 机过程;第二,分析方法不同:关联分析是进行因素间时间序列的比较,而相关分析是因素 间数组的比较;第三,数据量要求不同:关联分析不要求数据太多,而相关分析则需有足够 的数据量;第四,研究重点不同:关联度分析主要研究动态过程,而相关分析则以静态研究 为主。因此,关联度分析适应性更广,在用于社会经济系统中的应用更有其独到之处。 一般的抽象系统,如社会系统、经济系统、农业系统、生态系统等都包含有许多种因素, 多种因素共同作用的结果决定了该系统的发展态势。我们常常希望知道众多的因素中,哪些 是主要因素,哪些是次要因素,哪些因素对系统发展影响大,哪些因素对系统发展影响小, 哪些因素对系统发展起推动作用需加强,哪些因素对系统发展起阻碍作用需抑制…… 数理统计中的回归分析、方差分析、主成分分析等都是用来进行系统特征分析的方法。 但数理统计中的分析方法往往需要大量数据样本,且服从某个典型分布。灰色关联分析方法 弥补了采用数理统计方法作系统分析所导致的缺憾,它对样本量的多少和样本有无规律都同 样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。 灰色关联分析的基本思想是根据序列曲线几何形状的相似程度来判断其联系是否紧密。 曲线越接近,相应序列之间关联度就越大,反之就越小。例如某地区农业总产值 X0 ,种植 业总产值 X1 ,畜牧业总产值 X2 和林业总产值 X3 ,从 1997-2002 年共 6 年的统计数据如下: X0 =(18,20,22,35,41,46) (7.52) X1 =(8,11,12,17,24,29) (7.53) X2 =(3,2,7,4,11,6) (7.54) (7.55) 产值散点图 0 1 0 2 0 3 0 4 0 5 0 1997 1998 1999 2000 2001 2001 年份 产值 农业 种植业 畜牧业 林果业