当前位置：和泉文库 > 电气与自动化 > 浏览文档

【机器学习】融合并行混沌萤火虫算法的K-调和均值聚类编辑部

文件格式：PDF，文件大小：662.35KB，售价：3.51元

文档详细内容（约9页）

第10卷第6期智能系统学报 Vol.10 No.6 2015年12月 CAAI Transactions on Intelligent Systems Dee.2015 D0:10.11992.tis.201505043 网络出版地址：http://www.cnki.net/kcms/detail/23.1538.tp.20151110.1354.006.html 融合并行混沌萤火虫算法的K-调和均值聚类朱书伟，周治平，张道文 (江南大学物联网工程学院，江苏无锡214122) 摘要：针对K-调和均值算法易陷于局部最优的缺点，提出一种基于改进萤火虫算法(firefly algorithm,FA)的K-调和均值聚类算法。将基于FA的粗搜索与基于并行混沌优化FA的精细搜索相结合，其中精细搜索部分首先通过FA 搜索到当前最优解及次优解，然后通过改进的1 ogistic映射与并行混沌优化策略产生混沌序列在其附近直接搜索，以增强算法的寻优性能。最终，将这种改进的FA用于K调和均值算法聚类中心的优化。实验结果表明：该算法不但对几种测试函数具有更高的搜索精度，而且对6种数据集的聚类结果均有一定的改善，有效地抑制了K-调和均值算法陷于局部最优的问题，提高了聚类准确性和稳定性。关键词：K调和均值：局部最优：莹火虫算法；聚类：并行混沌优化：混沌局部搜索：映射模型：种群多样性中图分类号：TP18文献标志码：A文章编号：1673-4785(2015)06-0872-09 中文引用格式：朱书伟，周治平，张道文.融合并行混沌萤火虫算法的K-调和均值聚类[J].智能系统学报，2015,10(6)：872-880. 英文引用格式：ZHU Shuwei,ZHOU Zhiping,ZHANG Daowen.K-harmonic means clustering merged with parallel chaotic firefly algorithm[J].CAAI Transactions on Intelligent Systems,2015,10(6):872-880. K-harmonic means clustering merged with parallel chaotic firefly algorithm ZHU Shuwei,ZHOU Zhiping,ZHANG Daowen (School of Internet of Things Engineering,Jiangnan University,Wuxi 214122,China) Abstract:The K-harmonic means algorithm (KHM)has the disadvantage of easily falling into a local optimum.To solve this problem,we propose a hybrid KHM based on an improved firefly algorithm(FA).In this paper,we com- bined raw FA-based searching with parallel chaotic FA-based elaborate searching.In the elaborate searching,we found the current best and second-best solutions using the FA,then we used an improved logistic map model com- bined with parallel chaotic optimization to search this area in order to enhance the searching ability of the algorithm. Finally,we used the improved FA to optimize the cluster centers obtained by the KHM.Experimental results dem- onstrate that the proposed algorithm not only had higher search precision for several test functions,but also im- proved the clustering accuracy and stability of six datasets,effectively avoiding being trapped into a local optimum. Keywords:K-harmonic means;local optimum;firefly algorithm;clustering;parallel chaotic optimization;chaotic local search;map model;diversity of population 聚类分析是一种广泛使用的数据分析方法，一最经典且使用最为广泛的聚类算法，其过程简单快直被应用于多个领域，特别是在数据挖掘、模式识捷，容易实现。为了克服K-means对初始聚类中心别、图像处理等领域应用十分广泛。K-meanst是敏感的缺陷，Zhang等)于1999年提出一种K-调和均值(K-harmonic means,KHM)算法，具有较高的稳收稿日期：2015-05-27.网络出版日期：2015-11-10. 定性、收敛速度快，但由于其与K-means同样基于划基金项目：江苏省产学研联合创新资金-前瞻性联合研究基金资助项目 (BY2013015-33). 分的原理，仍存在易陷于局部最优的问题。通信作者：朱书伟.E-mail:6131905056@ip-jiangnan.cdu.cm 目前，对于KHM算法的研究主要是结合智能

第１０卷第６期智能系统学报Ｖｏｌ．１０ №．６２０１５年１２月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＤｅｃ．２０１５ＤＯＩ：１０．１１９９２．ｔｉｓ．２０１５０５０４３网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ｔｐ．２０１５１１１０．１３５４．００６．ｈｔｍｌ融合并行混沌萤火虫算法的Ｋ⁃调和均值聚类朱书伟，周治平，张道文（江南大学物联网工程学院，江苏无锡２１４１２２）摘要：针对Ｋ⁃调和均值算法易陷于局部最优的缺点，提出一种基于改进萤火虫算法（ｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ，ＦＡ）的Ｋ⁃调和均值聚类算法。将基于ＦＡ的粗搜索与基于并行混沌优化ＦＡ的精细搜索相结合，其中精细搜索部分首先通过ＦＡ搜索到当前最优解及次优解，然后通过改进的ｌｏｇｉｓｔｉｃ映射与并行混沌优化策略产生混沌序列在其附近直接搜索，以增强算法的寻优性能。最终，将这种改进的ＦＡ用于Ｋ⁃调和均值算法聚类中心的优化。实验结果表明：该算法不但对几种测试函数具有更高的搜索精度，而且对６种数据集的聚类结果均有一定的改善，有效地抑制了Ｋ⁃调和均值算法陷于局部最优的问题，提高了聚类准确性和稳定性。关键词：Ｋ⁃调和均值；局部最优；萤火虫算法；聚类；并行混沌优化；混沌局部搜索；映射模型；种群多样性中图分类号：ＴＰ１８文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０６⁃０８７２⁃０９中文引用格式：朱书伟，周治平，张道文．融合并行混沌萤火虫算法的Ｋ⁃调和均值聚类［Ｊ］．智能系统学报，２０１５，１０（６）：８７２⁃８８０．英文引用格式：ＺＨＵＳｈｕｗｅｉ，ＺＨＯＵＺｈｉｐｉｎｇ，ＺＨＡＮＧＤａｏｗｅｎ．Ｋ⁃ｈａｒｍｏｎｉｃｍｅａｎｓｃｌｕｓｔｅｒｉｎｇｍｅｒｇｅｄｗｉｔｈｐａｒａｌｌｅｌｃｈａｏｔｉｃｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（６）：８７２⁃８８０．Ｋ⁃ｈａｒｍｏｎｉｃｍｅａｎｓｃｌｕｓｔｅｒｉｎｇｍｅｒｇｅｄｗｉｔｈｐａｒａｌｌｅｌｃｈａｏｔｉｃｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍＺＨＵＳｈｕｗｅｉ，ＺＨＯＵＺｈｉｐｉｎｇ，ＺＨＡＮＧＤａｏｗｅｎ（ＳｃｈｏｏｌｏｆＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓＥｎｇｉｎｅｅｒｉｎｇ，ＪｉａｎｇｎａｎＵｎｉｖｅｒｓｉｔｙ，Ｗｕｘｉ２１４１２２，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：ＴｈｅＫ⁃ｈａｒｍｏｎｉｃｍｅａｎｓａｌｇｏｒｉｔｈｍ（ＫＨＭ）ｈａｓｔｈｅｄｉｓａｄｖａｎｔａｇｅｏｆｅａｓｉｌｙｆａｌｌｉｎｇｉｎｔｏａｌｏｃａｌｏｐｔｉｍｕｍ．Ｔｏｓｏｌｖｅｔｈｉｓｐｒｏｂｌｅｍ，ｗｅｐｒｏｐｏｓｅａｈｙｂｒｉｄＫＨＭｂａｓｅｄｏｎａｎｉｍｐｒｏｖｅｄｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ（ＦＡ）．Ｉｎｔｈｉｓｐａｐｅｒ，ｗｅｃｏｍ⁃ ｂｉｎｅｄｒａｗＦＡ⁃ｂａｓｅｄｓｅａｒｃｈｉｎｇｗｉｔｈｐａｒａｌｌｅｌｃｈａｏｔｉｃＦＡ⁃ｂａｓｅｄｅｌａｂｏｒａｔｅｓｅａｒｃｈｉｎｇ．Ｉｎｔｈｅｅｌａｂｏｒａｔｅｓｅａｒｃｈｉｎｇ，ｗｅｆｏｕｎｄｔｈｅｃｕｒｒｅｎｔｂｅｓｔａｎｄｓｅｃｏｎｄ⁃ｂｅｓｔｓｏｌｕｔｉｏｎｓｕｓｉｎｇｔｈｅＦＡ，ｔｈｅｎｗｅｕｓｅｄａｎｉｍｐｒｏｖｅｄｌｏｇｉｓｔｉｃｍａｐｍｏｄｅｌｃｏｍ⁃ ｂｉｎｅｄｗｉｔｈｐａｒａｌｌｅｌｃｈａｏｔｉｃｏｐｔｉｍｉｚａｔｉｏｎｔｏｓｅａｒｃｈｔｈｉｓａｒｅａｉｎｏｒｄｅｒｔｏｅｎｈａｎｃｅｔｈｅｓｅａｒｃｈｉｎｇａｂｉｌｉｔｙｏｆｔｈｅａｌｇｏｒｉｔｈｍ．Ｆｉｎａｌｌｙ，ｗｅｕｓｅｄｔｈｅｉｍｐｒｏｖｅｄＦＡｔｏｏｐｔｉｍｉｚｅｔｈｅｃｌｕｓｔｅｒｃｅｎｔｅｒｓｏｂｔａｉｎｅｄｂｙｔｈｅＫＨＭ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｄｅｍ⁃ ｏｎｓｔｒａｔｅｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍｎｏｔｏｎｌｙｈａｄｈｉｇｈｅｒｓｅａｒｃｈｐｒｅｃｉｓｉｏｎｆｏｒｓｅｖｅｒａｌｔｅｓｔｆｕｎｃｔｉｏｎｓ，ｂｕｔａｌｓｏｉｍ⁃ ｐｒｏｖｅｄｔｈｅｃｌｕｓｔｅｒｉｎｇａｃｃｕｒａｃｙａｎｄｓｔａｂｉｌｉｔｙｏｆｓｉｘｄａｔａｓｅｔｓ，ｅｆｆｅｃｔｉｖｅｌｙａｖｏｉｄｉｎｇｂｅｉｎｇｔｒａｐｐｅｄｉｎｔｏａｌｏｃａｌｏｐｔｉｍｕｍ．Ｋｅｙｗｏｒｄｓ：Ｋ⁃ｈａｒｍｏｎｉｃｍｅａｎｓ；ｌｏｃａｌｏｐｔｉｍｕｍ；ｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ；ｃｌｕｓｔｅｒｉｎｇ；ｐａｒａｌｌｅｌｃｈａｏｔｉｃｏｐｔｉｍｉｚａｔｉｏｎ；ｃｈａｏｔｉｃｌｏｃａｌｓｅａｒｃｈ；ｍａｐｍｏｄｅｌ；ｄｉｖｅｒｓｉｔｙｏｆｐｏｐｕｌａｔｉｏｎ收稿日期：２０１５⁃０５⁃２７．网络出版日期：２０１５⁃１１⁃１０．基金项目：江苏省产学研联合创新资金－前瞻性联合研究基金资助项目（ＢＹ２０１３０１５⁃３３）．通信作者：朱书伟．Ｅ⁃ｍａｉｌ：６１３１９０５０５６＠ｖｉｐ．ｊｉａｎｇｎａｎ．ｅｄｕ．ｃｎ．聚类分析是一种广泛使用的数据分析方法，一直被应用于多个领域，特别是在数据挖掘、模式识别、图像处理等领域应用十分广泛。Ｋ⁃ｍｅａｎｓ［１］是最经典且使用最为广泛的聚类算法，其过程简单快捷，容易实现。为了克服Ｋ⁃ｍｅａｎｓ对初始聚类中心敏感的缺陷，Ｚｈａｎｇ等［２］于１９９９年提出一种Ｋ⁃调和均值（Ｋ⁃ｈａｒｍｏｎｉｃｍｅａｎｓ，ＫＨＭ）算法，具有较高的稳定性、收敛速度快，但由于其与Ｋ⁃ｍｅａｎｓ同样基于划分的原理，仍存在易陷于局部最优的问题。目前，对于ＫＨＭ算法的研究主要是结合智能

第6期朱书伟，等：融合并行混沌莹火虫算法的K-调和均值聚类 ·873. 优化算法进行改进，以充分利用其全局搜索能力，如这里采用欧式距离计算样本到聚类中心的融合粒子群)、变邻域搜索)、改进候选组搜索) 距离，参数p对算法的性能具有重要的影响，且等混合聚类算法。此外，将模糊概念引入KHM中当p≥2时聚类的效果比较好2]。算法通过不断也得到了一定的关注6)。目前，各种群智能优化地迭代使目标函数值不断减小并保持稳定，每次算法已被广泛地应用于各个领域中[81)，并且依据迭代过程中，各个簇的中心点c()=1,2,…,k)的没有免费的午餐定律，本文提出新的混合聚类算法。更新如下[3) 萤火虫算法(firefly algorithm,FA)是由剑桥学者 Yang等[2.1)在2008年提出的一种新颖的群智能算 ∑，mw(c/x)XU(x)Xx i=1 (2) 法，具有结构简单、可调参数少、宜于并行处理等特点，可以有效解决各种优化问题，并能够成功应用到 ∑mum(cy/x,)X0uw() 聚类问题中提高算法的准确性和鲁棒性[。很多式中：成员函数m和权重函数wKv的定义分别为学者已经对它开展了不少研究工作，引入混沌原理式(3)和式(4)。改进的FA具有一定的优势，Fister等[s]对现有的混 Ix:-c‖p-2 mkH(C/x:）= (3) 沌萤火虫算法(chaos-based firefly algorithm,CFA) lx-l-p-2 进行了总结，它们的主要思想都是基于算法参数的改进，其中Gandomi等[u6]采用各种混沌映射模型进 x-6 WKHM(x:）= (4) 行了比较全面的对比分析。然而，仅对参数的调整 (,g-6) 无法更全面有效地利用混沌优化的优点，混沌局部 1.2 萤火虫算法的相关定义搜索(chaotic local search,CLS)[91o]是一种能够有在FA中萤火虫彼此吸引主要取决于2个因效提高算法优化性能的策略。素：亮度和吸引度。亮度决定了个体所处位置的好本文从进一步提高FA的优化性能出发，提出坏及其移动方向，吸引度决定了移动的距离，通过亮一种新颖的CFA,并将其融入到KHM以获得一种度和吸引度的不断更新，实现目标优化。通常直接更有效的混合聚类方法。在FA中引入一种并行混利用目标函数值的大小表示萤火虫i的亮度I,即沌局部搜索策略，将CLS与并行混沌优化(parallel L=f:),x:=[xax2…xa]。FA的相关定 chaotic optimization,PC0)[7-l8]相结合，提高FA的义如下12.13 局部搜索能力，具有更高的搜索效率，并能够有效避定义1萤火虫i与j之间的吸引度为免局部最优。将这种改进的CFA融入到KHM中优 B=Boe-r (5) 化其目标函数，通过对实际数据集的实验可以看出式中：B。为在r=0处的吸引度，一般可取值为1；y 本文所提的聚类算法能够获得更好的性能指标，有为光强吸收系数，对算法的性能具有重要的影响，通效抑制了陷入局部最优的问题。常情况下可以取y=1;r,为萤火虫i与j之间的空 1算法概念与定义间距离，一般采用欧氏距离计算。定义2萤火虫i被更亮的萤火虫j吸引而移 1.1K-调和均值算法动的位置为 K-调和均值算法的原理基本上与K-means是相 xi=x;+B(Xi-xi)+aEi (6) 似的，不同的是其使用调和均值(harmonic means, 式中：x:、x为萤火虫i和j的位置：a为步长因子， HM)代替算术均值来计算目标函数，能够有效解决可设为常数：e:为服从均匀分布的随机数向量。对初始类中心点选取的敏感性问题。假定数据集 X=[x1x2…x.]包含n个数据，它们被划分 2基于改进FA的K-调和均值聚类到k个聚类簇，每个簇的中心用c,(G=1,2,…,k)表 2.1并行混沌局部搜索策略改进的FA 示，KHM的目标函数为[) 基本的FA缺乏变异机制，当处于局部极值时 KHM(X,C)= -,i=1,2,…,n 难以摆脱，且当前最优解xg周围是搜索到更优解的 1 最有利的区域，而FA在优化过程中采用对其随机 2x:-G1 扰动的方式，搜索效率不高。混沌优化方法能够有 (1) 效地跳出局部最优并搜索到全局最优解，现有文献

优化算法进行改进，以充分利用其全局搜索能力，如融合粒子群［３］、变邻域搜索［４］、改进候选组搜索［５］等混合聚类算法。此外，将模糊概念引入ＫＨＭ中也得到了一定的关注［６⁃７］。目前，各种群智能优化算法已被广泛地应用于各个领域中［８⁃１１］，并且依据没有免费的午餐定律，本文提出新的混合聚类算法。萤火虫算法（ｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ，ＦＡ）是由剑桥学者Ｙａｎｇ等［１２⁃１３］在２００８年提出的一种新颖的群智能算法，具有结构简单、可调参数少、宜于并行处理等特点，可以有效解决各种优化问题，并能够成功应用到聚类问题中提高算法的准确性和鲁棒性［１４］。很多学者已经对它开展了不少研究工作，引入混沌原理改进的ＦＡ具有一定的优势，Ｆｉｓｔｅｒ等［１５］对现有的混沌萤火虫算法（ｃｈａｏｓ⁃ｂａｓｅｄｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ，ＣＦＡ）进行了总结，它们的主要思想都是基于算法参数的改进，其中Ｇａｎｄｏｍｉ等［１６］采用各种混沌映射模型进行了比较全面的对比分析。然而，仅对参数的调整无法更全面有效地利用混沌优化的优点，混沌局部搜索（ｃｈａｏｔｉｃｌｏｃａｌｓｅａｒｃｈ，ＣＬＳ）［９⁃１０］是一种能够有效提高算法优化性能的策略。本文从进一步提高ＦＡ的优化性能出发，提出一种新颖的ＣＦＡ，并将其融入到ＫＨＭ以获得一种更有效的混合聚类方法。在ＦＡ中引入一种并行混沌局部搜索策略，将ＣＬＳ与并行混沌优化（ｐａｒａｌｌｅｌｃｈａｏｔｉｃｏｐｔｉｍｉｚａｔｉｏｎ，ＰＣＯ）［１７⁃１８］相结合，提高ＦＡ的局部搜索能力，具有更高的搜索效率，并能够有效避免局部最优。将这种改进的ＣＦＡ融入到ＫＨＭ中优化其目标函数，通过对实际数据集的实验可以看出本文所提的聚类算法能够获得更好的性能指标，有效抑制了陷入局部最优的问题。１算法概念与定义１．１Ｋ⁃调和均值算法Ｋ⁃调和均值算法的原理基本上与Ｋ⁃ｍｅａｎｓ是相似的，不同的是其使用调和均值（ｈａｒｍｏｎｉｃｍｅａｎｓ，ＨＭ）代替算术均值来计算目标函数，能够有效解决对初始类中心点选取的敏感性问题。假定数据集Ｘ＝［ｘ１ｘ２ … ｘｎ］包含ｎ个数据，它们被划分到ｋ个聚类簇，每个簇的中心用ｃｊ（ｊ＝１，２，…，ｋ）表示，ＫＨＭ的目标函数为［３］ＫＨＭ（Ｘ，Ｃ）＝ ∑ ｎｉ＝１ｋ ∑ ｋｊ＝１１ ‖ｘｉ－ｃｊ‖ｐ，∀ｉ＝１，２，…，ｎ（１）这里采用欧式距离计算样本到聚类中心的距离，参数ｐ对算法的性能具有重要的影响，且当ｐ≥２时聚类的效果比较好［２］。算法通过不断地迭代使目标函数值不断减小并保持稳定，每次迭代过程中，各个簇的中心点ｃｊ（ｊ＝１，２，…，ｋ）的更新如下［３］。ｃｊｎｅｗ＝ ∑ ｎｉ＝１ｍＫＨＭ（ｃｊ／ｘｉ） × ｗＫＨＭ（ｘｉ） × ｘｉ ∑ ｎｉ＝１ｍＫＨＭ（ｃｊ／ｘｉ） × ｗＫＨＭ（ｘｉ）（２）式中：成员函数ｍＫＨＭ和权重函数ｗＫＨＭ的定义分别为式（３）和式（４）。ｍＫＨＭ（ｃｊ／ｘｉ）＝ ‖ｘｉ－ｃｊ‖－ｐ－２ ∑ Ｋｊ＝１ ‖ｘｉ－ｃｊ‖ －ｐ－２（３）ｗＫＨＭ（ｘｉ）＝ ∑ ｋｊ＝１ ‖ｘｉ－ｃｊ‖－ｐ－２（∑ ｋｊ＝１ ‖ｘｉ－ｃｊ‖－ｐ）２（４）１．２萤火虫算法的相关定义在ＦＡ中萤火虫彼此吸引主要取决于２个因素：亮度和吸引度。亮度决定了个体所处位置的好坏及其移动方向，吸引度决定了移动的距离，通过亮度和吸引度的不断更新，实现目标优化。通常直接利用目标函数值的大小表示萤火虫ｉ的亮度Ｉｉ，即Ｉｉ＝ｆ（ｘｉ），ｘｉ＝［ｘｉ１ｘｉ２ … ｘｉｄ］。ＦＡ的相关定义如下［１２⁃１３］：定义１萤火虫ｉ与ｊ之间的吸引度为 β ＝ β０ｅ－γｒ２ｉｊ（５）式中： β０为在ｒ＝０处的吸引度，一般可取值为１； γ 为光强吸收系数，对算法的性能具有重要的影响，通常情况下可以取 γ ＝１；ｒｉｊ为萤火虫ｉ与ｊ之间的空间距离，一般采用欧氏距离计算。定义２萤火虫ｉ被更亮的萤火虫ｊ吸引而移动的位置为ｘｉｎｅｗ＝ｘｉ＋ β（ｘｊ－ｘｉ）＋ α εｉ（６）式中：ｘｉ、ｘｊ为萤火虫ｉ和ｊ的位置；α 为步长因子，可设为常数； εｉ为服从均匀分布的随机数向量。２基于改进ＦＡ的Ｋ⁃调和均值聚类２．１并行混沌局部搜索策略改进的ＦＡ基本的ＦＡ缺乏变异机制，当处于局部极值时难以摆脱，且当前最优解ｘｐｇ周围是搜索到更优解的最有利的区域，而ＦＡ在优化过程中采用对其随机扰动的方式，搜索效率不高。混沌优化方法能够有效地跳出局部最优并搜索到全局最优解，现有文献第６期朱书伟，等：融合并行混沌萤火虫算法的Ｋ⁃调和均值聚类 ·８７３·

·874… 智能系统学报第10卷对混沌模型的研究非常广泛，如logistic映射、Sinu- 1.0 soidal映射、Gaussian映射等16,1。文献[9-10]中采取一种改进logistic映射分别与粒子群(particle swarm optimization,PS0)算法和差分进化算法融合提出2种有效的基于CLS的混合优化算法，成功用于短期梯级水电系统调度问题，并且在文献[19]中验证了这种混沌映射的优势，它具有较大的李雅普 -1.0 -0.590.51.0 诺夫指数。logistic映射模型为[1例 y(1+1)=4y()(1-y(l)),y(1)∈(0,1) (b)多峰图12种特殊情况的最优解与次优解局部搜索区域 (7) Fig.1 Two particular types of local search region a- 式中：l表示迭代次数，需要注意的是混沌变量初始 round the best and second best solutions 值y(0){0.25,0.5,0.75},若设置y(1)=(z(l)+ 为了进一步提高搜索效率，提出一种并行混沌 1)/2,则可以获得改进的logistic映射如式(8)1)：局部搜索(parallel chaotic local search,PCLS)策略， z(1+1)=1-2(z(1))2,z(1)∈（-1,1)(8) 采用并行混沌优化的思想产生N个混沌局部变量并且其概率密度分布表达式为对次优解和最优解并行扰动，不但克服传统CLS的 1 ,z∈(-1,1) 串行机制搜索精确解效率不高、收敛稳定性不强等 f(z)=m√1-z (9) 缺点[910，还能够有效地兼顾最优解与次优解。当 0,z年(-1,1) 最优解和次优解接近时可将它们的作用视为相等，由式(9)可以看出改进logistic映射可以将混沌不接近时则能够有效地拓展局部搜索空间。每次迭变量的搜索空间拓展到(-1,1)，在接近边界-1和1 代后取N个并行变量与xg和x综合排序获得新处具有较大的概率密度值，因此具有更好的遍历性、的最优解和次优解，有效地提高算法搜索能力。随机性。因此，本文利用改进logistic映射在当前最考虑到文献[17-18]中PC0结合了粗搜索与细优解附近直接搜索，其本质上属于一种混沌干扰法，搜索的策略以平衡算法的探索与开发性能，为了使即产生许多局部最优解的邻域点，以增强搜索到全并行混沌局部搜索萤火虫算法(parallel chaotic local 局最优解的概率。与此同时，适应度值仅次于最优 search firefly algorithm,PCLSFA)在前期进行一定的解x的次优解x同样对搜索到更优解具有一定的粗搜索，可在前T次迭代直接执行FA,PCLSFA 价值，文献[20]中以最优点和次优点为基础进行反的具体过程为：射、延伸、收缩等步骤的单纯形法也为本文提供一定 1)初始化萤火虫个体的位置并计算其对应的的启发。为了更直观地分析，在图1中分别给出二目标函数值1，作为亮度，初始化迭代次数t=0,最大维的单峰和多峰搜索空间的2种特殊情况的次优解迭代次数设为T,粗搜索迭代次数T1o 与最优解局部搜索区域，它们的局部搜索半径均相 2)执行FA不断更新亮度，最亮的个体即为当等，并且假定越往内适应度值越好。从图1(a)、前最优解xs,并且次优解为x,若>T1,则采用 (b)中可见2种特殊情况下次优解相对于最优解均 PCLS在它们附近寻优作为细搜索。具有更好的搜索潜力。 3)设置当前混沌搜索次数1=0，在上文几个断点外的区域初始化混沌变量-1<g<1(i=1,2, 1.0 饮优解 …,N;j=1,2,…,m),N为并行变量数，m为单变量 0.5 维数，则表示第i个并行变量的第j维。此外，中最秋解间变量矩阵为Y,PCLS最大迭代次数为Cr。 ①考虑到大多数情况下x具有更好的搜索潜 -0.5 力，令0=n(,i=1,2…2,且0=.(0. -1.0 0.5 0 0.51.0 i=2N+12W+2 3 ,3,,N,使用式(8)确定第41次 (a)单峰迭代的混沌扰动变量写+

对混沌模型的研究非常广泛，如ｌｏｇｉｓｔｉｃ映射、Ｓｉｎｕ⁃ ｓｏｉｄａｌ映射、Ｇａｕｓｓｉａｎ映射等［１６，１９］。文献［９⁃１０］中采取一种改进ｌｏｇｉｓｔｉｃ映射分别与粒子群（ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ，ＰＳＯ）算法和差分进化算法融合提出２种有效的基于ＣＬＳ的混合优化算法，成功用于短期梯级水电系统调度问题，并且在文献［１９］中验证了这种混沌映射的优势，它具有较大的李雅普诺夫指数。ｌｏｇｉｓｔｉｃ映射模型为［１９］ｙ（ｌ＋１）＝４ｙ（ｌ）（１－ｙ（ｌ）），ｙ（ｌ） ∈ （０，１）（７）式中：ｌ表示迭代次数，需要注意的是混沌变量初始值ｙ（０） ∉ ｛０．２５，０．５，０．７５｝，若设置ｙ（ｌ）＝（ｚ（ｌ）＋１）／２，则可以获得改进的ｌｏｇｉｓｔｉｃ映射如式（８）［１９］：ｚ（ｌ＋１）＝１－２（ｚ（ｌ））２，ｚ（ｌ） ∈ （－１，１）（８）并且其概率密度分布表达式为ｆ（ｚ）＝１ π １－ｚ２，ｚ ∈ （－１，１）０，ｚ ∉ （－１，１） ì î í ï ï ïï （９）由式（９）可以看出改进ｌｏｇｉｓｔｉｃ映射可以将混沌变量的搜索空间拓展到（－１，１），在接近边界－１和１处具有较大的概率密度值，因此具有更好的遍历性、随机性。因此，本文利用改进ｌｏｇｉｓｔｉｃ映射在当前最优解附近直接搜索，其本质上属于一种混沌干扰法，即产生许多局部最优解的邻域点，以增强搜索到全局最优解的概率。与此同时，适应度值仅次于最优解ｘｐｇ的次优解ｘｐｓ同样对搜索到更优解具有一定的价值，文献［２０］中以最优点和次优点为基础进行反射、延伸、收缩等步骤的单纯形法也为本文提供一定的启发。为了更直观地分析，在图１中分别给出二维的单峰和多峰搜索空间的２种特殊情况的次优解与最优解局部搜索区域，它们的局部搜索半径均相等，并且假定越往内适应度值越好。从图１（ａ）、（ｂ）中可见２种特殊情况下次优解相对于最优解均具有更好的搜索潜力。（ａ）单峰（ｂ）多峰图１２种特殊情况的最优解与次优解局部搜索区域Ｆｉｇ．１Ｔｗｏｐａｒｔｉｃｕｌａｒｔｙｐｅｓｏｆｌｏｃａｌｓｅａｒｃｈｒｅｇｉｏｎａ⁃ ｒｏｕｎｄｔｈｅｂｅｓｔａｎｄｓｅｃｏｎｄｂｅｓｔｓｏｌｕｔｉｏｎｓ为了进一步提高搜索效率，提出一种并行混沌局部搜索（ｐａｒａｌｌｅｌｃｈａｏｔｉｃｌｏｃａｌｓｅａｒｃｈ，ＰＣＬＳ）策略，采用并行混沌优化的思想产生Ｎ个混沌局部变量对次优解和最优解并行扰动，不但克服传统ＣＬＳ的串行机制搜索精确解效率不高、收敛稳定性不强等缺点［９⁃１０］，还能够有效地兼顾最优解与次优解。当最优解和次优解接近时可将它们的作用视为相等，不接近时则能够有效地拓展局部搜索空间。每次迭代后取Ｎ个并行变量与ｘｐｇ和ｘｐｓ综合排序获得新的最优解和次优解，有效地提高算法搜索能力。考虑到文献［１７⁃１８］中ＰＣＯ结合了粗搜索与细搜索的策略以平衡算法的探索与开发性能，为了使并行混沌局部搜索萤火虫算法（ｐａｒａｌｌｅｌｃｈａｏｔｉｃｌｏｃａｌｓｅａｒｃｈｆｉｒｅｆｌｙａｌｇｏｒｉｔｈｍ，ＰＣＬＳＦＡ）在前期进行一定的粗搜索，可在前Ｔｍａｘ１次迭代直接执行ＦＡ，ＰＣＬＳＦＡ的具体过程为：１）初始化萤火虫个体的位置并计算其对应的目标函数值Ｉｉ作为亮度，初始化迭代次数ｔ＝０，最大迭代次数设为Ｔｍａｘ，粗搜索迭代次数Ｔｍａｘ１。２）执行ＦＡ不断更新亮度，最亮的个体即为当前最优解ｘｐｇ，并且次优解为ｘｐｓ，若ｔ＞Ｔｍａｘ１，则采用ＰＣＬＳ在它们附近寻优作为细搜索。３）设置当前混沌搜索次数ｌ＝０，在上文几个断点外的区域初始化混沌变量－１＜ｚｉｊ（０）＜１（ｉ＝１，２， …，Ｎ；ｊ＝１，２，…，ｍ），Ｎ为并行变量数，ｍ为单变量维数，则ｚｉｊ表示第ｉ个并行变量的第ｊ维。此外，中间变量矩阵为Ｙ，ＰＣＬＳ最大迭代次数为Ｃｍａｘ。 ①考虑到大多数情况下ｘｐｇ具有更好的搜索潜力，令ｙ（ｌ）ｉ＝ｘｐｇ（ｌ），ｉ＝１，２…，２Ｎ３，且ｙ（ｌ）ｉ＝ｘｐｓ（ｌ），ｉ＝２Ｎ＋１３，２Ｎ＋２３，…，Ｎ，使用式（８）确定第ｌ＋１次迭代的混沌扰动变量ｚｉｊ（ｌ＋１）。 ·８７４· 智能系统学报第１０卷

第6期朱书伟，等：融合并行混沌莹火虫算法的K-调和均值聚类 ·875· ②混沌变量与收缩因子B,成比例，通过混沌扰式(15)所示，获得替换种群并更新其适应度值。动产生N个新变量如式(10)所示。 x"M=b+Cx;(b-a) (15) y)=y(+B(Iras (10) 这里随着迭代次数的增加对边界范围不断收式中：lrs为并行混沌局部搜索的范围，可将其设缩，在各个不同阶段生成不同尺度的混沌变量，能够置为0.01l~0.11,1为变量尺度，若6、l分别为变避免直接根据初始的定义域随机生成替代个体时效量的上下界，则取1=(u,-1,)/2,收缩因子B,为率不高的问题，且同样能够改善种群多样性。 B=e-cvTn (11) 2.3改进FA的收敛性分析及复杂度分析式中：C是一个用于控制PCLS精度的正数，根据实目前，FA还没有很完备的数学理论基础[2)，但验分析可在[1,10]内选取，一般对于较难搜索到全已有的仿真实验结果表明FA具有较高的寻优精度局最优的问题取较小值。求得N个新变量组成的和收敛速度，是一种有效的优化方法。本文改进算法矩阵为与基本FA的不同之处为迭代T,次后增加了PCLS (1+1) y11 2+) …yw7 过程，故只需证明3)过程的收敛性，即可证明PCLS 31) y2(1 …y2*0 FA的收敛性优于FA。从测度论上进行分析，由于 (12) PCLS属于下降算法，并且它具有很好的遍历性，因而 (1+1) 设R表示全局最优点x·的可行域。总迭代次数为t LYMI 时(t>T,),在执行2)后的当前最优解xg和次优解 ③计算每个新变量所对应的目标函数值为 fy,”）,并将y+w与xw”、x+》合并，对这 x落入R的事件集合为A,P(A,)≤1，PCLS每次 N+2个变量的适应度值进行排序，得到第l+1次迭迭代后产生的序列矩阵y”且与x”、x0(1=1, 代中的最优解x网)和次优解xn。 2,…,C)合并后落入R的事件集合为A,因此AC ④=l+1,若l<C,转向①；否则转向4)。 A,C…CAc,概率测度单调不减，故P(Ac）≥ …≥P(A2)≥P(A)。可知执行3)之后具有更高的 4)t=t+1,若t<Tmx,转向2)，且随机选取一个萤火虫个体用3)中获得的x替换并更新其亮度；概率落入全局最优点x·的可行域，故PCLSFA的收敛性优于FA,接下来通过对基准函数的仿真实验能否则停止迭代，输出全局最优解。够进一步验证其收敛性。此外，当忽略对目标函数的 2.2提高种群多样性的策略由于FA缺乏保持种群多样性的操作，降低了计算时，FA的时间复杂度为O(Ts·N2),且算法探索到全局最优解的能力，因此需要采取一定 PCLSFA的时间复杂度为O(Tm·Np2+T2· 的措施来解决这一问题。本文中算法每迭代V。次 Cmx·N),（Tnma=Tnax-Tmxi）。 2.4KHM-PCLSFA算法流程时，找出适应度值最差的n%的个体并采用混沌重本文采用K-调和均值的目标函数KHM(X,C) 构法生成新的个体替代它们。对于各维尺度相等的优化问题，直接计算出当前种群所有维空间的最大作为萤火虫i的亮度1：，并以此确定其移动方向，其值xmm和最小值xmn作为各维的统一边界。对于各本质上是将聚类问题转化为一种优化问题。若k为维尺度不相等的优化问题，对边界向量不断地收缩，聚类的数量，m为数据的维数，则用一个k×m列的初始时第j维的边界等于定义域[a,b],当达到第一维向量x=(x1,x2,…,xm,…,x1,x2,…,xm）来表示一个聚类中心，即一个萤火虫个体。由于算 N,次迭代的最优个体为x·,根据式(13)收缩边界。法对初始值不敏感，可从数据集中随机选择k个不 %=考-o(6,-a） (13) 同的点并对其进行较小的扰动以构成一个中心向量 (b"ew=x·+p(b-a） x,确定P个这样的向量作为种群初始位置。由于式中：p∈(0,0.5)，并且为了保证新的边界范围不本文算法的总迭代次数Itermax较小，不需要执行粗会越界，对其进行相应的处理为：若a"<a,则搜索。 g=a;若b,>b,则6=b。然后根据式(7)的综上所述，本文算法KHM-PCLSFA的流程为： logistic映射生成比例为n.%的N个在(0,1)上的向 1)初始化算法的基本参数y、aB、Cms、N、l并量Cx(i=1,2,…,N)如式(14)所示。随机初始化萤火虫种群的位置。 Cx:=4×y×(1-y),y∈(0,1)(14) 2)根据萤火虫的位置计算其目标函数值作为最后再将其转换到当前种群变量的取值空间如亮度，初始化当前迭代次数gen=0

②混沌变量与收缩因子 βｔ成比例，通过混沌扰动产生Ｎ个新变量如式（１０）所示。ｙｉｊ（ｌ＋１）＝ｙｉｊ（ｌ）＋ βｔｚｉｊ（ｌ＋１）ｌＰＣＬＳ（１０）式中：ｌＰＣＬＳ为并行混沌局部搜索的范围，可将其设置为０．０１ｌ～０．１ｌ，ｌ为变量尺度，若ｕｂ、ｌｂ分别为变量的上下界，则取ｌ＝（ｕｂ－ｌｂ）／２，收缩因子 βｔ为 βｔ＝ｅ－Ｃ∗ｔ／Ｔｍａｘ（１１）式中：Ｃ是一个用于控制ＰＣＬＳ精度的正数，根据实验分析可在［１，１０］内选取，一般对于较难搜索到全局最优的问题取较小值。求得Ｎ个新变量组成的矩阵为Ｙ（ｌ＋１）＝ｙ１１（ｌ＋１）ｙ１２（ｌ＋１） … ｙ１ｍ（ｌ＋１）ｙ２１（ｌ＋１）ｙ２２（ｌ＋１） … ｙ２ｍ（ｌ＋１） ︙ ︙ ︙ ｙＮ１（ｌ＋１）ｙＮ２（ｌ＋１） … ｙＮｍ（ｌ＋１） é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú （１２） ③计算每个新变量所对应的目标函数值为ｆ（ｙｉ（ｌ＋１）），并将Ｙ（ｌ＋１）与ｘｐｇ（ｌ＋１）、ｘｐｓ（ｌ＋１）合并，对这Ｎ＋２个变量的适应度值进行排序，得到第ｌ＋１次迭代中的最优解ｘｐｇ（ｌ＋１）和次优解ｘｐｓ（ｌ＋１）。 ④ｌ＝ｌ＋１，若ｌ＜Ｃｍａｘ，转向①；否则转向４）。４）ｔ＝ｔ＋１，若ｔ＜Ｔｍａｘ，转向２），且随机选取一个萤火虫个体用３）中获得的ｘｐｇ替换并更新其亮度；否则停止迭代，输出全局最优解。２．２提高种群多样性的策略由于ＦＡ缺乏保持种群多样性的操作，降低了算法探索到全局最优解的能力，因此需要采取一定的措施来解决这一问题。本文中算法每迭代Ｎｐ次时，找出适应度值最差的ｎｃ％的个体并采用混沌重构法生成新的个体替代它们。对于各维尺度相等的优化问题，直接计算出当前种群所有维空间的最大值ｘｍａｘ和最小值ｘｍｉｎ作为各维的统一边界。对于各维尺度不相等的优化问题，对边界向量不断地收缩，初始时第ｊ维的边界等于定义域［ａｊ，ｂｊ］，当达到第Ｎｐ次迭代的最优个体为ｘ ∗ ，根据式（１３）收缩边界。ａｊｎｅｗ＝ｘｊ ∗ － φ（ｂｊ－ａｊ）ｂｊｎｅｗ＝ｘｊ ∗ ＋ φ（ｂｊ { －ａｊ）（１３）式中： φ ∈ （０，０．５），并且为了保证新的边界范围不会越界，对其进行相应的处理为：若ａｊｎｅｗ＜ａｊ，则ａｊｎｅｗ＝ａｊ；若ｂｊｎｅｗ＞ｂｊ，则ｂｊｎｅｗ＝ｂｊ。然后根据式（７）的ｌｏｇｉｓｔｉｃ映射生成比例为ｎｃ％的Ｎｃ个在（０，１）上的向量Ｃｘｉ（ｉ＝１，２，…，Ｎｃ）如式（１４）所示。Ｃｘｉ＝４ × ｙ × （１－ｙ），ｙ ∈ （０，１）（１４）最后再将其转换到当前种群变量的取值空间如式（１５）所示，获得替换种群并更新其适应度值。ｘｉｎｅｗ＝ｂ＋Ｃｘｉ（ｂ－ａ）（１５）这里随着迭代次数的增加对边界范围不断收缩，在各个不同阶段生成不同尺度的混沌变量，能够避免直接根据初始的定义域随机生成替代个体时效率不高的问题，且同样能够改善种群多样性。２．３改进ＦＡ的收敛性分析及复杂度分析目前，ＦＡ还没有很完备的数学理论基础［１２⁃１３］，但已有的仿真实验结果表明ＦＡ具有较高的寻优精度和收敛速度，是一种有效的优化方法。本文改进算法与基本ＦＡ的不同之处为迭代Ｔｍａｘ１次后增加了ＰＣＬＳ过程，故只需证明３）过程的收敛性，即可证明ＰＣＬＳ⁃ ＦＡ的收敛性优于ＦＡ。从测度论上进行分析，由于ＰＣＬＳ属于下降算法，并且它具有很好的遍历性，因而设Ｒｇ表示全局最优点ｘ ∗ 的可行域。总迭代次数为ｔ时（ｔ＞Ｔｍａｘ１），在执行２）后的当前最优解ｘｐｇ和次优解ｘｐｓ落入Ｒｇ的事件集合为Ａ０，Ｐ（Ａ０） ≤ １，ＰＣＬＳ每次迭代后产生的序列矩阵ｙ（ｌ）且与ｘｐｇ（ｌ）、ｘｐｓ（ｌ）（ｌ＝１，２，…，Ｃｍａｘ）合并后落入Ｒｇ的事件集合为Ａｌ，因此Ａ１⊂ Ａ２⊂ … ⊂ ＡＣｍａｘ，概率测度单调不减，故Ｐ（ＡＣｍａｘ） ≥ … ≥Ｐ（Ａ２） ≥ Ｐ（Ａ１）。可知执行３）之后具有更高的概率落入全局最优点ｘ ∗ 的可行域，故ＰＣＬＳＦＡ的收敛性优于ＦＡ，接下来通过对基准函数的仿真实验能够进一步验证其收敛性。此外，当忽略对目标函数的计算时，ＦＡ的时间复杂度为Ｏ（Ｔｍａｘ ∙Ｎｐｏｐ２），且ＰＣＬＳＦＡ的时间复杂度为Ｏ（Ｔｍａｘ ∙Ｎｐｏｐ２＋Ｔｍａｘ２ ∙ Ｃｍａｘ∙Ｎ），（Ｔｍａｘ２＝Ｔｍａｘ－Ｔｍａｘ１）。２．４ＫＨＭ⁃ＰＣＬＳＦＡ算法流程本文采用Ｋ⁃调和均值的目标函数ＫＨＭ（Ｘ，Ｃ）作为萤火虫ｉ的亮度Ｉｉ，并以此确定其移动方向，其本质上是将聚类问题转化为一种优化问题。若ｋ为聚类的数量，ｍ为数据的维数，则用一个ｋ×ｍ列的一维向量ｘ＝（ｘ１１，ｘ１２，…，ｘ１ｍ，…，ｘｋ１，ｘｋ２，…，ｘｋｍ）来表示一个聚类中心，即一个萤火虫个体。由于算法对初始值不敏感，可从数据集中随机选择ｋ个不同的点并对其进行较小的扰动以构成一个中心向量ｘ，确定Ｐｓｉｚｅ个这样的向量作为种群初始位置。由于本文算法的总迭代次数Ｉｔｅｒｍａｘ较小，不需要执行粗搜索。综上所述，本文算法ＫＨＭ⁃ＰＣＬＳＦＡ的流程为：１）初始化算法的基本参数 γ、 α、β、Ｃｍａｘ、Ｎ、ｌ并随机初始化萤火虫种群的位置。２）根据萤火虫的位置计算其目标函数值作为亮度，初始化当前迭代次数ｇｅｎ＝０。第６期朱书伟，等：融合并行混沌萤火虫算法的Ｋ⁃调和均值聚类 ·８７５·

·876. 智能系统学报第10卷 3)执行PCLSFA进行搜索，迭代运行gen,次，B=(B-B)er房+B,其中B=1,Ba= 求出当前的最优个体G以及对应的最优目标函 0.2。对搜索空间较小的函数f1~f取1cs=0.1l,对数值F,进入下一步操作。并且，选出占种群比例搜索空间较大的函数f取1cs=0.01l。此外，为%的最差个体并采用混沌重构法将其替换。 PCLSFA中的N=15,N。=50,n.=20,中=0.4。 4)以G为聚类中心执行KHM操作，迭代运仿真实验基于MATLAB201Ob平台，计算机行gen2次，得到目标函数值KHM(X,C)和聚类中的硬件配置为：Intel Core i5-4200MCPU2.5 心并将其转化为一维向量xKHM,若KHM(X,C)< GHz、4 GB RAM。各函数的维数均为30，每种算 F,则用xKM代替G,并以xKHM随机替换一个萤法独立运行30次，计算各自的最大值、最小值、火虫。平均值和标准差，记录至表1。对各函数的收敛 5)gen=gen+1,若gen<Itermax,则转到3)继续曲线为30次运行的平均结果，分别如图2所示，执行，否则停止迭代得出聚类结果。为了更明显的比较，图中纵坐标是对最优解求g 若数据集中有n个数据，则KHM每次迭代的 (f)后的平均值。时间复杂度为O(knm),本文聚类算法FA部分采用表14个基准函数的实验结果的是同步的适应度更新方式，故3)中PCLSFA Table 1 The experiment results for four test functions 的时间复杂度为O(gen,·(Pic·（Pr+knm)+ 函数算法最小值最大值平均值标准差 Cms·N·knm),4)中KHM的时间复杂度为O FA3.763×1046.981×10-33.084×1031.962×10 (gen2·knm),并且Pe<khnm,gen,<gen1·Pc,因此 CLSPS07.994×1052.6605 1.2916 0.9344 本文算法的时间复杂度为O(Itermax·gen,·（Pc+ CLSFA1.139x10i00.0522 0.0201 0.0260 Cmax·N)·knm)。 PCLSFA1.052×10-01.496×10-01.259×10~01.212×101 3 实验数据与分析 FA 26.575029.2100 28.3060 0.8046 CLSPS07.919×10-4 4.2221 0.2651 0.7178 3.1 PCLSFA的性能测试 CLSEA 0.0302 32.1542 4.0760 9.6093 选取了4个标准的无约束测试函数f~f): PCLSFA2.208×10-3 0.2135 0.1308 0.0669 Ackley(x:∈[-30,30])、Rosenbrock(x∈ [-2.048,2.048])、Rastrigin(x:∈[-5.12,5.12])、 FA 20.8950 47.8200 30.9116 7.1678 CLSPS059.6970112.431088.5517 12.5322 Griewank(x:∈[-600,600])进行仿真测试，它们的 f CLSFA 10.8617 38.6014 21.0392 5.8030 最优解都是O。通过FA、采用串行CLS分别改进 PCLSFA 6.574 8 22.109113.21294.3872 PS0和FA算法的CLSPSOUS)和CLSFA进行对比分析，以验证PCLSFA的收敛性能及寻优能力。各算 FA 3.089×1053.441×10+1.030×107.068×10-3 法种群规模都为Nm=40,最大迭代数T=2000,3 CLSPS07.116×1040.04899.674×10-30.0117 种具有CLS机制的算法中取Cmm=10,C=5。考虑斤C5FA1.112x10-3.296×10-9.873x10-51.508×10 FA对不同函数的收敛性能不同，在CLSFA和 PCLSFA1.110×10165.541×10~63.331×1061.655×10-6 PCLSFA前期执行粗搜索的迭代数也不相同，对f 根据表1可见，PCLSFA对各函数求出的最优和f取T,=500,对6取T,=0,对取T,= 解的平均值及标准差均为最小，表明算法具有较高 200。CLSPS0中采用线性递减的惯性权重w),且的寻优精度与稳定性。虽然对f和f,CLSPS0能搜 wmm=0.9,0mi=0.4,学习因子为c1=c2=1.496。FA 索到更佳的最小值，但相应的概率较小，从其偏大的型算法中统一设置y=1,随机步长α随着迭代次数平均值和标准差可以看出。并且，CLSFA对于f和 t的增加不断减小为 f,能够获得的最小值与PCLSFA接近，但其很不稳 a+1=a((10-4/0.9)A(b/T)) 定使其平均值相对较差，有效验证了并行CLS相对式中：a的初始值为1，b是控制收敛精度的参数，对于串行CLS的优势。由图2可见PCLSFA对f和f 算法的收敛性能具有较大的影响，偏大会导致早熟的收敛性均取得了显著的提高，对于相对较难寻优收敛，偏小则会使算法无法更精确地搜索到全局最的f2和f也取得了一定的提高。因此，表1和图2 优解，经过实验对比分析本文取b=3。此外，为防中的实验结果有效验证了本文算法的收敛性。尽管止距离太大使算法失效，还需对B进行调整，即为 PCLSFA对复杂函数的寻优精度方面还有待改进

３）执行ＰＣＬＳＦＡ进行搜索，迭代运行ｇｅｎ１次，求出当前的最优个体Ｇｂｅｓｔ以及对应的最优目标函数值Ｆｇ，进入下一步操作。并且，选出占种群比例为ｎｃ％的最差个体并采用混沌重构法将其替换。４）以Ｇｂｅｓｔ为聚类中心执行ＫＨＭ操作，迭代运行ｇｅｎ２次，得到目标函数值ＫＨＭ（Ｘ，Ｃ）和聚类中心并将其转化为一维向量ｘＫＨＭ，若ＫＨＭ（Ｘ，Ｃ）＜Ｆｇ，则用ｘＫＨＭ代替Ｇｂｅｓｔ，并以ｘＫＨＭ随机替换一个萤火虫。５）ｇｅｎ＝ｇｅｎ＋１，若ｇｅｎ＜Ｉｔｅｒｍａｘ，则转到３）继续执行，否则停止迭代得出聚类结果。若数据集中有ｎ个数据，则ＫＨＭ每次迭代的时间复杂度为Ｏ（ｋｎｍ），本文聚类算法ＦＡ部分采用的是同步的适应度更新方式［１５］，故３）中ＰＣＬＳＦＡ的时间复杂度为Ｏ（ｇｅｎ１ ∙（Ｐｓｉｚｅ ∙（Ｐｓｉｚｅ＋ｋｎｍ）＋Ｃｍａｘ∙Ｎ∙ｋｎｍ）），４）中ＫＨＭ的时间复杂度为Ｏ（ｇｅｎ２∙ｋｎｍ），并且Ｐｓｉｚｅ＜ｋｎｍ，ｇｅｎ２＜ｇｅｎ１∙Ｐｓｉｚｅ，因此本文算法的时间复杂度为Ｏ（Ｉｔｅｒｍａｘ∙ｇｅｎ１∙（Ｐｓｉｚｅ＋Ｃｍａｘ∙Ｎ）∙ｋｎｍ）。３实验数据与分析３．１ＰＣＬＳＦＡ的性能测试选取了４个标准的无约束测试函数ｆ１～ｆ４［１７⁃１８］：Ａｃｋｌｅｙ（ｘｉ ∈ ［－３０，３０］）、Ｒｏｓｅｎｂｒｏｃｋ（ｘｉ ∈ ［－２．０４８，２．０４８］）、Ｒａｓｔｒｉｇｉｎ（ｘｉ ∈ ［－５．１２，５．１２］）、Ｇｒｉｅｗａｎｋ（ｘｉ∈ ［－６００，６００］）进行仿真测试，它们的最优解都是０。通过ＦＡ、采用串行ＣＬＳ分别改进ＰＳＯ和ＦＡ算法的ＣＬＳＰＳＯ［９］和ＣＬＳＦＡ进行对比分析，以验证ＰＣＬＳＦＡ的收敛性能及寻优能力。各算法种群规模都为Ｎｐｏｐ＝４０，最大迭代数Ｔｍａｘ＝２０００，３种具有ＣＬＳ机制的算法中取Ｃｍａｘ＝１０，Ｃ＝５。考虑ＦＡ对不同函数的收敛性能不同，在ＣＬＳＦＡ和ＰＣＬＳＦＡ前期执行粗搜索的迭代数也不相同，对ｆ１和ｆ４取Ｔｍａｘ１＝５００，对ｆ２取Ｔｍａｘ１＝０，对ｆ３取Ｔｍａｘ１＝２００。ＣＬＳＰＳＯ中采用线性递减的惯性权重ｗ［９］，且ｗｍａｘ＝０．９，ｗｍｉｎ＝０．４，学习因子为ｃ１＝ｃ２＝１．４９６。ＦＡ型算法中统一设置 γ ＝１，随机步长 α 随着迭代次数ｔ的增加不断减小为 α ｔ＋１＝ α ｔ（（１０－４／０．９） ∧ （ｂ／Ｔｍａｘ））式中：α 的初始值为１，ｂ是控制收敛精度的参数，对算法的收敛性能具有较大的影响，偏大会导致早熟收敛，偏小则会使算法无法更精确地搜索到全局最优解，经过实验对比分析本文取ｂ＝３。此外，为防止距离太大使算法失效，还需对 β 进行调整，即为 β ＝（β ｍａｘ－ β ｍｉｎ）ｅ－γｒ２ｉｊ＋ β ｍｉｎ，其中 β ｍａｘ＝１， β ｍｉｎ＝０．２。对搜索空间较小的函数ｆ１～ｆ３取ｌＰＣＬＳ＝０．１ｌ，对搜索空间较大的函数ｆ４取ｌＰＣＬＳ＝０．０１ｌ。此外，ＰＣＬＳＦＡ中的Ｎ＝１５，Ｎｐ＝５０，ｎｃ＝２０， ϕ ＝０．４。仿真实验基于ＭＡＴＬＡＢ２０１０ｂ平台，计算机的硬件配置为：ＩｎｔｅｌＣｏｒｅｉ５⁃４２００ＭＣＰＵ２．５ＧＨｚ、４ＧＢＲＡＭ。各函数的维数均为３０，每种算法独立运行３０次，计算各自的最大值、最小值、平均值和标准差，记录至表１。对各函数的收敛曲线为３０次运行的平均结果，分别如图２所示，为了更明显的比较，图中纵坐标是对最优解求ｌｇ（ｆ）后的平均值。表１４个基准函数的实验结果Ｔａｂｌｅ１Ｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｆｏｒｆｏｕｒｔｅｓｔｆｕｎｃｔｉｏｎｓ函数算法最小值最大值平均值标准差ｆ１ＦＡＣＬＳＰＳＯＣＬＳＦＡＰＣＬＳＦＡ３．７６３×１０－４７．９９４×１０－１５１．１３９×１０－１０１．０５２×１０－１０６．９８１×１０－３２．６６０５０．０５２２１．４９６×１０－１０３．０８４×１０－３１．２９１６０．０２０１１．２５９×１０－１０１．９６２×１０－３０．９３４４０．０２６０１．２１２×１０－１１ｆ２ＦＡＣＬＳＰＳＯＣＬＳＦＡＰＣＬＳＦＡ２６．５７５０７．９１９×１０－４０．０３０２２．２０８×１０－３２９．２１００４．２２２１３２．１５４２０．２１３５２８．３０６００．２６５１４．０７６００．１３０８０．８０４６０．７１７８９．６０９３０．０６６９ｆ３ＦＡＣＬＳＰＳＯＣＬＳＦＡＰＣＬＳＦＡ２０．８９５０５９．６９７０１０．８６１７６．５７４８４７．８２００１１２．４３１０３８．６０１４２２．１０９１３０．９１１６８８．５５１７２１．０３９２１３．２１２９７．１６７８１２．５３２２５．８０３０４．３８７２ｆ４ＦＡＣＬＳＰＳＯＣＬＳＦＡＰＣＬＳＦＡ３．０８９×１０－５７．１１６×１０－１４１．１１２×１０－１６１．１１０×１０－１６３．４４１×１０－４０．０４８９３．２９６×１０－４５．５４１×１０－１６１．０３０×１０－４９．６７４×１０－３９．８７３×１０－５３．３３１×１０－１６７．０６８×１０－５０．０１１７１．５０８×１０－４１．６５５×１０－１６根据表１可见，ＰＣＬＳＦＡ对各函数求出的最优解的平均值及标准差均为最小，表明算法具有较高的寻优精度与稳定性。虽然对ｆ１和ｆ２，ＣＬＳＰＳＯ能搜索到更佳的最小值，但相应的概率较小，从其偏大的平均值和标准差可以看出。并且，ＣＬＳＦＡ对于ｆ１和ｆ４能够获得的最小值与ＰＣＬＳＦＡ接近，但其很不稳定使其平均值相对较差，有效验证了并行ＣＬＳ相对于串行ＣＬＳ的优势。由图２可见ＰＣＬＳＦＡ对ｆ１和ｆ４的收敛性均取得了显著的提高，对于相对较难寻优的ｆ２和ｆ３也取得了一定的提高。因此，表１和图２中的实验结果有效验证了本文算法的收敛性。尽管ＰＣＬＳＦＡ对复杂函数的寻优精度方面还有待改进， ·８７６· 智能系统学报第１０卷

点击进入文档下载页（PDF格式）

共9页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录