当前位置：和泉文库 > 电气与自动化 > 浏览文档

【智能系统】WSB-EA进化算法的符号网络弱结构平衡分析

文件格式：PDF，文件大小：918.05KB，售价：3.12元

文档详细内容（约8页）

第13卷第5期智能系统学报 Vol.13 No.5 2018年10月 CAAI Transactions on Intelligent Systems Oct.2018 D0:10.11992/tis.201706054 网络出版地址：http:/kns.cnki.net/kcms/detail/23.1538.tp.20180423.1019.006.html WSB-EA进化算法的符号网络弱结构平衡分析常新功，赵雅娟 (山西财经大学信息管理学院，山西太原030006) 摘要：由于大多数真实符号网络更满足弱结构平衡理论，并且求解符号网络的弱结构平衡问题是P难问题，因此提出了基于进化算法的符号网络弱结构平衡计算方法一一WSB-EA算法。该方法将弱结构平衡定理的能量函数作为适应值函数，首先利用启发式的方法初始化种群，经过锦标赛选择、单路交叉、单点变异、局部搜索4个阶段，迭代有限次之后得到最优解。在此算法中，提出了大型符号网络的存储方法和增量计算方式。通过大量实验，NSB-EA算法得出了4个小型符号网络和2个大型符号网络的弱不平衡度。并且与其他算法相比，WSB-EA算法能更快收敛得到最优解，具有较高鲁棒性。关键词：符号网络；进化算法；NP难问题；结构平衡理论；弱结构平衡理论；单路交叉；局部搜索；弱不平衡度中图分类号：TP301.6文献标志码：A 文章编号：1673-4785(2018)05-0783-08 中文引用格式：常新功，赵雅娟.WSB-EA进化算法的符号网络弱结构平衡分析J.智能系统学报，2018,13(5)：783-790. 英文引用格式：CHANG Xingong,ZHAO Yajuan.Weak structure balance analysis of signed network based on WSB-EA evolution- ary algorithmJ.CAAI transactions on intelligent systems,2018,13(5):783-790. Weak structure balance analysis of signed network based on WSB-EA evolutionary algorithm CHANG Xingong,ZHAO Yajuan (Faculty of Information Management,Shanxi University of Finance and Economics,Taiyuan 030006,China) Abstract:The weak structural balance (WSB)theory is suitable to solve the weak structure balance problem of most signed networks,and it is an NP-hard problem.Here a WSB evolutionary algorithm(WSB-EA)is proposed,which com- putes the global unbalanced degree of signed network based on evolutionary algorithm.In this method,the energy func- tion of WSB theory is used as the fitness function.First,a heuristic method is used to initialize the population.After the tournament selection,single crossing,single point variation,and local search,the optimal solution is obtained after a fi- nite number of iterations.The algorithm involves a storage of large signed network and incremental calculation. Through several experiments,the weak unbalanced degree of four small signed networks and two large signed networks are derived from WSB-EA algorithm.Compared with other algorithms,the WSB-EA algorithm can converge to the op- timal solution faster and has a higher robustness. Keywords:signed network;evolutionary algorithm;NP-hard problem;structural balance theory;weak structural bal- ance theory;single cross;local search;weak unbalanced degree 符号网络是指具有正边或负边的网络，其络抽象为符号网络。例如，国际关系网中合作中正边表示积极的、正面的意义，负边表示消极和敌对的关系、社交网络中朋友和敌人关系、生的、负面的意义。在现实生活中，可以将很多网物网络中促进和抑制作用等。1946年Heider 收稿日期：2017-06-14.网络出版日期：2018-04-24. 提出三角形关系中正关系与负关系的相互作用模基金项目：山西省哲学社会科学“十二五“规划2015年度课题项目；山西省自然科学基金项目(2013011016-4). 式，将符号网络带人大家的视线。随着符号网络通信作者：赵雅娟.E-mail:707238065@qq.com. 的兴起，网络的全局平衡性引起众多学者的关

DOI: 10.11992/tis.201706054 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20180423.1019.006.html WSB-EA 进化算法的符号网络弱结构平衡分析常新功，赵雅娟（山西财经大学信息管理学院，山西太原 030006）摘要：由于大多数真实符号网络更满足弱结构平衡理论，并且求解符号网络的弱结构平衡问题是 NP 难问题，因此提出了基于进化算法的符号网络弱结构平衡计算方法——WSB-EA 算法。该方法将弱结构平衡定理的能量函数作为适应值函数，首先利用启发式的方法初始化种群，经过锦标赛选择、单路交叉、单点变异、局部搜索 4 个阶段，迭代有限次之后得到最优解。在此算法中，提出了大型符号网络的存储方法和增量计算方式。通过大量实验，WSB-EA 算法得出了 4 个小型符号网络和 2 个大型符号网络的弱不平衡度。并且与其他算法相比，WSB-EA 算法能更快收敛得到最优解，具有较高鲁棒性。关键词：符号网络；进化算法；NP 难问题；结构平衡理论；弱结构平衡理论；单路交叉；局部搜索；弱不平衡度中图分类号：TP301.6 文献标志码：A 文章编号：1673−4785(2018)05−0783−08 中文引用格式：常新功, 赵雅娟. WSB-EA 进化算法的符号网络弱结构平衡分析[J]. 智能系统学报, 2018, 13(5): 783–790. 英文引用格式：CHANG Xingong, ZHAO Yajuan. Weak structure balance analysis of signed network based on WSB-EA evolutionary algorithm[J]. CAAI transactions on intelligent systems, 2018, 13(5): 783–790. Weak structure balance analysis of signed network based on WSB-EA evolutionary algorithm CHANG Xingong，ZHAO Yajuan (Faculty of Information Management, Shanxi University of Finance and Economics, Taiyuan 030006, China) Abstract: The weak structural balance (WSB) theory is suitable to solve the weak structure balance problem of most signed networks, and it is an NP-hard problem. Here a WSB evolutionary algorithm (WSB-EA) is proposed, which computes the global unbalanced degree of signed network based on evolutionary algorithm. In this method, the energy function of WSB theory is used as the fitness function. First, a heuristic method is used to initialize the population. After the tournament selection, single crossing, single point variation, and local search, the optimal solution is obtained after a finite number of iterations. The algorithm involves a storage of large signed network and incremental calculation. Through several experiments, the weak unbalanced degree of four small signed networks and two large signed networks are derived from WSB-EA algorithm. Compared with other algorithms, the WSB-EA algorithm can converge to the optimal solution faster and has a higher robustness. Keywords: signed network; evolutionary algorithm; NP-hard problem; structural balance theory; weak structural balance theory; single cross; local search; weak unbalanced degree 符号网络[1-2]是指具有正边或负边的网络，其中正边表示积极的、正面的意义，负边表示消极的、负面的意义。在现实生活中，可以将很多网络抽象为符号网络。例如，国际关系网[3]中合作和敌对的关系、社交网络[4]中朋友和敌人关系、生物网络[5]中促进和抑制作用等。1946 年 Heider[6] 提出三角形关系中正关系与负关系的相互作用模式，将符号网络带入大家的视线。随着符号网络的兴起，网络的全局平衡性引起众多学者的关收稿日期：2017−06−14. 网络出版日期：2018−04−24. 基金项目：山西省哲学社会科学“十二五”规划 2015 年度课题项目；山西省自然科学基金项目 (2013011016-4). 通信作者：赵雅娟. E-mail：707238065@qq.com. 第 13 卷第 5 期智能系统学报 Vol.13 No.5 2018 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2018

·784· 智能系统学报第13卷注。根据计算得到的全局平衡性可以有效地进行为是平衡结构。因此产生了一个新的概念，K平个性化推荐、态度预测等。一般全局平衡性用不衡网络。这一理论认为，一个符号网络是弱平衡平衡度来衡量，不平衡度是指一个网络从不平衡的，当且仅当可以将这一网络中的节点分为k个到平衡的距离，若将这些引起不平衡的边的符号子集，子集内部都是正边，子集之间都是负边。取反，网络就变为平衡网络。然而对于大多数符结构平衡定理是弱结构平衡定理中k为2的特殊号网络而言，结构平衡定理太过严苛。Leskovec等☑ 情况。K平衡网络的结构如图2所示，图中集合也证实了弱结构平衡定理更适合真实网络。因此内部连边都是正边，集合之间连边都是负边。本文从弱结构平衡定理出发，来研究网络的弱不平衡性。孙一翔提出Meme-SB算法，将结构平衡定理的能量函数作为适应值函数，利用混合遗传算法求得真实符号网络的不平衡度。在Meme- SB算法基础上，本文提出了WSB-EA算法，将研 (a)三边为正b)一边为正(c)两边为正(d三边为负究范围扩展到符号网络的弱不平衡性。即将弱结图1符号网络中4种三角形结构川构平衡定理的能量函数当作适应值函数，利用进 Fig.1 Four triangle signed network structures 化算法原理，初始化种群，选择、交叉、变异，最终得到网络的弱不平衡度。4个小型数据集的实验集合表明，WSB-EA算法比其他算法能够更快收敛得到最优解。在实验最后部分计算得到两大符号网络Epinions和Slashdot的弱不平衡度。集合集合背景知识 -1 从20世纪40年代，Heider提出三角形关系中正关系与负关系的相互作用模式，到Cartwright 集合集合等用图论语言描述这一理论将其推广到整个网 -1 络。越来越多的研究者对符号网络的结构和演化图2弱结构平衡网络问题感兴趣，致力于研究社会群体的派系结构和 Fig.2 Weak balance network structure 发展过程。然而，有很大一部分真实网络并不符 1.2 弱结构平衡定理能量函数合Heider提出的结构平衡理论，由此Davis放宽根据弱结构平衡定理，计算符号网络的弱不结构平衡理论的约束条件，提出弱结构平衡理论。平衡度就是寻找一种集合划分，使得集合内部之 1.1弱结构平衡定理间的负边数和集合外部之间的正边数最少。例符号网络用数学符号G(V,E)表示，V表示网如，节点1和节点2之间的连边为正，如果将这两络节点集合，E表示网络边的集合。其中任意一个节点分到同一个集合，这两个节点就没有对弱条边J∈E,其符号为“+”或“-”。“+”代表节点不平衡度做出“贡献”，如果把它们分到不同的集 i与节点j之间的边是积极关系，“-”则代表消极合，就需要计算这两个节点对弱不平衡度做的“贡关系。Heider指出如果网络中任意一个三角形的献”。同理，两个节点之间的边是负边时，将其分符号乘积为正，则网络是平衡的。如图1所示，到同一集合，也要计算这一部分的“贡献”。因此 (a)和(b)是平衡三角，(c)和(d)是不平衡三角。计算弱不平衡度就是遍历整个符号网络，找到所在此基础上Cartwright和Harary等提出判断符号有对弱不平衡度做出“贡献”的节点对。由此提出网络是否平衡的一个充要条件一一“如果一个网弱结构平衡定理的能量函数：络中的节点能够被分割为两个子集，每个子集内 h(s)=∑（1-n6(s,s》/2 (1) 的所有边均是正边，子集间的边均为负边，这样的网络就是平衡的。” 在弱结构平衡定理中，一个无向符号网络被然而对于大多数符号网络而言，结构平衡定分为k个子集。因此，网络中每个节点都有一个理的要求太过严苛。之后Davis放宽结构平衡理所属的子集编号，在式中用5，来表示这一编号。论的约束条件，提出了弱结构平衡理论。这一理 (s,S)的计算结果由S,和s决定，如果s,和s的论将图1()三条边都是负号这样的三角结构也认值相同则计算结果为+1，否则为-1

注。根据计算得到的全局平衡性可以有效地进行个性化推荐、态度预测等。一般全局平衡性用不平衡度来衡量，不平衡度是指一个网络从不平衡到平衡的距离，若将这些引起不平衡的边的符号取反，网络就变为平衡网络。然而对于大多数符号网络而言，结构平衡定理太过严苛。Leskovec 等 [7] 也证实了弱结构平衡定理更适合真实网络。因此本文从弱结构平衡定理出发，来研究网络的弱不平衡性。孙一翔[8]提出 Meme-SB 算法，将结构平衡定理的能量函数作为适应值函数，利用混合遗传算法求得真实符号网络的不平衡度。在 MemeSB 算法基础上，本文提出了 WSB-EA 算法，将研究范围扩展到符号网络的弱不平衡性。即将弱结构平衡定理的能量函数当作适应值函数，利用进化算法原理，初始化种群，选择、交叉、变异，最终得到网络的弱不平衡度。4 个小型数据集的实验表明，WSB-EA 算法比其他算法能够更快收敛得到最优解。在实验最后部分计算得到两大符号网络 Epinions 和 Slashdot 的弱不平衡度。 1 背景知识从 20 世纪 40 年代，Heider 提出三角形关系中正关系与负关系的相互作用模式，到 Cartwright 等 [9]用图论语言描述这一理论将其推广到整个网络。越来越多的研究者对符号网络的结构和演化问题感兴趣，致力于研究社会群体的派系结构和发展过程。然而，有很大一部分真实网络并不符合 Heider 提出的结构平衡理论，由此 Davis[10]放宽结构平衡理论的约束条件，提出弱结构平衡理论。 1.1 弱结构平衡定理 Ji j ∈ E 符号网络用数学符号 G(V, E) 表示，V 表示网络节点集合，E 表示网络边的集合。其中任意一条边，其符号为“+”或“–”。“+”代表节点 i 与节点 j 之间的边是积极关系，“–”则代表消极关系。Heider 指出如果网络中任意一个三角形的符号乘积为正，则网络是平衡的。如图 1 所示， (a) 和 (b) 是平衡三角，(c) 和 (d) 是不平衡三角。在此基础上 Cartwright 和 Harary 等提出判断符号网络是否平衡的一个充要条件——“如果一个网络中的节点能够被分割为两个子集，每个子集内的所有边均是正边，子集间的边均为负边，这样的网络就是平衡的。” 然而对于大多数符号网络而言，结构平衡定理的要求太过严苛。之后 Davis 放宽结构平衡理论的约束条件，提出了弱结构平衡理论。这一理论将图 1(d) 三条边都是负号这样的三角结构也认为是平衡结构。因此产生了一个新的概念，K-平衡网络。这一理论认为，一个符号网络是弱平衡的，当且仅当可以将这一网络中的节点分为 k 个子集，子集内部都是正边，子集之间都是负边。结构平衡定理是弱结构平衡定理中 k 为 2 的特殊情况。K-平衡网络的结构如图 2 所示，图中集合内部连边都是正边，集合之间连边都是负边。 B A C + + + (a) 三边为正 B A C + − − (b) 一边为正 B A C − + + (c) 两边为正 B A C − − − (d) 三边为负图 1 符号网络中 4 种三角形结构[1] Fig. 1 Four triangle signed network structures[1] 集合 1 集合 3 集合 4 集合 5 集合 2 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 图 2 弱结构平衡网络 Fig. 2 Weak balance network structure 1.2 弱结构平衡定理能量函数根据弱结构平衡定理，计算符号网络的弱不平衡度就是寻找一种集合划分，使得集合内部之间的负边数和集合外部之间的正边数最少。例如，节点 1 和节点 2 之间的连边为正，如果将这两个节点分到同一个集合，这两个节点就没有对弱不平衡度做出“贡献”，如果把它们分到不同的集合，就需要计算这两个节点对弱不平衡度做的“贡献”。同理，两个节点之间的边是负边时，将其分到同一集合，也要计算这一部分的“贡献”。因此计算弱不平衡度就是遍历整个符号网络，找到所有对弱不平衡度做出“贡献”的节点对。由此提出弱结构平衡定理的能量函数： h(s) = ∑ i j ( 1− Ji jδ ( si ,sj ))/2 (1) 在弱结构平衡定理中，一个无向符号网络被分为 k 个子集。因此，网络中每个节点都有一个所属的子集编号，在式中用 si 来表示这一编号。 δ(si , sj ) 的计算结果由 si 和 sj 决定，如果 si 和 sj 的值相同则计算结果为+1，否则为–1。 ·784· 智能系统学报第 13 卷

第5期常新功，等：WSB-EA进化算法的符号网络弱结构平衡分析 ·785· 由此，求解符号网络的弱结构平衡问题就转每条染色体，但这样的初始化方式效率不高。如变为最小化能量函数的优化问题。能量函数的最果初始化的染色体对应的适应值很低，要经过很小值代表了导致符号网络弱不平衡的最少边的数多次迭代才能得到最优解，收敛速度太慢。因此目。若将这些边的符号取反，可以将此网络转变本文使用一种简单的启发式方法，保证在初始化为弱结构平衡网络。如果能量函数值为0，说明时每一个节点与它的邻居节点对能量函数没有此网络已是弱结构平衡网络。 “贡献”。即在初始化之后，随机选择一个节点 1.3进化算法如果此节点与它的邻居节点对能量函数没有“贡进化算法-2或称演化算法(evolutionary al-. 献”，则不改变这一节点的取值，否则将其改为它 gorithms,.EAS),是一个算法簇，它们产生的灵感的正邻居节点所属的子集编号。这样的操作重都来自于大自然的生物进化，但它有很多的变化，复n次，并且保证每次选择的节点是之前没有选有不同的遗传基因表达方式，不同的交叉和变异择过的。算子，特殊算子的引用，以及不同的再生和选择 2.4遗传操作方法。与传统的基于微积分的方法和穷举法等优本文的遗传操作过程如算法2所示。遗传过化算法相比，进化计算是一种成熟的具有高鲁棒程分为3步：首先将上一代种群中的优秀个体保性和广泛适用性的全局优化方法，具有自组织、存到新一代种群中，这个过程称为精英保留：接自适应、自学习的特性，能够不受问题性质的限制，下来利用锦标赛方式选取父代染色体，经过单路有效地处理传统优化算法难以解决的复杂问题。交叉：单点变异得到新一代种群。 2WSB-EA算法描述算法2 evolvePopulation(individual)算法输入原始种群Pop,最优个体individual,.锦 2.1WSB-EA算法主要流程标赛规模tournamentSize,交叉概率uniformRate, 根据问题定义以及进化算法原理，本文将弱变异概率mutationRate; 结构平衡定理的能量函数作为目标函数，在Meme 输出新一代种群newPopo SB算法的基础上，初始化种群，经过选择、交叉 1)newPop.saveIndividua(0,individual):// 变异得到最优解。具体框架如算法1所示。保留算法1WSB-EA算法 2)for(0;j<Pop.size();j+) 输入邻接矩阵J,种群规模P,迭代次数M 3)indivl=tournamentSelection(Pop,/选择父输出最优解的适应值，即网络弱不平衡度。本1 1)putO,存储邻接矩阵 4)indiv2 tournamentSelection(Pop); 2)Pop-Population(P,true,/初始化种群 S)newlndiv=crossover(indivI,indiv2,∥交叉算法 3)=0; 6)newPop.saveIndividua(j,newIndiv); 4)repeat 7)for(j=0;j<Pop.size();j++) S)individual=Pop.getFittest(),/计算得到 8)mutate(newPop.getIndividual(),/变异算法种群最优个体 2.4.1选择操作 6)Pop+-evolvePopulation(Pop,individual):// 在进化算法中轮盘赌是最常用也是最简单的群进化，选择、交叉、变异操作选择算子。但对于本文而言，轮盘赌不利于保持 7)a=a+1: 种群多样性。为了解决这一问题，本文选用锦标 8)until a=M达到最大进化次数时停止赛方法选取优秀个体进行繁衍。首先确定锦标赛 2.2编码规模1，随机从种群中选择出1个个体，计算这些本文使用的编码方式是整数编码。种群中个体的适应值，将适应值最小的个体作为父代进的染色体由X={x,2x,…,x,…,x}表示，其中行繁衍。 n为符号网络的节点个数，x表示第i个节点所属 2.4.2交叉操作的子集编号。假设符号网络中有k个子集，则x的般在进化算法中经常使用的两点交叉算子取值范围是0~k-1。例如第j个染色体可以表示很有可能会破坏父代染色体中优秀的基因结构，成X=1,2,0,…,k-1,…,1,010 因此为了保存父代染色体中的优秀基因结构，本 2.3初始化文选择单路交叉方式作为交叉算子。首先通过一般进化算法中的初始化方法都是随机产生锦标赛选择算法选择两个优秀父代A、B。随机产

由此，求解符号网络的弱结构平衡问题就转变为最小化能量函数的优化问题。能量函数的最小值代表了导致符号网络弱不平衡的最少边的数目。若将这些边的符号取反，可以将此网络转变为弱结构平衡网络。如果能量函数值为 0，说明此网络已是弱结构平衡网络。 1.3 进化算法进化算法[11-12]或称演化算法 (evolutionary algorithms, EAS)，是一个算法簇，它们产生的灵感都来自于大自然的生物进化，但它有很多的变化，有不同的遗传基因表达方式，不同的交叉和变异算子，特殊算子的引用，以及不同的再生和选择方法。与传统的基于微积分的方法和穷举法等优化算法相比，进化计算是一种成熟的具有高鲁棒性和广泛适用性的全局优化方法，具有自组织、自适应、自学习的特性，能够不受问题性质的限制，有效地处理传统优化算法难以解决的复杂问题。 2 WSB-EA 算法描述 2.1 WSB-EA 算法主要流程根据问题定义以及进化算法原理，本文将弱结构平衡定理的能量函数作为目标函数，在 MemeSB 算法的基础上，初始化种群，经过选择、交叉、变异得到最优解。具体框架如算法 1 所示。算法 1 WSB-EA 算法输入邻接矩阵 J，种群规模 P，迭代次数 M；输出最优解的适应值，即网络弱不平衡度。 1) putJ (); //存储邻接矩阵 2) Pop←Population(P, true); //初始化种群 3) a=0; 4) repeat 5) individual = Pop.getFittest();//计算得到种群最优个体 6) Pop←evolvePopulation(Pop, individual); //种群进化，选择、交叉、变异操作 7) a=a+1; 8) until a=M //达到最大进化次数时停止 2.2 编码 Xj = {x1, x2, x3,··· , xi ,··· , xn} xi xi Xj = {1,2,0,··· , k−1,··· ,1,0} 本文使用的编码方式是整数编码[13]。种群中的染色体由表示，其中 n 为符号网络的节点个数，表示第 i 个节点所属的子集编号。假设符号网络中有 k 个子集，则的取值范围是 0 ~ k–1。例如第 j 个染色体可以表示成。 2.3 初始化一般进化算法中的初始化方法都是随机产生每条染色体，但这样的初始化方式效率不高。如果初始化的染色体对应的适应值很低，要经过很多次迭代才能得到最优解，收敛速度太慢。因此本文使用一种简单的启发式方法，保证在初始化时每一个节点与它的邻居节点对能量函数没有 “贡献”。即在初始化之后，随机选择一个节点，如果此节点与它的邻居节点对能量函数没有“贡献”，则不改变这一节点的取值，否则将其改为它的正邻居节点所属的子集编号。这样的操作重复 n 次，并且保证每次选择的节点是之前没有选择过的。 2.4 遗传操作本文的遗传操作过程如算法 2 所示。遗传过程分为 3 步：首先将上一代种群中的优秀个体保存到新一代种群中，这个过程称为精英保留；接下来利用锦标赛方式选取父代染色体，经过单路交叉；单点变异得到新一代种群。算法 2 evolvePopulation (individual) 算法输入原始种群 Pop，最优个体 individual，锦标赛规模 tournamentSize，交叉概率 uniformRate，变异概率 mutationRate；输出新一代种群 newPop。 1) newPop.saveIndividua(0, individual); //精英保留 2) for( j=0; j< Pop.size(); j++) 3) indiv1 =tournamentSelection(Pop); //选择父本 1 4) indiv2 = tournamentSelection(Pop); 5) newIndiv=crossover(indiv1, indiv2); //交叉算法 6) newPop.saveIndividua ( j, newIndiv); 7) for( j=0; j< Pop.size(); j++) 8) mutate(newPop.getIndividual( j)); //变异算法 2.4.1 选择操作在进化算法中轮盘赌是最常用也是最简单的选择算子。但对于本文而言，轮盘赌不利于保持种群多样性。为了解决这一问题，本文选用锦标赛方法选取优秀个体进行繁衍。首先确定锦标赛规模 t，随机从种群中选择出 t 个个体，计算这些个体的适应值，将适应值最小的个体作为父代进行繁衍。 2.4.2 交叉操作一般在进化算法中经常使用的两点交叉算子很有可能会破坏父代染色体中优秀的基因结构，因此为了保存父代染色体中的优秀基因结构，本文选择单路交叉方式[14]作为交叉算子。首先通过锦标赛选择算法选择两个优秀父代 A、B。随机产第 5 期常新功，等：WSB-EA 进化算法的符号网络弱结构平衡分析 ·785·

·786· 智能系统学报第13卷生一个0~k-1的整数m,记录A中所有m所在的之后都需重新计算一次适应值，这样重复操作使位置，然后将B对应位置的基因值改为m。例如，得算法的时间复杂度太高。基于此，本文在定理图3中，每一条染色体有15个基因，选择两条父 1的基础上提出一种增量计算的方式，在重新计代染色体，随机产生一个数2，将B中对应位置的算适应值时，只计算个体中因基因改变使得适应取值都改为2。值增减的部分。 1 定理1假设个体ind在位置h处变异，sh由 2 3 old变为new,则个体ind的新适应值h(ind)w为 13103 31-2 3 0 hew=hau+∑Jh(6aew,s）-dold,s》 VJEN(n) 3 0 其中N(wa)={(v,a)∈E是节点的邻居节点集合。 2 证明 h= 》J6(,s）= 1 1 2 0 2 2 ∑h8(功+∑ J6(s,5)= (2) .VJE 1 1 ViVEENi=h 3 33 3 3 ∑Jh6(,s)+ ∑6,s) !=h 2 2 2 2 由于式(2)等号右侧第2部分在变异前后不 B B 变，所以图3单路交叉 hpew -hold Fig.3 Single cross Jn6(new,sj)- Jh6(old,s）= 2.4.3变异操作 (3) 本文的变异算子是单点变异。从父代种群中 (6(new,sj)-6(old,sj)) VEN(V) 随机选择一条染色体，然后从这一染色体中随机选取一个基因，对其重新赋值，但要保证变异之上述推导表明，当个体ind在h位置变异后，后染色体的能量函数值没有增加。这样的操作要新的适应值通过旧适应值加一个增量就可以得循环n次，因此变异也可以看作一种局部搜索，将到，而这个增量只需要遍历y的邻居节点就可以染色体变异为它的邻居染色体，试图找到局部最算出，这样计算一个个体的适应值的时间复杂度优的染色体。从Om)降为O(d,其中dg为平均度数。 2.5符号网络存储基于定理1，计算新的适应值就可以简便为符号网络在计算机中一般有3种存储方式：计算改变子集编号的节点与其邻居节点对适应值邻接矩阵、三元组和链表方式。邻接矩阵是普遍的“贡献”。具体分为两种情况：1)原本对适应值使用的一种方式。然而对于大型符号网络来说，没有“贡献”的边，在改变基因之后对适应值有“贡邻接矩阵达到103×10的数量级，存储这样的邻接献”；2)原本对适应值有“贡献”的边，在改变之后矩阵对内存要求太高。因此本文选择邻接链表对适应值没有“贡献”。增量计算大大地降低了时来存储网络信息。首先为每一个节点都创建一条间复杂度，在交叉算法中的增量计算只需循环若链表，头结点是节点本身，后面链接与这一节点干次，而在变异算法中只需运行一次。有联系的节点信息，包括节点编号以及边的符算法具体操作如算法3所示。算法第1行将号。例如，图4中，这一链表存储节点1的连边信 increaseFitness设置为0，第2行是将c赋值为被息。节点1与节点2的连边为1，节点1与节点6 改变基因所对应的节点的链表头结点，为了找到的连边为-1。虽然每条边都存储了两次，但相对这个节点的所有邻居，之后遍历整个链表。算法于邻接矩阵的存储方式，大大降低了内存占用。第4~8行是在判断邻居为正邻居之后，再次判断 123160 如果邻居的基因与旧基因相同，但与新基因不同图4二维链表示例时，increaseFitness加2；如果邻居的基因与旧基因 Fig.4 Two-dimension link structure 不同，但与新基因相同时，increaseFitness减2。算 2.6增量计算法第9~13行是在判断邻居为负邻居之后，再次在一般的遗传算法中，每一次的交叉和变异判断如果邻居的基因与旧基因相同，但与新基因

生一个 0 ~ k–1 的整数 m，记录 A 中所有 m 所在的位置，然后将 B 对应位置的基因值改为 m。例如，图 3 中，每一条染色体有 15 个基因，选择两条父代染色体，随机产生一个数 2，将 B 中对应位置的取值都改为 2。 1 2 1 3 1 0 3 2 1 0 2 1 3 1 2 0 A 0 1 3 1 1 2 0 2 1 2 0 1 3 3 1 2 B 1 2 1 3 1 0 3 2 1 0 2 1 3 1 2 0 A 0 2 3 1 1 2 0 2 1 2 2 1 3 3 2 2 B 图 3 单路交叉 Fig. 3 Single cross 2.4.3 变异操作本文的变异算子是单点变异。从父代种群中随机选择一条染色体，然后从这一染色体中随机选取一个基因，对其重新赋值，但要保证变异之后染色体的能量函数值没有增加。这样的操作要循环 n 次，因此变异也可以看作一种局部搜索，将染色体变异为它的邻居染色体，试图找到局部最优的染色体。 2.5 符号网络存储符号网络在计算机中一般有 3 种存储方式：邻接矩阵、三元组和链表方式。邻接矩阵是普遍使用的一种方式。然而对于大型符号网络来说，邻接矩阵达到 105 ×105 的数量级，存储这样的邻接矩阵对内存要求太高。因此本文选择邻接链表[15] 来存储网络信息。首先为每一个节点都创建一条链表，头结点是节点本身，后面链接与这一节点有联系的节点信息，包括节点编号以及边的符号。例如，图 4 中，这一链表存储节点 1 的连边信息。节点 1 与节点 2 的连边为 1，节点 1 与节点 6 的连边为–1。虽然每条边都存储了两次，但相对于邻接矩阵的存储方式，大大降低了内存占用。 first 1 2 1 3 1 6 −1 10 −1 ^ 图 4 二维链表示例 Fig. 4 Two-dimension link structure 2.6 增量计算在一般的遗传算法中，每一次的交叉和变异之后都需重新计算一次适应值，这样重复操作使得算法的时间复杂度太高。基于此，本文在定理 1 的基础上提出一种增量计算的方式，在重新计算适应值时，只计算个体中因基因改变使得适应值增减的部分。定理 1 假设个体 ind 在位置 h 处变异，sh 由 old 变为 new，则个体 ind 的新适应值 h(ind)new 为 hnew = hold + ∑ vj∈N(vh ) Jh j( δ ( new,sj ) −δ ( old,sj )) N (vh) = {vk |(vk 其中 , vh) ∈ E} 是节点 vh 的邻居节点集合。证明 h = ∑ vi,vj∈E Ji jδ ( si ,sj ) = ∑ vh,vj∈E Jh jδ ( sh,sj ) + ∑ vi,vj∈E∧i!=h Ji jδ ( si ,sj ) = ∑ vj∈N(vh) Jh jδ ( sh,sj ) + ∑ vi,vj∈E∧i!=h Ji jδ ( si ,sj ) (2) 由于式 (2) 等号右侧第 2 部分在变异前后不变，所以 hnew −hold = ∑ vj∈N(vh ) Jh jδ ( new,sj ) − ∑ vj∈E(vh ) Jh jδ ( old,sj ) = ∑ vj∈N(vh) Jh j( δ ( new,sj ) −δ ( old,sj )) (3) 上述推导表明，当个体 ind 在 h 位置变异后，新的适应值通过旧适应值加一个增量就可以得到，而这个增量只需要遍历 vh 的邻居节点就可以算出，这样计算一个个体的适应值的时间复杂度从 O(m) 降为 O(davg)，其中 davg 为平均度数。基于定理 1，计算新的适应值就可以简便为计算改变子集编号的节点与其邻居节点对适应值的“贡献”。具体分为两种情况：1) 原本对适应值没有“贡献”的边，在改变基因之后对适应值有“贡献”；2) 原本对适应值有“贡献”的边，在改变之后对适应值没有“贡献”。增量计算大大地降低了时间复杂度，在交叉算法中的增量计算只需循环若干次，而在变异算法中只需运行一次。算法具体操作如算法 3 所示。算法第 1 行将 increaseFitness 设置为 0，第 2 行是将 c 赋值为被改变基因所对应的节点的链表头结点，为了找到这个节点的所有邻居，之后遍历整个链表。算法第 4 ~ 8 行是在判断邻居为正邻居之后，再次判断如果邻居的基因与旧基因相同，但与新基因不同时，increaseFitness 加 2；如果邻居的基因与旧基因不同，但与新基因相同时，increaseFitness 减 2。算法第 9 ~ 13 行是在判断邻居为负邻居之后，再次判断如果邻居的基因与旧基因相同，但与新基因 ·786· 智能系统学报第 13 卷

第5期常新功，等：WSB-EA进化算法的符号网络弱结构平衡分析 ·787· 不同时，increaseFitness减2；如果邻居的基因与旧数及其取值。算法的运行环境是Intel(R)Core(TM) 基因不同，但与新基因相同时，increaseFitness i3-2330m,运行内存4GB,操作系统Windows7旗加2。舰版，使用的软件是eclipse44.5。算法3 ncreaseFitness0)算法表1参数设置输入需要计算适应值的个体individual,基 Table 1 Parameter setting 因改变位置id,旧基因old,新基因new; 参数含义取值输出增加的适应值increaseFitness。 G 迭代次数 50 1)increaseFitness=0; M 种群规模 100 2)c=Data.node[id].first; tournamentSize 锦标赛规模 5 3)遍历节点id的所有邻居节点； uniformRate 交叉概率 0.9 4)f(正邻居) 5)if(getGene(c.data)==old&&getGene(c.data)!= mutationRate 变异概率 0.1 new) 3.2小型符号网络实验结果 6)increaseFitness=increaseFitness+2: 本文使用的小型数据集有4个：斯洛文尼亚 7)else if getGene(c.data)!=old&&getGene(c.data) 政党网络(SPP)、Gahuku-Gama部落网络(GGS)、 new) 社交圈网络(SC)和yeast网络(yeast)。 8)increaseFitness=increaseFitness-2; 斯洛文尼亚政党网络：这是一个由斯洛文尼 9)else if(负邻居) 亚10个议会政党之间的关系组成的网络， 10)if(getGene(c.data)=old&&getGene(c.data) 1994年由一些研究政治的学者提出%。10个议 !=new) 会政党的英文名字缩写分别是SKD、ZLSD、SDSS、 11)increaseFitness=increaseFitness-2: LDS、ZS-ESS、ZS、DS、SLS、SPS-SNS和SNS。这 12)else if(getGene(c.data)!=old&&getGene 一网络中有10个节点，45条连边。 (c.data)=new) Gahuku-Gama部落网络1刃：这一网络中有 13)increaseFitness=increaseFitness+2; 16个节点，代表16个部落。边数为59，代表部落 2.7复杂性分析之间的联盟和对抗。在整个算法中，时间复杂度最高的是遗传操社交圈网络：这一网络是根据现实生活中人作这一部分，因此只分析这一部分的时间复杂与人之间的关系得到的实际网络，节点有28个，度。首先定义几个基础概念，节点个数n、边个边数为42，代表节点之间的朋友关系或敌人关系。数m、种群规模M、锦标赛规模1以及迭代次数 Yeast网络：这是一个酵母菌的基因调控网络图， G。选择父本的时间复杂度是O()。交叉算法所该网络包含690个节点和1080条边。由于这一花费的时间复杂度是O(n)。变异算子的时间复杂网络的节点个数较多，在实验中将种群规模增加度是O(1)。计算适应值的时间复杂度分两种情到500。况，若不用增量计算，计算适应值时要遍历整个为了验证WSB-EA算法的准确性以及健壮网络的所有边，此时的时间复杂度是O(m)。如果性，在这4个数据集上与孙一翔提出的Meme-SB 使用增量计算的方式，在计算适应值时只需遍历算法和没有使用增量计算的WSB-EA算法的实网络中的若干条边。假设改变的是节点i的子集验结果作对比分析。每一个数据集都做30次实验，编号，而节点i的度数为d,则需遍历d,条边。在记录求得最小适应值时的迭代次数和时间。实验网络中每个节点的度数是不相等的，因此用平均结果如表2所示。同时，为了验证增量计算对算度dve来代表某一个节点的度最合理。所以此时法的贡献，将WSB-EA算法与没有使用增量计算的时间复杂度是O(d)。总体算法的时间复杂度的WSB-EA算法进行时间比较，即得到迭代相同是OMG(+m)。的次数所用的时间。结果如表3所示。 3实验结果与分析从表2可知，无论是只有10个节点的SPP网络还是有690个节点的yeast网络，在求得相同适 3.1参数设置应值的情况下，WSB-EA算法的迭代次数较少，也表1列出了WSB-EA算法中使用到的所有参就说明WSB-EA算法能更快收敛到最优解。这

不同时，increaseFitness 减 2；如果邻居的基因与旧基因不同，但与新基因相同时，increaseFitness 加 2。算法 3 ncreaseFitness() 算法输入需要计算适应值的个体 individual，基因改变位置 id，旧基因 old，新基因 new；输出增加的适应值 increaseFitness。 1) increaseFitness=0； 2) c =Data.node[id].first; 3) 遍历节点 id 的所有邻居节点； 4) if (正邻居) 5) if(getGene(c.data)==old&&getGene(c.data)!= new) 6) increaseFitness= increaseFitness+2； 7) else if(getGene(c.data)!=old&&getGene(c.data)== new) 8) increaseFitness= increaseFitness-2； 9) else if(负邻居) 10) if(getGene(c.data)==old&&getGene (c.data) !=new) 11) increaseFitness= increaseFitness-2； 12) else if(getGene(c.data)!=old&&getGene (c.data) == new) 13) increaseFitness= increaseFitness+2； 2.7 复杂性分析在整个算法中，时间复杂度最高的是遗传操作这一部分，因此只分析这一部分的时间复杂度。首先定义几个基础概念，节点个数 n、边个数 m、种群规模 M、锦标赛规模 t 以及迭代次数 G。选择父本的时间复杂度是 O(t)。交叉算法所花费的时间复杂度是 O(n)。变异算子的时间复杂度是 O(1)。计算适应值的时间复杂度分两种情况，若不用增量计算，计算适应值时要遍历整个网络的所有边，此时的时间复杂度是 O(m)。如果使用增量计算的方式，在计算适应值时只需遍历网络中的若干条边。假设改变的是节点 i 的子集编号，而节点 i 的度数为 di，则需遍历 di 条边。在网络中每个节点的度数是不相等的，因此用平均度 davg 来代表某一个节点的度最合理。所以此时的时间复杂度是 O(davg)。总体算法的时间复杂度是 O(MG(n+m))。 3 实验结果与分析 3.1 参数设置表 1 列出了 WSB-EA 算法中使用到的所有参数及其取值。算法的运行环境是 Intel(R)Core(TM) i3-2330m，运行内存 4 GB，操作系统 Windows7 旗舰版，使用的软件是 eclipse4.5。表 1 参数设置 Table 1 Parameter setting 参数含义取值 G 迭代次数 50 M 种群规模 100 tournamentSize 锦标赛规模 5 uniformRate 交叉概率 0.9 mutationRate 变异概率 0.1 3.2 小型符号网络实验结果本文使用的小型数据集有 4 个：斯洛文尼亚政党网络 (SPP)、Gahuku-Gama 部落网络 (GGS)、社交圈网络 (SC) 和 yeast 网络 (yeast)。斯洛文尼亚政党网络：这是一个由斯洛文尼亚 1 0 个议会政党之间的关系组成的网络， 1994 年由一些研究政治的学者提出[16]。10 个议会政党的英文名字缩写分别是 SKD、ZLSD、SDSS、 LDS、ZS-ESS、ZS、DS、SLS、SPS-SNS 和 SNS。这一网络中有 10 个节点，45 条连边。 Gahuku-Gama 部落网络[ 1 7 ] ：这一网络中有 16 个节点，代表 16 个部落。边数为 59，代表部落之间的联盟和对抗。社交圈网络：这一网络是根据现实生活中人与人之间的关系得到的实际网络，节点有 28 个，边数为 42，代表节点之间的朋友关系或敌人关系。 Yeast 网络：这是一个酵母菌的基因调控网络[18] ，该网络包含 690 个节点和 1 080 条边。由于这一网络的节点个数较多，在实验中将种群规模增加到 500。为了验证 WSB-EA 算法的准确性以及健壮性，在这 4 个数据集上与孙一翔提出的 Meme-SB 算法和没有使用增量计算的 WSB-EA 算法的实验结果作对比分析。每一个数据集都做 30 次实验，记录求得最小适应值时的迭代次数和时间。实验结果如表 2 所示。同时，为了验证增量计算对算法的贡献，将 WSB-EA 算法与没有使用增量计算的 WSB-EA 算法进行时间比较，即得到迭代相同的次数所用的时间。结果如表 3 所示。从表 2 可知，无论是只有 10 个节点的 SPP 网络还是有 690 个节点的 yeast 网络，在求得相同适应值的情况下，WSB-EA 算法的迭代次数较少，也就说明 WSB-EA 算法能更快收敛到最优解。这第 5 期常新功，等：WSB-EA 进化算法的符号网络弱结构平衡分析 ·787·

点击进入文档下载页（PDF格式）

共8页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录