第二十三章现代优化算法 现代优化算法是80年代初兴起的启发式算法。这些算法包括禁忌搜索(tabu search),模拟退火( simulated annealing),遗传算法( genetic algorithms),人工神经网 络( neural networks)。它们主要用于解决大量的实际应用问题。目前,这些算法在理论 和实际应用方面得到了较大的发展。无论这些算法是怎样产生的,它们有一个共同的目 标一求NP-hard组合优化问题的全局最优解。虽然有这些目标,但 NP-hard理论限制它 们只能以启发式的算法去求解实际问题 启发式算法包含的算法很多,例如解决复杂优化问题的蚁群算法( Ant Colony Algorithms)。有些启发式算法是根据实际问题而产生的,如解空间分解、解空间的限 制等;另一类算法是集成算法,这些算法是诸多启发式算法的合成。 现代优化算法解决组合优化问题,如TSP( Traveling Salesman Problem)问题,QAP ( Quadratic Assignment Problem)问题,JsP(Job- shop Scheduling Problem)问题等效 果很好 §1模拟退火算法 算法简介 模拟退火算法得益于材料的统计力学的研究成果。统计力学表明材料中粒子的不 同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和 重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过 称为退火),粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终 成处于低能状态的晶体 如果用粒子的能量定义材料的状态, Metropolis算法用一个简单的数学模型描述了 退火过程。假设材料在状态i之下的能量为E(),那么材料在温度T时从状态i进入状 态j就遵循如下规律: (1)如果E()≤E(),接受该状态被转换。 (2)如果E()>E(i),则状态转换以如下概率被接受 E()=E 其中K是物理学中的波尔兹曼常数,T是材料温度。 在某一个特定温度下,进行了充分的转换之后,材料将达到热平衡。这时材料处 于状态i的概率满足波尔兹曼分布: P 其中x表示材料当前状态的随机变量,S表示状态空间集合。 显然 E(i) lim
-271- 第二十三章 现代优化算法 现代优化算法是 80 年代初兴起的启发式算法。这些算法包括禁忌搜索(tabu search),模拟退火(simulated annealing),遗传算法(genetic algorithms),人工神经网 络(neural networks)。它们主要用于解决大量的实际应用问题。目前,这些算法在理论 和实际应用方面得到了较大的发展。无论这些算法是怎样产生的,它们有一个共同的目 标-求 NP-hard 组合优化问题的全局最优解。虽然有这些目标,但 NP-hard 理论限制它 们只能以启发式的算法去求解实际问题。 启发式算法包含的算法很多,例如解决复杂优化问题的蚁群算法(Ant Colony Algorithms)。有些启发式算法是根据实际问题而产生的,如解空间分解、解空间的限 制等;另一类算法是集成算法,这些算法是诸多启发式算法的合成。 现代优化算法解决组合优化问题,如 TSP(Traveling Salesman Problem)问题,QAP (Quadratic Assignment Problem)问题,JSP(Job-shop Scheduling Problem)问题等效 果很好。 §1 模拟退火算法 1.1 算法简介 模拟退火算法得益于材料的统计力学的研究成果。统计力学表明材料中粒子的不 同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和 重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过 程被称为退火),粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终形 成处于低能状态的晶体。 如果用粒子的能量定义材料的状态,Metropolis 算法用一个简单的数学模型描述了 退火过程。假设材料在状态i 之下的能量为 E(i) ,那么材料在温度T 时从状态i 进入状 态 j 就遵循如下规律: (1)如果 E( j) ≤ E(i) ,接受该状态被转换。 (2)如果 E( j) > E(i) ,则状态转换以如下概率被接受: KT E i E j e ( )− ( ) 其中 K 是物理学中的波尔兹曼常数,T 是材料温度。 在某一个特定温度下,进行了充分的转换之后,材料将达到热平衡。这时材料处 于状态i 的概率满足波尔兹曼分布: ∑∈ − − = = j S KT E j KT E i T e e P x i ( ) ( ) ( ) 其中 x 表示材料当前状态的随机变量, S 表示状态空间集合。 显然 | | 1 lim ( ) ( ) S e e j S KT E j KT E i T = ∑∈ − − →∞
其中S|表示集合S中状态的数量。这表明所有状态在高温下具有相同的概率。而当温 度下降时 lim =lim T→0 m组 = lime A7 若 I Smin I i∈Smin -E(l-Emin ∑e 其它 其中Emn=minE()且Smn={iE(1)=Emn}。 上式表明当温度降至很低时,材料会以很大概率进入最小能量状态, 假定我们要解决的问题是一个寻找最小值的优化问题。将物理学中模拟退火的思 想应用于优化问题就可以得到模拟退火寻优方法。 考虑这样一个组合优化问题:优化函数为f:x→R,其中x∈S,它表示优化 问题的一个可行解,R={yy∈R,y>0},S表示函数的定义域。N(x)三S表示x 的一个邻域集合 首先给定一个初始温度T。和该优化问题的一个初始解x(0),并由x(0)生成下一个 解x∈N(x(O),是否接受x作为一个新解x(1)依赖于下面概率: 若f(x)<f(x(0) P(x(0)→x)={x-xo) 其它 换句话说,如果生成的解x的函数值比前一个解的函数值更小,则接受x(1)=x作为 个新解。否则以概率e 接受x作为一个新解。 泛泛地说,对于某一个温度T和该优化问题的一个解x(k),可以生成x。接受x 作为下一个新解x(k+1)的概率为: 若f(x)<f(x(k) P(x(k)→x)={_/x)=xk (1) 其它 在温度T下,经过很多次的转移之后,降低温度T,得到T1<T。在T下重复上述 过程。因此整个优化过程就是不断寻找新解和缓慢降温的交替过程。最终的解是对该问 题寻优的结果。 我们注意到,在每个T下,所得到的一个新状态x(k+1)完全依赖于前一个状态 x(k),可以和前面的状态x(0),…,x(k-1)无关,因此这是一个马尔可夫过程。使用马 尔可夫过程对上述模拟退火的步骤进行分析,结果表明:从任何一个状态x(k)生成x的 概率,在N(x(k)中是均匀分布的,且新状态x被接受的概率满足式(1),那么经过 有限次的转换,在温度T下的平衡态x的分布由下式给出 -272-
-272- 其中| S | 表示集合 S 中状态的数量。这表明所有状态在高温下具有相同的概率。而当温 度下降时, ∑ ∑ ∑∉ − − ∈ − − − − → ∈ − − − − → + = min min min min min min min ( ) ( ) ( ) 0 ( ) ( ) 0 lim lim j S KT E j E j S KT E j E KT E i E T j S KT E j E KT E i E T e e e e e ⎪ ⎩ ⎪ ⎨ ⎧ ∈ = = ∑∈ − − − − → 其它 若 0 | | 1 lim min min ( ) ( ) 0 min min min i S S e e j S KT E j E KT E i E T 其中 min ( ) min E E j j∈S = 且 { | ( ) } min Emin S = i E i = 。 上式表明当温度降至很低时,材料会以很大概率进入最小能量状态。 假定我们要解决的问题是一个寻找最小值的优化问题。将物理学中模拟退火的思 想应用于优化问题就可以得到模拟退火寻优方法。 考虑这样一个组合优化问题:优化函数为 → + f : x R ,其中 x ∈ S ,它表示优化 问题的一个可行解, = { | ∈ , > 0} + R y y R y ,S 表示函数的定义域。N(x) ⊆ S 表示 x 的一个邻域集合。 首先给定一个初始温度T0 和该优化问题的一个初始解 x(0) ,并由 x(0) 生成下一个 解 x'∈ N(x(0)) ,是否接受 x' 作为一个新解 x(1) 依赖于下面概率: ⎪ ⎩ ⎪ ⎨ ⎧ < → = − − 其它 若 ( ') ( (0)) 0 1 ( ') ( (0)) ( (0) ') T f x f x e f x f x P x x 换句话说,如果生成的解 x' 的函数值比前一个解的函数值更小,则接受 x(1) = x' 作为 一个新解。否则以概率 0 ( ') ( (0)) T f x f x e − − 接受 x' 作为一个新解。 泛泛地说,对于某一个温度Ti 和该优化问题的一个解 x(k) ,可以生成 x' 。接受 x' 作为下一个新解 x(k +1) 的概率为: ⎪ ⎩ ⎪ ⎨ ⎧ < → = − − 其它 若 ( ') ( ( )) 0 1 ( ') ( ( )) ( ( ) ') T f x f x k e f x f x k P x k x (1) 在温度Ti 下,经过很多次的转移之后,降低温度Ti ,得到Ti+1 < Ti 。在Ti+1 下重复上述 过程。因此整个优化过程就是不断寻找新解和缓慢降温的交替过程。最终的解是对该问 题寻优的结果。 我们注意到,在每个Ti 下,所得到的一个新状态 x(k +1) 完全依赖于前一个状态 x(k) ,可以和前面的状态 x(0),L, x(k −1) 无关,因此这是一个马尔可夫过程。使用马 尔可夫过程对上述模拟退火的步骤进行分析,结果表明:从任何一个状态 x(k) 生成 x' 的 概率,在 N(x(k)) 中是均匀分布的,且新状态 x' 被接受的概率满足式(1),那么经过 有限次的转换,在温度Ti 下的平衡态 i x 的分布由下式给出:
PC/、c (2) f(r) 当温度T降为0时,x,的分布为 P={|S 若x,∈Sm 0 其它 并且 P"=1 这说明如果温度下降十分缓慢,而在每个温度都有足够多次的状态转移,使之在每一个 度下达到热平衡,则全局最优解将以概率1被找到。因此可以说模拟退火算法可以找 到全局最优解。 在模拟退火算法中应注意以下问题 (1)理论上,降温过程要足够缓慢,要使得在每一温度下达到热平衡。但在计算 机实现中,如果降温速度过缓,所得到的解的性能会较为令人满意,但是算法会太慢, 相对于简单的搜索算法不具有明显优势。如果降温速度过快,很可能最终得不到全局最 优解。因此使用时要综合考虑解的性能和算法速度,在两者之间采取一种折衷 (2)要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续m次的 转换过程没有使状态发生变化时结束该温度下的状态转换。最终温度的确定可以提前定 为一个较小的值冖’或连续几个温度下转换过程没有使状态发生变化算法就结束 (3)选择初始温度和确定某个可行解的邻域的方法也要恰当 12应用举例 例已知敌方100个目标的经度、纬度如表1所示。 经度和纬度数据表 经度纬度 经度 经度纬度 纬度 30.33136.9348 5654322141881081981625292278912310 101584124819 □20105015456219 264951 2131484 60 440356135401 289836 38.472 282694290011 32.1910586993648632972840971828477 89586246635165618361431059715.11850211102944 8.151995325 0.1215188726 48.207716.8889 31949917.6309 474134237783 41.86713.56 53.352426.7256 308165134595277133507 23922276306519612228511127938157307 4956883669 21505124090915254827211 6207051442 492430167044 171682003543416882275719440239200115812145677 5211810408 9.555914219 24450965634 584816.8474 35661999333 2446543.16440.777569576 14.470313.6368 19866015.1224 586849 3951681693 7957 〖38430084648 5l8181230159 89983236440 50.115623.7816 137909195103405742339602306248431919.985757902 273
-273- ∑∈ − − = j S T f x T f x i i i i i e e P T ( ) ( ) ( ) (2) 当温度T 降为 0 时, i x 的分布为: ⎪ ⎩ ⎪ ⎨ ⎧ ∈ = 其它 若 0 | | 1 min min * x S P S i i 并且 1 min * ∑ = x ∈S i i P 这说明如果温度下降十分缓慢,而在每个温度都有足够多次的状态转移,使之在每一个 温度下达到热平衡,则全局最优解将以概率 1 被找到。因此可以说模拟退火算法可以找 到全局最优解。 在模拟退火算法中应注意以下问题: (1)理论上,降温过程要足够缓慢,要使得在每一温度下达到热平衡。但在计算 机实现中,如果降温速度过缓,所得到的解的性能会较为令人满意,但是算法会太慢, 相对于简单的搜索算法不具有明显优势。如果降温速度过快,很可能最终得不到全局最 优解。因此使用时要综合考虑解的性能和算法速度,在两者之间采取一种折衷。 (2)要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续 m 次的 转换过程没有使状态发生变化时结束该温度下的状态转换。最终温度的确定可以提前定 为一个较小的值Te ,或连续几个温度下转换过程没有使状态发生变化算法就结束。 (3)选择初始温度和确定某个可行解的邻域的方法也要恰当。 1.2 应用举例 例 已知敌方 100 个目标的经度、纬度如表 1 所示。 表 1 经度和纬度数据表 经度 纬度 经度 纬度 经度 纬度 经度 纬度 53.7121 15.3046 51.1758 0.0322 46.3253 28.2753 30.3313 6.9348 56.5432 21.4188 10.8198 16.2529 22.7891 23.1045 10.1584 12.4819 20.1050 15.4562 1.9451 0.2057 26.4951 22.1221 31.4847 8.9640 26.2418 18.1760 44.0356 13.5401 28.9836 25.9879 38.4722 20.1731 28.2694 29.0011 32.1910 5.8699 36.4863 29.7284 0.9718 28.1477 8.9586 24.6635 16.5618 23.6143 10.5597 15.1178 50.2111 10.2944 8.1519 9.5325 22.1075 18.5569 0.1215 18.8726 48.2077 16.8889 31.9499 17.6309 0.7732 0.4656 47.4134 23.7783 41.8671 3.5667 43.5474 3.9061 53.3524 26.7256 30.8165 13.4595 27.7133 5.0706 23.9222 7.6306 51.9612 22.8511 12.7938 15.7307 4.9568 8.3669 21.5051 24.0909 15.2548 27.2111 6.2070 5.1442 49.2430 16.7044 17.1168 20.0354 34.1688 22.7571 9.4402 3.9200 11.5812 14.5677 52.1181 0.4088 9.5559 11.4219 24.4509 6.5634 26.7213 28.5667 37.5848 16.8474 35.6619 9.9333 24.4654 3.1644 0.7775 6.9576 14.4703 13.6368 19.8660 15.1224 3.1616 4.2428 18.5245 14.3598 58.6849 27.1485 39.5168 16.9371 56.5089 13.7090 52.5211 15.7957 38.4300 8.4648 51.8181 23.0159 8.9983 23.6440 50.1156 23.7816 13.7909 1.9510 34.0574 23.3960 23.0624 8.4319 19.9857 5.7902
408801142978 14.5229 18663567436 528423272880 39949429.5114 24.0664 10.1121272662 28.781227.6659 349616835949981660828193631762369545230265 15732019569715118173884440398162635397139284203 383392199950246543196057369980243992 4.15913.1853 40.140020.3030 23.987694030 41.108427.7149 我方有一个基地,经度和纬度为(70,40)。假设我方飞机的速度为1000公里/小时。 我方派一架飞机从基地出发,侦察完敌方所有目标,再返回原来的基地。在敌方每一目 标点的侦察时间不计,求该架飞机所花费的时间(假设我方飞机巡航时间可以充分长) 这是一个旅行商问题。我们依次给基地编号为1,敌方目标依次编号为2,3, 101,最后我方基地再重复编号为102(这样便于程序中计算)距离矩阵D=(d1)x02, 其中d表示表示,j两点的距离,j=12,…102,这里D为实对称矩阵。则问题是 求一个从点1出发,走遍所有中间点,到达点102的一个最短路径。 上面问题中给定的是地理坐标(经度和纬度),我们必须求两点间的实际距离。设 A,B两点的地理坐标分别为(x1,y1),(x2,y2),过A,B两点的大圆的劣弧长即为两点 的实际距离。以地心为坐标原点O,以赤道平面为XOy平面,以0度经线圈所在的平 面为YOZ平面建立三维直角坐标系。则A,B两点的直角坐标分别为 A(Rcos x cos y,, Rsin x, cos y,, Rsin yu) B(RcOS x2 cos y2, Rsin x2 cos y2, Rsin y2) 其中R=6370为地球半径 A,B两点的实际距离 )A·OB d= Marco 化简得 d=Rarccos[cos(x, -x2)cos y, cos y2+sin y, sin y2] 求解的模拟退火算法描述如下 (1)解空间 解空间S可表为{1,2,,101102}的所有固定起点和终点的循环排列集合,即 S={(x1…,m1a)|x1=1,(x2…,ro)为{23…101)的循环排列,r1a2=102} 其中每一个循环排列表示侦察100个目标的一个回路,丌=j表示在第i次侦察j点 初始解可选为(1,2,…102),本文中我们使用 Monte carlo方法求得一个较好的初始解。 (2)目标函数 此时的目标函数为侦察所有目标的路径长度或称代价函数。我们要求 minf(x,z2…,zm)=∑dx 而一次迭代由下列三步构成 (3)新解的产生 ①2变换法
-274- 40.8801 14.2978 58.8289 14.5229 18.6635 6.7436 52.8423 27.2880 39.9494 29.5114 47.5099 24.0664 10.1121 27.2662 28.7812 27.6659 8.0831 27.6705 9.1556 14.1304 53.7989 0.2199 33.6490 0.3980 1.3496 16.8359 49.9816 6.0828 19.3635 17.6622 36.9545 23.0265 15.7320 19.5697 11.5118 17.3884 44.0398 16.2635 39.7139 28.4203 6.9909 23.1804 38.3392 19.9950 24.6543 19.6057 36.9980 24.3992 4.1591 3.1853 40.1400 20.3030 23.9876 9.4030 41.1084 27.7149 我方有一个基地,经度和纬度为(70,40)。假设我方飞机的速度为 1000 公里/小时。 我方派一架飞机从基地出发,侦察完敌方所有目标,再返回原来的基地。在敌方每一目 标点的侦察时间不计,求该架飞机所花费的时间(假设我方飞机巡航时间可以充分长)。 这是一个旅行商问题。我们依次给基地编号为 1,敌方目标依次编号为 2,3,…, 101,最后我方基地再重复编号为 102(这样便于程序中计算)。距离矩阵 102 102 ( ) D = dij × , 其中 dij 表示表示i, j 两点的距离,i, j = 1,2,L,102 ,这里 D 为实对称矩阵。则问题是 求一个从点 1 出发,走遍所有中间点,到达点 102 的一个最短路径。 上面问题中给定的是地理坐标(经度和纬度),我们必须求两点间的实际距离。设 A, B 两点的地理坐标分别为( , ) 1 1 x y ,( , ) 2 2 x y ,过 A, B 两点的大圆的劣弧长即为两点 的实际距离。以地心为坐标原点O ,以赤道平面为 XOY 平面,以 0 度经线圈所在的平 面为 XOZ 平面建立三维直角坐标系。则 A, B 两点的直角坐标分别为: ( cos cos , sin cos , sin ) 1 1 1 1 1 A R x y R x y R y ( cos cos , sin cos , sin ) 2 2 2 2 2 B R x y R x y R y 其中 R = 6370为地球半径。 A, B 两点的实际距离 ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ ⋅ ⋅ = OB OB d R OA OA arccos , 化简得 arccos[cos( ) cos cos sin sin ] 1 2 1 2 1 2 d = R x − x y y + y y 。 求解的模拟退火算法描述如下: (1)解空间 解空间 S 可表为{1,2,L,101,102 }的所有固定起点和终点的循环排列集合,即 {( , , ) | 1,( , , ) {2,3, ,101} , 102} S = π 1 L π 102 π 1 = π 2 L π 101 为 L 的循环排列 π 102 = 其中每一个循环排列表示侦察 100 个目标的一个回路, j π i = 表示在第i 次侦察 j 点, 初始解可选为(1,2,L,102) ,本文中我们使用 Monte Carlo 方法求得一个较好的初始解。 (2)目标函数 此时的目标函数为侦察所有目标的路径长度或称代价函数。我们要求 ∑= + = 101 1 1 2 102 1 min ( , , , ) i i i f π π L π dπ π 而一次迭代由下列三步构成: (3)新解的产生 ① 2 变换法
任选序号u,v(u<v)交换l与v之间的顺序,此时的新路径为 ②3变换法 任选序号u,和w,将l和v之间的路径插到w之后,对应的新路径为(设 u<y<w) 丌1…丌u-1+…丌丌u…n,n+1 (4)代价函数差 对于2变换法,路径差可表示为 Af =(d r, +d m)-(d, (5)接受准则 △f<0 p(-A/7)4f≥0 如果Δ∫<0,则接受新的路径。否则,以概率eXp(-Δ/T)接受新的路径,即若 p(-A/7)大于0到1之间的随机数则接受。 (6)降温 利用选定的降温系数α进行降温即:T←-α,得到新的温度,这里我们取 (7)结束条件 用选定的终止温度e=10-30,判断退火过程是否结束。若T<e,算法结束,输出 当前状态。 我们编写如下的 matlab程序如下 load sj.txt%加载敌方100个目标的数据,数据按照表格中的位置保存在纯文本 文件stxt中 sj(:1:28)x=x(:) s(:228)y=y() dl=70,40] %距离矩阵d Zeros(102) for i=1: 101 for j=i+1: 102 temp=cos(sj(i, 1)-sjG, 1))*cos(sj(i, 2)*cos(sj(, 2))+sin(sj (1, 2)*sin(sj(, 2)); nd So=U; Sum=inf and(state, sum(clock) forj=1:1000 S=[l 1+randperm100), 102
-275- 任选序号 u,v (u < v )交换u 与v 之间的顺序,此时的新路径为: π 1Lπ u−1 π vπ v+1Lπ u+1 π uπ v+1Lπ 102 ② 3 变换法 任选序号 u,v 和 w ,将 u 和 v 之间的路径插到 w 之后,对应的新路径为(设 u < v < w ) π 1Lπ u−1 π v+1Lπ wπ u Lπ vπ w+1Lπ 102 (4)代价函数差 对于 2 变换法,路径差可表示为 ( ) ( ) −1 +1 −1 +1 Δ = + − + u v u v u u v v f dπ π dπ π dπ π dπ π (5)接受准则 ⎩ ⎨ ⎧ −Δ Δ ≥ Δ < = exp( / ) 0 1 0 f T f f P 如果Δf < 0 ,则接受新的路径。否则,以概率exp(−Δf /T) 接受新的路径,即若 exp(−Δf /T)大于 0 到 1 之间的随机数则接受。 (6)降温 利用选定的降温系数α 进行降温即: T ←αT ,得到新的温度,这里我们取 α = 0.999 。 (7)结束条件 用选定的终止温度 30 10− e = ,判断退火过程是否结束。若T < e ,算法结束,输出 当前状态。 我们编写如下的 matlab 程序如下: clc,clear load sj.txt %加载敌方 100 个目标的数据,数据按照表格中的位置保存在纯文本 文件 sj.txt 中 x=sj(:,1:2:8);x=x(:); y=sj(:,2:2:8);y=y(:); sj=[x y]; d1=[70,40]; sj=[d1;sj;d1]; sj=sj*pi/180; %距离矩阵 d d=zeros(102); for i=1:101 for j=i+1:102 temp=cos(sj(i,1)-sj(j,1))*cos(sj(i,2))*cos(sj(j,2))+sin(sj(i,2))*sin(sj(j,2)); d(i,j)=6370*acos(temp); end end d=d+d'; S0=[];Sum=inf; rand('state',sum(clock)); for j=1:1000 S=[1 1+randperm(100),102]; temp=0;