∫(X)=f(X*)+-(△X)A△X (2-8) 对于二次函数f(x1,x2),A为常阵 C 11 0 VA(X)In=A 式中a12=a210 当A为正定阵时,即41>0,{0101|=:-ac>0, 则f(X)>f(X*),即∫(x*)为极小值。 可以证明:当A为负定阵时, f(X)<f(X*),即∫(X)为极大值。 「例1] f(X)=XTQX+BX+C (2-9) Q为常阵,B为常向量,C为常数。 Vf(x)=QX+B=0,其解即为驻点t X=-Q-IB Hese阵A=V2f(X)=Q,Q为可逆阵。 若Q为正定阵(Q为正定,一定可逆),则 XR=-Q-B 为函数了(X)的极小值点,f(x*)=C-2BQB 例2] 1 fOX=XTQX 由例1可知B=0时,X*=0,这是驻点,是否是极值点用 [注]:正定和负定的定义及其判别方法见本章§2-3,A正定,则 J(X“)为极小值的讧明见木节附录
Hesse阵的正定性来判别。现在,detQ=3>0,q1=1>0,Q正 定。A=Q,∴A为正定,因此X=0为极小值点,∫(X*)=0。 [例3] f(X)=-10 12x 4x4 Vf(x)=[-20x1-12x2,-12x1-8x2]7=0 解得驻点x=0,x2=0 20-12 A=V/(X) a1<0,det4=160-144=36>0,A为负定,X*=0为极大 值点,极大值∫(X*)=0。 附录:二元函数极值的充分条件 由(2-8)式得 f(X*十△X)一∫(X*)=(△X)7A△X=D 2x10 ax1ax ax 由(2-7)式得 D (△¥)A△=-(△x2) a2f(△ x12△ 22F ax10x2△x2/a (△x2)2{a1t2+2a12+a
a(△x2)2F() △ △ F(t)=a142+2a12t+a2 如果X*是极小点,则不管△x1、△x2如何变(当然变化 范围很小),D>0,即二项式F(#)不应变号。即F(t)>0或 F(#)<0,而不能等于0。 换有之,F()=a1t2+2a12t+a22=0不应有实根。 因此(2a12)2-4a:1a2<0,即 deta 0 1222 为保证detA>0,则a1必须与a22同号。 又当△x2=0时,D 1 a 2ax12 (△x1)2,因此 7x12 与 D同号,同理a22电必须与D同号。 因此,二元函数极值的充分条件为 Vf(X)Ix=0 detA>0 a1>0时,x*为极小点(即A为正定阵), a1<0时,X*为极大点(即A为负定阵)。 多元函数f(x)的极值条件可以从二元函数极值条件推广 这时X=[ ,f(X)=∫(x1,x2 将二元函数推广到n元可得如下结果: 函数∫(X)在X*点的泰物级数二次近似式为 f(X)=∫(X*)Vf(X*)△X 1 (△X)A△ 2-11)
Vf(Y*)=af af ax, ax XaX △X=[△x1,△ dx1dx2 xix a2f a2f A=V2(XIx=x axiax2 ax ajax (2-12) ax,ax1 axndx2 称为n元二次偏导数矩阵,即 lesse矩阵。 式(2-11)的展开式为: f ax △x;+-∑∑ ax ax △%;△ 则n元函数极值的必要与充分条件和二元函数极值条件一样 x*为极值的必要条件为f(X)x=0 充分条件为Vf(x)x*=0 令A为∫(X)二次近似展开式的 Hesse阵 (2-13) 当A为正定时,X*为极小 A为负定时,X*为极大。 A为负定的条件为(见§2-3); detA,<0,i=1,3,5 dct;>0,i=2,4,6,…。 其中detA;为A的左上角主子行列式。 如果函数f(X)可用解析式表达并且可导,则可用解非线性 联立方程组的方法(例如 Newton- Raphson法)求解Vf(X)
0得驻点,可能得到许多解,我们可以逐个地计算 Hesse阵A 以判断哪个是极大点,哪个是极小点。这一方法称为解析法(或间 接法) 变量数较多时,计算 Hesse阵是较困难的,因此解析法求最 优值一般很少用。用得较多的是数值计算法。 §2-2多变量函数的微分运算 在求解最优化问题时,常遇到下述微分运算问题:如时变向量 (或矩阵)对时间的求导,多变量标量函数对向量(或矩阵)的求 导,多变量向量函数对向量(或矩阵)的求导等。 下面列出几个常用的多变量函数求导规则 、时变向量(或矩阵)函数对时间t的导数 1.设x(t)为n维时变向量, X()=[x1(),x2(t),…,xn()] 则 Y(#) dX(t) d=[(4),(),…,x()](2-14) 2.设A()为mXn时变矩阼, () 1n(f) A(t)=lai (t)]nxn= c21(t)a22()…a2n(t) f)an2(扌) () da;〔t) =[a mX刹 (2-15) 3.设A(#)、B(t)为n×n时变矩阵