第六章多元函数的极值问题 §4.1普通极值问题 设f(x1…,xn)是集合ScR"上的函数,如果对P=(x1,…,xn),存在P在R"中 的邻域U,使得ⅦP=(x1…xn)∈S∩U,恒有∫(x1…,x)≤∫(x19…,x2) (f(x1,…xn)≥f(x,…,x),则f(x0…,x)称为f(x1…,x)在S上的局部极大值 (极小值),B称为∫(x1,…,x)的局部极大值(极小值)点.如果S是开集,则P称为普 通极值点.否则称为条件极值点 定理1:如果P=(x,…x0)是∫(x1…,xn)的普通极值点,且f(x1…,x)在P存 在偏导,则(x…x2) 证明:P是内点,因而x是一元函数f(x1,x2…,x0)的极值点,因此 0 定义:设f(x1…,x)在区域D上处处有偏导.如果在点P=(x,…,x)成立 ax 0,i=1…,n,则称P为∫(x1…,x)的判别点 如果P是∫(x1,…,xn)的极值点,则其是f(x1…,xn)的判别点但反之并不成立 例:令∫(x,y)=x (00)-0(00)- 0.但(00)并不是f(x,y)的极 值点 与一元函数相同,我们需要利用∫(x12…,xn)在判别点处的二阶 Taylor展开来讨论所 给判别点是否极值点以及是什么样的极值点.为此我们需要下面引理 引理:设n阶对称矩阵A是正定(负定)的,则存在E>0,使得对任意(x1,…,xn),恒
1 第六章 多元函数的极值问题 §4.1 普通极值问题 设 ( , , ) 1 n f x L x 是集合 n S Ì R 上的函数, 如果对 ( , , ) 0 0 0 1 n P = x L x , 存在 P0 在 n R 中 的邻域 U , 使 得 "P = (x1 ,L, xn )Î S IU , 恒 有 ( , , ) ( , , ) 0 0 1 n 1 n f x L x £ f x L x ( ( , , ) ( , , )) 0 0 1 n 1 n f x L x ³ f x L x , 则 ( , , ) 0 0 1 n f x L x 称为 ( , , ) 1 n f x L x 在 S 上的局部极大值 (极小值), P0 称为 ( , , ) 1 n f x L x 的局部极大值(极小值)点. 如果S 是开集, 则P0 称为普 通极值点. 否则称为条件极值点. 定理 1: 如果 ( , , ) 0 0 0 1 n P = x L x 是 ( , , ) 1 n f x L x 的普通极值点, 且 ( , , ) 1 n f x L x 在 P0 存 在偏导, 则 0, 1, , . ( , , ) 0 0 1 i n x f x x i n L L = = ¶ ¶ . 证 明 : P0 是内点 , 因 而 0 1 x 是一元函数 ( , , , ) 0 0 1 2 n f x x L x 的极值点 . 因 此 0 ( , , ) 1 0 0 1 = ¶ ¶ x f x x L n . 定义 : 设 ( , , ) 1 n f x L x 在区域 D 上处处有偏导. 如果在点 ( , , ) 0 0 0 1 n P = x L x 成立 i n x f x x x i n 0, 1, , ( , , , ) 0 0 2 0 1 L L = = ¶ ¶ , 则称P0 为 ( , , ) 1 n f x L x 的判别点. 如果 P0 是 ( , , ) 1 n f x L x 的极值点, 则其是 ( , , ) 1 n f x L x 的判别点. 但反之并不成立. 例: 令 2 2 f (x, y) = x - y , 则 0 (0,0) 0, (0,0) = ¶ ¶ = ¶ ¶ y f x f . 但(0,0) 并不是 f (x, y) 的极 值点. 与一元函数相同, 我们需要利用 ( , , ) 1 n f x L x 在判别点处的二阶 Taylor 展开来讨论所 给判别点是否极值点以及是什么样的极值点. 为此我们需要下面引理. 引理: 设n 阶对称矩阵 A 是正定(负定)的, 则存在e > 0, 使得对任意( , , ) 1 n x L x , 恒
有 (x…,x)A(x1…,x)2(x2+…+x2)(x,…,x,)4(x1…,x,)≤-(x2+…+x2) 证明:R"中单位球面S={x,…x+…+x=是有界闭集,因而是紧集 Sn上的函数(x1…,xn)A(x1…,xn)连续且处处不为零,因而在Sn上达到最小值,设为E 则对任意(x12…,xn)≠0,恒有 A ≥ 引理得证 定理2:设P=(x1,…,xn)是∫(x1,…,xn)在区域D内的判别点如果∫(x1,…,x) 在P的Hes矩阵H(P)是正定的,则P是f(x1;…,xn)的严格极小点,如果H(P)是 负定的,则P是f(x1…,x)的严格极大点;如果H(P)是不定的,则B不是 ∫(x1…,xn)的极值点 证明:设H/(B)(2f(x…¨x正定,取E>0满足上面引理将∫在P点作 ax ax 二阶 Taylor展开,由(x9…,x0)是判别点得 f∫(x )=d3f(x…x2)+4∑(x-x)2 P (x-x) 由于O在(x1…x)趋于(x,…,x0)时是无穷小,因此存在(x9…,x)的邻域U,使得 (x,…,x,)∈U时5+o>0,得f(x1…,x,)>f(x,…,x3).P是f(x,…,x,)的严 格极小点 如果H(P0)不定,则存在n维向量a≠0和B≠0,使得OH()a>0,而 PH(P)B<0.令B=B+1,P2=P+甲,则t充分小时P和P2都在D内,且 2
2 有 ( ) 2 2 1 1 1 ( , , ) ( , , ) n t n n x L x A x L x ³ e x +L+ x (( , , ) ( , , ) ( )). 2 2 1 1 1 n t n n x L x A x L x £ -e x +L+ x 证明: n R 中单位球面 {( , , ) 1} 2 2 Sn = x1 L xn x1 +L+ xn = 是有界闭集, 因而是紧集. Sn 上的函数 t n n (x , , x )A(x , , x ) 1 L 1 L 连续且处处不为零, 因而在 Sn 上达到最小值, 设为e . 则对任意(x1 ,L, xn ) ¹ 0 , 恒有 ³ e + + + + 2 2 1 1 2 2 1 1 ( , , ) ( , , ) n t n n n x x x x A x x x x L L L L . 引理得证. 定理 2: 设 ( , , ) 0 0 0 1 n P = x L x 是 ( , , ) 1 n f x L x 在区域 D 内的判别点. 如果 ( , , ) 1 n f x L x 在 P0 的Hessi矩阵 ( ) H f P0 是正定的, 则P0 是 ( , , ) 1 n f x L x 的严格极小点; 如果 ( ) H f P0 是 负定的, 则 P0 是 ( , , ) 1 n f x L x 的严格极大点 ; 如 果 ( ) H f P0 是不定的, 则 P0 不 是 ( , , ) 1 n f x L x 的极值点. 证明: 设 ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ = i j n f x x f x x H P ( , , ) ( ) 0 0 1 2 0 L 正定, 取e > 0 满足上面引理. 将 f 在 P0 点作 二阶 Taylor 展开, 由( , , ) 0 0 1 n x L x 是判别点得 ( ) ( ) ( ) . 2 , , ( ) , , ( ) 2 1 ( , , ) ( ) 2 1 ( , , ) ( , , ) 1 0 2 1 0 0 0 2 0 1 1 0 0 1 1 1 0 0 0 2 1 0 0 2 1 1 ÷ ø ö ç è æ ÷ - ø ö ç è æ ³ + ÷ ø ö ç è æ = - - - - + - ÷ ø ö ç è æ - = + - å å å = = = n i i i n i i i t n n f n n n i n n n i i o x x x x x x H P x x x x o x x f x x f x x d f x x o x x e L L L L L 由于o 在 ( , , ) 1 n x L x 趋于( , , ) 0 0 1 n x L x 时是无穷小, 因此存在( , , ) 0 0 1 n x L x 的邻域U , 使得 (x1 ,L, xn ) ÎU 时 0 2 + o > e , 得 ( , , ) ( , , ) 0 0 1 n 1 n f x L x > f x L x . P0 是 ( , , ) 1 n f x L x 的严 格极小点. 如果 ( ) H f P0 不定, 则存在 n 维向量a ¹ 0 和 b ¹ 0 , 使得 ( 0 ) > 0 t aH f P a , 而 ( 0 ) < 0 t bH f P b . 令P1 = P0 + ta, P2 = P0 + tb , 则t 充分小时 P1和 P2 都在 D 内, 且
f(P)-f(Po)=raH (P)a+0-12 all P lH, (Po a'+olap) 1充分小时,aH,(2yx+)0,因此2不是极大点同理 f(P2)-f(P)= BH, (P)B+o(eBiP) 在t充分小时小于零,因此f不是极小点.得P不是极值点 由定理2,仅当判别点P=(x,…,x)的Hes矩阵H/(P)是半正定或半负定时,我 们不能判定P是否是∫的极小或极大点,这是必须detH/(P)=0 利用定理2,我们需要判定Hess矩阵H,(P)的正定或负定性.对此我们需要下面《线 性代数》中给出的定理 定理3:对称矩阵A=(an),=1是正定(负定)的充分必要条件是A的主子行列式 det(a,a>0() "det(a,1>o 对k=1,…,n成立 例:求∫(x,y)=x2-xy+y2-2x+y的极值点 解:9(x,y) 2x-y-2 af( 2y-x+1.解得判别点为P=(10),而 a(Po)af(Po H(PB)=a2/(B)3/(P)(-12 ax axa 阶主子行列式(a1)=2>0,二阶主子行列式 =3>0,因此H(P0)正定, P=(1,0)是f(x,y)的极小点,∫(10)=-1是∫(x,y)的极小值 §4.2条件极值问题 设F(x1…,xn),…,Fm(x1,…,xn)是区域DcR"上的函数.定义S为
3 ( ) ( ( ) ( )). ( ) ( ) ( ) 2 0 2 2 2 0 2 1 0 a a a a a a t H P o f P f P t H P o t t f t f = + - = + × t 充分小时, ( ) ( ) 0 2 aH P0 a + o a > t f , 因此P0 不是极大点. 同理 ( ) ( ) ( ( ) ( )). 2 0 2 f P2 f P0 t bH P b o b t - = f + 在t 充分小时小于零, 因此P0 不是极小点. 得P0 不是极值点. 由定理 2, 仅当判别点 ( , , ) 0 0 0 1 n P = x L x 的 Hessi矩阵 ( ) H f P0 是半正定或半负定时, 我 们不能判定 P0 是否是 f 的极小或极大点, 这是必须det ( ) 0 H f P0 = . 利用定理 2, 我们需要判定 Hessi 矩阵 ( ) H f P0 的正定或负定性. 对此我们需要下面《线 性代数》中给出的定理. 定理 3: 对称矩阵 n A aij i, j 1 ( ) = = 是正定(负定)的充分必要条件是 A 的主子行列式 det( ) 0 (( 1) det( ) 0) , =1 > - , =1 > k ij i j k k aij i j a 对k = 1,L, n 成立. 例: 求 f (x, y) = x - xy + y - 2x + y 2 2 的极值点. 解: 2 1 ( , ) 2 2, ( , ) = - + ¶ ¶ = - - ¶ ¶ y x y f x y x y x f x y . 解得判别点为 (1,0) P0 = , 而 ÷ ÷ ø ö ç ç è æ - - = ÷ ÷ ÷ ÷ ø ö ç ç ç ç è æ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ = 1 2 2 1 ( ) ( ) ( ) ( ) ( ) 2 0 2 0 2 0 2 2 0 2 0 y f P x y f P x y f P x f P H f P . 一阶主子行列式 (a11 ) = 2 > 0 , 二阶主子行列式 3 0 1 2 2 1 = > - - , 因此 ( ) H f P0 正定, (1,0) P0 = 是 f (x, y) 的极小点, f (1,0) = -1是 f (x, y) 的极小值. §4.2 条件极值问题 设 ( , , ), , ( , , ) 1 1 n m 1 n F x L x L F x L x 是区域 n D Ì R 上的函数. 定义S 为
S=(x1 F(x Fn(x 设∫(x12…,xn)是S上的函数,∫(x1…,x)在S上的极值问题称为∫(x13…,xn)对约束 条件F(x1…xn)=0,…F(x1…,x)=0的条件极值.即P0=(x3,…x0)∈S称为 ∫(x1…,xn)对约束条件F1(x13…,xn)=0,…,Fm(x1,…,xn)=0的条件极大(极小)值 如果存在P在R”中的一个邻域U,使得VP=(x,…,x)∈S∩U,恒有 )(f(x1…,xn)≥f(x,…,x) 例:证明在所有周长相同的三角形中,等边三角形面积最大 证明:设三角形三条边为x,y,2.周长固定时x,y,z并非自由变量,受条件 x+y+z=2P的约束,其中p为常数由面积公式知,三角形面积为 p(p-xp-y(p 此我们需求∫(x,y,z)=(P-x)(p-y)(p-z)在条件x+y+2=2p下的最大值 由x+y+z=2p解出z=2p-x-y.这时x,y是自由变量,在一个开集上变化.代 入∫(x,y,),条件极值问题化为 h(x, y)=(p-x)(p-y(x+y-p) 的普通极值问题 解方程组 Jh, (x, y)=(p-y)(2p-2x-y)=0 h,(x,y)=(P-x)(2P-x-2y)=0, 得在x>0,y>0时只有一个解x==p,y=P.但由问题知,最大值存在,而判别点唯 因此判别点只能是最大点,得x==p,y==P,z==P时三角形面积最大 上例中我们是通过求解约束条件的方程,得到自由变量,代入求极值的函数,将条件极 值问题化为普通极值问题.但有时直接解约束条件的方程是困难的,但通过微分约束条件 解出某些变量的微分用另一些变量的微分来表示,再代入求极值函数的微分中,从而求得其 在约束条件下的判别点
4 {( , , ) ( , , ) ( , , ) 0} S = x1 L xn F1 x1 L xn =L = Fm x1 L xn = . 设 ( , , ) 1 n f x L x 是 S 上的函数, ( , , ) 1 n f x L x 在 S 上的极值问题称为 ( , , ) 1 n f x L x 对约束 条件 F1 (x1 ,L, xn ) = 0,L,Fm (x1 ,L, xn ) = 0 的条件极值. 即 P x x S = ( , , n ) Î 0 0 0 1 L 称为 ( , , ) 1 n f x L x 对约束条件 F1 (x1 ,L, xn ) = 0,L,Fm (x1 ,L, xn ) = 0 的条件极大(极小)值. 如果存在 P0 在 n R 中的一个邻域 U , 使 得 "P = (x1 ,L, xn )Î S IU , 恒 有 ( , , ) ( , , ) 0 0 1 n 1 n f x L x £ f x L x ( ( , , ) ( , , )) 0 0 1 n 1 n f x L x ³ f x L x . 例: 证明在所有周长相同的三角形中, 等边三角形面积最大. 证 明 : 设三角形三条边为 x, y, z . 周长固定时 x, y, z 并非自由变量 , 受条件 x + y + z = 2 p 的约束, 其中 p 为常数. 由面积公式知, 三角形面积为 s = p( p - x)( p - y)( p - z) . 因此我们需求 f (x, y,z) = ( p - x)( p - y)( p - z) 在条件 x + y + z = 2 p 下的最大值. 由 x + y + z = 2 p 解出 z = 2 p - x - y . 这时x, y 是自由变量, 在一个开集上变化. 代 入 f (x, y,z) , 条件极值问题化为 h(x, y) = ( p - x)( p - y)( x + y - p) 的普通极值问题. 解方程组 î í ì = - - - = = - - - = ( , ) ( )(2 2 ) 0, ( , ) ( )(2 2 ) 0 h x y p x p x y h x y p y p x y y x 得在 x > 0, y > 0 时只有一个解 x p y p 3 2 , 3 2 = = . 但由问题知, 最大值存在, 而判别点唯 一. 因此判别点只能是最大点, 得x p y p z p 3 2 , 3 2 , 3 2 = = = 时三角形面积最大. 上例中我们是通过求解约束条件的方程, 得到自由变量, 代入求极值的函数, 将条件极 值问题化为普通极值问题. 但有时直接解约束条件的方程是困难的, 但通过微分约束条件, 解出某些变量的微分用另一些变量的微分来表示, 再代入求极值函数的微分中, 从而求得其 在约束条件下的判别点
例:设光在空气和水中的速度分别为v1,V2,设光由空气射入水中时入射角为a,折射 角为β,假定光总在最短时间由一个点运动到另一点证明 SIn a sinβ 证明:如图.设P为光源,Q为光到达的点 空气 a,b为P,Q到水面的距离.设h为PQ到水面投影 点之间的距离,C是水面上任取的一个光的入射点 o\b 水 问题是c在什么位置时,光由P到Q所需时间最短 光在空气和水中总是以直线传播,因此c点确定 后,入射角a和折射角β因而确定,这时所需时间为 v, cosa v, cos B 需求t对a,B的极小值.但α,B并非独立变量,受条件 atga+ btg= h 的约束.问题化为条件极值 de 对aga+bgB=h微分,得a cos C cos2f0,因而 dB b cosB a cos a asin a da + -asin p v, COS B a sin a asin b v, cos S" B 但判别点的一阶微分为零,解得a,B满足 sin a sin B 时at=0.这时判别点是唯一的 而由问题知极小点存在,其必在判别点处达到 上面两例都是先求得判别点唯一,再根据问题性质说明极大极小值的存在性而得到极
5 例: 设光在空气和水中的速度分别为 1 2 v , v , 设光由空气射入水中时入射角为a , 折射 角为 b , 假定光总在最短时间由一个点运动到另一点. 证明 1 2 sin sin v v a b = . 证明: 如图. 设 P 为光源, Q 为光到达的点 , a,b 为 P,Q 到水面的距离. 设h 为 P,Q 到水面投影 点之间的距离, c 是水面上任取的一个光的入射点. 问题是c 在什么位置时, 光由P 到Q 所需时间最短. 光在空气和水中总是以直线传播, 因此c 点确定 后, 入射角a 和折射角 b 因而确定, 这时所需时间为 1 cosa v2 cos b b v a t = + , 需求t 对a,b 的极小值. 但a,b 并非独立变量, 受条件 atga + btgb = h 的约束. 问题化为条件极值. 对atga + btgb = h 微分, 得 0 cos cos 2 2 + = b b a a d b d a , 因而 a a b b d a b d 2 2 cos cos = - , 而 . cos cos cos sin cos sin cos sin cos sin 2 2 2 2 2 1 2 2 2 1 a a b b b a a a b b b a a a d a b v a d v a d v a d v a dt ÷ ÷ ø ö ç ç è æ - - = - + - + - = 但判别点的一阶微分为零, 解得a,b 满足 1 2 sin sin v v a b = 时dt = 0 . 这时判别点是唯一的, 而由问题知极小点存在, 其必在判别点处达到. 上面两例都是先求得判别点唯一, 再根据问题性质说明极大极小值的存在性而得到极 P a a 空气 c ß b 水 Q