教案 无条件极值 教学内容 最大值和最小值问题大量地出现于理论研究和客观实际之中,例如,路程最 短、用料最省、产量最多、收益最大等等。而最大值或最小值问题往往通过极值 问题来解决。由于许多问题往往受到多个因素的影响和制约,因此有必要讨论多 元函数的极值问题和最值问题。本节中主要讲解以下几方面的内容 (1)多元函数极值的概念与取极值的必要条件; (2)多元函数取极值的充分条件 (3)多元函数的最值问题; (4)最小二乘法与矛盾方程组。 教学思路和要求 (1)与一元函数类似,多元函数的最值与极值有着密切联系,且最值问题 的讨论,往往先从极值问题入手,因此我们先从函数的极值问题展开。 (2)由于关于一元函数已经讨论过极值和最值问题,学生掌这些概念、方 法和计算并不困难,但教师应通过实例指出多元函数的极值和最值问题仍有其特 点与复杂性。当充分性条件失效时,对于极值问题如何处理;对最值问题如何讨 论,都是要请清楚其复杂性的。同时,还要介绍一些计算技巧。 (3)由于最小二乘法与求矛盾方程组的最小二乘解的思想和方法在实际中 应用比较广泛,因此有必要将问题的来龙去脉讲清楚,计算方法讲清楚,不能 带而过。 教学安排 多元函数的无条件极值 多元函数的极值刻画了多元函数的一个局部性质。 定义7.7.1设n元函数∫定义于开集ΩcR”上,x0∈Ω。如果存在δ>0, 使得 f(x)≥f(x0)(或f(x)≤f(x0),x∈Ox0,0), 则称x为∫的一个极小值点(或极大值点),称∫(x)为相应的极小值(或极大 值),极小值点和极大值点统称为极值点,极小值和极大值统称为极值。 例函数z=x2+2y2在(0,0)点取极小值0,这是因为在(0,0)的任何邻域中 异于(0,0)的点处,函数均取正值 例函数z=xy在(O,0)点既不取到极大值,也不取到极小值。因为在点0,0) 处函数值为0,而在该点的任一邻域内,总有使函数值为正的点,也有使函数值 为负的点。 Fermat定理指出,对于一元函数而言,如果∫在点x处可导,那末x0是∫的 极值点的必要条件是f(x0)=0。由这个结果可以直接导出多元函数极值点的 个必要条件 定理7.7.1(极值点的必要条件)设x0=(x10)…,x0)是n元函数∫的一个
1 1 2 n f n R x0 0 ( ) ( ) x x0 f f ( ) ( )) x x0 f f ( , ) x O x0 x0 f ( ) x0 f 2 2 z x 2y (0, 0) 0 (0, 0) (0, 0) z xy (0, 0) (0, 0) 0 Fermat f 0 x 0 x f f (x0 ) 0 ( , , ) (0) (0) 0 1 n x x x n f
极值点,且∫在x处各个一阶偏导数均存在,则必有 f,(x0)=0,i=12…,n 证固定除x外的其余n-1个量,考察一元函数 P, (x)=f(x 则q在点x处可导,且x是q的极值点。由 Fermat定理,即得q(x0)=0,亦 即 f(x0)=0 f的各个一阶偏导数均为0的点称为它的驻点。定理771就是说:在偏导 数存在的前提下,极值点必定是驻点。 驻点未必是极值点,例77.2就说明了这一点。 偏导数不存在的点也可能是极值点。例如f(x,y)=x|,函数z=f(x,y)所对 应的图象是一个柱面,可见在Oxy平面上整个y轴上每一个点(O,y)都是f的极 小值点,但是在这些点上∫关于x的偏导数均不存在 二.取极值的充分条件 如何判别一个驻点是否为极值点?下面的定理提供了一个充分条件 定理77.2(极值点的充分条件)设n元函数∫在x0的某邻域上具有各个 二阶连续偏导数,x0是∫的一个驻点,∫的 Hessian矩阵为 则当在点x处H正定时,x为∫的极小值点;在点x处H负定时,x是∫的 极大值点 证由于x0是∫的驻点,所以 f(x)=0,i=1,2,… 由上一节末给出的∫在x处的一阶 Taylor公式得到 f(x)-f(xo)=(Ar)H(xo +BAx)Ar 其中△x=x-x0,0<0<1 根据正定矩阵特征可知H(x)正定等价于其各阶顺序主子式均取正值,而 hessian矩阵中所有元素∫”,在x某邻域中连续,从而各阶顺序主子式也在该邻 域中连续,因此可取到δ>0,使得x∈O(x,δ)时,H(x)的各阶顺序主子式均 取正值,也就是说,此时H(x)是正定矩阵。于是当04Ax|kδ时, (△x)2H(x0+x)△x>0, 所以 f(x)-f(x0) 即x是∫的极小值点。 当H在x处负定时,-H(x0)正定,从而x是-f的极小值点,即是∫的 极大值点
2 f x0 (x0 ) 0 i x f i 1,2, ,n i x n 1 ( ) ( , , , , , , ) (0) (0) 1 (0) 1 (0) i i 1 i i i n x f x x x x x i (0) i x (0) i x i Fermat ( ) 0, (0) i xi i x f (x0 ) 0 f 0 7.7.1 7.7.2 f (x, y) | x | z f (x, y) Oxy y (0, y) f f x n f x0 x0 f f Hessian n n n n n n x x x x x x x x x x x x x x x x x x f f f f f f f f f 1 2 2 1 2 2 2 1 1 1 2 1 H x0 H x0 f x0 H x0 f x0 f (x0 ) 0 i x f i 1,2, ,n f x0 Taylor x x (x) H(x x)x 2 1 ( ) ( ) 0 0 T f f x x x0 0 1 ( ) H x0 Hessian i j x x f x0 0 ( , ) x O x0 H(x) H(x) 0 || x || (x) H(x0 x)x 0 T f (x) f (x0 ) 0 x0 f H x0 ( ) H x0 x0 f f
证毕 例求u=f(x,y,2)=x3+y2+z2+6xy+2z的极值点。 解先求出函数f的驻点,为此,解方程组 0 ay=2y+6x=0, u2=2x+2=0 即得两个驻点P6,-18,-1),Q0,0,-1)。函数∫在点(x,y,2)处的 Hessian矩阵 为 H=620 于是 3660 060 H(P)=620,H(Q)=620 因为 36>0,620=72>0 所以H(P)是正定阵,由定理772可知,P是函数f的极小值点。 容易验证H(Q并非正定阵,从而不能用定理772判断Q是否为极值点。 由直接计算可得H(Q)的三个特征值为 1=2,2=1+√37,=1-√37 当我们取Ax为H(Q相应于特征值λ的特征向量时,可得 (Ax)2H(QAx=λ(A 即(Ax)H(QAx与λ同号,再利用 Hessian矩阵中各元素的连续性可知,当特 征向量的范数Ax充分小时 f(x)-f(xo)=-(Ar)H(xo +BAr)Ax 与λ同号。注意到λ,A2>0,3<0,这样,在x的任何邻域内,既能取到x 使得∫(x)>f(xa),又能取得x,使得∫(x)<f(x0),所以x不是∫的极值点 实际应用中经常遇到二元函数的情况,我们把这个特例作为一个推论。 推论7.7.1设函数z=∫(x,y)在点(x,y)的某邻域上各二阶偏导数均连 续,(xo,y)是∫的一个驻点,记 △=f"(x,y0)f”(x0,y)-”(x0,y)2。 )当△>0时 )是∫的极值点。且当∫ 时,(x0,y)是 极小值点;当∫(xy)<0时,(x0,y)是极大值点; (2)当Δ<0时,(x0,y)不是∫的极值点
3 u f (x, y,z) x y z 6xy 2z 3 2 2 f 2 2 0, 2 6 0, 3 6 0, 2 u z u y x u x y z y x P(6, 18, 1) Q(0, 0, 1) f (x, y,z) Hessian 0 0 2 6 2 0 6x 6 0 H 0 0 2 6 2 0 36 6 0 H(P) 0 0 2 6 2 0 0 6 0 H(Q) | 36 | 0 36 0 6 2 36 6 72 0 0 0 2 6 2 0 36 6 0 H(P) 7.7.2 P f H(Q) 7.7.2 Q H(Q) 1 2 2 1 37 3 1 37 x H(Q) i x H x x x T i T ( ) (Q) ( ) x H T ( ) (Q)x i Hessian || x ||x x (x) H(x x)x 2 1 ( ) ( ) 0 0 T f f i 1 ,2 0 3 0 x0 x ( ) ( ) x x0 f f x ( ) ( ) x x0 f f x0 f z f (x, y) ( , ) 0 0 x y ( , ) 0 0 x y f 2 0 0 0 0 0 0 f (x , y ) f (x , y ) [ f (x , y )] xx yy xy 0 ( , ) 0 0 x y f f xx (x0 , y0 ) 0 ( , ) 0 0 x y f xx (x0 , y0 ) 0 ( , ) 0 0 x y 0 ( , ) 0 0 x y f
注当Δ=0时,(x0,y)是否为极值点需另行讨论。 证因为△>0且f"(x0,y0)>0等价于∫在(x0,y0)处的 Hessian阵正定;同 样,△>0且∫"(x,y0)<0等价于∫在(x,y)处的 Hessian阵负定,由此即得(1) 的结论。 又因为∫在(x0,yo)处 Hessian阵两特征值之积即△,因而当△<0时两特征 值异号,此时易知(x0,y)一定不是∫的极值点 证毕 例设a≠0,求函数f(x,y)=xy(a-x-y)的极值。 解先求出∫的驻点,即解方程组 f∫y=y(a-x-y)-xy=0 I,=x(a-x-y)-xy=0 得到四个驻点 aa (0,0),(a,0),(0,a) 33 由计算得∫”(x,y)=-2y,又 ∫"/"-f"2=(-2x)(-2y)-( =-a2-4x2-4y2+4ax+4ay 以驻点代入,得 △ 因而(0,0),(a,0)和(O,a)均非f的极值点 由于 Δ 且 因而当a>0时,f9为极大值:;当a<0时,1,日=2为极小值 例讨论函数f(x,y)=(x-2)+(x-y)4的极值。 解解方程组 f(xy)=4x-2)2+4x-y)2=0 ∫(x,y)=-4(x-y)=0 得驻点(2,2)。在该点处fx=f=fm=0,所以 0 这样,不能用定理772来判定∫在(2,2)是否取得极值 但是,由于(x,y)≠(2,2)时,必有 f(x,y)=(x-2)+(x-y)>0=f(2,2), 所以(2,2)是函数∫的极小值点 例讨论f(x,y)=x2-2xy2+y4-y3的极值
4 0 ( , ) 0 0 x y 0 f xx (x0 , y0 ) 0 f ( , ) 0 0 x y Hessian 0 f xx (x0 , y0 ) 0 f ( , ) 0 0 x y Hessian 1 f ( , ) 0 0 x y Hessian 0 ( , ) 0 0 x y f a 0 f (x, y) xy(a x y) f ( ) 0 ( ) 0, f x a x y xy f y a x y xy y x (0, 0) (a, 0) (0, a) 3 , 3 a a f x y y xx ( , ) 2 2 2 f f f ( 2x)( 2y) (a 2x 2y) xx yy xy a 4x 4y 4ax 4ay 2 2 2 | | | 0 2 (0,0) (a,0) (0,a) a (0, 0) (a, 0) (0, a) f 0 3 1 | 2 3 , 3 a a a a a a f xx 3 2 3 , 3 a 0 3 27 , 3 3 a a a f a 0 3 27 , 3 3 a a a f 4 4 f (x, y) (x 2) (x y) ( , ) 4( ) 0 ( , ) 4( 2) 4( ) 0, 3 3 3 f x y x y f x y x x y y x (2, 2) f xx f yy f xy 0 | (2,2) 0 7.7.2 f (2, 2) (x, y) (2, 2) ( , ) ( 2) ( ) 0 (2,2) 4 4 f x y x x y f (2, 2) f 2 2 4 5 f (x, y) x 2xy y y
解解方程组 0a0 4xy+4y3-5y4=0 求得驻点(00)。再计算二阶偏导数, 4x+12y2-20y 在(00)处有AC-B2=0,这时候无法用定理判定 注意到f(00)=0,以及f(x,y)=(x-y2)2-y3,那么,在曲线x=y2,y>0 上f(x,y)<0;在曲线x=y2,y<0上f(x,y)>0,因此f(00)=0不是极值(见 下图)。 函数的最值 函数的最值是指函数在某区域上的最大值或最小值。如果说函数的极值是 个局部性的概念,那么函数的最值却是一个涉及整体性质的概念 当我们考虑函数的最值时,应当把区域内部所有极值点上的函数值和在区域 边界上的函数值作比较来确定。在通常遇到的实际问题中,如果所讨论的函数在 区域内部偏导数处处存在,而根据问题性质,又能确定其最值一定在区域内部取 得,当这个函数只有一个驻点时,可以肯定这个驻点就是函数的最值点。 例有一块宽12cm的薄金属片,把它的两边折起,做成一个截面为等腰梯 形的水槽(图77.1),问怎样析方能使梯形截面的面积最大? 解设截面梯形的腰长为x,腰与底边夹角为α,于是截面积F为 F(x, a)=-[(2-2x)+(12-2x+ 2xcos a)lrsin a =12xsin a-2x-sina+x sin acos o 根据问题的实际背景 D(F={(x,a)0≤x≤6,0≤a≤m}。 先求F在区域D(F)内部的驻点。解方程组 F(, a=12sin a-4xsin a + 2xsin a cosa=0 F(, a)=12xcosa-2x cosa+x(cos a-sin a)=0 当x>0,0<α<π时,原方程可简化为 6-2x+xcosa=0 12 cosa-2xcosa+x(2cos a-1)=0
5 4 4 5 0. 2 2 0, 3 4 2 xy y y y f x y x f (0,0) 2 3 2 2 2 2 2 2, 4 , 4x 12y 20y y f y x y f x f (0,0) 0 2 AC B f (0,0) 0 2 2 5 f (x, y) (x y ) y , 0 2 x y y f (x, y) 0 , 0 2 x y y f (x, y) 0 f (0,0) 0 12cm 7.7.1 x F [(12 2 ) (12 2 2 cos)] sin 2 1 F(x, ) x x x x 12 sin 2 sin sincos 2 2 x x x D(F) {(x,)| 0 x 6, 0 } F D(F) ( , ) 12 cos 2 cos (cos sin ) 0. ( , ) 12sin 4 sin 2 sin cos 0, 2 2 2 2 F x x x x F x x x x x 0 0 12 cos 2 cos (2cos 1) 0. 6 2 cos 0, 2 x x x x y , 0 2 x y y O x , 0 2 x y y