第1节基本概念 设(1为定义在n维欧式空间E的某一区域R上的n元函数,其中 X=(x12x2x)。对于X'∈R,如果存在某个E≥0,使所有与 X的距离小于6的X∈R(即X∈R且x-x1<6)均满足不等式 f(x)≥f(X),则称x为f(X)在R上的局部极小点(或相对极小点), f(X)为局部极小值。若对于所有X≠X且与X的距离小于E 的X∈R,f(X)2f(X),则称X为f(X)在R上的严格局格极小点, f(x)为严格局部极小值。 若点X∈R,而对于所有X∈R都有f(X)≥f(X),则称X为fX) 在R上的全局极小点,)为全局极小值。若对于所有X∈R且 X≠X,都有f(X)>f(x),则称X为)在R上的严格全局极小点, f(x)为严格全局极小值。 清华大学出版社
第1节 基本概念 T 1 2 ( , , , ) X x x x = … n * X R 0 * X X R X R * X X − * f X f X ( ) ( ) * X f X( ) * f X( ) * X X * X X R * f X f X ( ) ( ) * X f X( ) * f X( ) 设f(X)为定义在n维欧式空间En的某一区域R上的n元函数,其中 。对于 ,如果存在某个 ,使所有与 的距离小于 的 (即 且 )均满足不等式 ,则称 为 在R上的局部极小点(或相对极小点), 为局部极小值。若对于所有 且与 的距离小于 的 , ,则称 为 在R上的严格局格极小点, 为严格局部极小值。 * X R X R * f X f X ( ) ( ) * X f X( ) * f X( ) X R * X X * f X f X ( ) ( ) * X f X( ) * f X( ) 若点 ,而对于所有 都有 ,则称 为 在R上的全局极小点, 为全局极小值。若对于所有 且 ,都有 ,则称 为 在R上的严格全局极小点, 为严格全局极小值。 清华大学出版社 11
第1节基本概念 o2.极值点存在的条件 定理1(必要条件) 设R是n维欧式空间E上的某一开集,(X)在R上有一阶连续偏导数 ,且在点X'∈R取得局部极值,则必有 f(X)可(X of(X) 0(6-10) Ox 或 Vf(X)=0(6-11) 上式中 1?,9H V)/0f(x)0( (6-12) 为函数1)在点平*处的梯度。 清华大学出版社
第1节 基本概念 2.极值点存在的条件 * X R * * * 1 2 ( ) ( ) ( ) … 0 (6 10) = = = = − n f X f X f X x x x * = − f X( ) 0 (6 11) T * * * * 1 2 ( ) ( ) ( ) ( ) , (6 12) ,? , = − n f X f X f X f X x x x 定理1 (必要条件) 设R是n维欧式空间En上的某一开集,f(X)在R上有一阶连续偏导数 ,且在点 取得局部极值,则必有 或 上式中 为函数f(X)在点X*处的梯度。 清华大学出版社 12
第1节基本概念 定理2(充分条件) 设R是m维欧式空间E上的某一开集,fX)在R上有二阶连续偏导数, X'∈R若vf(x)=0且对任何非零向量Z∈E”有 Z H(XZ>0 ⑩则平为(X)的严格局部极小点。 ⑩此处H(x*)为八在点X*处的海赛(esst矩阵: 0/Xx)/(X)….0/x2 axax H(上)of(x')a3f(x) af(X) (6-14) 82f(X)2f(X)02f(Xx") ax ax, ax, 清华大学出版社
第1节 基本概念 定理2 (充分条件) 设R是n维欧式空间En上的某一开集,f(X)在R上有二阶连续偏导数, * X R * = f X( ) 0 n Z E T * Z H X Z ( ) 0 2 * 2 * 2 * 2 1 1 2 1 2 * 2 * 2 * 2 1 2 2 2 2 * 2 * 2 * 2 1 2 ( ) ( ) ( ) ( ) ( ) ( ) ( *) (6 14) ( ) ( ) ( ) … … … − n n n n n f X f X f X x x x x x f X f X f X H X x x x x x f X f X f X x x x x x ,若 ,且对任何非零向量 有 则X*为f(X)的严格局部极小点。 此处H(X*)为f(X)在点X*处的海赛(Hesse)矩阵: 清华大学出版社 13
第1节基本概念 13凸函数和凹函数 1.什么是凸函数和四函数 设(X为定义在n维欧式空间En中的某个凸集R上的函数,若对任 何实数a(0<∝<1)以及R中的任意两点和和X2),恒有 f(aX0+(1-a)x(2)≤af(X)+(1-a)f(X2)(6-15) 则称f(X为定义在R上的凸函数。 ⑩若对任何实数a(0<a<1)和X≠X(∈R f(aX)+(1-a)x2)<af(X)+(1-a)f(X2)(6-16) 则称八(为定义在R上的严格凸函数。 清华大学出版社
第1节 基本概念 ❖ 1.3 凸函数和凹函数 1. 什么是凸函数和凹函数 设f(X) 为定义在n维欧式空间En中的某个凸集R上的函数,若对任 何实数α(0< α<1)以及R中的任意两点X(1)和X(2),恒有 (1) (2) (1) (2) f X X f X f X ( (1 ) ) ( ) (1 ) ( ) (6 15) + − + − − 则称f(X)为定义在R上的凸函数。 (1) (2) (1) (2) f X X f X f X ( (1 ) ) ( ) (1 ) ( ) (6 16) + − + − − 则称f(X)为定义在R上的严格凸函数。 若对任何实数α(0< α<1)和 (1) (2) X X R 清华大学出版社 14
第1节基本概念 凸函数和凹函数的几何意义 f(r) af(x")+(1-a)f(x2) flar+(1-a)r 可(x)+(1-a)() f[ar+(1-a)r21 x+(1-a)x ar+(1-a)ra) (a)凸函数 (b)凹函数 f(x (c)非凸、非凹函数 清华大学出版社
第1节 基本概念 凸函数和凹函数的几何意义 清华大学出版社 15