第四章平方逼近 教学目的及要求: 掌握最小二乘法、初步掌握平方逼近及直交多项式、平方度量意义下函数的逼近 问题。 本书第二章是用数量 lp-f=maxp(x)-f(x) 来度量逼近多项式p(x)与已知函数f(x)的近似程度。若 pn(x)-f(x)→>0,n→>则意味着序列{pn(x)在区间[ab]上一致收敛到f(x)。 致逼近度量,亦称 Tchebyshev度量是很重要的一类度量标准。然而由于它的 非线性特性,使得最佳一致逼近多项式的构造问题十分困难。 对于许多问题来讲,人们需要求出的是在确定意义下的“整体”近似。本章 讨论一类新的度量-平方度量意义下函数的逼近问题。先从最小二乘法谈起。 §1.最小二乘法 最小二乘法起源于以测量和观测为基础的天文学。Gaus在1794年利用最小 乘法解决了多余观测问题,当时他只有十七岁。可以用下面的简单例子描述这 类问题 假定通过观测或实验得到如下一组数据(即列表函数): k 2 4 5 6 0 2 5 7 14 13 41.11.3 18 623
第四章 平方逼近 教学目的及要求: 掌握最小二乘法、初步掌握平方逼近及直交多项式、平方度量意义下函数的逼近 问题。 本书第二章是用数量 p f max p(x) f (x) a x b − = − 来 度 量 逼 近 多 项 式 p(x) 与已知函数 f (x) 的 近 似 程 度 。 若 p (x) − f (x) → 0,n → , n 则意味着序列 pn (x) 在区间 [a,b] 上一致收敛到 f (x) 。 一致逼近度量,亦称 Tchebyshev 度量是很重要的一类度量标准。然而由于它的 非线性特性,使得最佳一致逼近多项式的构造问题十分困难。 对于许多问题来讲,人们需要求出的是在确定意义下的“整体”近似。本章 讨论一类新的度量----平方度量意义下函数的逼近问题。先从最小二乘法谈起。 §1. 最小二乘法 最小二乘法起源于以测量和观测为基础的天文学。Gauss 在 1794 年利用最小 二乘法解决了多余观测问题,当时他只有十七岁。可以用下面的简单例子描述这 类问题。 假定通过观测或实验得到如下一组数据(即列表函数): k 1 2 3 4 5 6 7 8 k x 0 1 2 3 4 5 6 7 k y 1.4 1.3 1.4 1.1 1.3 1.8 1.6 2.3
我们的目的是一简单的式子表出这些数据间的关系。从分析数据看出,这些点差 不多分布在一条直线上,因此我们自然想到用线性式y=ax+b表示它们之间的 关系。这就须定出参数a和b的值来。这实际上是多余观测问题,用插值法不能 确定出a和b的值。代定参数的确定归结为矛盾方程组的求解问题。 假定有某方法可以定出a和b,则按y=a+bx,给出一个x便可以算出一个 我们记 a+bx y称为y的估计值,显然它们不会是完全相同的,它们之间的差(通常称为残 差 6k=yk-yk(k=1…8) 无疑是衡量被确定的参数a和b(也就是近似多项式y=ax+b)好坏的重要标志。 可以规定许多原则来确定参数a,b。例如 (1)参数的确定,将使残差绝对值中最大的一个达到最小,即 max|A为最小 (2)参数的确定,将使残差绝对值之和达到最小,即∑|为最小; (3)参数的确定,将使残差的平方和达到最小,即∑62为最小 (1)和(2)两个原则是很直观的,也很理想,但很不好用;而原则(3) 既直观又很好用。按原则(3)确定待定参数,从而得到近似多项式的方法,就 是通常所说的最小二乘法。这一方法的理论根据是,概率理论已证明,只有这样 的原则才能使得观测或实验的偶然误差对于所作的近似多项式有最小的影响。 回到所提出的问题上来,即用最小二乘法确定参数ab。按最小二乘法,应 使
我们的目的是一简单的式子表出这些数据间的关系。从分析数据看出,这些点差 不多分布在一条直线上,因此我们自然想到用线性式 y = ax + b 表示它们之间的 关系。这就须定出参数 a 和 b 的值来。这实际上是多余观测问题,用插值法不能 确定出 a 和 b 的值。代定参数的确定归结为矛盾方程组的求解问题。 假定有某方法可以定出 a 和 b ,则按 y = a + bx ,给出一个 x 便可以算出一个 y 。我们记 y = a + bx (k =1, ,8). k k y 称为 k y 的估计值,显然它们不会是完全相同的,它们之间的差(通常称为残 差) = y − y (k =1, ,8) k k k 无疑是衡量被确定的参数 a 和 b (也就是近似多项式 y = ax + b )好坏的重要标志。 可以规定许多原则来确定参数 a,b 。例如 (1) 参数的确定,将使残差绝对值中最大的一个达到最小,即 k k T = max 为最小; (2) 参数的确定,将使残差绝对值之和达到最小,即 k k 为最小; (3) 参数的确定,将使残差的平方和达到最小,即 2 k 为最小。 (1) 和(2)两个原则是很直观的,也很理想,但很不好用;而原则(3) 既直观又很好用。按原则(3)确定待定参数,从而得到近似多项式的方法,就 是通常所说的最小二乘法。这一方法的理论根据是,概率理论已证明,只有这样 的原则才能使得观测或实验的偶然误差对于所作的近似多项式有最小的影响。 回到所提出的问题上来,即用最小二乘法确定参数 a,b 。按最小二乘法,应 使
S(a,b)=∑(y-(a+b) 取最小值。因此,应有 =2∑(y1-(a+b)=0 =2∑(y2-(a+b,)x1=0 由此,得到如下线性方程组 p+b∑x=∑y 经过简单计算,这个方程组成为 8a+28b=122 28a+140b=47.3 解之可得a=1.142b=0.110,从而得近似多项式p1(x)=1.142+0110x 现在转入讨论更为一般的情形。设已知列表函数y=f(x,)=0,1,…,m),并且 我们想用一个通常的n(<m)次多项式 Pn(x)=a0+a1x+…+an 去近似它。问题是应该如何选择a,1,…an使pn(x)能较好地近似列表函数 ∫(x)。按最小二乘法,应该选择aoa1…,an使得 S(aa1…,an)=∑(f(x)-P2(x) 取最小。注意到S是非负的,且是a02a1…an的2次多项式,它必有最小值。 求S对a0,a1…,an的偏导数,并令其等于零,得到
= = − + s i i a bi S a b y 1 2 ( , ) ( ( )) 取最小值。因此,应有 2 ( ( )) 0. 2 ( ( )) 0, 8 1 8 1 = − + = = − + = = = i i i i i i i y a b x b S y a b a S 由此,得到如下线性方程组: . , 8 1 8 1 2 8 1 8 1 8 1 8 1 0 = = = = = = + = + = i i i i i i i i i i i i a x b x x y a i b x y 经过简单计算,这个方程组成为 + = + = 28 140 47.3 . 8 28 12.2 , a b a b 解之可得 a = 1.142,b = 0.110, 从而得近似多项式 ( ) 1.142 0.110 . 1 p x = + x 现在转入讨论更为一般的情形。设已知列表函数 y f (x )(i 0,1, ,m), i = i = 并且 我们想用一个通常的 n( m) 次多项式 n n n p x = a + a x ++ a x 0 1 ( ) (1.1) 去近似它。问题是应该如何选择 a a an , , , 0 1 使 p (x) n 能较好地近似列表函数 f (x) 。按最小二乘法,应该选择 a a an , , , 0 1 使得 = = − m i n i n i S a a a f x p x 0 2 0 1 ( , ,, ) ( ( ) ( )) 取最小。注意到 S 是非负的,且是 a a an , , , 0 1 的 2 次多项式,它必有最小值。 求 S 对 a a an , , , 0 1 的偏导数,并令其等于零,得到
anx;"x1=0(k=0…,n) 进一步,可以将它们写成 k+n y x. +a (k=0,1,…,n) 引进记号 =∑x和l4=∑yx 则上述方程组为 So do t Sn+a (1.3) 它的系数行列式是 由s(i=0,1…2n)的定义及行列式性质,可以断言 x=(7+D2u 此处符号W表 Vandermonde行列式,而∑是对所有可能的5(=01…m)求和 (每个5可以取值x,x1,…,xm并且当≠j时5≠5)。 由(1.4)式及 Vandermonde行列式的性质可知,当x,x1,…,xm互异时
( ) 0 ( 0,1, , ). 0 y a0 a1 x a x x k n k i m i n i − − i −− n i = = = 进一步,可以将它们写成 ( 0,1, , ). 0 0 1 1 0 0 0 y x a x a x a x k n m i k n n i m i k i m i k i m i k i i = + ++ = = + = + = = 引进记号 = = m i k k i s x 0 和 , 0 = = m i k k i i u y x 则上述方程组为 + + + = + + + = + + + = + + . , , 0 1 1 2 1 0 2 1 1 1 0 0 1 1 0 n n n n n n n n n s a s a s a u s a s a s a u s a s a s a u (1.3) 它的系数行列式是 . 1 2 1 2 1 0 1 1 n n n n n n s s s s s s s s s X + + + = 由 s (i 0,1, ,2n) i = 的定义及行列式性质,可以断言 ( ( , , , )) . ( 1)! 1 2 1 0 1 + n+ = W n n X (1.4) 此处符号 W 表 Vandermonde 行列式,而 是对所有可能的 (i 0,1, ,n) i = 求和 (每个 i 可以取值 , , , , 0 1 m x x x 并且当 i j 时 i j )。 由(1.4)式及 Vandermonde 行列式的性质可知,当 m x , x , , x 0 1 互异时
W(50,51,…,n) ≠ 从而,Xn1≠0(>0)方程组(1.3)有唯一解a,a,…,an,且它们使(12)取 极小值如此,我们应用最小二乘法找到了f(x)的近似多项式pn(x) 在利用最小二乘法组成和式(2)时,所有点x都起到了同样的作用,但是 有时依据某种理由认为∑中的某些项的作用大些,而另外一些作用小些(例如, 些y是由精度较高的仪器或操作上比较熟练的人员获得的,自然应该予以较 大的信任),这在数学上表现为用和 ∑(x)-p(x) 替代和(1.2)取最小值p>0,且∑P=1,p通常称之为权;而(.5)为加权和 例1设已知函数f(x)的表列值为 0.2 0.5 0.7 0.85 1.221 1.649 2.014 2.340 2.718 试按最小二乘法构造f(x)的二次近似多项式 解经过简单计算可得关于参数a0,a1和a2的方程组(参阅下面的第一个 表): 5a0+3.250a1+2.503a2=9942 3.250a0+2.503a1+2090a2=7.185 2.503a0+2.090a1+1.826a2=5857 解之,得a2=0.928,a1=0.751,a0=1.036故 p2x)=0.928x2+0.751x+1036
0. 1 1 1 ( , , , ) 0 1 2 2 1 2 0 0 1 0 1 = n n n n n n W n 从而, 0( 0), Xn+1 方程组 (1.3) 有唯一解 , , , , a0 a1 an 且它们使 (1.2) 取 极小值.如此,我们应用最小二乘法找到了 f (x) 的近似多项式 p (x) n . 在利用最小二乘法组成和式 (1.2) 时,所有点 i x 都起到了同样的作用,但是 有时依据某种理由认为 中的某些项的作用大些,而另外一些作用小些(例如, 一些 i y 是由精度较高的仪器或操作上比较熟练的人员获得的,自然应该予以较 大的信任),这在数学上表现为用和 ( ( ) ( )) = − m i i i n i f x p x 0 2 替代和 (1.2) 取最小值. 0, i 且 1, 1 = = n i i i 通常称之为权;而 (1.5) 为加权和. 例 1 设已知函数 f (x) 的表列值为 x 0.2 0.5 0.7 0.85 1 y 1.221 1.649 2.014 2.340 2.718 试按最小二乘法构造 f (x) 的二次近似多项式. 解 经过简单计算可得关于参数 a0 , a1 和 a2 的方程组(参阅下面的第一个 表): 5 a0 +3.250 a1 +2.503 a2 =9.942 3.250 a0 +2.503 a1 +2.090 a2 =7.185 2.503 a0 +2.090 a1 +1.826 a2 =5.857 解之,得 a2 =0.928, a1 =0.751, a0 =1.036.故 p (x) 2 =0.928 2 x +0.751 x +1.036