b+∑x 方程组(15)式称为正规方程组。如果引入以下矩阵: 2k A=XX=XI X22 X32 X 4s/ 42 Y b= b2
nb x b x b x b y x b x b x x b x x a a n a a n ak a n k a a n a a n a a n a a a n a a a n 0 1 1 1 2 1 1 1 1 0 1 2 1 1 1 2 1 2 1 2 1 2 + æ è ç ö ø ÷ + æ è ç ö ø ÷ + + æ è ç ö ø ÷ = æ è ç ö ø ÷ + æ è ç ö ø ÷ + æ è ç ö ø ÷ + + æ è ç ö = = = = = = = = å å å å å å å å … … ø ÷ = æ è ç ö ø ÷ æ è ç ö ø ÷ + æ è ç ö ø ÷ + + + æ è ç ö ø ÷ = æ è ç ö ø ÷ + = = = = = = = å å å å å å å å b x y x b x x b x b x x b x y x b x x k a a a n a a n a a a n a a ak a n k a a a n a n a n a a a n k k 1 2 1 0 1 2 1 1 2 2 2 1 1 2 1 1 0 1 ( ) … ………………………………………………………………………… æ è ç ö ø ÷ + æ è ç ö ø ÷ + + æ è ç ö ø ÷ = ì í ï ï ï ï ï ï ï î ï ï ï ï ï ï ï = = = b åxa xa b å b åx y a n a a n k a a a n 1 k k k 1 2 2 1 1 2 15 … ( ) 方程组(15)式称为正规方程组。如果引入以下矩阵: X x x x x x x x x x x x x k k k n nk = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ 1 1 1 1 11 12 1 21 22 2 31 32 3 1 2 … … … ………………………… … A X X x x x x x x x x x x x x x x x x x x x x x x x x T n n k k k nk k k k n n nk = = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ 1 1 1 1 1 1 1 1 11 21 31 1 12 22 32 2 1 2 3 11 12 1 21 22 2 31 32 3 1 2 … … … …………………………… … · … … … ………………………… … = = = = = = = = = = = = = = = å å å å å å å å å å å å å n x x x x x x x x x x x x x x x x x x x x a a a a n a n a n a a a n a an a n a ak a n a n a a n a a a n a a n a ak A N ak a n a ak a n a ak a k 2 1 1 1 1 2 1 1 2 1 1 1 1 1 2 1 2 2 1 2 1 1 1 2 2 2 1 1 … … … ………………………………………………… 1 2 1 n ak a n å åx = æ è ç ç ç ç ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ … ÷ Y y y y b b b b b n n = æ è ç ç ç ç ö ø ÷ ÷ ÷ ÷ = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ 1 2 0 1 2 … …
Ya 21 maya y Xa2y X M k X 则正规方程组(15)式可以进一步写成矩阵形式 Ab=B (15′) 求解(15′)式可得 b=A-B=(Xx-XY (16) 如果引入记号 )( j) j=1, (xa: -Xi(y-y) xay ya( 则正规方程组也可以写成 Lub,+Lmb2+ kb =l Li, b,+lib y-b,xI-b 例如,在1981—-1990年期间,某地区各城市的公共交通营运总额(y) 与城市人口总数(x1)以及工农业总产值(x2)的年平均统计数据如表2-7所 示。试建立y与x1及ⅹ2之间的线性回归模型。 表2一7某地区城市公共交通营运额、人口数及 工农业总产值的年平均数据
B X Y x x x x x x x x x x x x y y y y y x y x y x y T n n k k k nk n a a n a a a n a a a n ak a a n = = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ = æ è ç ç ç ç ç ç = = = = å å å å 1 1 1 1 11 21 31 1 12 22 32 2 1 2 3 1 2 3 1 1 2 1 1 … … … …………………………… … M M ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ 则正规方程组(15)式可以进一步写成矩阵形式 Ab=B (15′) 求解(15′)式可得 b=A-1B=(X T X)-1X T Y (16) 如果引入记号 L L x x x x x x n x x i j k ij ji a i a n ij j a aj a a n aj a n a n i i i = = - - = - æ è ç ö ø ÷ æ è ç ö ø ÷ = = = = = å å å å ( )( ) ( , , , , ) 1 1 1 1 1 1 2 … L x x y y x y n x y i k iy ai i a a n a a a a n a a n a n i i = - - = - æ è ç ö ø ÷ æ è ç ö ø ÷ = = = = = å å å å ( )( ) ( , , , ) 1 1 1 1 1 1 2 … 则正规方程组也可以写成 L b L b L b L L b L b L b L L b L b L b L b y b x b x b x b x k k y k k y k k kk k ky k k 11 1 12 2 1 1 21 1 22 2 2 2 1 1 2 2 0 1 1 1 1 2 2 15 + + = + + = + + = = - - - - ì í ï ï ï î ï ï ï … … ……………………………… … … ( ″) 例如,在 1981—1990 年期间,某地区各城市的公共交通营运总额(y) 与城市人口总数(x1)以及工农业总产值(x2)的年平均统计数据如表 2-7 所 示。试建立 y 与 x1及 x2之间的线性回归模型。 表 2-7 某地区城市公共交通营运额、人口数及 工农业总产值的年平均数据
城市序号公共交通营运额(y) 人口数(x1) 工农业总产值(x2) (千人公里) (千人) (千万元) 6825.99 1298.00 437.26 512.00 119.80 1283.48 1902.00 344.28 1128.33 146.00 235.56 600.58 37.00 76.72 65.26 17.81 441.26 187.00 15.92 23.98 10 1065.00 345.08 371.98 11 107 6.70 324.40 173.00 28.00 262.11 14 192.00 12.47 1072.27 据表2-7中的数据,我们有 X11X1 l11980128348 1344.281128.33 MM 1508.16 682500 y =190200 M 19200 经过计算可得 0363 故y与x1及x2之间的线性回归方程为 172.2415+5.1075x,+0.3636y (17) (二)多元线性回归模型的显著性检验 与一元线性回归模型一样,当多元线性回归模型建立以后,也需要进行 显著性检验 与前面的一元线性回归分析一样,因变量y的观测值y,y2,…yn之间
城市序号 公共交通营运额(y) (千人公里) 人口数(x1 ) (千人) 工农业总产值(x2 ) (千万元) 1 6825.99 1298.00 437.26 2 512.00 119.80 1283.48 3 1902.00 344.28 1128.33 4 146.00 235.56 600.58 5 2824.00 163.79 783.15 6 37.00 76.72 65.26 7 52.00 17.81 441.26 8 56.00 30.66 242.33 9 187.00 15.92 23.98 10 1065.00 345.08 371.98 11 107.00 6.70 324.40 12 173.00 28.00 262.11 13 771.00 75.00 1508.16 14 192.00 12.47 1072.27 据表 2-7 中的数据,我们有 X x x x x x x x x = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ 1 1 1 1 1 1298 00 437 26 1 119 80 128348 1 344 28 1128 33 1 12 47 150816 11 12 21 22 31 32 14 1 14 2 M M M M M M , . . . . . . . . , Y y y y y = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ = æ è ç ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ ÷ 1 2 3 14 6825 00 512 00 1902 00 192 00 M M . . . . 经过计算可得 b b b b X X X Y T T = æ è ç ç ç ö ø ÷ ÷ ÷ = = æ- è ç ç ç ö ø ÷ ÷ ÷ - 0 1 2 1 172 2415 51075 0 3636 ( ) . . . 故 y 与 x1及 x2之间的线性回归方程为 y = -172.241 5+ 5.107 5x1 + 0.363 6x2 17 Ù ( ) (二)多元线性回归模型的显著性检验 与一元线性回归模型一样,当多元线性回归模型建立以后,也需要进行 显著性检验。 与前面的一元线性回归分析一样,因变量 y 的观测值 y1,y2,…yn之间
的波动或差异,是由两个因素引起的,一是由于自变量x1,x2,…,x的取 值不同,另一是受其它随机因素的影响而引起的。为了从y的总变差中把它 们区分开来,就需要对回归模型进行方差分析,也就是将y的总的离差平方 和S总(或L)分解成两个部分,即回归平方和U和剩余平方和Q: 总+Ly=U+Q 在多元线性回归分析中,回归平方和表示的是所有k个自变量对y的变差的 总影响,它可以按公式 计算,而剩余平方和为 以上几个公式与一元线性回归分析中的有关公式完全相似。它们所代表 的意义也相似,即回归平方和越大,则剩余平方和Q就越小,回归模型的效 果就越好。不过,在多元线性回归分析中,各平方和的自由度略有不同,回 归平方和U的自由度等于自变量的个数K,而剩余平方和的自由度等于n-K 1,所以F统计量为 U/K F Q/(mn-K-1) 当统计量F计算出来之后,就可以查F分布表对模型进行显著性检验。 在上例中,计算可得 ∑(ya-y)2=442104853 U=b,L,+b,L,=39030046.11 Q=S-U=5491002.42 故 U/K U/239030046.11/2 F=Q/-K-1) Q/1541900242/11=39094 在置信水平a=0.01下查F分布表知:Fo1(2,11)=7.21。由于F=39.094 >F0.01(2,11)=721,所以在置信水平a=0.01下,回归方程(17)式是显著 的。 非线性回归模型的建立方法 在复杂地理系统中,除了线性关系以外,要素之间的非线性关系也是大 量存在的。因此,对非线性回归分析,也有必要作一些介绍。 (一)非线性关系的线性化 前面已经讨论了线性回归模型的建立方法。在复杂地理系统研究中,对 于要素之间的非线性关系,若能找到某种途径将其转化为线性关系,则我们 就可以借助于线性回归模型的建立方法,建立要素之间的非线性回归模型。 事实上,这是可以办得到的,只要根据要素之间的关系设定新的变量,通过 变量替换就可以将原来的非线性关系转化为新变量下的线性关系。譬如: (1)对于指数曲线y=dex,令y′=lny,x′=x,就可以将其转化为直线 形式:y′=a+bx′,其中,a=lnd;
的波动或差异,是由两个因素引起的,一是由于自变量 x1,x2,…,xk的取 值不同,另一是受其它随机因素的影响而引起的。为了从 y 的总变差中把它 们区分开来,就需要对回归模型进行方差分析,也就是将 y 的总的离差平方 和 S 总(或 Lyy)分解成两个部分,即回归平方和 U 和剩余平方和 Q: S 总=Lyy=U+Q 在多元线性回归分析中,回归平方和表示的是所有 k 个自变量对 y 的变差的 总影响,它可以按公式 U y y b L a n i iy i k = - = Ù = = å( ) å 2 1 1 计算,而剩余平方和为 Q ya ya L U a n = - = yy - Ù = å( ) 1 2 以上几个公式与一元线性回归分析中的有关公式完全相似。它们所代表 的意义也相似,即回归平方和越大,则剩余平方和 Q 就越小,回归模型的效 果就越好。不过,在多元线性回归分析中,各平方和的自由度略有不同,回 归平方和 U 的自由度等于自变量的个数 K,而剩余平方和的自由度等于 n-K- 1,所以 F 统计量为 F U K Q n K = - - / / ( ) ( ) 1 18 当统计量 F 计算出来之后,就可以查 F 分布表对模型进行显著性检验。 在上例中,计算可得 S = Lyy = a=1 14 总 (y y) . å a - = 2 44521048 53 U=b1L1y+b2L2y=39030046.11 Q=S 总-U=5491002.42 故 F = U / K Q / (n - K -1) = U / 2 Q / 11 = 39030046.11/ 2 5419002.42 / 11 = 39.094 在置信水平 a=0.01 下查 F 分布表知:F0.01(2,11)=7.21。由于 F=39.094 >F0.01(2,11)=7.21,所以在置信水平 a=0.01 下,回归方程(17)式是显著 的。 三、非线性回归模型的建立方法 在复杂地理系统中,除了线性关系以外,要素之间的非线性关系也是大 量存在的。因此,对非线性回归分析,也有必要作一些介绍。 (一)非线性关系的线性化 前面已经讨论了线性回归模型的建立方法。在复杂地理系统研究中,对 于要素之间的非线性关系,若能找到某种途径将其转化为线性关系,则我们 就可以借助于线性回归模型的建立方法,建立要素之间的非线性回归模型。 事实上,这是可以办得到的,只要根据要素之间的关系设定新的变量,通过 变量替换就可以将原来的非线性关系转化为新变量下的线性关系。譬如: (1)对于指数曲线 y=debx,令 y′=lny,x′=x,就可以将其转化为直线 形式:y′=a+bx′,其中,a=lnd;
(2)对于对数曲线y=a+blnx,令y′=y,x'′=nx,就可以将其转化为直 线形式:y′=a+bx (3)对于幂函数曲线y=dx,令y′=lny,x'=x,就可以将其转化为直 线形式:y′=a+bx′,其中,a=lnd (4)对于双曲线一=a+-,令 就可以将其转化为 直线形式:y=a+bx (5)对于S型曲线y= a+be 令yxL,x′=e,就可以将其转化 为直线形式:y′=a+bx (6)对于幂函数乘积: 只要令y′=lny,x1=mnxl,x2=lnx2,…,x=lnx,就 可以将其转化为直线形式 B。+ 上式中,β。=|nd (7)对于对数函数和:y=β0+β1nx1+β2nx2+…+ B,lnx 只要令y’=y,x1=lnx1,x2=lnx2,…,x=lnxk,就可 以将其化为线性形式 以上这种将非线性函数关系转化为线性关系的过程称为非线性关系的线 性处理。不过,需要强调指出的是,这种转化过程并不能保证函数关系中变 量个数不变。譬如,对于两变量的多项式 y=B+B1x+β2x2+…+Bx 若令x1=x,x2=x2,…,x=x2,y′=y,则它就被转化为多变量 的线性模型: y=βo+β1x1+β2x2+…+Bxk (二)非线性回归模型建立的实例 通过上述分析,我们可以得到建立非线性回归模型的一般方法:首先通 过适当的变量替换将非线性关系线性化,然后再用线性回归分析方法建立新 变量下的线性回归模型,通过新变量之间的线性相关关系反映原来变量之间 的非线性相关关系。下面,我们结合实例,说明非线性地理回归模型的建立 过程。 例如,黄土高原某地区1984-1990年期间,小麦亩产量(y)与化肥使用 量(x1),以及农家肥(干纯粪)使用量(x2)的数据如表2-8所示。试建立y 与x1及ⅹ2之间的相关关系模型。 表2-8某地区小麦亩产量与化肥、农家肥使用量(千克/亩)
(2)对于对数曲线 y=a+blnx,令 y′=y,x′=lnx,就可以将其转化为直 线形式:y′=a+bx′; (3)对于幂函数曲线 y=dxb,令 y′=lny,x′=x,就可以将其转化为直 线形式:y′=a+bx′,其中,a=lnd; (4)对于双曲线 = a + ,令 ′ , ′ ,就可以将其转化为 b x y = 1 y x = 1 x 1 y 直线形式:y′=a+bx′; (5)对于S型曲线y = ,令 ′ , ′ ,就可以将其转化 1 a + be y = 1 y x = e -x -x 为直线形式:y′=a+bx′; (6)对于幂函数乘积: y = dx x x 1 1 2 2 k β · β …, βk 只要令y′ = lny,x1 ′ = lnx1,x2 ′ = lnx2,…,x ′ k = lnxk,就 可以将其转化为直线形式: y′ = β0 + β1 x1 + β2 x + … + βk xk ′ ′ ′ 上式中,β0=lnd; (7)对于对数函数和:y=β0+β1lnx1+β2lnx2+…+βklnxk 只要令y′ = y,x1 ′ = lnx1,x2 ′ = lnx 2,…,x ′ k = lnx k,就可 以将其化为线性形式: y = + x + x + + x ′ β0 β1 1 β2 2 … βk k ′ ′ ′ 以上这种将非线性函数关系转化为线性关系的过程称为非线性关系的线 性处理。不过,需要强调指出的是,这种转化过程并不能保证函数关系中变 量个数不变。譬如,对于两变量的多项式 y=β0+β1x+β2x 2 +…+βkx k 若令x1 ′ = x,x ′ 2 = x 2,…,x ′ k = x k,y′ = y,则它就被转化为多变量 的线性模型: y = + x + x + + x ′ β0 β1 1 β2 2 … βk k ′ ′ ′ (二)非线性回归模型建立的实例 通过上述分析,我们可以得到建立非线性回归模型的一般方法:首先通 过适当的变量替换将非线性关系线性化,然后再用线性回归分析方法建立新 变量下的线性回归模型,通过新变量之间的线性相关关系反映原来变量之间 的非线性相关关系。下面,我们结合实例,说明非线性地理回归模型的建立 过程。 例如,黄土高原某地区 1984—1990 年期间,小麦亩产量(y)与化肥使用 量(x1),以及农家肥(干纯粪)使用量(x2)的数据如表 2-8 所示。试建立 y 与 x1及 x2之间的相关关系模型。 表 2-8 某地区小麦亩产量与化肥、农家肥使用量(千克/亩)