模型的基本假设,以及所依据的理论,将要解决的问题等都将直接或间接地 体现在模型之中;⑥能用于建模的有关数据、资料是什么?其可靠性如何? 应采用什么样的建模技术?有现成的技术方法可供借鉴还是需要建造新模 型?采用什么方法确定模型的参数?⑦所建模型的精度,以及该模型的合理 性和有效性如何?采用什么方法和手段检验所建模型?威氏的这些见解道出 了建造地理数学模型所必须注意的各个环节,同时也为我们提供了一个一般 性的建模程序。 (3)与GS相结合的问题。地理信息系统(GS),是本世纪70年代后期 发展起来的,对地理数据进行采集、输入、存储、更新、检索、管理及综合 分析与输出的计算机应用技术。它是以计算机为工具,综合利用定位观测数 据、统计调查数据、地图数据、遥感数据等,通过一系列空间操作与分析, 对地理学进行综合研究的现代化手段。数学方法,只有与GS技术相结合, 才能不断地提高其应用层次与水平,不断地拓宽其应用领域,充分发挥它在 现代地理学研究中的作用。一方面,从数学方法的角度来看,对于一些复杂 地理问题的研究,采用任何单一的数学方法和单个数学模型都是很难奏效 的。解决这类问题,需要综合运用多种数学方法,建立一系列具有分析、模 拟、仿真、预测、规划、决策、调控等各种功能的众多模型组成的模型系统 才能完成。然而,这种模型系统的运行,不但需要大量地理数据构成的数据 库的支持,还需要强有力的计算方法与计算机程序的支持,而且由模型系统 运行所得到的研究结论也需要以简明扼要的形式—地图、统计图形或表格 方式被输出。显然,对于模型系统的这些支持,必须由GIS技术才能完成。 另一方面,从G|S的角度来看,它不仅需要运用数学方法为其建造空间分析 模型,如数字地形模型(υTM、空间统计分析模型、叠加(0 ver lay)分析模 型、缓冲( Buffer)区分析模型等,以及其它应用分析模型,如综合评价模型 预测模型、规划模型、决策分析模型等;而且就连GS中的一些基本技术, 如空间数据的编码、数据格式的转换算法、遥感数据的几何校正、数据模型 与数据库的建造等都需要借助有关的数学方法来实现。近几年来所出现的 种针对一些特定的领域的面向应用对象的、高层次的智能化的地理信息系统 地理决策支持系统,就是数学方法、人工智能技术与G|S技术在应用地 理学研究领域中相互结合的成功典范
模型的基本假设,以及所依据的理论,将要解决的问题等都将直接或间接地 体现在模型之中;⑥能用于建模的有关数据、资料是什么?其可靠性如何? 应采用什么样的建模技术?有现成的技术方法可供借鉴还是需要建造新模 型?采用什么方法确定模型的参数?⑦所建模型的精度,以及该模型的合理 性和有效性如何?采用什么方法和手段检验所建模型?威氏的这些见解道出 了建造地理数学模型所必须注意的各个环节,同时也为我们提供了一个一般 性的建模程序。 (3)与 GIS 相结合的问题。地理信息系统(GIS),是本世纪 70 年代后期 发展起来的,对地理数据进行采集、输入、存储、更新、检索、管理及综合 分析与输出的计算机应用技术。它是以计算机为工具,综合利用定位观测数 据、统计调查数据、地图数据、遥感数据等,通过一系列空间操作与分析, 对地理学进行综合研究的现代化手段。数学方法,只有与 GIS 技术相结合, 才能不断地提高其应用层次与水平,不断地拓宽其应用领域,充分发挥它在 现代地理学研究中的作用。一方面,从数学方法的角度来看,对于一些复杂 地理问题的研究,采用任何单一的数学方法和单个数学模型都是很难奏效 的。解决这类问题,需要综合运用多种数学方法,建立一系列具有分析、模 拟、仿真、预测、规划、决策、调控等各种功能的众多模型组成的模型系统 才能完成。然而,这种模型系统的运行,不但需要大量地理数据构成的数据 库的支持,还需要强有力的计算方法与计算机程序的支持,而且由模型系统 运行所得到的研究结论也需要以简明扼要的形式——地图、统计图形或表格 方式被输出。显然,对于模型系统的这些支持,必须由 GIS 技术才能完成。 另一方面,从 GIS 的角度来看,它不仅需要运用数学方法为其建造空间分析 模型,如数字地形模型(DTM)、空间统计分析模型、叠加(Overlay)分析模 型、缓冲(Buffer)区分析模型等,以及其它应用分析模型,如综合评价模型、 预测模型、规划模型、决策分析模型等;而且就连 GIS 中的一些基本技术, 如空间数据的编码、数据格式的转换算法、遥感数据的几何校正、数据模型 与数据库的建造等都需要借助有关的数学方法来实现。近几年来所出现的一 种针对一些特定的领域的面向应用对象的、高层次的智能化的地理信息系统 ——地理决策支持系统,就是数学方法、人工智能技术与 GIS 技术在应用地 理学研究领域中相互结合的成功典范
第二章统计分析方法 地理系统,是由多种要素相复合而构成的复杂巨系统。在这个系统中, -方面,各种要素之间存在着相互联系、相互影响和相互制约的关系;另 方面,各种要素的复合作用又使各种地理事物和地理现象表现出强烈的地域 差异性。为了定量地揭示各种地理要素之间的相互关系,以及各种地理事物 和地理现象所表现出来的地域分异规律,就必须采用以概率论和数量统计知 识为基础的统计分析方法对地理系统进行深入的研究。本章,我们将介绍和 探讨统计相关分析、回归分析、系统聚类分析、主成分分析、马尔可夫预测 等统计分析方法在地理系统分析中的应用问题。 第一节地理要素间的相关分析 地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切 程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数 的计算与检验来完成的。一、两要素间相关程度的测定 (一)相关系数的计算与检验 1.相关系数的计算 对于两个要素x与y,如果它们的样本值分别为x;和y;(i=1,2,…, n),则它们之间的相关系数被定义为: ∑(x1-x)y;-y 在(1)式中,x和y分别表示两个要素样本值的平均值,即x=∑x, y;r为要素x与y之间的相关系数,它就是表示该两要素之间相 关程度的统计指标,其值在[-1,1]区间之内。rxy>0,表示正相关,即两 要素同向发展;rx<0,表示负相关,即两要素异向发展。r的绝对值越接 近于1,表示两要素的关系越密切;越接近于0,表示两要素的关系越不密切。 如果记 L。=∑(x-xy-y)=∑x-∑x∑y ∑(y-y)2=∑y 则公式(1)式可以进一步简化为
第二章 统计分析方法 地理系统,是由多种要素相复合而构成的复杂巨系统。在这个系统中, 一方面,各种要素之间存在着相互联系、相互影响和相互制约的关系;另一 方面,各种要素的复合作用又使各种地理事物和地理现象表现出强烈的地域 差异性。为了定量地揭示各种地理要素之间的相互关系,以及各种地理事物 和地理现象所表现出来的地域分异规律,就必须采用以概率论和数量统计知 识为基础的统计分析方法对地理系统进行深入的研究。本章,我们将介绍和 探讨统计相关分析、回归分析、系统聚类分析、主成分分析、马尔可夫预测 等统计分析方法在地理系统分析中的应用问题。 第一节 地理要素间的相关分析 地理要素之间的相关分析的任务,是揭示地理要素之间相互关系的密切 程度。而地理要素之间相互关系的密切程度的测定,主要是通过对相关系数 的计算与检验来完成的。一、两要素间相关程度的测定 (一)相关系数的计算与检验 1.相关系数的计算 对于两个要素 x 与 y,如果它们的样本值分别为 xi和 yi(i=1,2,…, n),则它们之间的相关系数被定义为: r x x y y x x y y xy i i n i i i n i i n = - - - - = = = å å å ( )( ) ( ) ( ) 1 2 1 2 1 · (1) 在(1)式中,x和y分别表示两个要素样本值的平均值,即x = , 1 n xi i n = å 1 y = r x y xy 1 n 1 yi i n = å ; 为要素 与 之间的相关系数,它就是表示该两要素之间相 关程度的统计指标,其值在[-1,1]区间之内。rxy>0,表示正相关,即两 要素同向发展;rxy<0,表示负相关,即两要素异向发展。rxy的绝对值越接 近于 1,表示两要素的关系越密切;越接近于 0,表示两要素的关系越不密切。 如果记: L xi x y y x y n xy x y i n i i i i i n i i n i n = - - = - æ è ç ö ø ÷ æ è ç ö ø ÷ = = = = å( )( ) å å å 1 1 1 1 1 L x x x x xx i i xi i n i n i n = - = - æ è ç ö ø ÷ = = = å( ) å å 2 2 1 2 1 1 1 L y y y n yy i y i n i i i n i n = - = - æ è ç ö ø ÷ = = = å( ) å å 2 1 2 1 2 1 1 则公式(1)式可以进一步简化为
例如,某地区1981—1990年期间的粮食总产量(x)和农业总产值(y) 数据如表2-1所示。试计算该地区粮食总产量与农业总产值之间的相关系数 表2-1某地区粮食总产量与农业产值数据 据表2-1计算可得: L。=∑x-0 ∑yJ=307000 2yi-102y) 故 307000 0.9214 3600000×30840 即该地区粮食总产量与农业总产量之间的相关系数为0.9214 如果问题涉及到x1,x2,…,x等n个要素,则对于其中任何两个要素 x;和x,我们都可以按照公式(1)或(2)式计算它们之间的相关系数r; 这样就可得到多要素的相关系数矩阵 Tu r,"IIn R 显然,由公式(1)或(2)式容易知道: (1)r;=1(i=1,2,…,n),即每一个要素x与它自己本身的相关程度 最大; (2)r;ri(i,j=1,2,…,n),即第i个要素(x)对第j个要素(x) 的相关程度,与第j个要素(x1)对第ⅰ个要素(x1)的相关程度相等。 2.相关系数的检验 当要素之间的相关系数求出之后,还需要对所求得的相关系数进行检 验。这是因为,这 表2-2检验相关系数p=0的临界值(ra)表 IIrI>r
r L L L xy xy xx yy = (2) 例如,某地区 1981—1990 年期间的粮食总产量(x)和农业总产值(y) 数据如表 2-1 所示。试计算该地区粮食总产量与农业总产值之间的相关系数 表 2-1 某地区粮食总产量与农业产值数据 据表 2—1 计算可得: Lxy xi yi x y i n i i i i = - æ è ç ö ø ÷ æ è ç ö ø ÷ = = = = å å å 1 1 10 1 10 1 10 30.7000 Lxx x x i i i i = - æ è ç ö ø ÷ = = = å å 1 10 2 1 10 2 1 10 360.000 Lyy yi yi i i = - æ è ç ö ø ÷ = = = å å 2 1 10 2 1 10 1 10 3.0840 故: r L L L xy xy xx yy = = = 30 7000 360 0000 3 0840 0 9214 . . . . × 即该地区粮食总产量与农业总产量之间的相关系数为 0.9214。 如果问题涉及到 x1,x2,…,xn等 n 个要素,则对于其中任何两个要素 xi 和 xj,我们都可以按照公式(1)或(2)式计算它们之间的相关系数 rij, 这样就可得到多要素的相关系数矩阵: R r r r r r r r r r n n n n nn = é ë ê ê ê ê ù û ú ú ú ú 11 12 1 21 22 2 1 2 3 … … … M M M ( ) 显然,由公式(1)或(2)式容易知道: (1)rii=1(i=1,2,…,n),即每一个要素 xi与它自己本身的相关程度 最大; (2)rij=rji(i,j=1,2,…,n),即第 i 个要素(xi)对第 j 个要素(xj) 的相关程度,与第 j 个要素(xj)对第 i 个要素(xi)的相关程度相等。 2.相关系数的检验 当要素之间的相关系数求出之后,还需要对所求得的相关系数进行检 验。这是因为,这 表 2-2 检验相关系数ρ=0 的临界值(ra )表 p{|r|>ra}=α
0.02 0.01 0.0001 0.98769 0.99692 0.999507 0.999877 0.999998 0.90000 0.95000 0.9800 0.99000 999000 0.8783 0.95873 91160 0.7293 0.8822 0.91720 0.9740 0.6694 0.7545 0.8329 0.8745 0.95047 0.6215 0.7067 0.7887 0.8343 0.92493 0.5822 0.6664 0.7493 0.7977 0.8982 789 0.5494 0.6319 0.7155 0.7646 0.8721 0.5214 0.6021 0.6851 0.7348 0.8471 0. 0.6581 0.7079 0.4762 0.6339 0.6835 0.8010 0.4575 0.5324 0.6120 0.6614 23456 0.4409 0.5139 0.592 0.6411 0.4259 0.4973 0.5742 0.6226 0.7420 0.4124 0.4821 0.5577 0.6055 0.7246 0.4000 0.4683 0.5425 0.5897 0.7084 0.5285 0.5751 0.3783 0.4438 0.5155 0.5614 0.4329 0.5034 0.5487 0.3598 0.42 0.4921 0.5368 0.6524 0.3233 0.4451 0.4869 0.5794 0.2960 0.3494 0.4093 0.4487 0.5541 40 0.2573 0.3044 0.3578 0.3932 0.4896 0.2428 0.3384 0.3721 0.2306 0.2732 0.3218 0.3541 0.4433 0.2108 0.2500 0.2948 0.3248 0.4078 0.1954 0.2319 0.2737 0.3017 0.3799 0.1829 0.2172 0.2565 0.2830 0.3568 0.1726 0.2050 0.2422 0.2673 0.3375 0.1628 0.1946 0.2301 0.2540 0.3211 里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多 少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通 过检验,才能知道它的可信度。 一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系 数检验的临界值表来完成的。表2-2给出了相关系数真值p=0(即两要素不 相关)时样本相关系数的临界值rn。 在表2-2中,左边的f值称为自由度,其数值为f=n-2,这里n为样本 数;上方的a代表不同的置信水平;表内的数值代表不同的置信水平下相关
α f 0.10 0.05 0.02 0.01 0.0001 1 0.98769 0.99692 0.999507 0.999877 0.9999988 2 0.90000 0.95000 0.9800 0.99000 0.999000 3 0.8054 0.8783 0.93433 0.95873 0.991160 4 0.7293 0.8114 0.8822 0.91720 0.97406 5 0.6694 0.7545 0.8329 0.8745 0.95047 6 0.6215 0.7067 0.7887 0.8343 0.92493 7 0.5822 0.6664 0.7493 0.7977 0.8982 8 0.5494 0.6319 0.7155 0.7646 0.8721 9 0.5214 0.6021 0.6851 0.7348 0.8471 10 0.4973 0.5760 0.6581 0.7079 0.8233 11 0.4762 0.5529 0.6339 0.6835 0.8010 12 0.4575 0.5324 0.6120 0.6614 0.7800 13 0.4409 0.5139 0.5923 0.6411 0.7603 14 0.4259 0.4973 0.5742 0.6226 0.7420 15 0.4124 0.4821 0.5577 0.6055 0.7246 16 0.4000 0.4683 0.5425 0.5897 0.7084 17 0.3887 0.4555 0.5285 0.5751 0.6932 18 0.3783 0.4438 0.5155 0.5614 0.6787 19 0.3687 0.4329 0.5034 0.5487 0.6652 20 0.3598 0.4227 0.4921 0.5368 0.6524 25 0.3233 0.3809 0.4451 0.4869 0.5794 30 0.2960 0.3494 0.4093 0.4487 0.5541 40 0.2573 0.3044 0.3578 0.3932 0.4896 45 0.2428 0.2875 0.3384 0.3721 0.4648 50 0.2306 0.2732 0.3218 0.3541 0.4433 60 0.2108 0.2500 0.2948 0.3248 0.4078 70 0.1954 0.2319 0.2737 0.3017 0.3799 80 0.1829 0.2172 0.2565 0.2830 0.3568 90 0.1726 0.2050 0.2422 0.2673 0.3375 0.1628 0.1946 0.2301 0.2540 0.3211 里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多 少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通 过检验,才能知道它的可信度。 一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系 数检验的临界值表来完成的。表 2-2 给出了相关系数真值ρ=0(即两要素不 相关)时样本相关系数的临界值 ra。 在表 2-2 中,左边的 f 值称为自由度,其数值为 f=n-2,这里 n 为样本 数;上方的 a 代表不同的置信水平;表内的数值代表不同的置信水平下相关
系数p=0的临界值,即ra;公式p{|r|>ra}=a的意思是当所计算的相 关系数r的绝对值大于在a水平下的临界值r。时,两要素不相关(即p=0) 的可能性只有a。在前例中,f=10-2=8,在不同的置信水平下的临界值ra可 以从表中查得:r0.1=0.5494,ro005=0.6319,ro.02=0.7155,ro01=0.7646, r0.00=0.8721。由于rx=0.9214>0.00=0.8721,这说明该地区粮食总产量 (x)与农业总产值(y)不相关的概率只有a=0.001,即0.1%,换句话说,该 地区粮食总产量(x)与农业总产值(y)同向相关的概率达0.99,即99.9%。 一般而言,当|r|<ro.,时,则认为两要素不相关,这时的样本相关系 数就不能反映两要素之间的关系。 (二)等级相关系数的计算与检验 1.等级相关系数的计算 等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述 两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数 的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列 位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上, 它是位次分析方法的数量化。 设两个要素x和y有n对样本值,令R1代表要素x的序号(或位次) R2代表要素y的序号(或位次),d2=(R1-R21)2代表要素x和y的同 组样本位次差的平方,那么要素ⅹ与y之间的等级相关系数(r′xy)被定义 为 例如,我国1985年各省(市,区)的总人口(x)和社会总产值(y)及其 位次列于表2-3。试计算总人口(x)与社会总产值(y)之间的等级相关系数。 由表2-3计算可知:n=29,n(n2-1)=24360,∑d2=1134,故 6×1134 =0726 (n2-1 24360 即:总人口(x)与社会总产值(y)的等级相关系数为0.726 2.等级相关系数的检验 与相关系数一样,等级相关系数是否显著,也需要检验。表2-4给出了 等级相关系数检验的临界值。 表2-4的内容与表2-2的内容相似,n代表样本个数,a代表不同的置信 水平,也称显著水 表2-31985年全国各省(市,区)总人口与社会总产值
系数ρ=0 的临界值,即 ra;公式 p={|r|>ra}=a 的意思是当所计算的相 关系数 r 的绝对值大于在 a 水平下的临界值 ra 时,两要素不相关(即ρ=0) 的可能性只有 a。在前例中,f=10-2=8,在不同的置信水平下的临界值 ra可 以从表中查得:r0.1=0.5494,r0.05=0.6319,r0.02=0.7155,r0.01=0.7646, r0.001=0.8721。由于 rxy=0.9214>r0.001=0.8721,这说明该地区粮食总产量 (x)与农业总产值(y)不相关的概率只有 a=0.001,即 0.1%,换句话说,该 地区粮食总产量(x)与农业总产值(y)同向相关的概率达 0.999,即 99.9%。 一般而言,当|r|<r0.1时,则认为两要素不相关,这时的样本相关系 数就不能反映两要素之间的关系。 (二)等级相关系数的计算与检验 1.等级相关系数的计算 等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述 两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数 的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列 位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上, 它是位次分析方法的数量化。 设两个要素 x 和 y 有 n 对样本值,令 R1代表要素 x 的序号(或位次), R2 y di = R -R x y 2 1 i 2i 代表要素 的序号(或位次), ( )2代表要素 和 的同一 组样本位次差的平方,那么要素 x 与 y 之间的等级相关系数(r′xy)被定义 为 r d n n xy i i n ′ = - - = å 1 6 1 4 2 1 2 ( ) ( ) 例如,我国 1985 年各省(市,区)的总人口(x)和社会总产值(y)及其 位次列于表 2-3。试计算总人口(x)与社会总产值(y)之间的等级相关系数。 由表2 - 3计算可知:n = 29,n(n 2 -1) = 24360, d i 2 = 1134,故 i= å 1 29 r d n n xy i ′ i × = - - = - = = å 1 6 1 1 6 1134 24360 0726 2 1 29 2 ( ) . 即:总人口(x)与社会总产值(y)的等级相关系数为 0.726 2.等级相关系数的检验 与相关系数一样,等级相关系数是否显著,也需要检验。表 2-4 给出了 等级相关系数检验的临界值。 表 2-4 的内容与表 2-2 的内容相似,n 代表样本个数,a 代表不同的置信 水平,也称显著水 表 2-3 1985 年全国各省(市,区)总人口与社会总产值