第2章地理数据与处理 地理数据,是对地理问颗进行定量化描述和研究的基础,是计量地理学研究与应用的 先决条件。所谓地理数据,就是用一定的测度方式描述和衡量地理对象的又量化标志。对于 不同的地理实体、地理要素、地理现象、地理事件、地理过程,需要采用不同的测度方式 测度标准进行描述和衡量,这样就产生了不同类型的地理数据。不同类型的地理数据,反映 者不同类型的地理问题。对于不同类型的地理数据,常常需要采用不同的方法。 第1节地理数据的类型 地理学的研究对象一地理系统,总是与一定的地理区域相对应的。任何地理实体、地 理要素、地理现象、地理事件、地理过程、其产生和发展都离不开具体的地理位置和地域空 间范围。因此,我们可以将所有的地理数据划分为两大基木类型,即空间数据和属性数据。 2.1.1空间数据 空间数据,用干描述地理实体、地理要素、地理现象、恤理电件及地理过程产生、存 在和发展的地理位置 区域范围及空间联系。对于空间数据的表达,可以将其归纳为点、线 面三种几何实体以及描述他们之间空间联系的拓扑关系。其中 (一)点由一个独立的坐标点(x,y)定位,是空间上不可再分的几何实体。它可 以表示精确的地理位置点,也可以是一些地理实体的抽象。 (一)线由若个(至少两个,理论上是无穷个)华标占(x,v)(1=1,2,) 定义,有一定的长度和走向,表示线状地物或点实体之间的联系 交通线、 可流 (三)面表示在空间上连续分布的地理景观或区域。譬如,某种土壤或植被的分布区 点、线、面是三种地理几何实体,按照一定的拓扑关系组合、排列,就可以形成更为 复杂的地理几何实体。譬如,点、线形成我那个罗:线面组合形成地带:点、面组合形成地 域类型:点、线、面组合形成地理区。点、线、面三种几何实体及其组合关系可以形象地用 图211表示。 点 网络 地域类型 区域 线 面 地指 图2.11三种基本的地理几何实体及其组合 2.12属性数据 属性数据,用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性
第 2 章 地理数据与处理 地理数据,是对地理问题进行定量化描述和研究的基础,是计量地理学研究与应用的 先决条件。所谓地理数据,就是用一定的测度方式描述和衡量地理对象的又量化标志。对于 不同的地理实体、地理要素、地理现象、地理事件、地理过程,需要采用不同的测度方式和 测度标准进行描述和衡量,这样就产生了不同类型的地理数据。不同类型的地理数据,反映 着不同类型的地理问题。对于不同类型的地理数据,常常需要采用不同的方法。 第 1 节 地理数据的类型 地理学的研究对象-地理系统,总是与一定的地理区域相对应的。任何地理实体、地 理要素、地理现象、地理事件、地理过程、其产生和发展都离不开具体的地理位置和地域空 间范围。因此,我们可以将所有的地理数据划分为两大基本类型,即空间数据和属性数据。 2.1.1 空间数据 空间数据,用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存 在和发展的地理位置、区域范围及空间联系。对于空间数据的表达,可以将其归纳为点、线、 面三种几何实体以及描述他们之间空间联系的拓扑关系。其中 (一)点 由一个独立的坐标点(x,y)定位,是空间上不可再分的几何实体 。它可 以表示精确的地理位置点,也可以是一些地理实体的抽象。 (二)线 由若干个(至少两个,理论上是无穷个)坐标点(xi,yi)(i =1,2,.) 定义,有一定的长度和走向,表示线状地物或点实体之间的联系。 譬如,交通线、河流 (三)面 表示在空间上连续分布的地理景观或区域。譬如,某种土壤或植被的分布区。 点、线、面是三种地理几何实体,按照一定的拓扑关系组合、排列,就可以形成更为 复杂的地理几何实体。譬如,点、线形成我那个罗;线面组合形成地带;点、面组合形成地 域类型;点、线、面组合形成地理区。点、线、面三种几何实体及其组合关系可以形象地用 图 2.1.1 表示。 网络 地域类型 地带 区域 线 点 面 图 2.1.1 三种基本的地理几何实体及其组合 2.1.2 属性数据 属性数据,用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性
特征。譬如,海拔高度、地形坡度、气温、降水量、道路的等级与长度、河流长度与径流量 等都是属性数据。对于地理对象的属性特征,往往需要从数量标志和品质标志两个方面进行 描述,所以属性数据又可以进一步分为以下两种类型: 数量标志数 (1)间隔尺度数据以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对 量。譬如,以摄氏或华氏作为温度量纲表示某地的气温,以某种面积量纲表示土地面积。 表2.1.1间隔尺度数据 人口) 人均GDP(元)第一产业比重第二产业比重第三产业比重 轮台县 80134 2282 61.32 13.8 25.5 尉犁县 88371 4336 55.58 24.87 19.55 若光县 29689 3901 39.46 41.89 18.63 且末县 48151 193 56.96 13.77 29.27 (2)比例尺度数据以无量纲的数据形式表示测度对象的相对量。 表2.12某地区耕地复种指数和农业发限指数 年份 1996 1997 1998 1999 2000 耕地复种指数(即措种面积 120.40 113.56 126.54 132.76 121.4 与耕地总面积之比) 3 农业发展指数(规定1996农 129.5 100 业产值为基数100) 115.6812450135.69 6 (二)品质标志数据 根据其测度标准,以将品质标志数据别分为加下二种类型: (1)有序数据 当测度标准不是连续的量时,只是表示其顺序关系的数据。这种数据 并不表示量的多少,而是给出一个等级或次序。 表21.3城市等规模等级与人口数量的排位次序 城市A 城市B 城市C城市D 城市B 规棋等级 1 2 3 4 4 人口位次 1 2 4 6 5 (2)名义尺度数据用数字表示地理实体、地理要素、地理现象或地理事件的状态类型 譬如,在士地利用现状调查中 ,用15表示“莱地”,13表示“水浇地”,14表示“旱地” 21表示“林地”等(表2.1.4)
特征。譬如,海拔高度、地形坡度、气温、降水量、道路的等级与长度、河流长度与径流量 等都是属性数据。对于地理对象的属性特征,往往需要从数量标志和品质标志两个方面进行 描述,所以属性数据又可以进一步分为以下两种类型: (一)数量标志数据 (1)间隔尺度数据 以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对 量。譬如,以摄氏或华氏作为温度量纲表示某地的气温,以某种面积量纲表示土地面积。 表 2.1.1 间隔尺度数据 人口(人) 人均 GDP(元) 第一产业比重 第二产业比重 第三产业比重 轮台县 80134 2282 61.32 13.8 25.5 尉犁县 88371 4336 55.58 24.87 19.55 若羌县 29689 3901 39.46 41.89 18.63 且末县 48151 1993 56.96 13.77 29.27 (2)比例尺度数据 以无量纲的数据形式表示测度对象的相对量。 表 2.1.2 某地区耕地复种指数和农业发展指数 年 份 1996 1997 1998 1999 2000 耕地复种指数(即播种面积 与耕地总面积之比) 120.40 113.56 126.54 132.76 121.4 3 农业发展指数(规定 1996 农 业产值为基数 100) 100 115.68 124.50 135.69 129.5 6 (二)品质标志数据 根据其测度标准,可以将品质标志数据划分为如下三种类型: (1)有序数据 当测度标准不是连续的量时,只是表示其顺序关系的数据。这种数据 并不表示量的多少,而是给出一个等级或次序。 表 2.1.3 城市等规模等级与人口数量的排位次序 城市 A 城市 B 城市 C 城市 D 城市 E 规模等级 1 2 3 4 4 人口位次 1 2 4 6 5 (2)名义尺度数据 用数字表示地理实体、地理要素、地理现象或地理事件的状态类型。 譬如,在土地利用现状调查中,用 15 表示“菜地”,13 表示“水浇地”,14 表示“旱地”, 21 表示“林地”等(表 2.1.4)
(3)二元数据用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题。 譬如,在人口统计中,用1表示男性,用0表示女性,在一个交通网络中,两两组合考虑结 点之间有无连线的情况,1表示“两个结点之间存在连线”,0表示“两个结点之不存在连 线”等表2.1.5)。 表2.1.4土地利用类型 地块序列号 1 2 3 4 5 6 土地利用类型 13 15 21 14 14 31 表2.15二元数(1表示两城市之间通航,0表示两城市之间不通航) 城市A 城市B 城市C 城市D 城市E 城市A 1 1 城市B 1 0 城市C 1 1 1 0 城市D 0 城市E 1 0 0 第2节地理数据的基本特征 地理系统的复杂性决定了地理数据的复杂性和多样性。对于不同的地理实体、地理要 素、地理现象、地理事件,地理过程,需要采用不同的数据形式和数据类型进行描述。对于 一个地理区域,则盂要从冬种角度,采用不同的数据形式和数展类型,对甘冬个方面的性质 分别进行描述。尽管地理数据的种类是多样的,数据的信息是海量的,但是一般而言,所有 的地理数据就都具有如下的几个方面的基本特征: 2.2.1数量化、形式化与逻辑化 (一)形式化、逻辑化与数量化,是所有地理数据的共同特征。 (二)定量化的地理数据是建立地理数学模型的基础,它有两方面的作用: (1)确定模型的参数、给定模型运行的初值条件:(2)检验模型的有效性。 (三)地理计算学,对于地理数据的形式化、逻辑化提出了更高的要求,要求“整体“和 “大容量“的地理数据具有统一的数据形式和交换标准。 地理计算学,对于地理数据的形式化、逻辑化提出了更高的要求,要求“整体”和“大 容量”的地理数据具有同一的数据形式和交换标准,从而使统一数据能够在不同的计算过程 中被使用:要求各种地理数据之间具有合理的逻辑关系,从而保证模型系统的运行剁成及计 算结果的正确性
(3)二元数据 用 0、1 两个数据表示地理事物、地理现象或地理事件的是非判断问题。 譬如,在人口统计中,用 1 表示男性,用 0 表示女性,在一个交通网络中,两两组合考虑结 点之间有无连线的情况,1 表示“两个结点之间存在连线”,0 表示“两个结点之间不存在连 线”等(表 2.1.5)。 表 2.1.4 土地利用类型 地块序列号 1 2 3 4 5 6 土地利用类型 13 15 21 14 14 31 表 2.1.5 二元数(1 表示两城市之间通航,0 表示两城市之间不通航) 城市 A 城市 B 城市 C 城市 D 城市 E 城市 A — 1 1 0 1 城市 B 1 — 1 1 0 城市 C 1 1 — 1 0 城市 D 0 1 1 — 1 城市 E 1 0 0 1 — 第 2 节 地理数据的基本特征 地理系统的复杂性决定了地理数据的复杂性和多样性。对于不同的地理实体、地理要 素、地理现象、地理事件,地理过程,需要采用不同的数据形式和数据类型进行描述。对于 一个地理区域,则需要从各种角度,采用不同的数据形式和数据类型,对其各个方面的性质 分别进行描述。尽管地理数据的种类是多样的,数据的信息是海量的,但是一般而言,所有 的地理数据就都具有如下的几个方面的基本特征: 2.2.1 数量化、形式化与逻辑化 (一)形式化、逻辑化与数量化,是所有地理数据的共同特征。 (二)定量化的地理数据是建立地理数学模型的基础,它有两方面的作用: (1)确定模型的参数、给定模型运行的初值条件;(2)检验模型的有效性。 (三)地理计算学,对于地理数据的形式化、逻辑化提出了更高的要求,要求“整体”和 “大容量”的地理数据具有统一的数据形式和交换标准。 地理计算学,对于地理数据的形式化、逻辑化提出了更高的要求,要求“整体”和“大 容量”的地理数据具有同一的数据形式和交换标准,从而使统一数据能够在不同的计算过程 中被使用;要求各种地理数据之间具有合理的逻辑关系,从而保证模型系统的运行剁成及计 算结果的正确性
2.2.2不确定性 不确定性是地理数据的基本特征之一。导致地理数据不确定性的原因没主要来自如下两 个方面: (一)地理系统本身的复杂性从本质上决定若地理数据的不确定性 (二)各种原因所导致的数据误差 在地理数据采集过程中 不同的数据来源、不同的 观测手段、不同的调查方法、不同的数据采集者的认识与操作水平等,都会产生地理数据的 误差不确定性。 223多种时空尺度 由于地理学的研究对象具有多种时空尺度,所以描述地理对象的地理数据也具有多种时 空尺度的性质。 (一)从空间尺度上来看,描述地理区域的各种地理数据,具有多种空间尺度一既有 全球尺度的、洲际尺度的 国家尺度的, 也有流域 度的、地区尺度的、 市尺度的、社区 尺度的。在不同的空间尺度上,地理数据的表现形式及其所包含的信息内容是不同的,为了 揭示复杂的地理空间,就必须在不同的空间尺度上对各种地理数据进行升入的解剖和分析, (二)从时间尺度上来看,描述地理过程的各种地理数据具有多种时间尺度,如历史 年代、天、月、季度、年等。在不同的时间尺度上,地理数据的表现形式及其所包含的信息 内容是不同的,为了揭示复杂的地理过程,就必须在不同的时间尺度上对各种地理数据进行 升入的解和分析 2.2.4多维性 (一)对于一个地理对象的具体意义要从空间、属性、时间三个方面综合描述。 (二)空间方面,需要描述该地理对象所处的地理位置和空间范围,一般需要2一3个 变量: (三)屈性方面,需要描述该地理对象的具体内容,至少需要1个以上,名则需要十几 个、甚至几十个变最 (四)时间方面,需要描述该地理对象产生、发展和存在的时间范围,需要1个变量: (五)地理数据的这种多维性,被人们描述为地理数据立方体(The Geographical Data Cube) 区 1,2.3,n m 图22.1地理数据立方休
2.2.2 不确定性 不确定性是地理数据的基本特征之一。导致地理数据不确定性的原因没主要来自如下两 个方面: (一)地理系统本身的复杂性从本质上决定着地理数据的不确定性。 (二)各种原因所导致的数据误差。在地理数据采集过程中,不同的数据来源、不同的 观测手段、不同的调查方法、不同的数据采集者的认识与操作水平等,都会产生地理数据的 误差不确定性。 2.2.3 多种时空尺度 由于地理学的研究对象具有多种时空尺度,所以描述地理对象的地理数据也具有多种时 空尺度的性质。 (一)从空间尺度上来看,描述地理区域的各种地理数据,具有多种空间尺度—既有 全球尺度的、洲际尺度的、国家尺度的,也有流域尺度的、地区尺度的、城市尺度的、社区 尺度的。在不同的空间尺度上,地理数据的表现形式及其所包含的信息内容是不同的,为了 揭示复杂的地理空间,就必须在不同的空间尺度上对各种地理数据进行升入的解剖和分析。 (二)从时间尺度上来看,描述地理过程的各种地理数据具有多种时间尺度,如历史 年代、天、月、季度、年等。在不同的时间尺度上,地理数据的表现形式及其所包含的信息 内容是不同的,为了揭示复杂的地理过程,就必须在不同的时间尺度上对各种地理数据进行 升入的解剖和分析。 2.2.4 多维性 (一)对于一个地理对象的具体意义要从空间、属性、时间三个方面综合描述。 (二)空间方面,需要描述该地理对象所处的地理位置和空间范围,一般需要 2~3 个 变量 ; (三)属性方面,需要描述该地理对象的具体内容,至少需要 1 个以上,多则需要十几 个、甚至几十个变量 ; (四)时间方面,需要描述该地理对象产生、发展和存在的时间范围 ,需要 1 个变量 ; (五)地理数据的这种多维性,被人们描述为地理数据立方体(The Geographical Data Cube)。 1, 2 , . m 区 域 要素 1,2,3,.,n t1 t2 . tk 时间 图 2.2.1 地理数据立方体
第3节地理数据的采集与处理 2.3.1地理数据的采集 地理数据的采集,就是运用各种技术手段,通过各种渠道搜集地理数据的过程。地理数 据采集的渠道来源主要包括如下几个方面: (一)来自于观测、测量部门的有关专业数据。警如,来自水文观测站的有关水文数据 (二) 来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据: (三)来自于有关单位或个人的不定期的典型调查数据、抽样调查数据: (四)来自于政府公报、政府文件中的有关数据: (五)来自于档案、图书等文献济料中的有关数据 (六)来自于互联网(Internet)的有关共字数据, (七)地图图件。主要包括各种比例尺的地形图 影像地图 专题地图等: (八)遥感数据。主要包括各种航空遥感数据和卫星遥感数据: (九)其它来源的有关数据。 采集地理数据的过程中需要注意以下几个问题】 一)影据的条性和可可靠性】 (二)在数据采集过程中,要采取一切可能的手段和技术措施,最大限度地减小数据的 误差 (三)在数据采集完毕后,要对各种数据质量进行检验,对不同来源的相同数据进行比 较、辨别真伪,通过数据筛选,去粗存精、去伪存真。对于残缺的但确实必须的数据,想办 法进行及时补充。 2.3,2地理数据处理 从广义上讲,任何地理问题的研究都必设计数据处理,整个研究过程就是从数据采集 到数据处理的 程 在地理学 人们千方百计地寻求和 用各种新的方法、技术和工 具,其目的就是为了准确及时地采集地理数据和有效地处理地理数据。地理数据处理,是所 有地理问题研究的核心环节。 从理论上讲,在地理雪中,数学方法的运用主要有两个目的:(1)运用数学语言对地理 问颗进行描绘,建立地理数学摸型,从根高、更深层次上揭示地理问颗的机理。(2)运用有 关数学方法,通过定量化的计算和分析,对地理数据进行处理,从而揭示有关地理现象的内 在规律。 地理数据处理是地理信息系统的核心功能。 地理计算学(Geocomputation)的实质是借助于现代化的计算理论、计算方法和计算 机技术,通过对“整体”和“大容量”的地理数据进行处理,揭示复杂地理系统的运行机制, 探索和寻求新的地理系统理论。 地 数据 理 据的 理数 GIS 数学方法 地理 Gaocompution 源 图2.3.1 地理数据采集与处理
第 3 节 地理数据的采集与处理 2.3.1 地理数据的采集 地理数据的采集,就是运用各种技术手段,通过各种渠道搜集地理数据的过程。地理数 据采集的渠道来源主要包括如下几个方面: (一)来自于观测、测量部门的有关专业数据。譬如,来自水文观测站的有关水文数据; (二) 来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据; (三)来自于有关单位或个人的不定期的典型调查数据、抽样调查数据; (四) 来自于政府公报、政府文件中的有关数据; (五)来自于档案、图书等文献资料中的有关数据; (六)来自于互联网(Internet)的有关共享数据; (七)地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等; (八)遥感数据。主要包括各种航空遥感数据和卫星遥感数据; (九)其它来源的有关数据。 采集地理数据的过程中需要注意以下几个问题: (一)数据的完备性和可靠性; (二)在数据采集过程中,要采取一切可能的手段和技术措施,最大限度地减小数据的 误差; (三)在数据采集完毕后,要对各种数据质量进行检验,对不同来源的相同数据进行比 较、辨别真伪,通过数据筛选,去粗存精、去伪存真。对于残缺的但确实必须的数据,想办 法进行及时补充。 2.3.2 地理数据处理 从广义上讲,任何地理问题的研究都必设计数据处理,整个研究过程就是从数据采集 到数据处理的过程。在地理学研究中,人们千方百计地寻求和采用各种新的方法、技术和工 具,其目的就是为了准确及时地采集地理数据和有效地处理地理数据。地理数据处理,是所 有地理问题研究的核心环节。 从理论上讲,在地理雪中,数学方法的运用主要有两个目的:(1)运用数学语言对地理 问题进行描绘,建立地理数学模型,丛根高、更深层次上揭示地理问题的机理。(2)运用有 关数学方法,通过定量化的计算和分析,对地理数据进行处理,从而揭示有关地理现象的内 在规律。 地理数据处理是地理信息系统的核心功能。 地理计算学(Geocomputation)的实质是借助于现代化的计算理论、计算方法和计算 机技术,通过对“整体”和“大容量”的地理数据进行处理,揭示复杂地理系统的运行机制, 探索和寻求新的地理系统理论。 地 理 数 据 的 数 据 源 地 理 数 据 采 集 数学方法 GIS Geocomputation 地理 处理 图 2.3.1 地理数据采集与处理 数据