0(0),1(1),2(10),3(11),4(100),5(101),6(110),7(111),8(1000,9(1001) 阿拉伯数字及其二级制表示 第五章GIS中的数据 导读:对空间数据的处理是GiS的核心功能,GS中的数据通常描述三部分信息 空间信息(位置,空间关系等等),非空间的属性信息,时间信息。数据按照其测量 尺度,可以分为定名、定比、间隔、比率量四种类型。由于各方面的原因,GIS数 据存在着质量问题,了解数据质量有利于数据的正确使用,避免出现“ Garbage In, Garbage Out”的情形。数据质量可以通过元数据进行描述,简单的说,元数据是对 数据的描述,在GS应用不断发展、空间数据不断增长的情况下,元数据有助于数 据的共享和有效使用。 本章讲述了上述的内容。 数据涵义与数据类型 1.1数据的涵义 1.1.1数据 数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具 体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。虽然数据是信息的载体 但并非就是信息,只有理解了数据的含义、对数据做出解释,才能得到数据中所包含的信息。 在计算机化的信息系统中,数据的格式往往与具体的计算机系统有关,随着载荷它的物理设 备的形式而改变。信息系统对数据进行处理(运算、排序、编码、分类、增强等)就是为了 得到数据中所包含的信息 在地理信息系统中,由系统建立者输入、机器存储的各种专题地图和统计图表是数据; 系统软件中所包含的代码是计算机系统中的二进制数据:用户对地理信息系统发出的各种指 令也是数据,等等。因此,地理信息系统的建立和运行,就是信息或数据按一定的方式流动 的过程。 数据的处理和解释是非常重要的环节。所谓数据处理,是指对数据进行收集、筛选、排 序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于
0(0),1(1),2(10),3(11),4(100),5(101),6(110),7(111),8(1000),9(1001)… 阿拉伯数字及其二级制表示 第五章 GIS 中的数据 导读:对空间数据的处理是 GIS 的核心功能,GIS 中的数据通常描述三部分信息: 空间信息(位置,空间关系等等),非空间的属性信息,时间信息。数据按照其测量 尺度,可以分为定名、定比、间隔、比率量四种类型。由于各方面的原因,GIS 数 据存在着质量问题,了解数据质量有利于数据的正确使用,避免出现“Garbage In, Garbage Out”的情形。数据质量可以通过元数据进行描述,简单的说,元数据是对 数据的描述,在 GIS 应用不断发展、空间数据不断增长的情况下,元数据有助于数 据的共享和有效使用。 本章讲述了上述的内容。 1.数据涵义与数据类型 1.1 数据的涵义 1.1.1 数据 数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具 体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。虽然数据是信息的载体, 但并非就是信息,只有理解了数据的含义、对数据做出解释,才能得到数据中所包含的信息。 在计算机化的信息系统中,数据的格式往往与具体的计算机系统有关,随着载荷它的物理设 备的形式而改变。信息系统对数据进行处理(运算、排序、编码、分类、增强等)就是为了 得到数据中所包含的信息。 在地理信息系统中,由系统建立者输入、机器存储的各种专题地图和统计图表是数据; 系统软件中所包含的代码是计算机系统中的二进制数据;用户对地理信息系统发出的各种指 令也是数据,等等。因此,地理信息系统的建立和运行,就是信息或数据按一定的方式流动 的过程。 数据的处理和解释是非常重要的环节。所谓数据处理,是指对数据进行收集、筛选、排 序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于
观察、分析、传输或进一步处理的形式;把数据加工成对正确管理和决策有用的数据:把数 据编辑后存储起来,以供不断使用。数据处理是为了解释,而数据解释需要人的智慧、学识 和经验。 1.1.2地理数据(空间数据)的基本特征 地理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特征,例 如变量、级别、数量特征和名称等等。空间特征(定位数据):表示现象的空间位置或现在 所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔 坐标等。时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、 短期的、中期的、长期的等等(图5-1)。 地理数据 定位数据 非定位数据 笛卡几坐标系 拓扑关系 R圃國 图5-1:空间数据的基本特性 Jack dangermond,1984] 1.2空间数据的类型 在地理信息系统中,按照其特征,数据可分为三种类型:空间特征数据(定位数据) 时间属性数据(尺度数据)和专题属性数据(非定位数据)。对于绝大部分地理信息系统的 应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性 特征数据统称为空间数据(或地理数据) 1.2.1空间特征数据 空间特征数据记录的是空间实体的位置、拓扑关系和几何特征,这是地理信息系统区别 于其他数据库管理系统的标志。空间特征指空间物体的位置、形状和大小等几何特征,以及 与相邻物体的拓扑关系。位置和拓扑特征是地理或空间信息系统所独有的,空间位置可以由
观察、分析、传输或进一步处理的形式;把数据加工成对正确管理和决策有用的数据;把数 据编辑后存储起来,以供不断使用。数据处理是为了解释,而数据解释需要人的智慧、学识 和经验。 1.1.2 地理数据(空间数据)的基本特征 地理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特征,例 如变量、级别、数量特征和名称等等。空间特征(定位数据):表示现象的空间位置或现在 所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔 坐标等。时间特征(时间尺度):指现象或物体随时间的变化,其变化的周期有超短期的、 短期的、中期的、长期的等等(图 5-1)。 图 5-1:空间数据的基本特性[Jack Dangermond,1984] 1.2 空间数据的类型 在地理信息系统中,按照其特征,数据可分为三种类型:空间特征数据(定位数据)、 时间属性数据(尺度数据)和专题属性数据(非定位数据)。对于绝大部分地理信息系统的 应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间特征数据和属性 特征数据统称为空间数据(或地理数据)。 1.2.1 空间特征数据 空间特征数据记录的是空间实体的位置、拓扑关系和几何特征,这是地理信息系统区别 于其他数据库管理系统的标志。空间特征指空间物体的位置、形状和大小等几何特征,以及 与相邻物体的拓扑关系。位置和拓扑特征是地理或空间信息系统所独有的,空间位置可以由
不同的坐标系统来描述,如经纬度坐标、一些标准的地图投影坐标或是任意的直角坐标等。 人类对空间目标的定位一般不是通过记忆其空间坐标,而是确定某一目标与其他更熟悉的目 标间的空间位置关系,而这种关系往往也是拓扑关系。如一所学校位于哪个路口或哪条街道。 1.2.2专题特征数据 专题特征指的是地理实体所具有的各种性质,如地形的坡度、坡向、某地的年降雨量、 土地酸缄类型、人口密度、交通流量、空气污染程度等。这类特征在其他类型的信息系统中 均可存储和处理。专题属性特征通常以数字、符号、文本和图像等形式来表示。 1.2.3时间特征数据 时间属性是指地理实体的时间变化或数据采集的时间等。严格地讲,空间数据总是在某 一特定时间或时段内采集得到或计算产生的。由于有些空间数据随时间变化相对较慢,因而 有时被忽略:有些时候,时间可以被看成一个专题特征 1.3空间数据的表示方法 般地,表示地理现象的空间数据可以细分为 类型数据:例如考古地点、道路线和土壤类型的分布等; 面域数据:例如随机多边形的中心点、行政区域界线和行政单元等; 网络数据:例如道路交点、街道和街区等 样本数据:例如气象站、航线和野外样方的分布区等 曲面数据:例如高程点、等高线和等值区域 文本数据:例如地名、河流名称和区域名称 符号数据:例如点状符号、线状符号和面状符号(晕线)等(如图52所示)
不同的坐标系统来描述,如经纬度坐标、一些标准的地图投影坐标或是任意的直角坐标等。 人类对空间目标的定位一般不是通过记忆其空间坐标,而是确定某一目标与其他更熟悉的目 标间的空间位置关系,而这种关系往往也是拓扑关系。如一所学校位于哪个路口或哪条街道。 1.2.2 专题特征数据 专题特征指的是地理实体所具有的各种性质,如地形的坡度、坡向、某地的年降雨量、 土地酸缄类型、人口密度、交通流量、空气污染程度等。这类特征在其他类型的信息系统中 均可存储和处理。专题属性特征通常以数字、符号、文本和图像等形式来表示。 1.2.3 时间特征数据 时间属性是指地理实体的时间变化或数据采集的时间等。严格地讲,空间数据总是在某 一特定时间或时段内采集得到或计算产生的。由于有些空间数据随时间变化相对较慢,因而 有时被忽略;有些时候,时间可以被看成一个专题特征。 1.3 空间数据的表示方法 一般地,表示地理现象的空间数据可以细分为: 类型数据:例如考古地点、道路线和土壤类型的分布等; 面域数据:例如随机多边形的中心点、行政区域界线和行政单元等; 网络数据:例如道路交点、街道和街区等; 样本数据:例如气象站、航线和野外样方的分布区等; 曲面数据:例如高程点、等高线和等值区域; 文本数据:例如地名、河流名称和区域名称; 符号数据:例如点状符号、线状符号和面状符号(晕线)等(如图 5-2 所示)
类数据由 点状要素 线状要素 状要素 区域数据 209区 区域中心 境界线 行政单元 网络数据 道路交点 街道 街区 +405 样本数据 气象站 线 样方分布区 曲面数据 高程点 等值线 概略等值区 雷德兰 文本数据|分5 商业区 地点名称 线状地物名称 区域名称 符号数据 中 点符号 线状符号 面状符号 图5-2:地理信息系统中各种数据以及其表现 2.数据的测量尺度 对特定现象的测量就是根据一定的标准对其赋值或打分。为了描述地理世界,对任何事 物都要鉴别、分类和命名。这些都是量测的组成部分。它们所使用的参考标准或尺度是不同 的。测量的尺度大致可以分成四个层次,由粗略至详细依次为:命名或类型、次序、间隔以 及比例
图 5-2:地理信息系统中各种数据以及其表现 2.数据的测量尺度 对特定现象的测量就是根据一定的标准对其赋值或打分。为了描述地理世界,对任何事 物都要鉴别、分类和命名。这些都是量测的组成部分。它们所使用的参考标准或尺度是不同 的。测量的尺度大致可以分成四个层次,由粗略至详细依次为:命名或类型、次序、间隔以 及比例
2.1命名( Nominal)量 定性而非定量,不能进行任何算术运算,如一个城市的名字。命名式的测量尺度也称为 类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述。例如,可以 用不同数值表示不同的土地利用类型、植被类型或岩石类型,但是这些数值之间无数量关系, 对命名数据的逻辑运算只有“等于”或“不等于”两种形式,而其近似均值只能使用众数 2.2次序( Ordinal)量 线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大 到小被标为1,2,3,…,级别的序号越低,其危险性越大,但危险性到底有多大并未给予 定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等算术运算。 次序测量尺度是基于对现象进行排序来标识的,如可以把山峰按高度分级为极高山、高 山、中山、低山和丘陵等,将坡度分为陡、中、缓等。不同次序之间的间隔大小可以不同。 对次序数据的逻辑运算除了“等于”与“不等于”之外,还可以比较它们的大小,即“大于” 或“小于”。 2.3间隔( Interva)量 不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较 大小,并且它们之间的差值大小是有意义的。 间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值无真的零值。例如,温度是 间隔尺度的数据而不是比例数据,因为它的“0”测量值随着所使用的不同温度测量单位而 不同。不能说150F的温度是75F的温度的两倍,因为这个比例在使用摄氏单位时就改变了。 相反,降水量是比例数据,因为它有真的零值。比例数据和间隔数据可用于加、减、乘、 除等运算,而且可以求算术平均 2.4比率( Ratio)量 比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺 度与使用的测量单位无关。 与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性 域的例子很多,如年降雨量、海拔高度、人口密度、发病率等 比例数据或间隔数据可以比较容易地被转变成次序或命名数据。而命名数据则很难被转 化成次序、间隔数据或比例数据。由此可见,尽管命名数据或次序数据便于使用,易于理解, 但有时不够精确,不能用于较髙级的算术运算。而比例数据或间隔数据比较精确,便于计算 机处理,但是在较复杂的GIS应用中,往往上述几种测量尺度的数据均需用到。 与比率量不同,间隔量中的零值往往是人为规定的,如摄氏温标中零摄氏度,时间中的零点等等
2.1 命名(Nominal)量 定性而非定量,不能进行任何算术运算,如一个城市的名字。命名式的测量尺度也称为 类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述。例如,可以 用不同数值表示不同的土地利用类型、植被类型或岩石类型,但是这些数值之间无数量关系, 对命名数据的逻辑运算只有“等于”或“不等于”两种形式,而其近似均值只能使用众数。 2.2 次序(Ordinal)量 线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大 到小被标为 1,2,3,…,级别的序号越低,其危险性越大,但危险性到底有多大并未给予 定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等算术运算。 次序测量尺度是基于对现象进行排序来标识的,如可以把山峰按高度分级为极高山、高 山、中山、低山和丘陵等,将坡度分为陡、中、缓等。不同次序之间的间隔大小可以不同。 对次序数据的逻辑运算除了“等于”与“不等于”之外,还可以比较它们的大小,即“大于” 或“小于”。 2.3 间隔(Interval)量 不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较 大小,并且它们之间的差值大小是有意义的。 间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值无真的零值。例如,温度是 间隔尺度的数据而不是比例数据,因为它的“0”测量值随着所使用的不同温度测量单位而 不同。不能说 150F 的温度是 75F 的温度的两倍,因为这个比例在使用摄氏单位时就改变了。 相反,降水量是比例数据,因为它有真的零值*。比例数据和间隔数据可用于加、减、乘、 除等运算,而且可以求算术平均。 2.4 比率(Ratio)量 比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺 度与使用的测量单位无关。 与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性 域的例子很多,如年降雨量、海拔高度、人口密度、发病率等。 比例数据或间隔数据可以比较容易地被转变成次序或命名数据。而命名数据则很难被转 化成次序、间隔数据或比例数据。由此可见,尽管命名数据或次序数据便于使用,易于理解, 但有时不够精确,不能用于较高级的算术运算。而比例数据或间隔数据比较精确,便于计算 机处理,但是在较复杂的 GIS 应用中,往往上述几种测量尺度的数据均需用到。 * 与比率量不同,间隔量中的零值往往是人为规定的,如摄氏温标中零摄氏度,时间中的零点等等