网络就是计算机 Sun Microsystem Corp 第十三章网络地理信息系统 导读:本章首先介绍了计算机网络的基本知识,包括定义、拓扑结构、分类、网络 协议等,然后介绍了因特网以及目前流行的WwW和HIML语言 第二节讲述了基于网络的分布计算以及地理信息系统在分布计算环境下的具体实现 方案 第三节主要介绍了在web上发布空间数据,即实现 WebGIS的几种技术方案,并进 行了比较。 计算机网络技术 1.1网络的基本概念 1.1.1定义 计算机网络( Computer Network)是指实现计算机之间通讯的软件和硬件系统的统称 从广义上讲,利用磁盘在两台微机之间拷贝数据也可以认为是一种特殊的网络。它的更加具 体的定义是“以共享资源为目的,通过数据通讯线路将多台计算机互联而组成的系统”,共 享的资源包括计算机网络中的硬件设备、软件或者数据 1.1.2网络拓扑结构和分类 计算机网络中,网络结点(Node)计算机或者终端的连接方式称为网络的拓扑结构,它影 响着网络的设计、功能、可靠性以及通讯费用等方面,常见的拓扑结构有以下类型:(图13-1) 星形拓扑结构 总线拓扑结构 环形拓扑结构 树形拓扑 完全连接结构; 相交环形
网络就是计算机。 Sun Microsystem Corp. 第十三章 网络地理信息系统 导读:本章首先介绍了计算机网络的基本知识,包括定义、拓扑结构、分类、网络 协议等,然后介绍了因特网以及目前流行的 WWW 和 HTML 语言。 第二节讲述了基于网络的分布计算以及地理信息系统在分布计算环境下的具体实现 方案。 第三节主要介绍了在 Web 上发布空间数据,即实现 WebGIS 的几种技术方案,并进 行了比较。 1.计算机网络技术 1.1 网络的基本概念 1.1.1 定义 计算机网络(Computer Network)是指实现计算机之间通讯的软件和硬件系统的统称, 从广义上讲,利用磁盘在两台微机之间拷贝数据也可以认为是一种特殊的网络。它的更加具 体的定义是“以共享资源为目的,通过数据通讯线路将多台计算机互联而组成的系统”,共 享的资源包括计算机网络中的硬件设备、软件或者数据。 1.1.2 网络拓扑结构和分类 计算机网络中,网络结点(Node)计算机或者终端的连接方式称为网络的拓扑结构,它影 响着网络的设计、功能、可靠性以及通讯费用等方面,常见的拓扑结构有以下类型:(图 13-1) ⚫ 星形拓扑结构; ⚫ 总线拓扑结构; ⚫ 环形拓扑结构; ⚫ 树形拓扑; ⚫ 完全连接结构; ⚫ 相交环形;
不规则拓扑结构等等。 Computer Cable Cable 米 图13-1:网络拓扑结构(A.S. Tanenbaum) (1)总线结构,(2)环形结构,(3)星形结构,(4)树形结构 (5)完全连接,(6)相交环形,(7)不规则拓扑结构 计算机网络的种类繁多,性能各异,按照不同的原则可以有不同的分类方式,最常见的 是根据其空间分布范围的大小,区分为局域网(LAN- Local Area Network)、城域网 ( MAN-Metropolitan Area Network)和广域网( WAN-Wide Area Network) 1)局域网 是指在比较小的区域一一如一座办公大楼,一个校园,一个公司等内建立的计算机网络, 其通讯距离较短,传输速率较快,误码率低。对于局域网而言,主要采用的拓扑结构是总线 结构和环形结构,前者如IFEE802.3,通常称为 Ethernet m(以太网),后者如IEEE8025, 即IBM的令牌环网( Token ring) 2)城域网 基本上是一个大的局域网,采用类似的拓扑结构,它可以覆盖一个城市,实现信息共享。 3)广域网 广域网最根本的特点是其机器分布范围广,可以实现大范围的信息共享,笼统地讲,因 特网( nternet))就属于广域网范畴。广域网可以采用多种拓扑结构,如星形,环形,树型,完 全连接,相交环形,甚至是不规则的拓扑结构 上述的网络类型,结点之间都是通过电缆进行连接,近年来无线网( Wireless Network) 得到较快的发展,利用无线网,可以实现移动计算
⚫ 不规则拓扑结构等等。 Computer Cable (1) (2) Cable 图 13-1:网络拓扑结构(A. S. Tanenbaum) (1)总线结构,(2)环形结构,(3)星形结构,(4)树形结构, (5)完全连接,(6)相交环形,(7)不规则拓扑结构 计算机网络的种类繁多,性能各异,按照不同的原则可以有不同的分类方式,最常见的 是根据其空间分布范围的大小,区分为局域网(LAN-Local Area Network) 、城域网 (MAN-Metropolitan Area Network)和广域网(WAN-Wide Area Network)。 1)局域网 是指在比较小的区域——如一座办公大楼,一个校园,一个公司等内建立的计算机网络, 其通讯距离较短,传输速率较快,误码率低。对于局域网而言,主要采用的拓扑结构是总线 结构和环形结构,前者如 IEEE 802.3,通常称为 EthernetTM(以太网),后者如 IEEE 802.5, 即 IBM 的令牌环网(Token Ring)。 2)城域网 基本上是一个大的局域网,采用类似的拓扑结构,它可以覆盖一个城市,实现信息共享。 3)广域网 广域网最根本的特点是其机器分布范围广,可以实现大范围的信息共享,笼统地讲,因 特网(Internet)就属于广域网范畴。广域网可以采用多种拓扑结构,如星形,环形,树型,完 全连接,相交环形,甚至是不规则的拓扑结构。 上述的网络类型,结点之间都是通过电缆进行连接,近年来无线网(Wireless Network) 得到较快的发展,利用无线网,可以实现移动计算
1.2因特网( Internet 因特网是指全球最大的、开放的、由众多网络相互连接而成的计算机网络,其形成和发 展无疑是信息技术发展过程中最为激动人心的事情,目前大专院校,大学,政府部门,图书 馆,企业以及个人都已经连接到因特网,它允许网络使用者在任何时间、任何地点查阅任何 网络上的信息,它给信息传播带来了巨大便利,它正在改变着整个人类社会的生活方式 1.2.1因特网发展历史 因特网的前身是1965年开始由美国国防部设计的ARPA( Advanced Research Project Agency)net。经过周密的策划,196年,分布于美国四所大学( UCLA UCSB,SR,UTAH) 的计算机开始进行互相数据交换,标志着 ARPAnet的诞生,后来,特别是1983年TCP/P 协议被正式应用于 ARPAnet之后,其接入用户飞速增长。 由于 ARPAnet的军方背景,给更加便捷的连入和访问造成不便,于是NSF( National Science foundation)建立了 NSFnet,其管理和速度都优越于 ARPAnet,到1990年,很多用 户从 ARPAnet转到 NSFnet,后来 NSfnet与 ARPAnet互连,其用户成指数增长。许多地区 性(包括加拿大、欧洲、大洋州等)的网络联入后,标志着 Internet的最终形成。 1.2.2因特网提供的应用服务 在传统上,因特网主要有以下四种应用: 电子邮件( Electronic mail) 新闻组(News) 远程登录; 文件传输。 直到八十年代初期,因特网还只是局限于学院、政府等等,但是www( World Wide Web) 的出现改变了这一切,WwW使得一个站点可以建立一些包括文本、图片、声音甚至录象 的页面,这些页面用超文本标志语言( HTML-Hyper Text Markup Language)写成,内嵌指向其 它页面的链接。WwW为用户查询、检索、浏览在因特网上发布的各种信息提供了极大的 便利,为因特网带来了大量的非学院用户。实际上因特网的迅猛发展,与WWW应用是密 不可分的,以至于今天提到 Internet时常常就是特指WWw服务。后面将对WWW以及相 关技术进行更为详细的说明。 其它一些因特网应用包括 Gopher,wAS等等。 1.2.3网络协议( Protocol〕和TcPP 在计算机网络中,为了使得相连的计算机或终端之间能够正确的传输信息,必须有一整 套关于信息传输顺序、信息格式以及内容的约定,称为计算机网络通讯协议。 在网络协议中,由国际标准化组织(SO发展和制定开放系统互连参考模型(OSI,Open System Interconnect Reference Model)制订了数据通讯协议的标准,尽管OSI模型并没有真 正地在实际中被应用,但是其提供的概念和词汇被计算机网络界广泛地使用和认可。OSI 参考模型包括七个协议层来定义数据通讯的协议功能,每一层是相对独立的,完成数据传输
1.2 因特网(Internet) 因特网是指全球最大的、开放的、由众多网络相互连接而成的计算机网络,其形成和发 展无疑是信息技术发展过程中最为激动人心的事情,目前大专院校,大学,政府部门,图书 馆,企业以及个人都已经连接到因特网,它允许网络使用者在任何时间、任何地点查阅任何 网络上的信息,它给信息传播带来了巨大便利,它正在改变着整个人类社会的生活方式。 1.2.1 因特网发展历史 因特网的前身是 1965 年开始由美国国防部设计的 ARPA(Advanced Research Project Agency)net。经过周密的策划,1969 年,分布于美国四所大学(UCLA,UCSB,SRI,UTAH) 的计算机开始进行互相数据交换,标志着 ARPAnet 的诞生,后来,特别是 1983 年 TCP/IP 协议被正式应用于 ARPAnet 之后,其接入用户飞速增长。 由于 ARPAnet 的军方背景,给更加便捷的连入和访问造成不便,于是 NSF(National Science Foundation)建立了 NSFnet,其管理和速度都优越于 ARPAnet,到 1990 年,很多用 户从 ARPAnet 转到 NSFnet,后来 NSFnet 与 ARPAnet 互连,其用户成指数增长。许多地区 性(包括加拿大、欧洲、大洋州等)的网络联入后,标志着 Internet 的最终形成。 1.2.2 因特网提供的应用服务 在传统上,因特网主要有以下四种应用: ⚫ 电子邮件(Electronic Mail); ⚫ 新闻组(News); ⚫ 远程登录; ⚫ 文件传输。 直到八十年代初期,因特网还只是局限于学院、政府等等,但是 WWW(World Wide Web) 的出现改变了这一切,WWW 使得一个站点可以建立一些包括文本、图片、声音甚至录象 的页面,这些页面用超文本标志语言(HTML-Hyper Text Markup Language)写成,内嵌指向其 它页面的链接。WWW 为用户查询、检索、浏览在因特网上发布的各种信息提供了极大的 便利,为因特网带来了大量的非学院用户。实际上因特网的迅猛发展,与 WWW 应用是密 不可分的,以至于今天提到 Internet 时常常就是特指 WWW 服务。后面将对 WWW 以及相 关技术进行更为详细的说明。 其它一些因特网应用包括 Gopher,WAIS 等等。 1.2.3 网络协议(Protocol)和 TCP/IP 在计算机网络中,为了使得相连的计算机或终端之间能够正确的传输信息,必须有一整 套关于信息传输顺序、信息格式以及内容的约定,称为计算机网络通讯协议。 在网络协议中,由国际标准化组织(ISO)发展和制定开放系统互连参考模型(OSI,Open System Interconnect Reference Model)制订了数据通讯协议的标准,尽管 OSI 模型并没有真 正地在实际中被应用,但是其提供的概念和词汇被计算机网络界广泛地使用和认可。OSI 参考模型包括七个协议层来定义数据通讯的协议功能,每一层是相对独立的,完成数据传输
过程中的部分功能。 目前,由于因特网的发展,TCPP作为其基础协议,应用越来越广泛。TCPP狭义特 指两个协议及传输控制协议(TCP, Transformation Control protocol)和网际协议(P, Internet Protocol),广义指由多个与因特网相关的协议组成的TCP/P参考模型,或者称为TCPP协 议栈( Protocol stack), TCP/IP模型类似于OSI参考模型,但是较为简单,没有表示层和会话 层。TCP及IP是其中重要的两个协议,IP是网络层协议,而TCP位于传输层 ICPP应用层包括所有高层应用协议,如虚拟终端( TELNET)、文件传输(FTP,Fle ransfer Protoco)、电子邮件(SMIP, Simple Mail Transfer Protocol和POP3 PostOffice Protocol)、域名服务(DNS, Domain Name Service)以及Web上用来传递页面的超文本传输协 ix(http,HyperTextTransferProtocol) OSI参考模型结构及其和 TCP/IP参考模型的对应关系如图13-2 应用层 应用层 表示层 会话层 模型中无 该层 传输层 传输层 网络层 Internet层 数据链路层 物理层 主机到网络 图13-2:OSI参考模型和TCPP参考模型 1.2.4因特网的地址、域名 为了能够在因特网上传输信息,必须有一种方法能够识别计算机,其方案是为因特网上 的每一台计算机都赋予了一个独一无二的32位地址,称为IP地址,该32位地址通采用用 点号分割的十进制数表示,每个字节为一个十进制数值,其数值范围从0到255,这样,IP 地址就表现为如下的形式:202.112.7.12(北京大学WWW服务器IP地址)。在因特网上, 计算机之间的通讯是通过IP地址来进行的。由于因特网的迅速发展,有越来越多的计算机 连入,现有的32位IP地址已经不太能够满足其进一步发展的需要,因此,ITEF( nternet Engineering Task Force,因特网工程任务组)开始制订更新的IP协议标准,称为lpv6,根据 该标准,IP地址将采用16个字节来标识。 虽然计算机之间的通讯是利用其各自的IP地址来实现的,但是人们在使用过程中,不 愿意总是使用难以记忆的数字,而是希望使用更为方便的文字名称。这样网络上的各个主机 除了P地址之外,通常还有一个名称来表示。该名称称为域名( Domal Name),与PP地址 一样,也是唯一的。这种在因特网上使用的名称系统称为域名系统(DNS, Domain name System)。DNS是一个层次状的命名系统,通过一个数据库对连接因特网的所有主机进行名 称和地址的管理。域名是以点号分割的字符串,如 PKUEDU. CN和 OPENGIS ORG等等。通 常最右边的字串称为顶级域名,顶级域名有两类,即类顶级域名和国家顶级域名,前者有 com(商业),ed(教育界),gon(政府机构),i(特定的国际组织),mi(军队系统),net(网 络提供者),og(非赢利机构)等,类顶级域名应用于美国的站点:后者用两个英文字母表 小一个国家和地区,如cn(中国),ca(加拿大,jp(日本)等等
过程中的部分功能。 目前,由于因特网的发展,TCP/IP 作为其基础协议,应用越来越广泛。TCP/IP 狭义特 指两个协议及传输控制协议(TCP,Transformation Control Protocol)和网际协议(IP,Internet Protocol),广义指由多个与因特网相关的协议组成的 TCP/IP 参考模型,或者称为 TCP/IP 协 议栈(Protocol Stack),TCP/IP 模型类似于 OSI 参考模型,但是较为简单,没有表示层和会话 层。TCP 及 IP 是其中重要的两个协议,IP 是网络层协议,而 TCP 位于传输层。 TCP/IP 应用层包括所有高层应用协议,如虚拟终端(TELNET)、文件传输(FTP,File Transfer Protocol)、电子邮件(SMTP,Simple Mail Transfer Protocol 和 POP3-PostOffice Protocol)、域名服务(DNS,Domain Name Service)以及 Web 上用来传递页面的超文本传输协 议(HTTP,Hyper Text Transfer Protocol)。 OSI 参考模型结构及其和 TCP/IP 参考模型的对应关系如图 13-2: 应用层 表示层 会话层 传输层 网络层 数据链路层 物理层 应用层 传输层 Internet 层 主机到网络 模型中无 该层 图 13-2:OSI 参考模型和 TCP/IP 参考模型 1.2.4 因特网的地址、域名 为了能够在因特网上传输信息,必须有一种方法能够识别计算机,其方案是为因特网上 的每一台计算机都赋予了一个独一无二的 32 位地址,称为 IP 地址,该 32 位地址通采用用 点号分割的十进制数表示,每个字节为一个十进制数值,其数值范围从 0 到 255,这样,IP 地址就表现为如下的形式:202.112.7.12(北京大学 WWW 服务器 IP 地址)。在因特网上, 计算机之间的通讯是通过 IP 地址来进行的。由于因特网的迅速发展,有越来越多的计算机 连入,现有的 32 位 IP 地址已经不太能够满足其进一步发展的需要,因此,ITEF(Internet Engineering Task Force, 因特网工程任务组)开始制订更新的 IP 协议标准,称为 Ipv6,根据 该标准,IP 地址将采用 16 个字节来标识。 虽然计算机之间的通讯是利用其各自的 IP 地址来实现的,但是人们在使用过程中,不 愿意总是使用难以记忆的数字,而是希望使用更为方便的文字名称。这样网络上的各个主机 除了 IP 地址之外,通常还有一个名称来表示。该名称称为域名(Domail Name),与 IP 地址 一样,也是唯一的。这种在因特网上使用的名称系统称为域名系统(DNS,Domain Name System)。DNS 是一个层次状的命名系统,通过一个数据库对连接因特网的所有主机进行名 称和地址的管理。域名是以点号分割的字符串,如 PKU.EDU.CN 和OPENGIS.ORG等等。通 常最右边的字串称为顶级域名,顶级域名有两类,即类顶级域名和国家顶级域名,前者有 com(商业),edu(教育界),gov(政府机构),int(特定的国际组织),mil(军队系统),net(网 络提供者),org(非赢利机构)等,类顶级域名应用于美国的站点;后者用两个英文字母表 示一个国家和地区,如 cn(中国),ca(加拿大),jp(日本)等等
1.2.5WWW、HTML和URL 正如前面描述的,万维网(WWW)的出现对于因特网来说具有划时代的意义,使得因 特网的应用走出专业化。WWW,通常又称为Web或3W,是存储在全世界的 Internet计算 机中、彼此关联、数以百万计的文档集合,它是世界上最大的电子信息仓库。在WwW应 用中,Web文档存放于一台或者多台计算机上,称为web服务器( Web server),用户利用浏 览器( Browser)来访问Web站点。 Web的第一个版本于1992年1月在瑞士的日内瓦首先开始运行,研究人员可以从 CERN(欧洲粒子物理研究所)的站点上访问web信息。web真正流行应该归功于 Mosaic,第 个基于图形的浏览器,该浏览器是由NCSA(美国国家超级计算应用中心)设计编写的,其 操作简便、界面友好的特点,使得人们可以方便的访问Web信息。目前广为流行的浏览器 XE Microsoft Internet Explorer FI Netscape Navigator 在Web站点上,采用HIML编写文档,通常称为超文本( Hyper Text),“超”的意思是指 在文档中包含对其它文档的超链接( Hyper Link),使用户阅读时可以通过关键字跳转到其 它的文档。由于允许在超文本中加入音乐以及图像等多媒体数据,又诞生了超媒体( Hyper Mdia)这个概念。HIML是一种标记语言,与系统平台和应用程序无关,它通过特殊的标记 和参考字符来设定Web文档的结构或者格式,并且有特殊的HTML元素(如定位元素 Anchor)来定义超链接,同时可以利用HIML表单元素从用户那里获取有关信息。在用户 访问Web站点时,浏览器和web服务器之间通过超文本传输协议(HTP)来发送请求和信息。 在浏览Web时,首先会碰到URI( Uniform Resource Locator,统一资源定位器)这一概念, 它是web文档的因特网地址,它与文档的关系就如同于书籍中目录和正文的关系。URL的 语法相当简单,由两部分组成,形如 <方法>:<方法指定部分>(< scheme>:< scheme- specific-part>) 个 Http Url如下 其中host部分由服务器的地址(IP地址或者域名)、文件路径、文件名组成;port部分 是HITP端口号,其缺省为80,通常可以忽略;而 search _ part部分往往是浏览器向服务器 发出的请求参数。下面是一个 Http Url的例子: http://www.pku.edu.cn/newsl/index.htm 除了Web以外,FTP、 Gopher等也采用URL进行资源定位 1.2.6企业内部互连网 在九十年代后半段,随着因特网的发展,出现了企业内部互连网( Intranet)这个崭新 的概念,简而言之, Intranet是企业自己的内部网络,不过这个网络同样采用了基于 Internet 的工具,如 Email,web浏览器和文件传输等等,因而使得一个企业内部充分享用因特网的 各种优势,如信息的共享和管理,实时通讯和协作,使用分布式的数据库等等 2.分布式地理信息系统 随着计算机网络的发展,基于客户机/服务器体系结构,并在网络支持下的分布式系统 结构已经成为地理信息系统的发展趋势。由于GIS的固有的特点,使得运行于网络上的分 布式系统特别适合于构造较大规模的GIS应用,其应用表现在以下几个方面:
1.2.5WWW、HTML 和 URL 正如前面描述的,万维网(WWW)的出现对于因特网来说具有划时代的意义,使得因 特网的应用走出专业化。WWW,通常又称为 Web 或 3W,是存储在全世界的 Internet 计算 机中、彼此关联、数以百万计的文档集合,它是世界上最大的电子信息仓库。在 WWW 应 用中,Web 文档存放于一台或者多台计算机上,称为 Web 服务器(Web Server),用户利用浏 览器(Browser)来访问 Web 站点。 Web 的第一个版本于 1992 年 1 月在瑞士的日内瓦首先开始运行,研究人员可以从 CERN(欧洲粒子物理研究所)的站点上访问 Web 信息。Web 真正流行应该归功于 Mosaic,第 一个基于图形的浏览器,该浏览器是由 NCSA(美国国家超级计算应用中心)设计编写的,其 操作简便、界面友好的特点,使得人们可以方便的访问 Web 信息。目前广为流行的浏览器 是 Microsoft Internet Explorer 和 Netscape Navigator。 在 Web 站点上,采用 HTML 编写文档,通常称为超文本(Hyper Text),“超”的意思是指 在文档中包含对其它文档的超链接(Hyper Link),使用户阅读时可以通过关键字跳转到其 它的文档。由于允许在超文本中加入音乐以及图像等多媒体数据,又诞生了超媒体(Hyper Media)这个概念。HTML 是一种标记语言,与系统平台和应用程序无关,它通过特殊的标记 和参考字符来设定 Web 文档的结构或者格式,并且有特殊的 HTML 元素(如定位元素 Anchor)来定义超链接,同时可以利用 HTML 表单元素从用户那里获取有关信息。在用户 访问 Web 站点时,浏览器和 Web 服务器之间通过超文本传输协议(HTTP)来发送请求和信息。 在浏览 Web 时,首先会碰到 URL(Uniform Resource Locator,统一资源定位器)这一概念, 它是 Web 文档的因特网地址,它与文档的关系就如同于书籍中目录和正文的关系。URL 的 语法相当简单,由两部分组成,形如: <方法>:<方法指定部分>(<scheme>:<scheme-specific-part>) 一个 HTTP URL 如下: http://<host>:<port>?<search_part> 其中 host 部分由服务器的地址(IP 地址或者域名)、文件路径、文件名组成;port 部分 是 HTTP 端口号,其缺省为 80,通常可以忽略;而 search_part 部分往往是浏览器向服务器 发出的请求参数。下面是一个 HTTP URL 的例子: http://www.pku.edu.cn/news1/index.htm 除了 Web 以外,FTP、Gopher 等也采用 URL 进行资源定位。 1.2.6 企业内部互连网 在九十年代后半段,随着因特网的发展,出现了企业内部互连网(Intranet)这个崭新 的概念,简而言之,Intranet 是企业自己的内部网络,不过这个网络同样采用了基于 Internet 的工具,如 Email,Web 浏览器和文件传输等等,因而使得一个企业内部充分享用因特网的 各种优势,如信息的共享和管理,实时通讯和协作,使用分布式的数据库等等。 2.分布式地理信息系统 随着计算机网络的发展,基于客户机/服务器体系结构,并在网络支持下的分布式系统 结构已经成为地理信息系统的发展趋势。由于 GIS 的固有的特点,使得运行于网络上的分 布式系统特别适合于构造较大规模的 GIS 应用,其应用表现在以下几个方面: