中图分类号P22 学校代码10533 UDC 528.1 密级公开 博士学位论文 测量数据误差分布的熵及其应用研究 Entropy of Surveying Data Error Distribution and Application 作者姓名:周访滨 学科专业:测绘科学与技术 研究方向:大地测量学与测量工程 学院(系、所):地球科学与信息物理学院 指导教师: 陈永奇教授 副指导教师: 朱建军 教授 论文答辩日期201457 答辩委员会主席子么考 中南大学 二O一四年五月 万方数据
中图分类号£22 UDC 528.1 博士学位论文 学校代码!Q墨圣三 密级 公珏 测量数据误差分布的熵及其应用研究 Entropy of Surveying Data Error Distribution and Application 作者姓名: 学科专业: 研究方向: 学院(系、所): 指导教师: 昌|J指导教师: 周访滨 测绘科学与技术 大地测量学与测量工程 地球科学与信息物理学院 陈永奇教授 朱建军教授 论文答辩日期丝!竺堑7 答辩委员会主席型 中 南 大学 二O一四年五月 万方数据
学位论文原创性声明 Y2686770 本人郑重声明,所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 中南大学或其他教育机构的学位或证书而使用过的材料。与我共同工作的 同志对本研究所作的贡献均已在论文中作了明确的说明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 作者签名: 日期:沁4年了月20日 学位论文版权使用授权书 本学位论文作者和指导教师完全了解中南大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交学位论文的复印 件和电子版;本人允许本学位论文被查阅和借阅;学校可以将本学位论文 的全部或部分内容编入有关数据库进行检索,可以采用复印、缩印或其它 手段保存和汇编本学位论文。 保密论文待解密后适应本声明。 作者签名: 物性 日期:4年」月20日 日期:2ol业年5月日 万方数据
学位论文原创性声明 本人郑重声明,所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 中南大学或其他教育机构的学位或证书而使用过的材料。与我共同工作的 同志对本研究所作的贡献均己在论文中作了明确的说明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 作者签名: 胜 日期:丛年—二月竺日 学位论文版权使用授权书 本学位论文作者和指导教师完全了解中南大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交学位论文的复印 件和电子版;本人允许本学位论文被查阅和借阅;学校可以将本学位论文 的全部或部分内容编入有关数据库进行检索,可以采用复印、缩印或其它 手段保存和汇编本学位论文。 保密论文待解密后适应本声明。 作者签名: 腥 导师签名 日期:趁!竺年上月—翌日 万方数据
测量数据误差分布的熵及其应用研究 摘要:测量数据的获取离不开一定的观测条件,在不同观测条件 下获取的测量数据必然对应着不同的误差分布,研究测量数据误 差分布的数字特征是误差分析与数据处理的前提。随着测量数据 向着海量、动态和多源误差特性方向发展,对测量数据处理提出 了更高要求,经典误差理论凸显了与其不相适应,主要表现在: ①误差描述不确定性问题的局限性,②误差表示方式的不唯 性,③误差分类的纠缠性,④误差合成估算的复杂性。 测量数据的不确定性实质是一种广义的误差,从信息论角 度,测量数据的获取、测量数据误差处理和测量数据质量评价都 是一种信息传递过程,可将信息熵应用于研究测量数据不确定 性。熵作为分布的数字特征之一综合反映了概率分布的形式和概 率分布的范围,研究测量数据误差分布的熵是拓展熵理论在测量 数据处理领域引用的基础,是研究熵意义上的测量数据不确定性 的先决条件,而且是广义误差理论拓展的有效途径。已有的相关 研究中尚有以下问题亟待解决: (1)熵可以综合反映一定观测条件下的测量数据的不确定 性,但不同类型分布的熵值运算法则和规律、误差熵的作用机理 等问题缺乏系统性地研究和归纳整理。 (2)污染分布模式促进了测量数据处理理论的发展,作为 复合分布的典型代表,其概率密度函数表达的不确定性造成了其 熵估算的难点。污染分布的熵,尤其是污染正态分布的熵如何估 算,目前研究未能很好解决。 (3)P-范分布熵的严密计算过程因其概率密度函数表达的 复杂性相对复杂,不利于实际应用,其熵计算能否得到有效简化 需要进一步研究解决。 (4)测量数据获取中难免有粗差的存在,污染率表征了粗 差的影响程度,在实际应用中粗差的统计常常受到门限的干扰, 数据的污染能否通过熵变化得以反映和污染率能否避开传统门 限值选择问题而通过熵变得以估算也需展开研究。 针对上述有关测量数据误差分布的熵研究中亟待解决的问 题,本文展开研究,主要内容和贡献有: 万方数据
测量数据误差分布的熵及其应用研究 摘要:测量数据的获取离不开一定的观测条件,在不同观测条件 下获取的测量数据必然对应着不同的误差分布,研究测量数据误 差分布的数字特征是误差分析与数据处理的前提。随着测量数据 向着海量、动态和多源误差特性方向发展,对测量数据处理提出 了更高要求,经典误差理论凸显了与其不相适应,主要表现在: ①误差描述不确定性问题的局限性,②误差表示方式的不唯一 性,⑧误差分类的纠缠性,④误差合成估算的复杂性。 测量数据的不确定性实质是一种广义的误差,从信息论角 度,测量数据的获取、测量数据误差处理和测量数据质量评价都 是一种信息传递过程,可将信息熵应用于研究测量数据不确定 性。熵作为分布的数字特征之一综合反映了概率分布的形式和概 率分布的范围,研究测量数据误差分布的熵是拓展熵理论在测量 数据处理领域引用的基础,是研究熵意义上的测量数据不确定性 的先决条件,而且是广义误差理论拓展的有效途径。已有的相关 研究中尚有以下问题亟待解决: (1)熵可以综合反映一定观测条件下的测量数据的不确定 性,但不同类型分布的熵值运算法则和规律、误差熵的作用机理 等问题缺乏系统性地研究和归纳整理。 (2)污染分布模式促进了测量数据处理理论的发展,作为 复合分布的典型代表,其概率密度函数表达的不确定性造成了其 熵估算的难点。污染分布的熵,尤其是污染正态分布的熵如何估 算,目前研究未能很好解决。 (3)P.范分布熵的严密计算过程因其概率密度函数表达的 复杂性相对复杂,不利于实际应用,其熵计算能否得到有效简化 需要进一步研究解决。 (4)测量数据获取中难免有粗差的存在,污染率表征了粗 差的影响程度,在实际应用中粗差的统计常常受到门限的干扰, 数据的污染能否通过熵变化得以反映和污染率能否避开传统门 限值选择问题而通过熵变得以估算也需展开研究。 针对上述有关测量数据误差分布的熵研究中亟待解决的问 题,本文展开研究,主要内容和贡献有: 万方数据
(1)系统研究了测量数据处理中的信息熵理论体系,归纳 整理了测量数据处理中熵的概念、基本性质和典型性质,阐明了 熵与误差、不确定度、分布和权的关系。 (2)系统研究了测量数据误差分布的熵律,通过连续型随 机变量具有明确概率密度函数的分布熵计算推导及其熵值特性 分析,全面归纳总结了一般意义上测量数据误差分布的熵律,进 一步阐述了熵意义上的测量数据误差以及误差熵的作用基础。 (3)建立了污染正态分布熵和熵系数估算的一种近似方法, 填补了以污染正态分布为典型代表的此类复杂复合分布的熵估 算方法的空白。研究以污染正态分布概率密度函数的模型研究入 手,引入Kullback-Leibler距离研究污染正态分布两种模型概率 密度函数的差异性,导出了污染正态分布的主体分布概率密度函 数、均值漂移模型下和方差扩大模型下总体分布概率密度函数之 间的Kullback-Leibler距离表达式,分析指出了污染正态分布的 熵估算关键是寻求一种适合熵值运算规律的方案。 (4)提出了以简单分布的熵组合近似估计P-范分布的熵, 简化了其计算过程,解决了P范分布复杂的概率密度函数表达式 不利于其熵计算和实际应用的问题。 (5)引入了熵分析方法研究GPS RTK观测数据误差特性, 给出了熵用于测量数据误差分析一种有效途径。 (6)建立了以熵为计算基础的数据污染率估算方法,分别 提出了数据在主体分布模式已知和未知两种情况下的污染率估 算方法,并分析了熵计算的截断误差对污染率的估算影响。 关键词:熵,熵系数,不确定度,污染正态分布,P范分布 分类号:P22 万方数据
(1)系统研究了测量数据处理中的信息熵理论体系,归纳 整理了测量数据处理中熵的概念、基本性质和典型性质,阐明了 熵与误差、不确定度、分布和权的关系。 (2)系统研究了测量数据误差分布的熵律,通过连续型随 机变量具有明确概率密度函数的分布熵计算推导及其熵值特性 分析,全面归纳总结了一般意义上测量数据误差分布的熵律,进 一步阐述了熵意义上的测量数据误差以及误差熵的作用基础。 (3)建立了污染正态分布熵和熵系数估算的一种近似方法, 填补了以污染正态分布为典型代表的此类复杂复合分布的熵估 算方法的空白。研究以污染正态分布概率密度函数的模型研究入 手,引入Kullback—Leibler距离研究污染正态分布两种模型概率 密度函数的差异性,导出了污染正态分布的主体分布概率密度函 数、均值漂移模型下和方差扩大模型下总体分布概率密度函数之 间的Kullback—Leibler距离表达式,分析指出了污染正态分布的 熵估算关键是寻求一种适合熵值运算规律的方案。 (4)提出了以简单分布的熵组合近似估计P一范分布的熵, 简化了其计算过程,解决了P.范分布复杂的概率密度函数表达式 不利于其熵计算和实际应用的问题。 (5)引入了熵分析方法研究GPS RTK观测数据误差特性, 给出了熵用于测量数据误差分析一种有效途径。 (6)建立了以熵为计算基础的数据污染率估算方法,分别 提出了数据在主体分布模式已知和未知两种情况下的污染率估 算方法,并分析了熵计算的截断误差对污染率的估算影响。 关键词:熵,熵系数,不确定度,污染正态分布,P一范分布 分类号:P22 万方数据
Entropy of Surveying Data Error Distribution and Application Abstract:Under a certain condition,the surveying error distribution of surveying data acquired must be obvious.The characteristics investigation of surveying error distribution is a prerequisite for error analysis and data processing.The surveying data is toward massive, dynamic and multi-resource error.It is limited for the classical error theory to process present type of surveying data.The main limitations summarized as follow:Dthe limitation of uncertaninty expressed by error,2the uniquity of error representation means,3the entanglement of error classification,4 the complexityof error synthesis.In view of the existing problems in the data processing,surveying uncertainty is used to measure data uncertainty and assess data quality in the field of GIS and measurement. The uncertainty of surveying data is actually a kind of generalized error.From the perspective of information theory,data acquisition, error processing and the quality evaluation of surveying data is a process of information transmission.Because information entropy is used to measure the uncertainty of random variables,it can be used to study data uncertainty.Entropy is one of the distribution digital characteristics, expressed by the form of probability distribution and the range of probability distribution.Study on the measurement data error distribution entropy is the basis of expanding the entropy theory cited in the field of surveying and data processing,is a prerequisite for investigating data uncertainty based on entropy,and is an effective way to expand the generalized error theory.The research of surveying data error distribution entropy has been achieved some results in the past half century,but there are still some problems as follows: 1)The entropy can reflect surveying data uncertainty under a certain observation conditions,but how to estimate different distribution entropy, and how to get the mechanism of error entropy et al issues is lack of investigation systematically. 2)Contaminated distribution once promoted the development of surveying data processing theory,and the probability density function 川 万方数据
Entropy of Surveying Data Error Distribution and Application Abstract:Under a certain condition,the surveying error distribution of surveying data acquired must be obvious.The characteristics investigation of surveying error distribution is a prerequisite for error analysis and data processing.The surveying data 1S toward massive, dynamic and multi—resource error.It iS limited for the classical error theory to process present type of surveying data.The main limitations summarized as follow:①the limitation of uncertaninty expressed by error,②the uniquity of error representation means,⑨the entanglement of error classification,④the complexityof error synthesis.In view of the existing problems in the data processing,surveying uncertainty 1S used to measure data uncertainty and assess data quality in the field of GIS and measurement. The uncertainty of surveying data is actually a kind of generalized error.From the perspective of information theory,data acquisition, error processing and the quality evaluation of surveying data iS a process of inforlnation transmission.Because information entropy is used to measure the uncertainty of random vailables,it can be used to study data uncertainty.Entropy is one of the distribution digital characteristics, expressed by the form of probability distribution and the range of probability distribution. Study on the measurement data error distribution entropy is the basis of expanding the entropy theory cited in the field of surveying and data processing,iS a prerequisite for investigating data uncertainty based on entropy,and is an effective way tO expand the generalized error theory.The research of surveying data error distribution entropy has been achieved some results in the past half century,but there are still some problems as follows: 1)The entropy can reflect surveying data uncertainty under a certain observation conditions,but how to estimate different distribution entropy, and how to get the mechanism of error entropy et al issues is lack of investigation systematically. 2、Contaminated distribution once promoted the development of surveying data processing theory,and the probability density function lIl 万方数据