博士学位论文 第1章绪论 1.3研究内容、目标及论文组织 1.3.1研究内容 本文针对测量数据误差分布熵估算存在的问题,系统研究了测量数据误差 分布的熵估算方法及其应用。研究内容包括测量数据处理中涉及的信息熵概念、 基本性质、典型性质,分析熵与误差、不确定度、分布和权的关系,测量数据 误差分布的熵律,污染正态分布的熵估算,P范分布的熵估算及其熵在测量数据 中的应用。论文的主要研究内容包括以下几点,这也是本课题研究的主体技术 路线: 1.熵在数据处理领域的应用和拓展十分宽泛,针对测量数据处理领域,研 究了本领域研究涉及的信息熵理论,包括测量数据处理研究中已引入的信息熵 概念、基本性质、典型性质,从信息论的角度诠释测量现象,认为任一测量过 程从数据获取、数据误差处理到测量数据质量评价都是一种信息传递过程,分 析指出了信息熵用于描述测量数据不确定性的独特优势,阐述了数据误差熵变 与误差存在之间的辩证关系,进一步阐明了信息熵与误差、不确定度、分布和 权的关系: 2.系统研究了测量数据误差分布的熵律,以测量数据处理中常见的正态分 布、均匀分布和拉普拉斯分布的熵计算入手,通过连续型随机变量具有明确概 率密度函数的分布熵计算推导及其熵值特性分析,系统归纳总结了一般意义上 测量数据误差分布的熵律,并进一步阐述了熵意义上的测量数据误差以及误差 熵作用基础: 3.研究了复合分布的典型代表一污染正态分布的熵估算方法,从污染正态 分布概率密度函数的模型研究入手,引入Kullback-Leibler距离研究污染正态分 布的“均值漂移”和“方差扩大”两种模型概率密度函数的差异性,导出了污 染正态分布的主体分布概率密度函数、均值漂移模型下和方差扩大模型下总体 分布概率密度函数之间的Kullback-Leibler距离表达式,分析指出污染正态分布 的熵估算关键不在于选取概率密度函数,而在于寻求一种适合熵值运算规律的 方案,在此基础上,提出了污染正态分布摘和熵系数估算的一种近似方法,有 效回避了污染正态分布本身表达中污染分布未知无法进行熵合成运算的问题: 4.研究了P-范分布熵估算的简化方法,P范分布是全面概括了正态分布、 均匀分布和拉普拉斯分布等测量数据处理领域常见的典型分布,它用参数p来 表达测量误差分布的一族指数分布,它的实质是一个分布族,P范分布有着极其 复杂的概率密度函数表达式,其熵的计算推导过程复杂而繁琐,不利于熵的计 16 万方数据
博士学位论文 第l章绪论 1.3研究内容、目标及论文组织 1.3.1研究内容 本文针对测量数据误差分布熵估算存在的问题,系统研究了测量数据误差 分布的熵估算方法及其应用。研究内容包括测量数据处理中涉及的信息熵概念、 基本性质、典型性质,分析熵与误差、不确定度、分布和权的关系,测量数据 误差分布的熵律,污染正态分布的熵估算,P一范分布的熵估算及其熵在测量数据 中的应用。论文的主要研究内容包括以下几点,这也是本课题研究的主体技术 路线: 1.熵在数据处理领域的应用和拓展十分宽泛,针对测量数据处理领域,研 究了本领域研究涉及的信息熵理论,包括测量数据处理研究中已引入的信息熵 概念、基本性质、典型性质,从信息论的角度诠释测量现象,认为任一测量过 程从数据获取、数据误差处理到测量数据质量评价都是一种信息传递过程,分 析指j_}{了信息熵用于捕述测量数据不确定性的独特优势,阐述了数据误差熵变 与误差存在之间的辩证关系,进一步阐明了信息熵与误差、不确定度、分布和 权的关系; 2.系统研究了测量数据误差分布的熵律,以测量数据处理中常见的正态分 布、均匀分布和拉普拉斯分布的熵计算入手,通过连续型随机变量具有明确概 率密度函数的分布熵计算推导及其熵值特性分析,系统归纳总结了一般意义上 测量数据误差分布的熵律,并进一步阐述了熵意义上的测量数据误差以及误差 熵作用基础; 3.研究了复合分布的典型代表一污染正态分布的熵估算方法,从污染正态 分布概率密度函数的模型研究入手,引入Kullback—Leibler距离研究污染正态分 布的“均值漂移”和“方差扩大”两种模型概率密度函数的差异性,导出了污 染正态分布的主体分布概率密度函数、均值漂移模型下和方差扩大模型下总体 分布概率密度函数之问的Kullback.Leibler距离表达式,分析指出污染正态分布 的熵估算关键不在于选取概率密度函数,而在于寻求一种适合熵值运算规律的 方案,在此基础上,提出了污染正态分布熵和熵系数估算的一种近似方法,有 效回避了污染正态分布本身表达中污染分布未知无法进行熵合成运算的问题; 4.研究了P一范分布熵估算的简化方法,P.范分布是全面概括了正态分布、 均匀分布和拉普拉斯分布等测量数据处理领域常见的典型分布,它用参数P来 表达测量误差分布的一族指数分布,它的实质是一个分布族,P一范分布有着极其 复杂的概率密度函数表达式,其熵的计算推导过程复杂而繁琐,不利于熵的计 16 万方数据
博士学位论文 第1章绪论 算和实际应用,针对这一问题,本文研究提出了利用简单分布的熵组合近似估 计P-范分布的熵,当1≤p≤2时,应用正态分布的熵H(x)和拉普拉斯分布的 熵H,(x)近似表达,当2≤p≤∞时,应用正态分布的熵Hx(x)和均匀分布的熵 H,(x)近似表达,简化其计算过程,数值模拟实证逼近效果良好: 5.GPS RTK观测数据是经历了一系列误差模型改正后的成品数据,其误差 特性和表现规律经典误差分析认为数据中只存在随机误差,服从正态分布,但 这一结论有学者提出异议,并采用大样本数据,通过分布检验方法证明GPS RTK 数据误差并不服从正态分布,呈现出随机误差和系统误差影响都相对明显的态 势;本文利用熵在测量数据处理中的优势,最大程度不依赖主观经验判断,采 用熵分析方法对GPS RTK观测数据误差进行了分析,得到结论GPS RTK观测 数据的误差不服从正态分布,进一步通过熵系数K值的计算比较分析,指出GPS RTK数据误差十分接近于正态分布和拉普拉斯分布,且有GPS RTK观测数据的 误差以偶然误差为主,X、Y分量的误差特性基本保持一致,H分量的误差特性 有别于X、Y分量的典型特点; 6.研究基于熵的污染率估算方法,提出以熵为计算基础的数据污染率估算 方法,避开传统粗差判别的限差取值问题,分别探讨数据在主体分布模式已知 和未知两种情况下的污染率估算方法,并结合熵计算中的截断误差分析了对污 染率的估算影响。 1.3.2研究目标 在以上内容中,需要达到以下具体的研究目标: 1.归纳整理测量数据处理中熵的概念和基本性质和典型性质,阐明熵与误 差、不确定度、分布和权的关系,并通过连续型随机变量具有明确概率密度函 数的分布熵计算推导及其熵值特性分析,全面归纳总结一般意义上测量数据误 差分布的熵律,进一步阐述熵意义上的测量数据误差以及误差熵作用机理: 2.建立污染正态分布熵和熵系数估算的一种近似方法,填补以污染正态分 布为典型代表的此类复杂复合分布的熵估算方法的空白: 3.提出P范分布熵的一种近邻估计方法,简化其计算过程,解决P范分布 复杂的概率密度函数表达式不利于其熵计算和实际应用的问题: 4.建立以熵为计算基础的数据污染率估算方法,分别提出数据在主体分布 模式已知和未知两种情况下的污染率估算方法,并分析熵计算的截断误差对污 染率的估算影响: 5.引入熵分析方法研究GPS RTK观测数据误差特性,给出熵用于测量数 据误差分析一种有效途径。 17 万方数据
博士学位论文 第1章绪论 算和实际应用,针对这一问题,本文研究提出了利用简单分布的熵组合近似估 计P一范分布的熵,当1≤P≤2时,应用正态分布的熵HⅣ(x1和拉普拉斯分布的 熵HL(z)近似表达,当2≤P≤o。时,应用正态分布的熵风(x)和均匀分布的熵 /tu(x)近似表达,简化其计算过程,数值模拟实证逼近效果良好; 5.GPS RTK观测数据是经历了一系列误差模型改正后的成品数据,其误差 特性和表现规律经典误差分析认为数据中只存在随机误差,服从正态分布,但 这一结论有学者提出异议,并采用大样本数据,通过分布检验方法证明GPS RTK 数据误差并不服从正态分布,呈现出随机误差和系统误差影响都相对明显的态 势;本文利用熵在测量数据处理中的优势,最大程度不依赖主观经验判断,采 用熵分析方法对GPS RTK观测数据误差进行了分析,得到结论GPS RTK观测 数据的误差不服从正态分布,进一步通过熵系数K值的计算比较分析,指出GPS RTK数据误差十分接近于正态分布和拉普拉斯分布,且有GPS RTK观测数据的 误差以偶然误差为主,x、Y分量的误差特性基本保持一致,H分量的误差特性 有别于X、Y分量的典型特点; 6.研究基于熵的污染率估算方法,提出以熵为计算基础的数据污染率估算 方法,避开传统粗差判别的限差取值问题,分别探讨数据在主体分布模式已知 和未知两种情况下的污染率估算方法,并结合熵计算中的截断误差分析了对污 染率的估算影响。 1.3.2研究目标 在以上内容中,需要达到以下具体的研究目标: 1.归纳整理测量数据处理中熵的概念和基本性质和典型性质,阐明熵与误 差、不确定度、分布和权的关系,并通过连续型随机变量具有明确概率密度函 数的分布熵计算推导及其熵值特性分析,全面归纳总结一般意义上测量数据误 差分布的熵律,进一步阐述熵意义上的测量数据误差以及误差熵作用机理; 2.建立污染正态分布熵和熵系数估算的一种近似方法,填补以污染正态分 布为典型代表的此类复杂复合分布的熵估算方法的空白; 3.提出P.范分布熵的一种近邻估计方法,简化其计算过程,解决P一范分布 复杂的概率密度函数表达式不利于其熵计算和实际应用的问题; 4.建立以熵为计算基础的数据污染率估算方法,分别提出数据在主体分布 模式己知和未知两种情况下的污染率估算方法,并分析熵计算的截断误差对污 染率的估算影响; 5.引入熵分析方法研究GPS RTK观测数据误差特性,给出熵用于测量数 据误差分析一种有效途径。 万方数据
博士学位论文 第1章绪论 1.3.3论文组织 论文分为七章,具体组织如下: 第一章,说明本文的研究背景和选题的意义,重点阐明熵在测量数据处理 中的研究价值,并综合分析了国内外研究现状,指出了当前基于熵的测量数据 不确定性研究中亟待解决的问题,确定了本文研究的主要内容和研究目标,以 测量数据误差分布的熵估算为主线构建了论文研究的组织框架。 第二章,系统描述测量数据处理研究中所涉及的熵,详细阐述已有测量数 据处理研究中引入的信息熵概念、基本性质、典型性质,从信息论的角度诠释 测量现象,分析说明信息熵用于描述测量数据不确定性的优势,阐述数据误差 熵变与误差存在之间的辩证关系,重点阐明了测量数据误差处理中熵与误差、 不确定度、分布和权的关系。 第三章,通过三个在测量数据处理中常见分布熵的求解研究测量数据误差 分布的熵律,详细解析和推导每个常见单一分布的熵求解过程、概率密度函数 形式变换以及熵值单位转化关系,在此基础上剖析了熵意义上的测量数据误差, 研究认为熵可用于表征测量数据中存在误差对其干扰的状态,测量数据误差的 分布律呈现出多样性,对于不同的分布律而言,误差的熵值也存在明显不同的 特性,并对误差熵的作用机理进行了系统研究,讨论了基于熵系数的误差分布 分析方法适用性、误差熵带模型、误差熵的截断估计和误差熵的合成等问题。 第四章,研究污染正态分布的熵估算问题,首先从污染正态分布概率密度 函数的模型研究入手,引入Kullback-Leibler距离研究了污染正态分布的“均值 漂移”和“方差扩大”两种模型概率密度函数的差异性,导出污染正态分布的 主体分布概率密度函数、均值漂移模型下和方差扩大模型下总体分布概率密度 函数之间的Kullback-Leibler距离表达式,通过两种模型概率密度函数的差异性 分析说明污染分布密度函数的不一致必将导致熵估算的很大差异,指出污染正 态分布的熵估算关键不在于选取概率密度函数,而在于寻求一种适合熵值运算 规律的方案,在此基础上,给出污染正态分布熵和熵系数估算的一种近似方法, 并用算例实证其可行性。 第五章,研究近代测量数据处理理论中另一重要分布一P范分布的熵估算问 题,首先从P范分布概率密度函数的表达入手,对于不同P范分布的概率密度 函数表达式,推证其在参数估计中的一致性:接着引用孙海燕提出的P-范分布 概率密度函数表达式详细求解P范分布熵的严密计算结果,这一过程的复杂推 算主要源于P范分布概率密度函数过于复杂:针对P范分布复杂的概率密度函 数表达式不利于熵的计算和实际应用,提出利用简单分布的熵组合近似估计P 18 万方数据
博士学位论文 第1章绪论 1.3.3论文组织 论文分为七章,具体组织如下: 第一章,说明本文的研究背景和选题的意义,重点阐明熵在测量数据处理 中的研究价值,并综合分析了国内外研究现状,指出了当前基于熵的测量数据 不确定性研究中亟待解决的问题,确定了本文研究的主要内容和研究目标,以 测量数据误差分布的熵估算为主线构建了论文研究的组织框架。 第二章,系统描述测量数据处理研究中所涉及的熵,详细阐述已有测量数 据处理研究中引入的信息熵概念、基本性质、典型性质,从信息论的角度诠释 测量现象,分析说明信息熵用于描述测量数据不确定性的优势,阐述数据误差 熵变与误差存在之间的辩证关系,重点阐明了测量数据误差处理中熵与误差、 不确定度、分布和权的关系。 第三章,通过三个在测量数据处理中常见分布熵的求解研究测量数据误差 分布的熵律,详细解析和推导每个常见单一分布的熵求解过程、概率密度函数 形式变换以及熵值单位转化关系,在此基础上剖析了熵意义上的测量数据误差, 研究认为熵可用于表征测量数据中存在误差对其干扰的状态,测量数据误差的 分布律呈现出多样性,对于不同的分布律而言,误差的熵值也存在明显不同的 特性,并对误差熵的作用机理进行了系统研究,讨论了基于熵系数的误差分布 分析方法适用性、误差熵带模型、误差熵的截断估计和误差熵的合成等问题。 第四章,研究污染正态分布的熵估算问题,首先从污染正态分布概率密度 函数的模型研究入手,引入Kullback-Leibler距离研究了污染正态分布的“均值 漂移”和“方差扩大”两种模型概率密度函数的差异性,导出污染正态分布的 主体分布概率密度函数、均值漂移模型下和方差扩大模型下总体分布概率密度 函数之问的Kullback.Leibler距离表达式,通过两种模型概率密度函数的差异性 分析说明污染分布密度函数的不一致必将导致熵估算的很大差异,指出污染正 态分布的熵估算关键不在于选取概率密度函数,而在于寻求一种适合熵值运算 规律的方案,在此基础上,给出污染正态分布熵和熵系数估算的一种近似方法, 并用算例实证其可行性。 第五章,研究近代测量数据处理理论中另一重要分布一P一范分布的熵估算问 题,首先从P.范分布概率密度函数的表达入手,对于不同P一范分布的概率密度 函数表达式,推证其在参数估计中的一致性;接着引用孙海燕提出的P.范分布 概率密度函数表达式详细求解P.范分布熵的严密计算结果,这一过程的复杂推 算主要源于P-范分布概率密度函数过于复杂;针对P.范分布复杂的概率密度函 数表达式不利于熵的计算和实际应用,提出利用简单分布的熵组合近似估计P. 万方数据
博上学位论文 第】章绪论 范分布的熵,简化其计算过程:并用数值演算对比实证该近似计算方法的有效 性。 第六章,通过两个在测量数据处理中应用熵的实例进一步展示熵在测量数 据处理中的实用价值,并借助具体的数据处理实例更进一步阐述熵在测量数据 处理中的各种关系和相关特性。其中应用熵分析法研究GPS RTK观测数据的误 差特性典型代表了多源误差特性测量数据的一种现代分析方法,利用了熵、熵 系数运算规律及其熵与分布的关系;基于熵的数据污染率估算则揭示熵与误差 之间的必然关系,用熵变诠释了测量数据被粗差污染的过程和程度。 第七章,总结本文的研究成果,并指明了今后研究的工作方向。 万方数据
博上学位论文 第1章绪论 范分布的熵,简化其计算过程;并用数值演算对比实证该近似计算方法的有效 性。 第六章,通过两个在测量数据处理中应用熵的实例进一步展示熵在测量数 据处理中的实用价值,并借助具体的数据处理实例更进一步阐述熵在测量数据 处理中的各种关系和相关特性。其中应用熵分析法研究GPS RTK观测数据的误 差特性典型代表了多源误差特性测量数据的一种现代分析方法,利用了熵、熵 系数运算规律及其熵与分布的关系;基于熵的数据污染率估算则揭示熵与误差 之间的必然关系,用熵变诠释了测量数据被粗差污染的过程和程度。 第七章,总结本文的研究成果,并指明了今后研究的工作方向。 . 19 万方数据
此页不缺内容 万方数据
万方数据