博士学位论文 第1章绪论 展,传统上基于随机变量统计方法的静态测量数据处理在静态测量广泛应用下 已不相适应,逐渐扩展至处理整个随机过程的统计分析方法。特别是GNSS技 术应用领域,为适应高精度、实时、自动化等技术需求特点,出现了自适应数 据处理方法。 (6)从传统的等式约束扩展至不等式约束。随着测量手段的逐渐精密化和 现代化,以及测量数据不断累积,将有效的先验信息转换为不等式约束参与平 差,形成了具有不等式约束的测量平差理论与方法。 (7)从传统的概率统计方法扩展至非统计方法。经典的测量数据处理方法 都是基于概率的统计方法,随着对测量数据不确定性的深入研究,描述和度量 测量数据的不确定性,基于统计的方法已不能完全满足实践的需要,因此非统 计方法应用而生,但目前的研究尚待深入展开。 (8)从误差分析扩展至熵分析。熵作为信息不确定性的唯一度量,熵最大 就意味着最具有不确定性,每种随机变量概率分布都对应着一个熵值等原理, 即可用误差熵值反映其离散度,形成熵分析方法。为避免求解具有多种可能解 的各种不适定问题中作主观性假定,即只依靠所得的数据含有的全部信息,及 求解所要求的约束条件,此外不再做任何主观假定,在最不确定性即最大熵准 测下求出不适定问题的解,简称最大熵方法。还有诸如最小互熵方法、熵优化 方法、贝叶斯最大熵地统计学方法等都是熵分析方法,该方法的主要优点在于 可不涉及概率分布和其它主观假设,目前在各个专业的数据处理领域广泛开展 研究(林洪桦,2010)。 1.2.2熵的概念与发展 1.2.2.1熵理论的发展历程 熵的概念最早起源于热力学研究,由物理学家克劳修斯(Clausius)于1854 年提出并用于表述热力学现象中的状态函数。1877年被玻尔茨曼(Boltzmann) 从统计力学角度导出,用于描述热力学系统分子在空间的分布及其能量分布的 紊乱程度,给出了有分布概率意义上的熵表达式E=knP。在熵理论发展历程 中最具有里程碑意义的是1948年申农(Shannon)创建信息论,将熵用于度量 信息的不确定性,习惯称之为信息熵,信息熵理论极大拓展和促进了熵在各专 业领域的应用研究。另外直至1957年詹涅斯(Jaynes)提出了最大熵原理,即 以最少主观偏见来确定概率分布的最大熵原则,至此熵理论得以日臻完善,基 于熵理论的数据处理方法不断挖掘出来并逐渐得到发展与应用(林洪桦,2010: 游扬声等,2008:周访滨等,2012,2013)。 万方数据
博士学位论文 第l章绪论 展,传统上基于随机变量统计方法的静态测量数据处理在静态测量广泛应用下 已不相适应, 逐渐扩展至处理整个随机过程的统计分析方法。特别是GNSS技 术应用领域,为适应高精度、实时、自动化等技术需求特点,出现了自适应数 据处理方法。 (6)从传统的等式约束扩展至不等式约束。随着测量手段的逐渐精密化和 现代化,以及测量数据不断累积,将有效的先验信息转换为不等式约束参与平 差,形成了具有不等式约束的测量平差理论与方法。 (7)从传统的概率统计方法扩展至非统计方法。经典的测量数据处理方法 都是基于概率的统计方法,随着对测量数据不确定性的深入研究,描述和度量 测量数据的不确定性,基于统计的方法已不能完全满足实践的需要,因此非统 计方法应用而生,但目前的研究尚待深入展开。 (8)从误差分析扩展至熵分析。熵作为信息不确定性的唯一度量,熵最大 就意味着最具有不确定性,每种随机变量概率分布都对应着一个熵值等原理, 即可用误差熵值反映其离散度,形成熵分析方法。为避免求解具有多种可能解 的各种不适定问题中作主观性假定,即只依靠所得的数据含有的全部信息,及 求解所要求的约束条件,此外不再做任何主观假定,在最不确定性即最大熵准 则下求出不适定问题的解,简称最大熵方法。还有诸如最小互熵方法、熵优化 方法、贝叶斯最大熵地统计学方法等都是熵分析方法,该方法的主要优点在于 可不涉及概率分布和其它主观假设,目前在各个专业的数据处理领域广泛开展 研究(林洪桦,2010)。 1.2.2熵的概念与发展 1.2.2.1熵理论的发展历程 熵的概念最早起源于热力学研究,由物理学家克劳修斯(Clausius)于1854 年提出并用于表述热力学现象中的状态函数。1877年被玻尔茨曼(Boltzmann) 从统计力学角度导出,用于描述热力学系统分子在空间的分布及其能量分布的 紊乱程度,给出了有分布概率意义上的熵表达式E=kInP。在熵理论发展历程 中最具有里程碑意义的是1948年申农(Shannon)创建信息论,将熵用于度量 信息的不确定性,习惯称之为信息熵,信息熵理论极大拓展和促进了熵在各专 业领域的应用研究。另外直至1957年詹涅斯(Jaynes)提出了最大熵原理,即 以最少主观偏见来确定概率分布的最大熵原则,至此熵理论得以日臻完善,基 于熵理论的数据处理方法不断挖掘出来并逐渐得到发展与应用(林洪桦,2010; 游扬声等,2008;周访滨等,2012,2013)。 万方数据
博士学位论文 第1章绪论 1.2.2.2熵应用研究现状 关于熵虽然目前存在很多争论的问题,但近年来它在数据处理领域的应用 更加宽泛:在信息领域,最新提出了一种非凸模糊隶属函数测度的模糊熵,比 一般的模糊隶属函数更具有灵活性,并应用于互信息分析(Le等,2011):有学 者提出了一种基于最大熵矩估计理论的多源验前信息融合方法(MEMM),该 方法完全从数据本身出发,不仅考虑了各验前信息源的可信度,还考虑了如何 尽可能减少分析者的主观影响,得到的是最保守的融合估计结果(冯静等, 2003):有学者在对称熵损失函数下,研究了一类分布族参数的Bayes估计问题, 并讨论了-·类逆线性形式估计的可容许性和不可容许性(王琪等,2011:任海平, 2010);还有学者基于非Gaussianl噪声线性定常控制系统,通过控制滤波器输出 残差或状态估计误差的条件概率密度函数形状来建立有效的滤波设计算法,创 建滤波器输出残差或状态估计误差的条件概率密度函数的统一表现形式。利用 复合概率密度函数的关系对残差或状态估计误差的条件概率密度函数的近似来 实现非高斯残差的高斯化或相应的熵最小化(吴刚等,2008)。在电子工程领 域,有学者结合信息论理论,提出了采用互信息熵来度量和评价测量效果,形成 了测量信息的基本概念:建立了测量的信息熵模型,提出了计算测量信息的公 式,研究了在测量和数据处理过程中测量熵的变化(肖明珠等,2004:吕文, 2006)。在计量技术领域,将熵用于测量数据不确定性研究,建立了基于熵的 测量不确定度(林洪桦,1997,2010)。有学者将熵理论用于有关工程类评价 模型中的影响因子权重计算和系统优化参数选择,诸如应用于岩体可爆性评价 (Zhou J.etal,2012),应用于地下采矿方法选择(LiuA.ctal,2010),应用于滑 坡灾害敏感性评价(解传银,2011)。文献[9]则从三个方面举例说明采用熵值计 算方法确定权重的不科学性(HanR.etal,2009)。在系统工程领域,有学者基 于熵理论描述系统脆性的一些指标,给出子系统脆性熵、脆性风险熵、复杂系 统脆性熵和子系统脆性联系熵的定义,并利用这些函数从不同角度描述复杂系 统内部的不确定性(吴红梅等,2009)。在土木工程领域,有学者针对隧道衬砌 结构参数的随机性、分布的多样性与极限状态功能函数高度非线性的特征,运 用最大熵原理对隧道衬砌结构参数进行估计,得到符合实际的参数估计值(张 道兵等,2012)。在环境科学领域,描述了贝叶斯最大熵地统计学方法的理论发 展过程及其在土壤和环境科学上的应用情况,并对该方法的应用做了总结与展 望(张贝等,2011)。还有研究误差熵及其相关统计量的关系问题和地形熵及其 在DEM中的应用问题,其成果主要分布于测量数据处理领域。 12 万方数据
博士学位论文 第l章绪论 1.2.2.2熵应用研究现状 关于熵虽然目前存在很多争论的问题,但近年来它在数据处理领域的应用 更加宽泛:在信息领域,最新提出了一种非凸模糊隶属函数测度的模糊熵,比 一般的模糊隶属函数更具有灵活性,并应用于互信息分析(Lee等,2011):有学 者提出了一种基于最大熵—矩估计理论的多源验前信息融合方法(MEMM),该 方法完全从数据本身出发,不仅考虑了各验前信息源的可信度,还考虑了如何 尽可能减少分析者的主观影响,得到的是最保守的融合估计结果(冯静等, 2003);有学者在对称熵损失函数下,研究了一类分布族参数的Bayes估计问题, 并讨论了一类逆线性形式估计的可容许性和不可容许性(王琪等,201 1;任海平, 2010);还有学者基于非Gaussian噪声线性定常控制系统,通过控制滤波器输出 残差或状态估计误差的条件概率密度函数形状来建立有效的滤波设计算法,创 建滤波器输出残差或状态估计误差的条件概率密度函数的统一表现形式。利用 复合概率密度函数的关系对残差或状态估计误差的条件概率密度函数的近似来 实现非高斯残差的高斯化或相应的熵最小化(吴刚等,2008)。在电子工程领 域,有学者结合信息论理论,提出了采用互信息熵来度量和评价测量效果,形成 了测量信息的基本概念;建立了测量的信息熵模型,提出了计算测量信息的公 式,研究了在测量和数据处理过程中测量熵的变化(肖明珠等,2004;吕文, 2006)。在计量技术领域,将熵用于测量数据不确定性研究,建立了基于熵的 测量不确定度(林洪桦,1997,2010)。有学者将熵理论用于有关工程类评价 模型中的影响因子权重计算和系统优化参数选择,诸如应用于岩体可爆性评价 (Zhou J.et al,2012),应用于地下采矿方法选择(Liu A.et al,2010),应用于滑 坡灾害敏感性评价(解传银,2011)。文献[9]则从三个方面举例说明采用熵值计 算方法确定权重的不科学性(Hall R.et al,2009)。在系统工程领域,有学者基 于熵理论描述系统脆性的一些指标,给出子系统脆性熵、脆性风险熵、复杂系 统脆性熵和子系统脆性联系熵的定义,并利用这些函数从不同角度描述复杂系 统内部的不确定性(吴红梅等,2009)。在土木工程领域,有学者针对隧道衬砌 结构参数的随机性、分布的多样性与极限状态功能函数高度非线性的特征,运 用最大熵原理对隧道衬砌结构参数进行估计,得到符合实际的参数估计值(张 道兵等,2012)。在环境科学领域,描述了贝叶斯最大熵地统计学方法的理论发 展过程及其在土壤和环境科学上的应用情况,并对该方法的应用做了总结与展 望(张贝等,2011)。还有研究误差熵及其相关统计量的关系问题和地形熵及其 在DEM中的应用问题,其成果主要分布于测量数据处理领域。 万方数据
博士学位论文 第1章绪论 1.2.3基于熵的测量数据处理研究现状及问题 熵在测量数据处理领域的研究,始于以信息论的观点看待测量现象,前苏 联学者波·佛·诺维茨基和伊·阿·佐格拉夫在其专著《测量结果误差估计》中论述 了测量数据随机误差问题的信息化处理方法,并指出采用数学描述随机误差问 题的信息处理方法的主要优点就是对于任何误差分布来说都能用数学方法严格 地确定其熵意义上的不确定度区间(诺维茨基,1990)。我国学者范懋木从信息 论中熵的基本概念出发,分析了误差熵和熵系数的意义,指出误差熵对应于误 差理论中的误差不确定度的量度,熵系数对应于误差的置信系数(范懋木, 1983)。张克权应用熵函数量测信息的基本原理与方法,针对地图上相互联系现 象的图形重合程度存在分类数目不同的特点,采用了导入近似改正值计算方法 确定评价相互联系现象间重合程度的适应系数,克服了传统方法只能局限于相 同数目的相同分类,使应用熵函数量测信息反映图形重合度的方法更具有普遍 意义(张克权,1984)。进入20世纪90年代以后,更多的学者利用信总论的方 法和理论研究测量现象及测量数据处理(张剑清等,1990;孙海燕,1994;史 玉峰等,2002:丁世飞等,2003:Jonas S.etal,2006;张春美等,2008),归纳 起来,主要有以下几个方面:①基于熵的测量数据不确定区间估计,这一问题 是信息熵与测量数据处理的最佳结合点,将不确定度区间作为评定测量精度的 指标,并以不确定度区间作为假设检验的置信区间,避开一般传统方法选取显 著水平:时的非客观因素影响,能以测量数据误差不同分布形式建立相应的熵 不确定度区间。文献[103]根据信息熵及其性质,将其引入测量平差,界定了描 述观测量和参数估值不确定性时有关熵的概念,论证了熵与不确定区间之间的 关系,给出了一般常用单一分布熵不确定度区间,更进一步推证了t分布、x分 布及F分布的熵及其不确定度区间(孙海燕,1994)。以上熵不确定度研究建立 在一维随机变量的基础上,文献[66]将一维随机变量的熵不确定度指标加以推 广,讨论了二维、三维和N维的情况,提出了熵不确定椭圆、熵不确定椭球和 熵不确定超椭球指标(李大军等,2002,2006)。②最大熵原理的应用,最大熵 原理是熵理论应用于很多自然科学领域的基础,它为很多不适定问题或条件约 束问题提供了有效地解决途径,例如文献[38]在基于贝叶斯估计理论研究不等式 约束问题中,利用最大熵原理将不等式约束平差问题转换成后验分布并有效求 解(ZhuJ.etal,2005):还有学者基于最大最小熵理论研究了参数最优估计和主 成分分析法(Chen B.etal,2010:HeR.etal,2010;Peter E.W.etal,2006王 永弟等,2012)。③熵权应用,文献[113]针对测量平差中按经验定权的片面性, 引入熵权法处理水准网平差问题,提高了平差结果精度(王永弟等,2012)。④ 13 万方数据
博士学位论文 第l章绪论 1.2.3基于熵的测量数据处理研究现状及问题 熵在测量数据处理领域的研究,始于以信息论的观点看待测量现象,前苏 联学者波·佛·诺维茨基和伊·阿·佐格拉夫在其专著《测量结果误差估计》中论述 了测量数据随机误差问题的信息化处理方法,并指出采用数学描述随机误差问 题的信息处理方法的主要优点就是对于任何误差分布来说都能用数学方法严格 地确定其熵意义上的不确定度区间(诺维茨基,1990)。我国学者范懋木从信息 论中熵的基本概念出发,分析了误差熵和熵系数的意义,指出误差熵对应于误 差理论中的误差不确定度的量度,熵系数对应于误差的置信系数(范懋木, 1983)。张克权应用熵函数量测信息的基本原理与方法,针对地图上相互联系现 象的图形重合程度存在分类数目不同的特点,采用了导入近似改正值计算方法 确定评价相互联系现象间重合程度的适应系数,克服了传统方法只能局限于相 同数目的相同分类,使应用熵函数量测信息反映图形重合度的方法更具有普遍 意义(张克权,1984)。进入20世纪90年代以后,更多的学者利用信息论的方 法和理论研究测量现象及测量数据处理(张剑清等,1990;孙海燕,1994;史 玉峰等,2002;丁世飞等,2003;Jonas S.et al,2006;张春美等,2008),归纳 起来,主要有以下几个方面:①基于熵的测量数据不确定区间估计,这一问题 是信息熵与测量数据处理的最佳结合点,将不确定度区问作为评定测量精度的 指标,并以不确定度区问作为假设检验的置信区间,避开一般传统方法选取显 著水平口时的非客观因素影响,能以测量数据误差不同分布形式建立相应的熵 不确定度区间。文献f1031根据信息熵及其性质,将其引入测量平差,界定了描 述观测量和参数估值不确定性时有关熵的概念,论证了熵与不确定区间之间的 关系,给出了一般常用单一分布熵不确定度区间,更进一步推证了t分布、z2分 布及F分布的熵及其不确定度区间(孙海燕,1994)。以上熵不确定度研究建立 在一维随机变量的基础上,文献[66]将一维随机变量的熵不确定度指标加以推 广,讨论了二维、三维和Ⅳ维的情况,提出了熵不确定椭圆、熵不确定椭球和 熵不确定超椭球指标(李大军等,2002,2006)。②最大熵原理的应用,最大熵 原理是熵理论应用于很多自然科学领域的基础,它为很多不适定问题或条件约 束问题提供了有效地解决途径,例如文献[38】在基于贝叶斯估计理论研究不等式 约束问题中,利用最大熵原理将不等式约束平差问题转换成后验分布并有效求 解(Zhu J.et al,2005);还有学者基于最大最小熵理论研究了参数最优估计和主 成分分析法(Chen B.et al,2010;He R.et al,20101 Peter E.W.et al,2006王 永弟等,2012)。⑨熵权应用,文献[113]针对测量平差中按经验定权的片面性, 引入熵权法处理水准网平差问题,提高了平差结果精度(王永弟等,2012)。④ 万方数据
博士学位论文 第1章绪论 误差熵带模型,在GS领域,应用熵研究不确定性问题,形成了误差熵不确定 带模型和空间信息定量度量方法(范爱民等,2001;李大军等2002,2003:朱 长青等,2005:史玉峰等,2006:陈杰等,2010:孙金礼等,2011):并将熵理 论应用推向了诸如利用熵研究地形信息处理(陶旸等,2009:席雷平等,2010: 曹伟超等,2011:)、GIS产品质量综合评价(赵泉华等,2009:)和DM空间 不确定性分析与质量检查(陈楠等,2005:Wise S.,2011,2012)等研究。⑤ 熵的工程应用,在遥感领域,将熵用于影像处理(王向阳等,2002;江万寿等, 2009:刘俊怡等,2007:赖志坤等,2008:尤红建,2011;吴一全等,2011;张 斌等,2011:郎丰铠等,2012)、不确定性评价(许菡等,2007:刘艳芳等,2009)、 图像相关性研究与熵估算(卢健,2006)。另外,在工程测量等其它测量领域也 有应用出现,例如,应用最大熵法拟定大坝安全监控指标(丛培江等,2008), 应用信息熵理论建立顾及道路等级的几何信息量量测方法(王红等,2010),基 于信息熵界定城市边缘区(蔡栋等,2010)。这些研究成果虽未形成完整统一的 体系,但展示了熵理论在测量数据处理中的应用价值,且大多都是近10年的最 新研究成果,说明基于熵的测量数据处理研究前景广阔,今后必将硕果累累。 从基于熵的测量数据处理研究现状以及信息摘理论与应用的发展历程来看,在 过去的30年里,通过学者们不间断研究,取得了一系列重要成果,诸如熵意义 上的测量数据不确定区间理论(范懋木,1983:孙海燕,1994:林洪桦,1997, 2010;李大军等,2002,2006)、误差熵和误差熵带模型理论(范爱民等,2001; 李大军等2002,2003:朱长青等,2005:史玉峰等,2006:陈杰等,2010:孙 金礼等,2011)、信息熵的实际测量工程应用典型等等。这些理论和应用实践建 立了基于熵的测量数据不确定分析基本概念与框架,使得熵理论在测量数据处 理中的应用有了更为普遍的现实意义,单就测量数据误差分布的熵及其应用研 究而言,先前的研究仅仅解决了基于熵的测量数据不确定度区间估计问题,求 解了具有确定概率密度函数且单一分布的熵值,讨论了未知分布的熵不确定度 和多维随机变量的熵不确定度指标,引入了熵权法改善传统定权方法的不足, 但在测量数据误差分布的熵值计算及其应用方面尚缺乏系统而全面的研究,主 要表现在以下方面: (1)一定观测条件下的测量数据误差对应着特定的误差分布形式,熵通过分 布形式和分布范围综合反映测量数据的不确定性,熵越大则表示最有不确定性, 反之熵越小则表示越确定,这是已知的普适性规律,但在测量数据处理中,诸 如不同分布的熵值有怎样的运算法则和规律、误差熵的作用机理何在等问题缺 乏系统性地研究和归纳整理。 14 万方数据
博士学位论文 第1章绪论 误差熵带模型,在GIS领域,应用熵研究不确定性问题,形成了误差熵不确定 带模型和空间信息定量度量方法(范爱民等,2001;李大军等2002,2003;朱 长青等,2005;史玉峰等,2006;陈杰等,2010;孙金礼等,2011);并将熵理 论应用推向了诸如利用熵研究地形信息处理(陶吻等,2009;席雷平等,2010: 曹伟超等,2011;)、GIS产品质量综合评价(赵泉华等,2009;)和DEM空间 不确定性分析与质量检查(陈楠等,2005;Wise S.,2011,2012)等研究。⑤ 熵的工程应用,在遥感领域,将熵用于影像处理(王向阳等,2002;江万寿等, 2009;刘俊怡等,2007:赖志坤等,2008:尤红建,201 l;吴一全等,201 l;张 斌等,201 l;郎丰铠等,2012)、不确定性评价(许菡等,2007;刘艳芳等,2009)、 图像相关性研究与熵估算(卢健,2006)。另外,在工程测量等其它测量领域也 有应用出现,例如,应用最大熵法拟定大坝安全监控指标(丛培江等,2008), 应用信息熵理论建立顾及道路等级的几何信息量量测方法(王红等,2010),基 于信息熵界定城市边缘区(蔡栋等,2010)。这些研究成果虽未形成完整统一的 体系,但展示了熵理论在测量数据处理中的应用价值,且大多都是近lO年的最 新研究成果,说明基于熵的测量数据处理研究前景广阔,今后必将硕果累累。 从基于熵的测量数据处理研究现状以及信息熵理论与应用的发展历程来看,在 过去的30年里,通过学者们不间断研究,取得了一系列重要成果,诸如熵意义 上的测量数据不确定区间理论(范懋木,1983;孙海燕,1994;林洪桦,1997, 2010;李大军等,2002,2006)、误差熵和误差熵带模型理论(范爱民等,2001; 李大军等2002,2003:朱长青等,2005;史玉峰等,2006:陈杰等,2010;孙 金礼等,201 1)、信息熵的实际测量工程应用典型等等。这些理论和应用实践建 立了基于熵的测量数据不确定分析基本概念与框架,使得熵理论在测量数据处 理中的应用有了更为普遍的现实意义,单就测量数据误差分布的熵及其应用研 究而言,先自订的研究仅仅解决了基于熵的测量数据不确定度区间估计问题,求 解了具有确定概率密度函数且单一分布的熵值,讨论了未知分布的熵不确定度 和多维随机变量的熵不确定度指标,引入了熵权法改善传统定权方法的不足, 但在测量数据误差分布的熵值计算及其应用方面尚缺乏系统而全面的研究,主 要表现在以下方面: (1)一定观测条件下的测量数据误差对应着特定的误差分布形式,熵通过分 布形式和分布范围综合反映测量数据的不确定性,熵越大则表示最有不确定性, 反之熵越小则表示越确定,这是已知的普适性规律,但在测量数据处理中,诸 如不同分布的熵值有怎样的运算法则和规律、误差熵的作用机理何在等问题缺 乏系统性地研究和归纳整理。 14 万方数据
博上学位论文 第1章绪论 (2)通常情况下,只要确知某单一分布的概率密度函数,即可根据连续型随 机变量熵值求解方法获得该分布的熵值和熵系数计算结果。但对于复合分布, 即分布不再是单纯的单一分布,而是两个甚至多个分布复合而成的分布,其模 型表达中不仅包含多个分布的自身的特征函数,而且包含各个分布间的相关系 数,由于参数繁杂,对于此类分布熵的计算显然无法类似于单一分布熵的计算 方法,因此,复合分布熵的估算问题尚需研究和讨论。复合分布的典型代表是 污染分布,污染分布理论促进了近代误差理论和测量数据处理理论的发展,它 有着特殊的表达形式,概率密度函数表达存在的不确定性造成了其熵估算的难 点。污染分布的熵,尤其是测量数据处理中经典的污染正态分布,其熵如何估 算,这一问题的研究目前亟待深入下去。 (3)P范分布同样是测量数据处理理论发展中出现的重要分布,它全面概括 了正态分布、均匀分布和拉普拉斯分布等测量数据处理领域常见的典型分布, 它是用参数P来表达测量误差分布的一族指数分布,它的实质是一个分布族, 虽然能像单一分布一样给出含有参数p的概率密度函数表达式而严密求解其熵 值表达式,但其熵的严密计算因其概率密度函数表达相对复杂求解过程十分复 杂,不利于实际应用。在已有的实践中,P范分布的表达可通过其包含的简单分 布复合表达,那么P范分布的熵计算能不能就此得到有效简化需要进一步研究 解决。 (4)随着测量手段的日新月异,测量数据朝着海量、复杂多源误差特性方向 发展,GPS RTK数据是典型的代表,其数据误差特性目前存在争论,经典的误 差分析认为GPS RTK数据经过各种模型改正后,只存在随机误差,服从正态分 布,这在一般意义上有其合理性,但缺乏严格的科学证明,只是一种带有主观 经验的分析结论,利用熵的优势,通过熵分析方法揭示GPS RTK数据的误差特 性尚需进一步实践和深入研究。 (5)测量数据获取中难免有粗差的存在,污染率表征了粗差的影响程度,在 实际应用中粗差的统计常常受到门限的干扰,数据的污染能否通过熵变化得以 反映和污染率能否避开传统门限值选择问题而通过熵变得以估算也需展开研 究。 上述问题成为本文研究的主线,通过研究测量数据误差分布的熵获取熵在 测量数据不确定性研究中的基本理论与方法,以具体问题的应用研究实证熵理 论和方法在测量数据不确定性研究中的可适性和可靠性。 15 万方数据
博士学位论文 第l章绪论 (2)通常情况下,只要确知某单一分布的概率密度函数,即可根据连续型随 机变量熵值求解方法获得该分布的熵值和熵系数计算结果。但对于复合分布, 即分布不再是单纯的单一分布,而是两个甚至多个分布复合而成的分布,其模 型表达中不仅包含多个分布的自身的特征函数,而且包含各个分布间的相关系 数,由于参数繁杂,对于此类分布熵的计算显然无法类似于单一分布熵的计算 方法,因此,复合分布熵的估算问题尚需研究和讨论。复合分布的典型代表是 污染分布,污染分布理论促进了近代误差理论和测量数据处理理论的发展,它 有着特殊的表达形式,概率密度函数表达存在的不确定性造成了其熵估算的难 点。污染分布的熵,尤其是测量数据处理中经典的污染正态分布,其熵如何估 算,这一问题的研究目前亟待深入下去。 (3)P一范分布同样是测量数据处理理论发展中出现的重要分布,它全面概括 了正态分布、均匀分布和拉普拉斯分布等测量数据处理领域常见的典型分布, 它是用参数P来表达测量误差分布的一族指数分布,它的实质是一个分布族, 虽然能像单一分布一样给出含有参数P的概率密度函数表达式而严密求解其熵 值表达式,但其熵的严密计算因其概率密度函数表达相对复杂求解过程十分复 杂,不利于实际应用。在已有的实践中,P.范分布的表达可通过其包含的简单分 布复合表达,那么P.范分布的熵计算能不能就此得到有效简化需要进一步研究 解决。 (4)随着测量手段的日新月异,测量数据朝着海量、复杂多源误差特性方向 发展,GPS RTK数据是典型的代表,其数据误差特性目前存在争论,经典的误 差分析认为GPS RTK数据经过各种模型改正后,只存在随机误差,服从正态分 布,这在一般意义上有其合理性,但缺乏严格的科学证明,只是一种带有主观 经验的分析结论,利用熵的优势,通过熵分析方法揭示GPS RTK数据的误差特 性尚需进一步实践和深入研究。 (5)测量数据获取中难免有粗差的存在,污染率表征了粗差的影响程度,在 实际应用中粗差的统计常常受到门限的干扰,数据的污染能否通过熵变化得以 反映和污染率能否避开传统门限值选择问题而通过熵变得以估算也需展开研 究。 上述问题成为本文研究的主线,通过研究测量数据误差分布的熵获取熵在 测量数据不确定性研究中的基本理论与方法,以具体问题的应用研究实证熵理 论和方法在测量数据不确定性研究中的可适性和可靠性。 万方数据