第1章误差理论与数据处理本章介绍测量的概念,误差分析与数据处理的初步知识,给出一些结论和简化的计算方法,希望同学们结合每一个具体实验,通过运用加以掌握。1.1测量1.1.1测量物理实验中为了找出有关物理量之间的定量关系,必须进行定量的测量。测量是物理实验中及其重要的一个组成部分。测量就是把待测量直接或间接地与另外一个选作计量标准的同类物理量进行比较的过程。测量得到的实验数据应包含测量值的大小和单位,二者缺一不可。1.1.2测量的分类在实验中会遇到各种类型的测量,可以从不同的角度对测量进行分类,按测量方法口分为直接测量和间接测量:按测量的条件可分为等精度测量和非等精度测量。1.直接测量和间接测量(1)直接测量。用测量仪器或仪表与待测量进行比较,直接测出被测量结果的测量。例如用来尺测量物体长度,用天平测量物体的质量等都是直接测量。(2)间接测量。利用几个直接测量的量按照一定的函数关系得到待测量的大小。例如通过测量体积和质量得到物体的密度,通过测量单摆的摆长和周期测定重力加速度等。2.等精度测量和非等精度测量(1)等精度测量。是指在相同条件下对同一个物理量进行的多次测量。所得到的一组数据x,X2,Xx,称为测量列。严格的等精度测量是不存在的,当某些条件的变化对测量结果影响不大或可以忽略时,可视为等精度测量。在物理实验中要求多次测量的均指等精度测量,对测量误差与数据处理的讨论,都是以等精度测量为前提的。(2)非等精度测量。是指在测量过程中由于仪器的不同、方法的差异、测量条件的改变以及测量者的原因而造成测量结果的变化,这样的测量称为非等精度测量。非等精度测量通常用在科学研究实验中。1.2误差1.2.1误差的概念及表示方法1.真值任何一个物理量在一定客观条件下(某一时刻、某一位置或某一状态),都存在着一个—4—
— 4 — 第 1 章 误差理论与数据处理 本章介绍测量的概念,误差分析与数据处理的初步知识,给出一些结论和简化的计算 方法,希望同学们结合每一个具体实验,通过运用加以掌握。 1.1 测量 1. 1. 1 测量 物理实验中为了找出有关物理量之间的定量关系,必须进行定量的测量。测量是物理 实验中及其重要的一个组成部分。测量就是把待测量直接或间接地与另外一个选作计量标 准的同类物理量进行比较的过程。 测量得到的实验数据应包含测量值的大小和单位,二者缺一不可。 1. 1. 2 测量的分类 在实验中会遇到各种类型的测量,可以从不同的角度对测量进行分类,按测量方法可 分为直接测量和间接测量;按测量的条件可分为等精度测量和非等精度测量。 1. 直接测量和间接测量 (1)直接测量。用测量仪器或仪表与待测量进行比较,直接测出被测量结果的测量。 例如用米尺测量物体长度,用天平测量物体的质量等都是直接测量。 (2)间接测量。利用几个直接测量的量按照一定的函数关系得到待测量的大小。例如 通过测量体积和质量得到物体的密度,通过测量单摆的摆长和周期测定重力加速度等。 2. 等精度测量和非等精度测量 (1)等精度测量。是指在相同条件下对同一个物理量进行的多次测量。所得到的一组 数据 1 x , 2 x ,x3 n x 称为测量列。严格的等精度测量是不存在的,当某些条件的变化对 测量结果影响不大或可以忽略时,可视为等精度测量。在物理实验中要求多次测量的均指 等精度测量,对测量误差与数据处理的讨论,都是以等精度测量为前提的。 (2)非等精度测量。是指在测量过程中由于仪器的不同、方法的差异、测量条件的改 变以及测量者的原因而造成测量结果的变化,这样的测量称为非等精度测量。非等精度测 量通常用在科学研究实验中。 1. 2 误差 1.2. 1 误差的概念及表示方法 1. 真值 任何一个物理量在一定客观条件下(某一时刻、某一位置或某一状态),都存在着一个
不以人的意志为转移的客观值,这个客观值称为该物理量的真值。被测量的真值是客观存在的,是一个理想的概念,一般是不可知的。在实际测量中常用被测量的实际值或已修正过的算术平均值来代替真值,称为约定真值。2.误差误差就是测量结果与被测量的真值之间的差异。物理实验是以测量为基础的,由于实验原理、测量装置、实验条件、观测者等种种因素的局限,任何测量结果总存在着误差。进行误差分析对科学实验有极其重要的指导意义:一是通过分析误差来源及其性质,采用合理的方法减少或消除误差,并对实验结果作出合理的评价:二是通过误差分析优化实验方法、选择测量仪器和测量条件、拟定实验步骤和数据处理方法等,获得合理的实验结果。3.误差的表示方法误差的表示方法一般有两种,即绝对误差和相对误差。(1)绝对误差。测量值与被测量的真值之间的差值。绝对误差用△x表示。(1)式Ax=x-Xo中,x为测量结果,x。为被测量的真值。误差的大小反映了测量结果的准确程度。(2)相对误差。绝对误差与被测量的真值的比值。相对误差用E表示。E=×100%(2)Xo相对误差的大小反映了测量结果的优劣。1.2.2误差的分类误差根据其来源和性质可分为系统误差和随机误差两大类。1.系统误差系统误差是指在同一条件下(方法、仪器、环境、人员),多次测量同一被测量的过程中误差的大小和符号保持不变,或当条件改变时按某一规律变化的误差分量,系统误差主要来源有以下几方面:(1)方法误差。由于实验原理或方法的近似性带来的误差,如用伏安法测电阻没有考虑电表内阻的影响,用单摆测重力加速度时取sinθ~θ带来的误差等。(2)仪器误差。由于仪器本身不完善而产生的误差,包括仪器的零值误差、示值误差、机构误差和测量附件误差等,如天平不等臂带来的误差。(3)环境误差。由于实际环境条件与规定条件不一致引起的误差,如标准电池是以20℃时的电动势作为标称值的,若在30℃条件下使用时,如不加以修正就引入了系统误差,(4)人为误差。由于测量人员主观因素和操作技术所引入的误差。系统误差又可以分为已定系统误差和未定系统误差。已定系统误差的符号和绝对值可以确定。未定系统误差的符号和绝对值不能确定,实验中常用估计误差限的方法得出。大学物理实验要重视对系统误差的分析,尽量减小它对测量结果的影响,一般采用的151
— 5 — 不以人的意志为转移的客观值,这个客观值称为该物理量的真值。 被测量的真值是客观存在的,是一个理想的概念,一般是不可知的。在实际测量中常 用被测量的实际值或已修正过的算术平均值来代替真值,称为约定真值。 2. 误差 误差就是测量结果与被测量的真值之间的差异。 物理实验是以测量为基础的,由于实验原理、测量装置、实验条件、观测者等种种因 素的局限,任何测量结果总存在着误差。进行误差分析对科学实验有极其重要的指导意义: 一是通过分析误差来源及其性质,采用合理的方法减少或消除误差,并对实验结果作出合 理的评价;二是通过误差分析优化实验方法、选择测量仪器和测量条件、拟定实验步骤和 数据处理方法等,获得合理的实验结果。 3. 误差的表示方法 误差的表示方法一般有两种,即绝对误差和相对误差。 (1) 绝对误差。测量值与被测量的真值之间的差值。绝对误差用 x 表示。 0 x x x (1) 式 中, x 为测量结果, 0 x 为被测量的真值。误差的大小反映了测量结果的准确程度。 (2)相对误差。绝对误差与被测量的真值的比值。相对误差用 E 表示。 100% 0 x x E (2) 相对误差的大小反映了测量结果的优劣。 1. 2. 2 误差的分类 误差根据其来源和性质可分为系统误差和随机误差两大类。 1. 系统误差 系统误差是指在同一条件下(方法、仪器、环境、人员),多次测量同一被测量的过 程中误差的大小和符号保持不变,或当条件改变时按某一规律变化的误差分量。 系统误差主要来源有以下几方面: (1)方法误差。由于实验原理或方法的近似性带来的误差,如用伏安法测电阻没有考虑 电表内阻的影响,用单摆测重力加速度时取 sin 带来的误差等。 (2)仪器误差。由于仪器本身不完善而产生的误差,包括仪器的零值误差、示值误差、 机构误差和测量附件误差等,如天平不等臂带来的误差。 (3)环境误差。由于实际环境条件与规定条件不一致引起的误差,如标准电池是以 20 ℃ 时的电动势作为标称值的,若在 30 ℃条件下使用时,如不加以修正就引入了系统误差。 (4)人为误差。由于测量人员主观因素和操作技术所引入的误差。 系统误差又可以分为已定系统误差和未定系统误差。已定系统误差的符号和绝对值可 以确定。未定系统误差的符号和绝对值不能确定,实验中常用估计误差限的方法得出。 大学物理实验要重视对系统误差的分析,尽量减小它对测量结果的影响,一般采用的
方法是:①对已定系统误差进行修正:②通过校准测量仪器、改进实验方案和实验装置、修正测量数据和采用适当的测量方法(如交换法、补偿法、替换法、异号法等)予以减小或消除;③合理评定系统误差分量大致对应的B类不确定度。2.随机误差在多次测量同一被测量的过程中,绝对值和符号以不可预知的方式变化着的误差分量称为随机误差。在采取措施消除或修正一切明显的系统误差之后,对被测量进行多次测量时,测量值仍会出现一些无规律的起伏。随机误差是由实验中各种因素(如温度、湿度、气流、电源电压、杂散电磁场、震动等)的微小变动引起的,以及实验装置、测量机构在各次调整操作时的变动性,测量仪器示值的变动性,观察者本人在判断和估计读数上的变动性等等。随机误差,就某一测量而言是没有规律的,当测量次数足够多时,随机误差服从统计分布规律,可以用统计学方法估算随机误差。3.异常数据的剔除剔除测量列中异常数据的标准有3c准则、肖维准则、格拉布斯准则等。统计理论表明,测量值的偏差超过3的概率已小于1%。因此,可以认为偏差超过3o的测量值是由于其它因素(实验装置故障、测量条件的意外变化、较强的外界干扰)或过失造成的异常数据,应当剔除。方法是用偏差△x=(x,一x)和3α比较,若△xi≥3α,则该测量值应该剔除掉。1.2.3仪器量程精密度准确度量程是指仪器所能测量的范围。对量程的选择要适当,当被测量超过仪器的量程时会损坏仪器,但也不应一味选择大量程,因为如果仪器的量程比测量值大很多时,测量误差往往会比较大。精密度是指仪器所能分辨物理量的最小值,一般与仪器的最小分度值一致,最小分度值越小,所测物理量的位数就越多,精密度越高。同时仪器精密度的大小反映了各次测量结果的离散程度。准确度是表示测量结果与真值接近的程度,因而它是系统误差的反映。由于测量目的不同,对仪器准确程度的要求也不同。按国家规定,电气仪表的准确度等级a分为0.1、0.2、0.5、1.0、1.5、2.5、5.0共七级,在规定条件下使用时,其示值x的最大绝对误差为(3)△x=土量程×准确度等级%例如,0.5级电压表量程为3V时,△U=±3×0.5%=±0.015V。对仪器准确度的选择要适当,在满足测量要求的前提下尽量选择准确度等级较低的仪器。当待测物理量为间接测量时,各直接测量仪器准确度等级的选择,应根据误差合成和误差均分原理,视直接测量的误差对实验最终结果影响程度的大小而定,影响小的可选择准确度等级较低的仪器,否则应选择准确度等级较高的仪器。1.3测量结果的最佳值与随机误差的估算随机误差与系统误差的来源和性质不同,所以处理的方法也不同。-6-
— 6 — 方法是:① 对已定系统误差进行修正;②通过校准测量仪器、改进实验方案和实验装置、 修正测量数据和采用适当的测量方法(如交换法、补偿法、替换法、异号法等)予以减小或 消除;③合理评定系统误差分量大致对应的 B 类不确定度。 2.随机误差 在多次测量同一被测量的过程中,绝对值和符号以不可预知的方式变化着的误差分量 称为随机误差。在采取措施消除或修正一切明显的系统误差之后,对被测量进行多次测量 时,测量值仍会出现一些无规律的起伏。随机误差是由实验中各种因素(如温度、湿度、气 流、电源电压、杂散电磁场、震动等)的微小变动引起的,以及实验装置、测量机构在各次 调整操作时的变动性,测量仪器示值的变动性,观察者本人在判断和估计读数上的变动性 等等。随机误差,就某一测量而言是没有规律的,当测量次数足够多时,随机误差服从统 计分布规律,可以用统计学方法估算随机误差。 3.异常数据的剔除 剔除测量列中异常数据的标准有 3 准则、肖维准则、格拉布斯准则等。 统计理论表明,测量值的偏差超过 3 的概率已小于 1%。因此,可以认为偏差超过 3 的测量值是由于其它因素(实验装置故障、测量条件的意外变化、较强的外界干扰)或过 失造成的异常数据,应当剔除。方法是用偏差 x (x x) i i 和 3 比较,若 3 ' x i , 则该测量值应该剔除掉。 1.2. 3 仪器量程 精密度 准确度 量程是指仪器所能测量的范围。对量程的选择要适当,当被测量超过仪器的量程时会 损坏仪器,但也不应一味选择大量程,因为如果仪器的量程比测量值大很多时,测量误差 往往会比较大。 精密度是指仪器所能分辨物理量的最小值,一般与仪器的最小分度值一致,最小分度 值越小,所测物理量的位数就越多,精密度越高。同时仪器精密度的大小反映了各次测量 结果的离散程度。 准确度是表示测量结果与真值接近的程度,因而它是系统误差的反映。由于测量目的 不同,对仪器准确程度的要求也不同。按国家规定,电气仪表的准确度等级 a 分为 0.1、0.2、 0.5、1.0、1.5、2.5、5.0 共七级,在规定条件下使用时,其示值 x 的最大绝对误差为 x 量程×准确度等级 % (3) 例如, 0.5 级电压表量程为 3 V 时,U 30.5% 0.015 V。 对仪器准确度的选择要适当,在满足测量要求的前提下尽量选择准确度等级较低的仪 器。当待测物理量为间接测量时,各直接测量仪器准确度等级的选择,应根据误差合成和 误差均分原理,视直接测量的误差对实验最终结果影响程度的大小而定,影响小的可选择 准确度等级较低的仪器,否则应选择准确度等级较高的仪器。 1.3 测量结果的最佳值与随机误差的估算 随机误差与系统误差的来源和性质不同,所以处理的方法也不同
1.3.1随机误差的分布规律实践证明,等精度测量中,当测量次数n很f(Axr)大时,测量列的随机误差多服从正态分布。正态分布的曲线如图1所示,图中横坐标表示随机误68,3%差Ax=(x,一xo),纵坐标为对应的误差出现的概率密度函数f(△x)。应用概率论方法可导出Ar1e202(4)f(Ar)=0/2元式中,特征量称为标准误差。aToaAxEAx?图1随机误差的正态分布(5)(n→)6ntf(Ar)图2是不同α值时的f(4x)曲线。小,曲线陡且峰值高,说明误差集中,小误差占优势,各测量值的离散性小,重复性好。反之,大,<,曲线较平坦,各测量值的离散性大,重复性差。随机误差落在[Ax,Ax+d(Axr)]区间内的概率[oAr为f(△x)d(△x),显然误差出现在(-0,+0)范围图2不同α的概率密度曲线内的概率为百分之百,「f(Ax)d(Ax)=1。误差出现在(-α,+o)内的概率P就是图1.3.1中该区间内f(Ar)曲线下的面积,可以证明P=f(x)dx=68.3%。这说明任一次测量,随机误差落在(-0,+o)区间的概率为68.3%。区间(-0,+o)称为置信区间,相应的概率称为置信概率。置信区间分别取-2g,+2α)、(-3α,+3α)时,相应的置信概率为P(2)=95.4%、P(3g)=99.7%。服从正态分布的随机误差具有以下特征:①单峰性。绝对值小的误差出现的概率比绝对值大的误差出现的概率大。②对称性。绝对值相等的正、负误差出现的概率相等。③有界性。绝对值很大的误差出现的概率很小,甚至趋近于零。④抵偿性。随机误差的算术平均值随着测量次数的增加而越来越趋于零,即1"lim-ZAx,=0(6)n7
— 7 — 1.3. 1 随机误差的分布规律 实践证明,等精度测量中,当测量次数 n 很 大时,测量列的随机误差多服从正态分布。正态 分布的曲线如图 1 所示,图中横坐标表示随机误 差 ( ) 0 x x x i ,纵坐标为对应的误差出现的 概率密度函数 f (x) 。应用概率论方法可导出 2 2 2 2 1 ( ) x f x e (4) 式中,特征量 称为标准误差。 ( ) 2 n n xi (5) 图 2 是不同 值时的 f (x) 曲线。 小,曲 线陡且峰值高,说明误差集中,小误差占优势, 各测量值的离散性小,重复性好。反之, 大, 曲线较平坦,各测量值的离散性大,重复性差。 随机误差落在 x,x d(x) 区间内的概率 为 f (x)d(x) ,显然误差出现在 (,) 范围 内的概率为百分之百, ( )d( ) 1 f x x 。 误差出现在 (,) 内的概率 P 就是图 1.3.1 中该区间内 f (x) 曲线下的面积,可以证 明 ( ) 68.3% P f x dx 。 这说明任一次测量,随机误差落在 (,) 区间的概率为 68.3%。区间 (,) 称为置信区间,相应的概率称为置信概率。置信区间分别取 (2,2) 、(3,3) 时, 相应的置信概率为 P(2) 95.4%、 P(3) 99.7%。 服从正态分布的随机误差具有以下特征: ①单峰性。绝对值小的误差出现的概率比绝对值大的误差出现的概率大。 ②对称性。绝对值相等的正、负误差出现的概率相等。 ③有界性。绝对值很大的误差出现的概率很小,甚至趋近于零。 ④抵偿性。随机误差的算术平均值随着测量次数的增加而越来越趋于零,即 0 1 lim 1 i n i n x n (6) 图 1 随机误差的正态分布 图 2 不同 的概率密度曲线 f (x) 0 x 68.3% f (x) x 0 2 1 1
1.3.2测量结果最佳值一一算术平均值在测量不可避免地存在随机误差的情况下,每次测量都有差异,那么接近真值的最佳值是什么呢?我们可以利用随机误差的统计特性来判断实验结果的最佳值。设对某一物理量进行了n次等精度测量,所得测量列为:x,x2,x"x,。测量结果的算术平均值为1"X=-xnil根据误差的定义有Ax, = x, - Xo1n1n-EAx, =-Ex, -Xo=x-Xonn=i随着测量次数的增加,测量列的算术平均值越来越趋近于真值。随机误差的抵偿性,当n→0时=Ax,→0,因此x→xo。n所以,测量列的算术平均值文是真值x。的最佳估计值。1.3.3随机误差的估算一—标准偏差算术平均值作为真值的最佳估计值,在实际测量中,测量结果的随机误差究竞有多大?如何来估算呢?各次测量值与算术平均值之差△x,=(x,一x)称为偏差(残差)当测量次数有限时,随机误差引起测量值的离散性可用单次测量的标准偏差来表示,用S表示,它是的一个估算值,在有限次测量中可用由以下贝塞尔公式计算:2(x, - x)2(7)S,=n-1S的统计意义:S,小,说明随机误差的分布范围窄,小误差占优势,各测量值的离散性小,重复性好。反之,S大,各测量值的离散性大,重复性差。一般情况下,在多次测量后,是以算术平均值表达测量结果的,而算术平均值本身也是随机量,也有一定的分散性,可用平均值的标准偏差S-来表征这一分散性:-8
— 8 — 1.3.2 测量结果最佳值——算术平均值 在测量不可避免地存在随机误差的情况下,每次测量都有差异,那么接近真值的最佳 值是什么呢? 我们可以利用随机误差的统计特性来判断实验结果的最佳值。 设对某一物理量进行了 n 次等精度测量,所得测量列为: 1 x , 2 x , x3 n x 。测量 结果的算术平均值为 i n i x n x 1 1 根据误差的定义有 0 x x x i i 0 0 1 1 1 1 x x x x n x n i n i i n i 随着测量次数的增加,测量列的算术平均值越来越趋近于真值。 随机误差的抵偿性,当 n 时 0 1 xi n ,因此 0 x x 。 所以,测量列的算术平均值 x 是真值 0 x 的最佳估计值。 1.3. 3 随机误差的估算——标准偏差 算术平均值作为真值的最佳估计值,在实际测量中,测量结果的随机误差究竟有多大? 如何来估算呢? 各次测量值与算术平均值之差 x (x x) i i 称为偏差(残差)。 当测量次数有限时,随机误差引起测量值的离散性可用单次测量的标准偏差来表示, 用 x S 表示,它是 的一个估算值,在有限次测量中可用由以下贝塞尔公式计算: 1 ( ) 2 n x x S i x (7) x S 的统计意义: x S 小,说明随机误差的分布范围窄,小误差占优势,各测量值的离 散性小,重复性好。反之, x S 大,各测量值的离散性大,重复性差。 一般情况下,在多次测量后,是以算术平均值表达测量结果的,而算术平均值本身也 是随机量,也有一定的分散性,可用平均值的标准偏差 x S 来表征这一分散性: