第2章分析化学中的误差和统计学处理 2.1分析化学中的误差 误差无疑会降低测量数据的质量以及分析结果的可靠性,所以,人们自然地想减小误差,甚 至将其消除。其实,在分析实践方面,减小误差并不是唯一目的(有时甚至不是主要目的),重要 的是将误差控制在允许范围之内,在测量效率、测量成本和数据质量之间找到一个平衡点。为此, 需要对误差的来源以及特性有深入而且系统的认识。在分析方法学方面,对误差的分析和溯源有 助于现有方法的改进以及新方法的设计。 ●》系统误差 系统误差(systematic error))源自测量系统(包括仪器、试剂、实验方案以及实验者等)的缺陷 系统误差具有确定的来源(尽管囿于认知水平,在特定时期人们不一定知道这个来源到底是什 么),产生了确定的结果,所以系统误差也称确定性误差(determinate error)。由于这种确定性, 系统误差具有再现性:其影响非正即负,因而数值具有单向性;可以采用适当方法减小,甚至 消除 系统误差与测量系统密切相关,因而具有“人工”的烙印。 ◆随机误差 随机误差(random error)源自测量过程中的不确定因素D,也称不确定性误差(indeterminate ©or)。随机误差对测量结果的影响或正或负,无法预知,但服从一定的统计分布:可以减小 但不能消除。 随机误差永远存在,是客观世界的一种属性,因而具有“自然”的烙印。 ◆准确度 准确度(accuracy)衡量测量值与真实值的接近程度。准确度有两种指标,分别是误差和相 对误差。如果以x和x分别表示测量值和真实值,误差的计算公式是xm一,相对误差的计 算公式是(x一x)/。相对误差通常表示为百分数,量纲为一,可以用于比较不同类型测量的 准确度 inis)以为 不 角定因素就其木质而言并非随机。 不可预 下确 仅仅表明人类知识的铁乏程度 为 页献】
2.1分析化学中的误差 精密度 精密度(precision)衡量相同测量条件下同一对象的多次测量值的接近程度,反映测量系列 的稳定性。以,2,xn表示这样一组测量值,令x表示其平均值,那么精密度有以下几种 指标: di=x-X 偏差(deviation) a=∑4 平均偏差(mean deviation) 相对平均偏差(relative mean deviation) ∑(x-x) s= 样本标准偏差(sample standard deviation) n-1 2 样本方差(sample variance) 其中,只有相对平均偏差的量纲为一。 ●》有效数字 有效数字(significant f6 gures/digits)是测量值中具有物理意义的数字,包含所有实际测量到 的数字再加一位估计数字。对于数显仪器给出的测量值,最后一位是估计值。 下面通过两个实例作进一步解释。 用一把最小刻度为毫米的直尺测量某物体的长度。此物体一端与零刻度对齐,然后清楚无 疑地观测到另一-端超出了21mm的刻度线,超出的部分估计占1mm的1/4,因此测得物体长 度是21.2mm。这个测量值中的3个数字都是通过直尺这一测量仪器得到的,具有确定的物理 意义,是有效数字。 仍然使用这把直尺,测量一个较短物体的长度。为了减小测量误差,将多个相同的短物体, 如9个,紧密接触并排在一起,测得总长度为10.3mm。那么一个短物体的长度就是10.3/9 1.1444444.。这是一个循环小数,可以写得很长,但是没有实际意义。例如,小数点后第3 位上的数字4,并不说明这把直尺测量到了4m。这把直尺的最高精度是1mm,再加上一位 估计值,所以,一个短物体长度的可靠测量值是1.1mm。 从上述例子可以看出,有效数字与测量仪器密切相关,反映了仪器的测量精度。 有效数字容易确定:从数值的左端开始,第一个非零数字之后(包括该数字)均为有效数字。例 如,这些数值,0.1234、1.1234、1.0234、1.2340、00012340,粗体是有效数字,斜体是非有效数字。 换算单位时不应改变有效数字。例如,测量值5.7g如果以毫克为单位,应写作5.7×103g,而 不是5700g。此外,测量值的记录应该尽量采用科学计数法,以明确表示出有效数字。 ①为了简使运算,可以采用公式= ②样本方差2以一1面非月作为分母是出于统计学的考忠,取平均之意。这样,2戴是总体方差。2的无偏售计。样本标准偏 差:不是总体标准偏差。的无偏估计,但是当较大时比牧接近。所谓无偏估计,就是估计量的数学期望等于总体参数,关于样本和 总体的概念,参见2.32第四部分抽样分布或者数理统计专著
16 第2章分析化学中的误差和统计学处理 如果测量值参与运算,那么必须对最终运算结果进行修约,即删去由于数值计算而产生的多 余数字。数值修约的原因是有效数字反映了仪器测量精度,运算结果也必须体现这一性质。数值 修约规则是“四舍六入五成双”:“四舍六入”容易理解:“五成双”是指被截数字5可进可舍, 以使被保留数字成为双数,但是如果5后面还有数字,就只进不舍。例如,对以下数值进行修约 保留3位有效数字,1.235、1.245、1.2351、1.2451,结果为1.24、1.24、1.24、1.25。 以上是数值修约规则,至于最终运算结果需要保留多少位有效数字,视具体运算而定。对于 加减运算,以小数位数最少的数值为基准;对于乘除运算,以有效数字位数最少的数值为基准。 对于常用对数和反常用对数的运算结果,首数不计入有效数字,而是由尾数的位数确定 例如,某长度测量值1.2k,有两位有效数字,取对数时应该保留两位有效数字,所以g1.2= 0.079。若以厘米为单位,1.2km=1.2×105cm,幂指数5仅用于单位换算,并不影响有效数 字位数,常用对数运算之后,幂指数5成为对数首数,当然也不能影响运算结果的有效数字位 数,所以1g(1.2×10)=5.079具有两位有效数字,而非四位。 如果数值的最高位上是9,那么在乘除运算中,其有效数字位数增加1。例如,9.08、0.092 参与乘除运算时,可视为分别具有四位、三位有效数字。这种约定可以给运算结果增加一个数 字,而相对误差基本不变(0.01/9.08≈0.01/10.08) 需要指出的是,仅对最终结果修约。如果因为算式比较复杂,或者计算工具比较简陋, 而不得不分步计算时,那么对暂存的中间结果尽量多保留几位数字,以减少数值计算中截 断误差的累积。本书例题中,中间结果比应该修约的多保留两位数字即是出于这种考虑。 下面是一些运算结果的有效数字修约实例,其中基准数值以粗体显示。 6.4503 6.4503 5.62 5.62 +0.071 ×0.071 e0.00224 1g(3.42)= 12.1413 2.5737. 22697. 2.6302.×10 修约 修约 修约 约 12.14 2.6 -2.270 2.6×10 小数点后 保留2位 保留3位有效数字保留2位有效数字 保留2位 有效数字 首数不计入有效数字首数不计入有效数字 2.2实验数据中的误差传递 很多情况下,分析结果不是直接测得,而是将相关的直接测量值代入特定算式后计算得到。 这些测量值的误差会通过该算式影响最终分析结果,这就是误差传递(propagation of error))。下 面介绍误差传递的计算。 设分析结果的计算式如下 R=4,B,.) 式中,A、B等表示不同的直接测量值,R表示最终分析结果。误差传递所要考虑的是,A、B
2.2实验数据中的误差传递 。174 等测量值的误差如何影响最终分析结果R,换言之,这些误差如何通过∫代表的算式传递到R 上。从另一个角度看,误差传递考虑的是,A、B等数值的微小变化会导致R发生多大的变化。 自然地,这是一个全微分问题,即 上面的全微分式中,d4、dB等可以视为A、B等测量值的误差,dR可视为分析结果R的 误差。 实验误差包括系统误差和随机误差,因此误差传递分为两种情形,下面分别介绍。 2.2.1系统误差传递 系统误差的传递公式如下 AR=△M+AB+ 式中,△表示测量值与真实值之差。 例21 系统误差传递;低难度 欲配制浓度约为0.5g·L的某溶液,具体方法是称量一定量的溶质,溶解并定容到一定体积。试分 析,质量测量误差和体积测量误差对该溶液浓度的影响。 解根据浓度计算公式,得到系统误差的传递公式如下 Ae-IAm-iAV 由于c≈0.5,因此1/V≈2m/Y2,即△m对浓度的影响权重大约是△V影响权重的2倍。如果△m与△/ 相当,那么应该优先考虑诚小质量测量误差。 例2.2 系统误差传递;中等难度 在吸收光谱分析中,强度为的单色光透过厚度为b的溶液,被浓度为C的组分吸收了一部分,透 射光强因此降为1。存在这样的定量关系:-g(I/)=c,其中。是与该组分有关的常数,称为摩尔吸光系 数。定义透光率T=I/,再定义吸光度A=gT,那么上述定量关系就变成A=b。这是著名的朗伯-比 尔定律(Lambert-Beer'sLaw),是吸收光谱定量分析的基础。试通过误差传递来分析光强测量误差对组分 浓度计算值的影响。 解根据题意,组分浓度的计算公式可以写为 c=1glo-lgl cb 根据系统误差的传递公式,得到 Ac-In10cb/A/ 考虑浓度计算值的相对误差,通过上二式可以得到 告no0-e5N
·18- 第2章分析化学中的误差和统计学处理 「上式表明,光强测量误差△对结果的影响权重是·个关于测量光强1的函数。容易算出,该影响权重在 g1110)=1n10时有最小值,此时吸光度A=11m10=0.434。所以,吸收光谱定量分析应该尽量避免过 低或者过高的吸光度(吸光度最小值为零),以减小光强测量误差对组分浓度计算值的影响。 2.2.2随机误差传递 随机误差的传递公式如下 (ar 式中,s表示标准偏差,用以表征相应测量的随机误差。 例23 随机误差传递:中等难度 某随机信号的标准偏差为s,对其进行n次相同条件下的测量后取平均值,计算此平均值的标准偏差。 解以x表示第i次测量值(=1,2,.,那么信号平均值的计算公式如下 x=(+2++x】 根据随机误差的传递公式,得到 月 n 所以 对于随机噪声,其强度的度量是标准偏差,所以从上述结果可以得出,将多次相同条件下的测量进 行平均是一种有效的噪声抑制方法。 信噪比(signal-lo-noise ratio,SNR)用于衡量实测信号中噪声的影响,定义为f/s,其中∫为纯信号的 强度,8为噪声的标准偏差。将n个单次测量值进行平均,那么平均值中纯信号的强度仍为人而噪声强 度降为s√厅,所以平均值的信噪比是单次测量值的信噪比的√厅倍。 这种取平均的方法具有显著的降噪效果,而又不影响非噪声信号,优于普通(电子或数字)滤噪方法 傅里叶变换红外和傅里叶变换核磁都是利用这一原理进行噪声抑制,以测得微弱的非噪声信号。但是, 这种方法要求非噪声信号在多次测量中不能发生变化①。 2.3数理统计基础知识 本节介绍分析化学数据处理所需要的数理统计知识。内容的选取以及知识点的安排以通俗 易懂为目的,数理统计专业方面的定义和叙述参见相关专著。 数理统计方法看起来有些抽象,然而源于解决实际问题,与日常经验有密切联系,是朴素 是在,色区城中更明 事么这些片的平与将相比的片