B3化工实验数据的处理 工程试验不同于其他科学实验,十分重视实验的经济性,对其准确度应有一个适当的要 求:准确度过低当然不可取,对准确度要求过高,对仪器和设备的要求往往会大幅提高,造 成对人力和物力的浪费。因此,对测量准确度的恰当要求是极其重要的 实验数据误差的问题,已在分析化学和物理化学等课程中,陆续学习过一些有关的理论 和方法,这里不再系统论述。而在化学工程的研究中经常会遇到数据的回归分析,以及离散 数据的解析等数值计算的问题。因此本节将着重介绍化学工程实验中常用的一些数据处理方 (一)实验数据的误差及其性质 在化工实验中,用各种测量仪器测量的物理量。由于测量仪器、实验方法、人的观察力 等原因,使测量值与真值之间总会存在一定差别,测量值也不可能完全一致。测量值与真值 之差称为误差。根据误差的性质和产生的原因,误差一般分为系统误差和偶然误差。在同 条件下多次测量同一量时,误差的绝对值和符号保持恒定:或在条件改变时,按某一确定的 规律变化的误差成称系统误差。在实际相同条件下多次测量同一量时,误差的绝对值和符号 的变化,时大时小,时正时负,没有确定的规律,也不可预测但具有抵偿性的误差称为偶然 误差 1.系统误差的消除 在测量中所测得的数值重现性的大小,称为精确度。测量值与真值之间的符合程度,称 为准确度。为说明准确度与精确度的区别,往往用打靶来做比喻。如图B.3-1中所示,A表 示精确度与准确度都很好;B表示精确度很妤,但准确度却不髙;C表示精确度与准确度都 不好 图B.3-1 准确度主要是由系统误差决定的。当然在科学测量中没有像靶心那样明确的真值,而是 设法去测定这个未知的真值,即设法减小和消除系统误差和偶然误差。 替代消除法(校准法) 就是在其它测量条件不变的情况下,用某一已知量替换被测量以达到消除系统误差的目 的。也就是常见的标定的方法。 对称法 就是将测量中的某些条件改变,使产生系统误差的原因对测量的结果起相反的作用,从 而抵消了系统误差 例如:阿贝折光仪有空行程,即螺旋旋转时,刻度变化而量杆不动,引起系统误差。为 消除这一系统误差,可以从两个方向对线,然后取平均值 初学者在实验过程中,往往满足于实验数据的重现性,而忽略了精确的测量值是否准确。 绝对真值是不可知的,只能在计量上订出一些国际标准作为测量仪表准确性的参考标准。随 着人类认识运动的推移和发展,可以逐渐迫近它
1 B.3 化工实验数据的处理 工程试验不同于其他科学实验,十分重视实验的经济性,对其准确度应有一个适当的要 求:准确度过低当然不可取,对准确度要求过高,对仪器和设备的要求往往会大幅提高,造 成对人力和物力的浪费。因此,对测量准确度的恰当要求是极其重要的。 实验数据误差的问题,已在分析化学和物理化学等课程中,陆续学习过一些有关的理论 和方法,这里不再系统论述。而在化学工程的研究中经常会遇到数据的回归分析,以及离散 数据的解析等数值计算的问题。因此本节将着重介绍化学工程实验中常用的一些数据处理方 法。 (一)实验数据的误差及其性质 在化工实验中,用各种测量仪器测量的物理量。由于测量仪器、实验方法、人的观察力 等原因,使测量值与真值之间总会存在一定差别,测量值也不可能完全一致。测量值与真值 之差称为误差。根据误差的性质和产生的原因,误差一般分为系统误差和偶然误差。在同一 条件下多次测量同一量时,误差的绝对值和符号保持恒定;或在条件改变时,按某一确定的 规律变化的误差成称系统误差。在实际相同条件下多次测量同一量时,误差的绝对值和符号 的变化,时大时小,时正时负,没有确定的规律,也不可预测但具有抵偿性的误差称为偶然 误差。 1. 系统误差的消除 在测量中所测得的数值重现性的大小,称为精确度。测量值与真值之间的符合程度,称 为准确度。为说明准确度与精确度的区别,往往用打靶来做比喻。如图 B.3-1 中所示,A 表 示精确度与准确度都很好;B 表示精确度很好,但准确度却不高;C 表示精确度与准确度都 不好。 图 B.3-1 准确度主要是由系统误差决定的。当然在科学测量中没有像靶心那样明确的真值,而是 设法去测定这个未知的真值,即设法减小和消除系统误差和偶然误差。 替代消除法(校准法) 就是在其它测量条件不变的情况下,用某一已知量替换被测量以达到消除系统误差的目 的。也就是常见的标定的方法。 对称法 就是将测量中的某些条件改变,使产生系统误差的原因对测量的结果起相反的作用,从 而抵消了系统误差。 例如:阿贝折光仪有空行程,即螺旋旋转时,刻度变化而量杆不动,引起系统误差。为 消除这一系统误差,可以从两个方向对线,然后取平均值。 初学者在实验过程中,往往满足于实验数据的重现性,而忽略了精确的测量值是否准确。 绝对真值是不可知的,只能在计量上订出一些国际标准作为测量仪表准确性的参考标准。随 着人类认识运动的推移和发展,可以逐渐迫近它
2.偶然误差的统计特征 通过大量实验数据发现,多种因素微小变化引起的偶然误差通常都近似地遵守正态分 布,其概率分布密度为: 3) y8 它恰当地体现了偶然误差的统计特征: 0=05 (1)绝对值小的误差出现的次数比绝对值大的 误差出现的次数多得多,即单峰性和有界性 =1 2)绝对值相等的正误差与负误差出现的次数大 致相等,这一特性称之为对称性 这类误差还有一个极其重要的特性为 (3)抵偿性,即同条件下对同一量进行测量,其 误差的算术平均值,随着测量次数的无限增加而趋于零。图B.3-2偶然误差的分布 (二)实验数据的记录及有效数字 实验直接测量的数据或计算结果,该用几位有效数字来表示,是件很重要的事情。有人 往往容易产生这样两种想法:认为一个数值中小数点后面位数愈多愈精确,或者计算结果保 留位数愈多愈精确。其实这两种想法都是错误的。因为其一,小数点的位置不决定精确度 而与所用单位大小有关。例如,用电位差计测热电偶的电动势记为7649μV或记为 07649mV,精确度是完全相同的;其二,测量仪器只能做到一定精度(或称灵敏度),还以 上面这个例子来说,这种电位差计精度若只能达到0.1μⅤ或0.0001mV,结果的精确度绝不 会超过这个仪器所允许的范围。 由此可见,测量值或计算结果的数值用几位有效数字来表示,决定于测量仪器的精度。 数值精确度大小,可由有效数字位数来表达。如上面例子中,数值的精度为0.1μV,精确 度以四位有效数字表示 在科学与工程中,为了清楚地表示出数值的精确度,可将有效数字写出,并在第一个有 效数字后面加上小数点,而数值的数量级由10的整数幂来确定。这种用10的整数幂来计数 的方法称为科学计数法。例如,0.000388可写作3.88×10-4,而380可写作3.88×104 科学计数法的好处是不仅便于辨认一个数值的准确度(因为现存的数字无疑都是有效数字), 而且便于运算。 有关有效数字的运算法则,大家都已较熟悉,这里不再赘述 (三)单个物理量数据的处理和精确度的表示 1.实验数据的处理 根据误差的统计原理,在无系统误差情况下,当测量次数足够多的情况下,测量值的算 术平均值非常接近于真值。因此我们可以用数据的平均值作为结果。但是在我们实验中测量 次数总是有限的,用有限测量值求得的平均值,只能是近似真值 在化工实验中,常用的平均值有下列几种: (1)算术平均值:设x1x2…,xn为各次测量值,n代表测量次数,算术平均值为 x1+x2+…+xn (2)几何平均值:几何平均值是将一组n个测量值连乘并开n次方求得,即 x=x1x2…xn 2
2 2. 偶然误差的统计特征 通过大量实验数据发现,多种因素微小变化引起的偶然误差通常都近似地遵守正态分 布,其概率分布密度为: 2 2 2 1 ( ) - e y = 它恰当地体现了偶然误差的统计特征: (1) 绝对值小的误差出现的次数比绝对值大的 误差出现的次数多得多,即单峰性和有界性; (2)绝对值相等的正误差与负误差出现的次数大 致相等,这一特性称之为对称性; 这类误差还有一个极其重要的特性为: (3)抵偿性,即同条件下对同一量进行测量,其 误差的算术平均值,随着测量次数的无限增加而趋于零。 图 B.3-2 偶然误差的分布 (二)实验数据的记录及有效数字 实验直接测量的数据或计算结果,该用几位有效数字来表示,是件很重要的事情。有人 往往容易产生这样两种想法:认为一个数值中小数点后面位数愈多愈精确,或者计算结果保 留位数愈多愈精确。其实这两种想法都是错误的。因为其一,小数点的位置不决定精确度, 而与所用单位大小有关。例如,用电位差计测热电偶的电动势记为 764.9μV 或记为 0.7649mV,精确度是完全相同的;其二,测量仪器只能做到一定精度(或称灵敏度),还以 上面这个例子来说,这种电位差计精度若只能达到 0.1μV 或 0.0001mV,结果的精确度绝不 会超过这个仪器所允许的范围。 由此可见,测量值或计算结果的数值用几位有效数字来表示,决定于测量仪器的精度。 数值精确度大小,可由有效数字位数来表达。如上面例子中,数值的精度为 0.1μV,精确 度以四位有效数字表示。 在科学与工程中,为了清楚地表示出数值的精确度,可将有效数字写出,并在第一个有 效数字后面加上小数点,而数值的数量级由 10 的整数幂来确定。这种用 10 的整数幂来计数 的方法称为科学计数法。例如,0.000388 可写作 3.88 4 10− ,而 38800 可写作 3.88 104。 科学计数法的好处是不仅便于辨认一个数值的准确度(因为现存的数字无疑都是有效数字), 而且便于运算。 有关有效数字的运算法则,大家都已较熟悉,这里不再赘述。 (三)单个物理量数据的处理和精确度的表示 1. 实验数据的处理 根据误差的统计原理,在无系统误差情况下,当测量次数足够多的情况下,测量值的算 术平均值非常接近于真值。因此我们可以用数据的平均值作为结果。但是在我们实验中测量 次数总是有限的,用有限测量值求得的平均值,只能是近似真值。 在化工实验中,常用的平均值有下列几种: (1) 算术平均值:设 n x , x ,..., x 1 2 为各次测量值,n 代表测量次数,算术平均值为 n x x x x + + + n = ... 1 2 = = n i i x n 1 1 (2) 几何平均值:几何平均值是将一组 n 个测量值连乘并开 n 次方求得,即 n n x x x ...x = 1 2
(3)方均根值:方均根平均值按下式计算 ∑∑ 2.数据精确度的表示 实验数据的精确度或重现性是由偶然误差决定的,通常由测量值与其平均值偏差的统计 值来表示常用的误差表示法有下列两种 (1)(算术)平均偏差:算术平均偏差是表示偏差较好的方法,其表示式为 ∑ls 6 式中:m-一测量次数;δ为测量值与其平均值之间的差值,i=1,23,…,n (2)标准偏差:标准偏差也称为均方根偏差,其表示式为 式中n与S表示的意义与上式相同。 3.错误数据的剔除 如果一系列测量值中混有“坏值”,必然会歪曲实验的结果,这时若能将该值剔除不用, 就一定会使结果更符合客观情况。另一种方面,一组正确测量值的分散性,本来客观反映了 应用某仪器在特定条件下进行测量的随机波动特性,但若为了得到精度更高的结果,而人为 的丢掉了一些误差大一点的、但不属于坏值的测量值,则这样得到的所谓分散很小的结果, 实质上是虚假的,所以怎样正确剔除“坏值”,是实践中经常碰到的问题. 由误差理论可知:如果某个测量值x的偏差满足下式 >3S 则认为该值是含有粗差的坏值,须剔除不要 (四)由实验数据整理函数关系 所谓实验数据的整理,就是把所获得的一系列实验数据用最合适的方式表示出来。在化 工实验中,有如下三种表达方式: 1.实验数据列成表格 将实验直接测定的一组数据,或根据测量值计算得到的一组数据,按照其原样,以一定 的顺序一一对应列出数据表。例如:热电偶标定实验测得一组数据,以温度为自变量,以热 电势为因变量列成数据表。这种列表法最为简便。但在实验测量中,自变量(如上例中的温 度)不一定按等间距有规则的分度,这会给使用时带来困难。这就需要根据实验数据重新分 度,使表中所列数据有规则地排列起来,而且希望自变量按整数作等间距顺序排列。这样会 使查阅更为方便 数据的分度有多种方法,最为简单的是图解法,将实验原始数据作图,然后再利用图中 曲线按需要重新列表。其他方法这里不再介绍,可参阅有关书籍。这里仅对如何列数据表提 出如下几点注意事项 l)表格要有简明扼要而又符合内容的标题名称 (2)项目应写明名称、符号及单位。化工数据中,有的数量级很大或很小。如二氧化碳
3 (3) 方均根值:方均根平均值按下式计算 = = n i m i x n x 1 2 1 2 n x x i m = 2 2. 数据精确度的表示 实验数据的精确度或重现性是由偶然误差决定的,通常由测量值与其平均值偏差的统计 值来表示常用的误差表示法有下列两种: (1)(算术)平均偏差:算术平均偏差是表示偏差较好的方法,其表示式为 n i = 式中:n——测量次数; i ——为测量值与其平均值之间的差值,i=1,2,3,...,n。 (2) 标准偏差:标准偏差也称为均方根偏差,其表示式为 1 2 − = n S i 式中 n 与 i 表示的意义与上式相同。 3. 错误数据的剔除 如果一系列测量值中混有“坏值”,必然会歪曲实验的结果,这时若能将该值剔除不用, 就一定会使结果更符合客观情况。另一种方面,一组正确测量值的分散性,本来客观反映了 应用某仪器在特定条件下进行测量的随机波动特性,但若为了得到精度更高的结果,而人为 的丢掉了一些误差大一点的、但不属于坏值的测量值,则这样得到的所谓分散很小的结果, 实质上是虚假的,所以怎样正确剔除“坏值”,是实践中经常碰到的问题. 由误差理论可知:如果某个测量值 x 的偏差满足下式 x − x 3S 则认为该值是含有粗差的坏值,须剔除不要。 (四)由实验数据整理函数关系 所谓实验数据的整理,就是把所获得的一系列实验数据用最合适的方式表示出来。在化 工实验中,有如下三种表达方式: 1. 实验数据列成表格 将实验直接测定的一组数据,或根据测量值计算得到的一组数据,按照其原样,以一定 的顺序一一对应列出数据表。例如:热电偶标定实验测得一组数据,以温度为自变量,以热 电势为因变量列成数据表。这种列表法最为简便。但在实验测量中,自变量(如上例中的温 度)不一定按等间距有规则的分度,这会给使用时带来困难。这就需要根据实验数据重新分 度,使表中所列数据有规则地排列起来,而且希望自变量按整数作等间距顺序排列。这样会 使查阅更为方便。 数据的分度有多种方法,最为简单的是图解法,将实验原始数据作图,然后再利用图中 曲线按需要重新列表。其他方法这里不再介绍,可参阅有关书籍。这里仅对如何列数据表提 出如下几点注意事项: (1) 表格要有简明扼要而又符合内容的标题名称。 (2) 项目应写明名称、符号及单位。化工数据中,有的数量级很大或很小。如二氧化碳
的享利系数,用科学计数法表示,在20℃时,E=144×105kPa。当列表时,项目名称写 为:E×10-5/kPa,而表中数字写为 这种情形在化工数据表中经常遇到,提请大 家注意。 (3)数字写法应注意有效数字的位数,每列之内小数点应对齐 (4)若直接记录实验数据作表,则在实验中应注意自变量尽可能取等间距和整数。 2.实验数据整理成图形 根据解析几何原理,可将实验数据的函数关系,整理成图形表示出来。这种表示法形式 直观,容易由图线直接看出函数关系的变化规律。在化工实验中,常采用这种方法整理实验 数据,因此十分重要。 将实验数据在图上进行标绘时,需注意下列几点 (1)对于一般采用的直角坐标,常选横轴为自变量,纵轴为因变量。在两轴侧要标明变 量名称、符号和单位。尤其是单位,初学者往往因受纯数学的影响而容易忽略。 (2)坐标分度的选择,要反映出实验数据的有效数字位数,即与被标数值精度一致,并 要求方便易读。坐标分度值不一定从零开始,而使图形占满全幅坐标纸较为合适。 (3)若在同一张坐标纸上,同时标绘几组测量值,则各点要用不同符号(如:·,⊕,口 等),以示区别。若几组不同函数同绘在一张坐标纸上,则在曲线上要标明函数关系或名称, 或标明读数方向箭头,如图B.3-3所示 图B3-3 (4)实验曲线以直线最易标绘,使用也最为方便。因此在处理数据时,尽量使曲线直线 化。为此,根据不同情况将变量加以变换或选用不同坐标纸,如在化工实验数据处理上,经 常采用的半对数和双对数坐标纸。并且希望所得值线的斜率力求近于1来进行分度 关于曲线标绘的方法和要求,大家都比较熟悉,这里无需重述。下面着重介绍一下有关 对数坐标的一些基本知识 在化工实验中,常遇到y=ax+b和y=ax”的函数关系。前者在普通坐标上可标绘成 一条直线;而后者标绘在普通坐标上则为一条曲线。如果将等式y=ax"的两边取对数,则 可得 lg y= nlg x+lg a 若将y和lx标绘在普通坐标上,也就可以得到一条直线。 例如,有一组实验数据如下表所示。现将这些实验数据按y对x和gy对lx分别标 绘在普通坐标上,可得一条曲线和一条直线,如图B.3-4所示 实验数据表 /1/ min 5.40 16.73 1.301 2079 2.204 0.732 0.880 1.032 1.114 1.176
4 的亨利系数,用科学计数法表示,在 20℃时, 5 E = 1.4410 kPa。当列表时,项目名称写 为: 5 10− E / kPa ,而表中数字写为:1.44。这种情形在化工数据表中经常遇到,提请大 家注意。 (3) 数字写法应注意有效数字的位数,每列之内小数点应对齐。 (4) 若直接记录实验数据作表,则在实验中应注意自变量尽可能取等间距和整数。 2. 实验数据整理成图形 根据解析几何原理,可将实验数据的函数关系,整理成图形表示出来。这种表示法形式 直观,容易由图线直接看出函数关系的变化规律。在化工实验中,常采用这种方法整理实验 数据,因此十分重要。 将实验数据在图上进行标绘时,需注意下列几点: (1) 对于一般采用的直角坐标,常选横轴为自变量,纵轴为因变量。在两轴侧要标明变 量名称、符号和单位。尤其是单位,初学者往往因受纯数学的影响而容易忽略。 (2) 坐标分度的选择,要反映出实验数据的有效数字位数,即与被标数值精度一致,并 要求方便易读。坐标分度值不一定从零开始,而使图形占满全幅坐标纸较为合适。 (3)若在同一张坐标纸上,同时标绘几组测量值,则各点要用不同符号(如:•,⊕, 等),以示区别。若几组不同函数同绘在一张坐标纸上,则在曲线上要标明函数关系或名称, 或标明读数方向箭头,如图 B.3-3 所示。 图 B.3-3 (4) 实验曲线以直线最易标绘,使用也最为方便。因此在处理数据时,尽量使曲线直线 化。为此,根据不同情况将变量加以变换或选用不同坐标纸,如在化工实验数据处理上,经 常采用的半对数和双对数坐标纸。并且希望所得值线的斜率力求近于 1 来进行分度。 关于曲线标绘的方法和要求,大家都比较熟悉,这里无需重述。下面着重介绍一下有关 对数坐标的一些基本知识。 在化工实验中,常遇到 y = ax + b 和 n y = ax 的函数关系。前者在普通坐标上可标绘成 一条直线;而后者标绘在普通坐标上则为一条曲线。如果将等式 n y = ax 的两边取对数,则 可得: lg y = nlg x + lg a 若将 lg y 和 lg x 标绘在普通坐标上,也就可以得到一条直线。 例如,有一组实验数据如下表所示。现将这些实验数据按 y 对 x 和 lg y 对 lg x 分别标 绘在普通坐标上,可得一条曲线和一条直线,如图 B.3-4 所示。 实 验 数 据 表 x/ mm 20 40 80 120 160 200 y/ l / min 5.40 7.59 10.76 13.01 15.00 16.73 lgx 1.301 1.602 1.903 2.079 2.204 2.301 lgy 0.732 0.880 1.032 1.114 1.176 1.223
图B.3-4普通坐标 图B.3-5双对数坐标 为了避免将每个数据都换算成对数,可以将坐标纸的分度直接按对数值绘制。现将表中 的数据直接标绘在对数坐标纸上,如图B.3-5所示。纵坐标和横坐标都用对数值进行绘制, 称为双对数坐标。对于某些函数关系,如y=e只需纵坐标用对数值绘制,即谓半对数 坐标 对数坐标有几个特点,在应用时需特别注意 (1)在对数坐标轴上的数值为真数。坐标轴的原点为1:,而不是 (2)由于0.01、0.1、1、10、100等的对数,分别为-2、-1、0、1、2等,所以在坐 标纸上,每一数量级的距离是相等的 (3)在对数坐标上求取斜率的方法,与普通坐标上求法有所不同,这一点需要特别注意。 在双对数坐标上求斜率,则不能直接用坐标标度来度量,因为在对数坐标上标度的数值是 真数而不是对数。因此,需用对数值来求算,或者直接用尺子在坐标纸上量取线段长度求 取,如图B3-5中所示的直线,其斜率 lg y2-lgyr y2-yu Ig x2-Ig x 式中:Mh与M的数值,即用尺子测量而得的线段长度 4)在双对数坐标上,直线与x=1的纵轴相交处的y值,即为原方程y=ax"中的a值。 若所标绘的直线需延长很远才能与x=1的纵轴相交,则可在求得斜率n之后,在直线上任 取一组数据x和y,代入原方程y=ax”中,也可求得a的值 3.由实验数据拟合函数关系 在化学工程研究中,在某些场合下,可以根据所研究过程的机理用数学方程来描述该过 程的各个参数和变量之间的关系,即所谓建立数学模型。在计算机技术不断取得进展的现今 时代来讲,为建立数学模型及其求解提供了可能性。至今虽还不是所有场合都能做到,但它
5 图 B.3-4 普通坐标 图 B.3-5 双对数坐标 为了避免将每个数据都换算成对数,可以将坐标纸的分度直接按对数值绘制。现将表中 的数据直接标绘在对数坐标纸上,如图 B.3-5 所示。纵坐标和横坐标都用对数值进行绘制, 称为双对数坐标。对于某些函数关系,如 bx y = ae 只需纵坐标用对数值绘制,即谓半对数 坐标。 对数坐标有几个特点,在应用时需特别注意: (1) 在对数坐标轴上的数值为真数。坐标轴的原点为 1;,而不是 0。 (2) 由于 0.01、0.1、1、10、100 等的对数,分别为-2、-1、0、1、2 等,所以在坐 标纸上,每一数量级的距离是相等的。 (3) 在对数坐标上求取斜率的方法,与普通坐标上求法有所不同,这一点需要特别注意。 在双对数坐标上求斜率,则不能直接用坐标标度来度量,因为在对数坐标上标度的数值是 真数而不是对数。因此,需用对数值来求算,或者直接用尺子在坐标纸上量取线段长度求 取,如图 B.3-5 中所示的直线,其斜率 2 1 2 1 2 1 2 1 lg lg lg lg x x y y x x y y l h n − − − − = = 式中: h 与 l 的数值,即用尺子测量而得的线段长度。 (4) 在双对数坐标上,直线与 x=1 的纵轴相交处的 y 值,即为原方程 n y = ax 中的 a 值。 若所标绘的直线需延长很远才能与 x=1 的纵轴相交,则可在求得斜率 n 之后,在直线上任 取一组数据 x 和 y,代入原方程 n y = ax 中,也可求得 a 的值。 3. 由实验数据拟合函数关系 在化学工程研究中,在某些场合下,可以根据所研究过程的机理用数学方程来描述该过 程的各个参数和变量之间的关系,即所谓建立数学模型。在计算机技术不断取得进展的现今 时代来讲,为建立数学模型及其求解提供了可能性。至今虽还不是所有场合都能做到,但它