1、15第 2 章 实验数据的误差分析通过实验测量所得大批数据是实验的主要成果,但在实验中,由于测量仪表和人的观察等方面的原因,实验数据总存在一些误差,所以在整理这些数据时,首先应对实验数据的可靠性进行客观的评定。误差分析的目的就是评定实验数据的精确性,通过误差分析,认清误差的来源及其影响,并设法消除或减小误差,提高实验的精确性。对实验误差进行分析和估算,在评判实验结果和设计方案方面具有重要的意义。本章就化工原理实验中遇到的一些误差基本概念与估算方法作一扼要介绍。2.1 误差的基本概念2.1.1 真值与平均值真值是指某物理量客观存在的确定值。通常一个物理量的真值是不知道的,是我们努力要求测到的。严
2、格来讲,由于测量仪器,测定方法、环境、人的观察力、测量的程序等,都不可能是完善无缺的,故真值是无法测得的,是一个理想值。科学实验中真值的定义是:设在测量中观察的次数为无限多,则根据误差分布定律正负误差出现的机率相等,故将各观察值相加,加以平均,在无系统误差情况下,可能获得极近于真值的数值。故“真值”在现实中是指观察次数无限多时,所求得的平均值(或是写入文献手册中所谓的“公认值”) 。然而对我们工程实验而言,观察的次数都是有限的,故用有限观察次数求出的平均值,只能是近似真值,或称为最佳值。一般我们称这一最佳值为平均值。常用的平均值有下列几种:(1)算术平均值 这种平均值最常用。凡测量值的分布服从
3、正态分布时,用最小二乘法原理可以证明:在一组等精度的测量中,算术平均值为最佳值或最可信赖值。(2-1)nxnxi121式中: 各次观测值;n观察的次数。x21、(2)均方根平均值(2-2)nxnxxi12221均(3)加权平均值设对同一物理量用不同方法去测定,或对同一物理量由不同人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。(2-3)niiinwxwx121 16式中; 各次观测值;nx21、各测量值的对应权重。各观测值的权数一般凭经验确定。w、(4)几何平均值(2-4)nnxx321发(5)对数平均值(2-5)2121llxn以上介绍的各种平均值,目的是要从一组测定值
4、中找出最接近真值的那个值。平均值的选择主要决定于一组观测值的分布类型,在化工原理实验研究中,数据分布较多属于正态分布,故通常采用算术平均值。2.1.2 误差的定义及分类在任何一种测量中,无论所用仪器多么精密,方法多么完善,实验者多么细心,不同时间所测得的结果不一定完全相同,而有一定的误差和偏差,严格来讲,误差是指实验测量值(包括直接和间接测量值)与真值(客观存在的准确值)之差,偏差是指实验测量值与平均值之差,但习惯上通常将两者混淆而不以区别。根 据 误 差 的 性 质 及 其 产 生 的 原 因 , 可 将 误 差 分 为 : 1) 系 统 误 差 ; 2) 偶 然 误 差 ; 3) 过失 误
5、 差 三 种 。1系统误差又称恒定误差,由某些固定不变的因素引起的。在相同条件下进行多次测量,其误差数值的大小和正负保持恒定,或随条件改变按一定的规律变化。产生系统误差的原因有:1)仪器刻度不准,砝码未经校正等;2)试剂不纯,质量不符合要求;3)周围环境的改变如外界温度、压力、湿度的变化等;4)个人的习惯与偏向如读取数据常偏高或偏低,记录某一信号的时间总是滞后,判定滴定终点的颜色程度各人不同等等因素所引起的误差。可以用准确度一词来表征系统误差的大小,系统误差越小,准确度越高,反之亦然。由于系统误差是测量误差的重要组成部分,消除和估计系统误差对于提高测量准确度就十分重要。一般系统误差是有规律的。
6、其产生的原因也往往是可知或找出原因后可以清除掉。至于不能消除的系统误差,我们应设法确定或估计出来。2偶然误差又称随机误差,由某些不易控制的因素造成的。在相同条件下作多次测量,其误差的大小,正负方向不一定,其产生原因一般不详,因而也就无法控制,主要表现在测量结果的分散性,但完全服从统计规律,研究随机误差可以采用概率统计的方法。在误差理论中,常用精密度一词来表征偶然误差的大小。偶然误差越大,精密度越低,反之亦然。在测量中,如果已经消除引起系统误差的一切因素,而所测数据仍在未一位或未二位数字上有差别,则为偶然误差。偶然误差的存在,主要是我们只注意认识影响较大的一些因素,而往往忽略其他还有一些小的影响
7、因素,不是我们尚未发现,就是我们无法控制,而这些影响,正是造成偶然误差的原因。17图 21 精密度、正确度、精确度含义示意图3过失误差又称粗大误差,与实际明显不符的误差,主要是由于实验人员粗心大意所致,如读错,测错,记错等都会带来过失误差。含有粗大误差的测量值称为坏值,应在整理数据时依据常用的准则加以剔除。综上所述,我们可以认为系统误差和过失误差总是可以设法避免的,而偶然误差是不可避免的,因此最好的实验结果应该只含有偶然误差。2.1.3 精密度、正确度和精确度(准确度)测量的质量和水平,可用误差的概念来描述,也可用准确度等概念来描述。国内外文献所用的名词术语颇不统一,精密度、正确度、精确度这几
8、个术语的使用一向比较混乱。近年来趋于一致的多数意见是:精密度:可以称衡量某些物理量几次测量之间的一致性,即重复性。它可以反映偶然误差大小的影响程度。正确度:指在规定条件下,测量中所有系统误差的综合,它可以反映系统误差大小的影响程度。精确度(准确度):指测量结果与真值偏离的程度。它可以反映系统误差和随机误差综合大小的影响程度。为说明它们间的区别,往往用打靶来作比喻。如图 2-1 所示,A 的系统误差小而偶然误差大,即正确度高而精密度低;B 的系统误差大而偶然误差小,即正确度低而精密度高;C 的系统误差和偶然误差都小,表示精确度(准确度)高。当然实验测量中没有像靶心那样明确的真值,而是设法去测定这
9、个未知的真值。对于实验测量来说,精密度高,正确度不一定高。正确度高,精密度也不一定高。但精确度(准确度)高,必然是精密度与正确度都高。2.2 误差的表示方法测量误差分为测量点和测量列(集合)的误差。它们有不同的表示方法。2.2.1 测量点的误差表示1绝对误差 D测量集合中某次测量值与其真值之差的绝对值称为绝对误差。(2-6 )xXD即 xxX 式中: 真值,常用多次测量的平均值代替;测量集合中某测量值2相对误差 Er绝对误差与真值之比称为相对误差 (2-7)XDEr18相对误差常用百分数或千分数表示。因此不同物理量的相对误差可以互相比较,相对误差与被测之量的大小及绝对误差的数值都有关系。3引用
10、误差仪表量程内最大示值误差与满量程示值之比的百分值。引用误差常用来表示仪表的精度。2.2.2 测量列(集合)的误差表示1范围误差范围误差是指一组测量中的最高值与最低值之差,以此作为误差变化的范围。使用中常应用误差的系数的概念。(2-8)LK式中: 最大误差系数;K范围误差;L算术平均值。范围误差最大缺点是使 只以决于两极端值。而与测量次数无关。2算术平均误差算术平均误差是表示误差的较好方法,其定义为= , (2-9)ndin,21式中: 观测次数; n测量值与平均值的偏差, 。idiix算术平均误差的缺点是无法表示出各次测量间彼此符合的情况。3标准误差标准误差也称为根误差。(2-10)ndi2
11、标准误差对一组测量中的较大误差或较小误差感觉比较灵敏,成为表示精确度的较好方法。上式适用无限次测量的场合。实际测量中,测量次数是有限的,改写为(2-11)12ndi标准误差不是一个具体的误差, 的大小只说明在一定条件下等精度测量集合所属的任一次观察值对其算术平均值的分散程度,如果 的值小,说明该测量集合中相应小的误差就占优势,任一次观测值对其算术平均值的分散度就小,测量的可靠性就大。算术平均误差和标准误差的计算式中第 次误差可分别代入绝对误差和相对误差,相i对得到的值表示测量集合的绝对误差和相对误差。上述的各种误差表示方法中,不论是比较各种测量的精度或是评定测量结果的质量,均以相对误差和标准误
12、差表示为佳,而在文献中标准误差更常被采用。192.2.3 仪表的精确度与测量值的误差1电工仪表等一些仪表的精确度与测量误差这些仪表的精确度常采用仪表的最大引用误差和精确度的等级来表示。仪表的最大引用误差的定义为最大引用误差 = 100% (2-12)绝 对 值该 仪 表 相 应 档 次 量 程 的仪 表 显 示 值 的 绝 对 误 差式中仪表显示值的绝对误差指在规定的正常情况下。被测参数的测量值与被测参数的标准值之差的绝对值的最大值。对于多档仪表,不同档次显示值的绝对误差和程量范围均不相同。式(2-12)表明,若仪表显示值的绝对误差相同,则量程范围愈大,最大引用误差愈小。我国电工仪表的精确度等
13、级有七种:0.1、0.2、0.5、1.0、1.5、25、5.0。如某仪表的精确度等级为 2.5 级,则说明此仪表的最大引用误差为 2.5%。在使用仪表时,如何估算某一次测量值的绝对误差和相对误差?设仪表的精确度等级 P 级,其最大引用误差为 10%。设仪表的测量范围为 仪表的nx示值为 ,则由式(2-12)得该示值的误差为ix(2-13)%PxDEini相 对 误 差绝 对 误 差式(2-13)表明:(1)若仪表的精确度等级 P 和测量范围 已固定,则测量的示值 愈大,测量的相n ix对误差愈小。(2)选 用 仪 表 时 , 不 能 盲 目 地 追 求 仪 表 的 精 确 度 等 级 。 因
14、为 测 量 的 相 对 误 差 还 与有关。应该兼顾仪表的精确度等级和 两者。inx inx2天平类仪器的精确度和测量误差这些仪器的精度用以下公式来表示:仪器的精密度= (2-14)量 程 的 范 围名 义 分 度 值式中名义分度值指测量时读数有把握正确的最小分度单位,即每个最小分度所代表的数值。例如 TG3284 型天平,其名义分度值(感量)为 0.1 毫克,测量范围为 0200 克,则其精确度= (2-15)7310502.)(若仪器的精确度已知,也可用式(2-14)求得其名义分度值。使用这些仪器时,测量的误差可用下式来确定: 20(2-16)测 量 值名 义 度 值相 对 误 差 名 义
15、 分 度 值绝 对 误 差3测量值的实际误差由于仪表的精确度用上述方法所确定的测量误差,一般总是比测量值的实际误差小的多。这是因为仪器没有调整到理想状态,如不垂直、不水平、零位没有调整好等,会引起误差;仪表的实际工作条件不符合规定的正常工作条件,会引起附加误差;仪器经过长期使用后,零件发生磨损,装配状况发生变化等,也会引起误差;可能存在有操作者的习惯和偏向所引起的误差;仪表所感受的信号实际上可能并不等于待测的信号;仪表电路可能会受到干扰等。总而言之,测量值实际误差大小的影响因素是很多的。为了获得较准确的测量结果,需要有较好的仪器,也需要有科学的态度和方法,以及扎实的理论知识和实践经验。2.3“
16、过失”误差的舍弃这里加引号的“过失”误差与前面提到真正的过失误差是不同的,在稳定过程,不受任何人为因素影响,测量出少量过大或过小的数值,随意地舍弃这些“坏值” ,以获得实验结果的一致,这是一种错误的做法, “坏值”的舍弃要有理论依据。如何判断是否属于异常值?最简单的方法是以三倍标准误差为依据。从概率的理论可知,大于 (均方根误差)的误差所出现的概率只有 0.3%,故通常3把这一数值称为极限误差,即(2-17)3极 限如果个别测量的误差超过 ,那么就可以认为属于过失误差而将舍弃。重要的是如何从有限的几次观察值中舍弃可疑值的问题,因为测量次数少,概率理论已不适用,而个别失常测量值对算术平均值影响很
17、大。有一种简单的判断法,即略去可疑观测值后,计算其余各观测值的平均值 及平均误差 ,然后算出可疑观测值 与平均值 的偏差ixd如果 4d则此可疑值可以舍弃,因为这种观测值存在的概率大约只有千分之一。2.4 间接测量中的误差传递在许多实验和研究中,所得到的结果有时不是用仪器直接测量得到的,而是要把实验现场直接测量值代入一定的理论关系式中,通过计算才能求得所需要的结果,既间接测量值。由于直接测量值总有一定的误差,因此它们必然引起间接测量值也有一定的误差,也就是说直接测量误差不可避免地传递到间接测量值中去,而产生间接测量误差。误差的传递公式:从数学中知道,当间接测量值 与直接值测量值)(y有函数关系
18、时,即),(21nx,(21nxfy则其微分式为:(2-18)ndxydxd2121(2-19) nn dxydxyxxfyd 2121),(根据式(2-18)和(2-19) ,当直接测量值的误差 很小,并且考),(21虑到最不利的情况,应是误差累积和取绝对值,则可求间接测量值的误差 为:y或(2-20)nxyxyxy 21(2-21) nnxf 21,21Er)(这两个式子就是由直接测量误差计算间接测量误差的误差传递公式。对于标准差的传则有:(2-22)2221 nxxxy yy式中 , 等分别为直接测量的标准误差、 为间接测量值的标准误差。1x2 y上式在有关资料中称之为“几何合成”或“极
19、限相对误差” 。现将计算函数的误差的各种关系式列表如下:函数式的误差关系表误 差 传 递 公 式数学式最大绝对误差 最大相对误差 )(Erynxy21 )(21nxxy y)(r21xy )(或 )( yxxr121E )( 21rr x)()(321)()r13231y或 321r)(EynxyEr1yxn或 xnrn)(ry或 y)(r21xyry 21rEx22cxy)(Eryxcy或 xyy)(E)(rr或ln4329.0ogx4329.0 ln r2.5 误差分析在阻力实验中的具体应用误差分析除用于计算测量结果的精确度外,还可以对具体的实验设计予与先进行误差分析,在找到误差的主要来源
20、及每一个因素所引起的误差大小后,对实验方案和选用仪器仪表提出有益的建议。例 2-1 本实验测定层流 Re 关系是在 Dg6(公称径为 6mm)的小铜管中进行,因内径大小,不能采用一般的游标卡尺测量,而是采用体积法进行直径间接测量。截取高度为 400mm 的管子,测量这段管子中水的容积,从而计算管子的平均内径。测量的量具用移液管,其体积刻度线相当准确,而且它的系统误差可以忽略。体积测量三次,分别为11.31、11.26、11.30(毫升) 。问体积的算术平均值 、平均绝对误差 D、相对误差 Er 为多少?解:算术平均值 29.130.26.1nxi平均绝对误差 02.3.129.1 D相对误差
21、%8.0.Era例 2-2 要测定层流状态下,公称内径为 6mm 的管道的摩擦系数 (参见流体阻力实验) ,希望在 Re =200 时, 的精确度不低于 4.5%,问实验装置设计是否合理?并选用合适的测量方法和测量仪器。解: 的函数形式是:= 2152)(6slVRdg式中: 、 被测量段前后液注读数值mH 2O:1R2流量m 3/s:sV被测量段长度m。l标准误差:Er()= 2122 )()()(5 RlVds 要求 Er()4.5%,由于 所引起的误差小于 ,故可以略去不考虑。剩下三项分误差,l 10rE可按等效法进行分配,每项分误差和总误差的关系:Er()= =4.5%23im每项分误
22、差 mi= %6.235.4流量项的分误差估计: 1首先确定 值sV23/4.9/104.91046.204Re 363 smlsdVs 这么小的流量可以采用 500ml 的量筒测其流量,量筒系统误差很小,可以忽略,读数误差为 ,计时用的秒表系统误差也可忽略,开停秒表的随机误差估计为 秒,当ml5 1.0Re=200 时,每次测量水量约为 450ml,需时间 48 秒左右。流量测量最大误差为:01.)485()(Vs式中具体数字说明 误差较大, 可以忽略。因此流量项的分误差:%2.01.21sm没有超过每项分误差范围。d 的相对误差 2要求: 即则 ,5 5d52.06.d由例 2-1 知道管
23、径 由体积法进行间接测量。 hV24d已知管高度为 400mm,绝对误差0.5mm为保险起见,仍采用几何合成法计算 的相对误差。 )(21hVd由例 2-1 已计算出 的相对误差为 0.18% V代入具体数值:%8.0)1405.8.(2%)10(252 hdm也没有超过每项分误差范围。压差的相对误差: 3单管式压差计用分度为 1mm 的尺子测量,系统误差可以忽略,读数随机绝对误差为0.5mm 。 R 212121 5.0RR压差测量值 与两测压点间的距离 成正比:21l 031.)6.78.49(06.4e64 2 ggudlR式中: 为平均流速m/s。u24由上式可算出 的变化对压差相对误
24、差的影响(见下表) 。lm21mR%1021R500100015002000153045606.73.32.21.6由表中可见,选用 可满足要求,若实验采用 其相对误差为:ml150 ml150%2.03.2123 RR总误差:Er()= 22223 ).(8.).(= %.通过以上误差分析可知:(a)为实验装置中两测点间的距离 的选定充分提供了依据。l(b)直径 的误差,因传递系数较大(等于 5) ,对总误差影响较大,但所选测量d的方案合理,这项测量精确度高,对总误差影响反而下降了。d(c)现有的测量 误差显得过大,其误差主要来自体积测量,因而若改用精确度更sV高一级的量筒,则可以提高实验结
25、果的精确度。例 2-3 若 选用 1.796m,水温 20 , ,测得出水量为 450ml 时,l mR1.821所需时间为 319 秒,当 Re=300 时,所测 的相对误差为多少?解:由例 2 知 %.1m8.02 %3.0.513Er()= 5.12.8.2232 m结果表明,由于压差下降,压差测量的相对误差上升,致使 测量的相对误差增大。当 Re=300 时, 的理论值为 ,如果实验结果与此值有差异(例如 =0.186 或.0Re64=0.240) ,并不一定说明 的测量值与理论值不符,要看偏差多少?象括号中的这种偏差是测量精密度不高引起的,如果提高压差测量精度或者增加测量次数并取平均值,就有可能与理论值相符。以上例子充分说明了误差分析在实验中的重要作用。