1、第二章 误差及分析数据的处理,概述 测量误差有效数字及其运算规则偶然误差的正态分布有限数据的统计处理和t分布,第一节 概述,1.定量分析的任务: 准确测定试样中组分的含量,必须使分析结果具有一定的准确度才能满足生产、科研等各方面的需要。本章所要解决的问题: 对分析结果进行评价,判断分析结果的准确性误差(error)。,误差(error),误差客观存在定量分析数据的归纳和取舍(有效数字)计算误差,评估和表达结果的可靠性和精密度了解原因和规律,减小误差,测量结果真值(true value),第二节 测量误差,一、误差分类及产生原因二、误差的表示方法三、误差的传递四、提高分析结果准确度的方法,一、误
2、差分类及产生原因,误差是分析结果与真实值之差。根据性质和产生的原因可分为三类: 系统误差 偶然误差 过失误差,(一)系统误差(可定误差): 由可定原因产生,1特点:具单向性(大小、正负一定 ) 可消除(原因固定) 重复测定重复出现,2分类:(1)按来源分 a方法误差:方法不恰当产生 b仪器与试剂误差:仪器不精确和试剂中含被测 组分或不纯组分产生 c操作误差: 操作方法不当引起 (2)按数值变化规律分 a恒定误差 b比值误差,(二)偶然误差(随机误差,不可定误差): 由不确定原因引起,特点:1)不具单向性(大小、正负不定)2)不可消除(原因不定) 但可减小(测定次数)3)在消除系统误差后,分布服
3、从统计学规律(正态分布),偶然误差统计规律,1)大小相等的正负误差出现的机会相等。2)小误差出现的机会多,大误差出现的机会少。随测定次数的增加,偶然误差的算术平均值将逐渐接近于零(正、负抵销)。,(三)过失误差,由于操作人员粗心大意、过度疲劳、精神不集中等引起的。其表现是出现离群值,极端值。,综上所述系统误差 可校正偶然误差 可控制过失误差 可避免,二、误差的表示方法,(一)准确度与误差(二)精密度与偏差(三)准确度与精密度的关系,(一)准确度与误差,1准确度:(accuracy)指测量结果与真值的接近程度,反映测定的正确性,是系统误差大小的量度。,2准确度的表示方法误差(1)绝对误差:测量值
4、与真实值之差 E = 测定值真实值x-xT,(2)相对误差:绝对误差占真实值的百分比,分析结果的准确度常用相对误差表示,如:对于1000kg和10kg ,绝对误差相同(1kg),但产生的相对误差却不同。,绝对误差和相对误差都有正负之分。,(二)精密度与偏差,1精密度(precision) :平行测量的各测量值(xi)间的相互接近程度,反映测定的再现性。,2精密度的表示方法偏差(deviation) : (1)绝对偏差 :单次测量值与平均值之差,(2)相对偏差:绝对偏差占平均值的百分比,续前,(3)平均偏差(mean deviation) :各测量值绝对偏差的算术平均值用以衡量精密度,(4)相对
5、平均偏差(relative mean deviation) : 平均偏差占平均值的百分比,例1:测定钢样中铬的百分含量,得如下结果:1.11, 1.16, 1.12, 1.15和1.12。计算此结果的平均偏差及相对平均偏差。,解:,用 表示精密度比较简单。该法的不足之处是不能充分反映大偏差对精密度的影响,例2:用碘量法测定某铜合金中铜的百分含量,得到两批数据,每批有10个。测定的平均值为10.0%。各次测量的偏差分别为:第一批di:+0.3, -0.2, -0.4*, +0.2, +0.1, +0.4*, 0.0, -0.3, +0.2, -0.3第二批di:0.0, +0.1, -0.7*,
6、 +0.2, -0.1,-0.2, +0.5*, -0.2, +0.3, +0.1试以平均偏差表示两批数据的精密度。,解:,结论:两批数据平均偏差相同, 但第二批数据明显比第一批数据分散。第一批较大偏差范围: -0.4 +0.4 第二批较大偏差范围: -0.7 +0.5,(5)标准偏差: (standard deviation),续前,基本术语数理统计研究的对象是不确定现象。1. 随机现象 个体上表现为不确定性而大量观察中呈现出统计规律性的现象。2. 总体 研究对象的全体(包括众多直至无穷多个体。3. 样本自总体中随机抽出一部分样品,通过样品推断总体的性质。4. 样本容量样本中所含个体的数目。
7、样本容量为n,其平均值为:,(5)标准偏差: (standard deviation),续前,基本术语5. 总体平均值(-population mean) 测量无限次,即n趋于时,为:,若无系统误差,则就是xT。 实用时,n30,就认为 =xT。,(5)标准偏差: (standard deviation),续前,6. 总体平均偏差() ( population mean deviation),7. 总体标准偏差( population standard deviation)数理统计中用标准偏差(标准差,均方差)而不是用平均偏差来衡量数据的精密度。,总体标准偏差,计算总体标准偏差时,对单次测定的
8、偏差平方作用:(1) 避免单次测定偏差相加时正负抵销(2) 大偏差 会得到放大,能更显著的反映出来,能更好地说明数据的分散程度。在实际分析测定中,测定次数一般不多,n20,而总体平均值又不知道。一般是用抽样的方法对样品进行测定。只能用样本标准偏差反映该组数据的分散程度,续前,8. 样本标准偏差(standard deviation),f=n-1,自由度:n个测定数据能相互独立比较的是n-1个。引入自由度(n-1)是为了校正以样本平均值代替总体平均值引起的误差。当测定次数非常多时,测定次数n与自由度(n-1)的区别就变小, 。即:,此时,S。,如用标准偏差比较例2中的两批数据的精密度,则:,S1
9、S2,可见第一批数据的精密度比第二批好。用标准偏差表示精密度的优点:S比 更灵敏地反映出较大偏差的存在,能更确切地评价出一组数据的精密度。,(5)标准偏差: (standard deviation),续前,样本标准偏差未知,总体标准偏差已知,(6)相对标准偏差(relative standard deviation-RSD) 又称变异系数(coefficient of variation-CV),练习,例:用丁二酮肟重量法测定钢铁中Ni的百分含量,结果 为10.48%,10.37%,10.47%,10.43%,10.40%;计算单次 分析结果的平均偏差,相对平均偏差,标准偏差和 相对标准偏差。
10、,解:,(7)平均值的标准偏差:,标准偏差与平均偏差 : 统计学方法证明:总体的标准偏差与平均偏差关系为:0.79790.8平均值的标准偏差与平均偏差:,由此可见S(X)与n的平方根成反比,增加测定次数, 可使平均值的标准偏差减小,但并不能使精密度成比例提高,通常测量46次足以,(三)准确度与精密度的关系,准确度(accuracy):测量值与真实值相接近的程度。反映了测量结果的正确性,用误差来评估。精密度(precision):各个测量值之间相互接近的程度。反映了测量结果的重现性,用偏差来评估。系统误差是分析误差的主要来源,影响结果的准确度偶然误差影响结果的精密度,例如,甲、乙、丙、丁四人同时
11、测定铜合中Cu的百分含量,各分析6次。设真值=10.00%,结果如下:,分析结果准确度高,要求精密度一定要高。分析结果精密度高,准确度不一定高。,精密度好,准确度不好,系统误差大,准确度、精密度都好,系统误差、偶然误差小,精密度较差,接近真值是因为正负误差彼此抵销,精密度、准确度差。系统误差、偶然误差大,准确度与精密度的关系,三、误差的传递,(一)系统误差的传递 R = f(x,y,z) ER,Ex,Ey,Ez,(二)偶然误差的传递,2乘除法计算,1加减法计算,2乘除法计算,标准偏差法,1加减法计算,练习,例:设天平称量时的标准偏差 s = 0.10mg,求称量试样 时的标准偏差sm 。,解:
12、,练习,例:用移液管移取NaOH溶液25.00mL,以0.1000mol/L的 HCL溶液滴定之,用去30.00mL,已知用移液管移 取溶液的标准差s1=0.02mL,每次读取滴定管读数的 标准差s2=0.01mL,假设HCL溶液的浓度是准确的, 计算标定NaOH溶液的标准偏差?,解:,四、提高分析结果准确度的方法,1选择合适的分析方法 例:测全Fe含量 K2Cr2O7法 40.20% 0.2%40.20% 比色法 40.20% 2.0%40.20%,2减小测量误差1)称量 例:天平一次的称量误差为 0.0001g,两次的称量误差为 0.0002g,RE% 0.1%,计算最少称样量?,续前,2
13、)滴定 例:滴定管一次的读数误差为0.01mL,两次的读数误差为 0.02mL,RE% 0.1%,计算最少移液体积?,3增加平行测定次数,一般测34次以减小偶然误差4消除测量过程中的系统误差1)校准仪器:消除仪器的误差2)空白试验:消除试剂误差3)对照实验:消除方法误差4)回收实验:加样回收,以检验是否存在方法误差,第三节 有效数字及其运算规则,一、有效数字二、有效数字的修约规则 三、有效数字的运算法则,一、有效数字:实际可以测得的数字,1. 有效数字位数包括所有准确数字和一位欠准数字 例:滴定读数20.30mL,最多可以读准三位 第四位欠准(估计读数)1%2. 在09中,只有0既是有效数字,
14、又是无效数字 例: 0.06050 四位有效数字 定位 有效位数 例:3600 3.6103 两位 3.60103 三位3单位变换不影响有效数字位数 例:10.00mL0.001000L 均为四位,续前,4pH,pM,pK,lgC,lgK等对数值,其有效数字的 位数取决于小数部分(尾数)数字的位数,整数部 分只代表该数的方次 例:pH = 11.20 H+= 6.310-12mol/L 两位5结果首位为8和9时,有效数字可以多计一位 例:90.0% ,可示为四位有效数字 例:99.87% 99.9% 进位,二、有效数字的修约规则,1四舍六入五留双,2只能对数字进行一次性修约,3当对标准偏差修约
15、时,修约后会使标准偏差结果 变差,从而提高可信度 例:s = 0.134 修约至0.14,可信度,例:0.37456 , 0.3745 均修约至三位有效数字,例:6.549, 2.451 一次修约至两位有效数字,0.374,0.375,6.5,2.5,三、有效数字的运算法则,1加减法:以小数点后位数最少的数为准(即以 绝对误差最大的数为准),2乘除法:以有效数字位数最少的数为准(即以 相对误差最大的数为准),例: 50.1 + 1.45 + 0.5812 = ?,E 0.1 0.01 0.0001,52.1,例:0.0121 25.64 1.05782 = ?,E 0.0001 0.01 0.
16、00001 RE 0.8% 0.4% 0.009%,0.328,保留三位有效数字,保留三位有效数字,第四节 偶然误差的正态分布,一、偶然误差的正态分布和标准正态分布二、偶然误差的区间概率,一、偶然误差的正态分布和标准正态分布,(一)频率和概率(Frequency and probability),1频率: 如果n次测量中随机事件A出现了 nA次,则称F(A)= nA/n 2概率:随机事件A的概率P(A)表示事件A发生的可能性大小当n无限大时,频率的极限为概率:limF(A)=P(A) (0P(A)Q表 则可疑值要舍去,否则保留; (4)完成Q检验,才能算X 和S;Q值愈大x疑愈远离群体值,例
17、某学生测 N%:20.48;20.55;20.60;20.53;20.50 问:(1)用Q检验20.60是否保留 _ _ _(2)报告分析结果 n,S ,x ,d/x (3)若xT=20.56 计算Er%(4)P=0.95时平均值的置信区间并说明含义,这说明在20.530.043区间中包括总体平均值的把握性为95%,小结,1. 比较: t 检验检验方法的系统误差 F 检验检验方法的偶然误差 G 检验异常值的取舍,2. 检验顺序: G检验 F 检验 t检验,异常值的取舍,精密度显著性检验,准确度或系统误差显著性检验,本章作业:P27 2,3,4P268 2, 4, 7P269 8, 10, 12P270 16, 20, 22, 24, 25P271 28, 29,