1、,分 析 化 学 Analytical Chemistry,第二章 误差及分析数据的统计处理,内容: 2.1定量分析中的误差 2.2分析结果的数据处理 2.3有效数据及其运算规则在任何测量中误差都是客观存在的,2.1定量分析中的误差,2.1.1误差与准确度 误差是测定值xi与真值之差,可分为绝对误差E和相对误差Er相对误差表示占真值的百分率 绝对误差和相对误差有正负之分,正误差表示分析结果偏高,负误差表示分析结果偏低. 在实际应用中一般用准确度来表示测定结果的可靠性,即平均值与真值接近的程度.,例: 滴定的体积误差,称量误差,滴定剂体积应为2030mL,称样质量应大于0.2g,用相对误差表示各
2、种测定结果的准确度更为确切些,例1 测定含铁样品中w(Fe), 比较结果的准确度。,A. 铁矿中,,B. Li2CO3试样中,A.,B.,2.1.2偏差与精密度,偏差是指个别测定结果xi与几次测定结果的平均值之间的差别.分为绝对偏差和相对偏差,其定义式:,2-3,2-4,平均偏差的表示方法有以下几种:,1.算术平均偏差(单次测定的平均偏差):各偏差值的绝对值的平均值。其数学式:,那么单次测定的相对平均偏差可表示为:,2-5,2-6,2.标准偏差(均方根偏差),分为总体标准偏差(n)和样本标准偏差s(n为有限次数),2-7,2-8,(n-1)表示n个测定中具有独立偏差的数目,又称自由度,标准偏差
3、常用的计算公式:,2-9,相对标准偏差,2-10,Sr如用百分率表示又称为变异系数CV,两种计算偏差的方法中用标准偏差更合理,因为它能将较大的偏差显著地表现出来。,精密度是指在确定条件下将测试方法实施多次求出所得结果之间的一致程度,其大小常用偏差来表示。也可用重复性和再现性来表示。,例: 两组测定数据甲:2.9 2.9 3.0 3.1 3.1乙:2.8 3.0 3.0 3.0 3.2 判断其精密度的差异。,解:平均值: 甲= 3.0 平均偏差:d甲=0.08 标准偏差:S甲=0.08乙=3.0 d乙=0.08 s乙=0.14,两组数据平均偏差相同,但数据离散程度不同。乙更分散,说明有时候平均偏
4、差不能 反应客观情况,而是用标准偏差来判断。,2.1.3 准确度与精密度的关系,图2-1 不同工作者分析同一试样的结果,准确度和精密度分析结果的衡量指标。( 1) 准确度分析结果与真实值的接近程度准确度的高低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。,(2) 精密度几次平行测定结果相互接近程度 精密度的高低用偏差来衡量,偏差是指个别测定值与平均值之间的差值。,(3) 两者的关系精密度是保证准确度的先决条件; 精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。,2.1.4 误差分类及避免误差的方法,1. 系统误差(可测误差) (1) 特点单向性a.对分析结果的影响比较恒定
5、;b.在同一条件下,重复测定, 重复出现;c.影响准确度,不影响精密度;d.可以消除。产生的原因?,(2) 产生的原因,a.方法误差选择的方法不够完善例: 重量分析中沉淀的溶解损失、共沉淀现象、灼烧时沉淀分解或挥发等;滴定分析中反应进行不完全、干扰离子影响、计量点和滴定终点不符合、副反应的发生等。这些因素系统地导致测定结果的偏低或偏高。b.仪器误差仪器本身的缺陷 例: 砝码重量、容量器皿刻度不准确、天平两臂不等;砝码、滴定管、容量瓶未校正。,c.试剂误差所用试剂有杂质例:去离子水不合格;试剂纯度不够(含待测组份或干扰离子)。d.操作误差操作人员主观因素造成例:对指示剂颜色辨别偏深或偏浅;滴定管
6、读数不准;灼烧沉淀时温度过高或过低等;,2. 偶然(随机)误差,(1) 特点 a.不恒定(时大时小时正时负)b.难以校正c.服从正态分布(统计规律)(2) 产生的原因 偶然因素:测量时环境的温度、湿度、气压的微小波动,仪器的微小变化,分析人员处理时的微小差别等 3. 过失误差 粗枝大叶、不按操作规程办事等造成的,完全可以避免的,4.误差的减免,(1) 系统误差的减免(1) 方法误差 采用标准方法,对比实验(2) 仪器误差 校正仪器(3) 试剂误差 作空白实验(2) 偶然误差的减免增加平行测定的次数,2.1.5随机误差分布服从正态分布无限多次测定,图2-2 标准正态分布曲线,y: 概率密度 x:
7、 测量值: 总体平均值 x-: 随机误差 : 总体标准差,随机误差分布的性质: 1.对称性 2.单峰性 3.有界性 4.抵偿性,特点: 1. 极大值在 x = 处. 2. 拐点在 x = 处. 3. 于x = 对称. 4. x 轴为渐近线.,表2-1 随机误差的区间概率,测定值或误差出现的概率称为置信度或置信水平,其意义可以理解为某一定范围的测定值(或误差)出现的概率,称为置信区间:真实值在指定概率下出现的区间,2.1.6有限测定中随机误差服从t分布,样本容量n: 样本所含的个体数.,有限次测定中随机误差服从t分布(类似于正态分布),图2-3 t 分布曲线,t分布曲线与正态分布相似,随自由度f
8、(f=n-1) 而变,当f20时二者接近,定义式,2-132-14,表 2-2 t 分布值表,由t的定义式可衍生得:在一定置信度下,对于有限次测量: ,n,s,真值(总体均值)将在测定平均值附近的一个区间(如下) 存在。,即:在一定的置信度下,真值(总体平均值)为,2-15,例3 测定SiO2的质量分数,得到下列数据(%):28.62, 28.59,28.51, 28.48,28.52,28.63。求平均值,标准偏差及置信度分别为90%和95%时 总体平均值的置信区间。,解:,=28.52%,s=0.06%,查表2-2,置信度为90%,n=6时,t=2.015, 因此,同理,对于置信度95%,
9、可得,2.1.7 公差,公差是生产部门对于分析结果允许误差的一种表示方法如果分析结果超出允许的公差范围称为超差,该项分析结果应该重做,.分析结果的数据处理,偏差较大数据的取舍,所测平均值与真值或标准值的差异是否合理,同种方法测的两组数据或不同方法对同一试样测得的两组数据间的差异是否在允许的范围内等。.可疑数据的取舍当个别测定值离群太远就要检查是否有操作错误,或过失误差,不能随意舍弃以提高精密度,而应该进行统计处理,.Grubbs法,步骤:将测定数据由小到大排列,其中最小值x1或最大值xn可疑,,如果x1可疑按照,2-16,计算。,如果xn可疑按照,2-17,表2-3 G(p,n)值表,例: 1
10、.25,1.27,1.31,1.40(P=95%)用格鲁布斯法判断时,1.40这个数值应保留否?,1.40这个数值应该保留,2. 值检验法,表2-4 Q值表,例 测定某溶液浓度(molL-1),得结果: 0.1014, 0.1012, 0.1016, 0.1025, 问: 0.1025是否应弃去?(置信度为90%),0.1025应该保留.,2.2.2 平均值与标准值的比较(检查方法的准确度),t 检验法,如果 表明被检验的方法存在系统误差,例 已知w(CaO)=30.43%, 测得结果为: n = 6, = 30.51%, s = 0.05%. 问此测定有无系统误差?(置信度95%),解,查t
11、 表, t0.05(5) = 2.57, t计 t表 此测定存在系统误差.,2.2.3 两个平均值的比较,1. F 检验精密度差异检验,2-20,如果F计算F表,说明两组值的精密度没有大的差别;再用t检验判断两组数据的平均值是否有显著性差异。反之,不能用此法判断。,判断两个平均值是否有显著性差异时, 首先要求这两个平均值的精密度没有大的差别。 然后再利用t检验法判断两个平均值是否有显著性差异。,表2-5 置信度95%时F值,第二步: t 检验比较 与,2-212-22,如果t计算t表(n1+n2-2),则两种不同的方法间存在显著性差异,例6 用两种方法测定w(Na2CO3),F计F表(3,4)
12、=6.59, 1 和2 无显著差异;,2. t 检验 (给定 = 0.05),两种方法不存在系统误差。,1. F 检验,解:,例 用两种不同方法测定合金中铌的质量分数,所得结果如下: 第一法 1.26 1.25 1.22 第二法 1.35 1.31 1.33 1.34 试问两种方法之间是否有显著性差异(置信度90)? 解:n1=3, =1.24 s1=0.021 n2=4 =1.33% s2=0.017% F=0.0212/0.0172=1.53F表(说明两组数据的标准偏差无显著性差异),判断一种新方法所得数据是否可靠: 1.可疑值取舍 2.方法可靠性检验(标准方法对照或加标回收) 3.用置信
13、区间表示测定结果,用重复性表示平行测定之间的允许差,系统误差a. 加减法R=mA+nB-pC ER=mEA+nEB-pECb. 乘除法R=mAnB/pC ER/R=EA/A+EB/B-EC/Cc. 指数运算R=mAn ER/R=nEA/Ad. 对数运算R=mlgA ER=0.434mEA/A,2-3 误差的传递,随机误差-用标准偏差表示a. 加减法R=mA+nB-pC sR2=m2sA2+n2sB2+p2sC2b. 乘除法R=mAnB/pC sR2/R2=sA2/A2+sB2/B2+sC2/C2c. 指数运算R=mAn sR/R=nsA/Ad. 对数运算R=mlgA sR=0.434msA/A
14、,极值误差最大可能误差R=A+B-C ER=|EA|+|EB|+|EC|RAB/C ER/R=|EA/A|+|EB/B|+|EC/C|,2.4 有效数字及其运算规则,有效数字:包括全部可靠数字及一位不确定数字在内,m 台秤(称至0.1g):12.8g(3), 0.5g(1), 1.0g(2)分析天平(称至0.1mg):12.8218g(6), 0.5024g(4), 0.0500g(3) V 滴定管(量至0.01mL):26.32mL(4), 3.97mL(3)容量瓶:100.0mL(4),250.0mL (4)移液管:25.00mL(4);量筒(量至1mL或0.1mL):26mL(2), 4
15、.0mL(2),1. 数字前的0不计,数字后的计入 : 0.02450(4位) 2. 数字后的0含义不清楚时, 最好用指数形式表示 : 1000 (1.0103 ,1.00103, 1.000 103 ) 3. 自然数可看成具有无限多位数(如倍数关系2、分数关系1/2);常数亦可看成具有无限多位数,如,几项规定,4. 数据的第一位数大于等于8 的, 可按多一位有效数字对待,如 9.45104, 95.2%, 8.6 5. 对数与指数的有效数字位数按尾数计,如 10-2.34 (2位); pH=11.02, 则H+=9.510-12 6. 误差只需保留12位有效数字; 7. 化学平衡计算中, 结
16、果一般为两位有效数字(由于K值一般为两位有效数字);8. 常量分析法一般为4 位有效数字(Er0.1%),微量分析为23位.,2 修约规则,四舍六入五成双,注意:一次修到所需要的位数,不能连续多次修约,例如, 要修约为四位有效数字时:尾数4时舍, 0.52664 - 0.5266尾数6时入, 0.36266 - 0.3627尾数5时, 若后面数为0, 舍5成双: 10.2350-10.24, 250.650-250.6若5后面还有不是0的任何数皆入: 18.0850001-18.09,3.运算规则加减法: 结果的绝对误差应不小于各项中绝对误差最大的数.(与小数点后位数最少的数一致)50.1 5
17、0.1 1.46 1.5+ 0.5812 + 0.6 52.1412 52.252.1,一般计算方法: 先计算,后修约.,结果的相对误差应与各因数中相对误差最大的数相适应. (即与有效数字位数最少的一致)例 0.012125.661.05780.328432,0.328,乘除法:,注意:在表示分析结果时,组分含量大于10%时用 四位有效数字,1%-10%用3位有效数字, 表示误差大小时有效数字取一位,最多两位。,报告结果: 与方法精度一致, 由误差 最大的一步确定.,如 称样0.0320g, 则w(NaCl) = 99%(3位);称样0. 3200g, 则w(NaCl) = 99.2%(4位)
18、;,光度法测w(Fe), 测量误差约5%, 则 w(Fe) = 0.064% (2位)要求称样准至3位有效数字即可.,合理安排操作程序,实验既准又快!,2-5一元线性回归分析 Abc 若直线能通过所有的实验点统计上认为A与c有密切的线性关系 一、一元线性回归方程 用(xi,yi)表示n个实验点(i=1,2,n) 任一条直线方程为:y*a + bx 则对每个数据点来说,测量值的误差为:yiy*yiabxi 总的误差平方和 回归直线是在所有直线中Q最小的一条直线 根据微积分求极值的原理:令,回归直线特点: (1)必定通过( )点 (2)对所有实验点来说,误差最小 (3)不一定通过所有的实验点,r物
19、理意义: (1)当r1时,所有的实验点都落在直线上,称x与y完全线性相关 (2)当r0时,则b0,回归直线平行x轴,称x与y毫无线性相关 (3) ,测量有误差, 越接近1,则x与y线性关系越好,第二章小结,一、误差的分类和表示(准确度:x、T、E、Er、di、dr、s、sr;精密度); 二、随机误差的分布: 规律、区间概率、 、p 三、有限数据的统计处理: 1.t、f,2. 平均值的置信区间: - u 、 s t 四、分析结果的数据处理 1.离群值的取舍:Grubbs 法、Q值检验法 2.显著性检验: t 检验法、(F检验+t 检验)法 五、有效数字: 位数确定、运算规则、修约规则.,作业,习题:2、4、6、8、10、12,