1、课程名称:检验数据分析 课程编号:ZY125,编写区域:杭州区域 主编人员:蒋红专,目 录,第一章:定量分析中的数据处理 第一节 分析结果的数据处理 第二节 定量分析数据的评价 第三节 有效数字及其运算规则 第四节 X-R控制图的应用,第一节 分析结果的数据处理,一、平均偏差 二、标准偏差 三、平均值的标准偏差 四、置信度与置信区间,一、 平均偏差,平均偏差又称算术平均偏差,用来表示一组数据的精密度。平均偏差: 特点:简单; 缺点:大偏差得不到应有反映。,二、 标准偏差,标准偏差又称均方根偏差;标准偏差的计算分两种情况: 1当测定次数趋于无穷大时标准偏差 : 为无限多次测定 的平均值(总体平均
2、值) 即:当消除系统误差时,即为真值。 2有限测定次数标准偏差 :相对标准偏差 :(变异系数)CV% = S / X,例题,用标准偏差比用平均偏差更科学更准确。 例: 两组数据 (1) X-X: 0.11, -0.73, 0.24, 0.51, -0.14, 0.00, 0.30, -0.21, n=8 d1=0.28 S1=0.38 (2) X-X:0.18,0.26,-0.25,-0.37,0.32 , -0.28, 0.31, -0.27n=8 d2=0.28 S2 =0.30 d1=d2, S1 S2,三、 平均值的标准偏差,m个n次平行测定的平均值:由统计学可得:由s s n 作图:
3、 由关系曲线,当n 大于5时, s s 变化不大,实际测定5次即可。 以 X s的形式表示分析结果更合理。,例题,例:水垢中 Fe2O3 的百分含量测定数据为 (测 6次) :79.58%,79.45%,79.47%,79.50%,79.62%,79.38%X = 79.50% s = 0.09% s= s/ n = 0.04%则真值所处的范围为(无系统误差) :79.50% + 0.04%数据的可信程度多大?如何确定?,四、置信度与置信区间,偶然误差的正态分布曲线:,置信度与置信区间,对于有限次测定,平均值 与总体平均值 关系为 :s.有限次测定的标准偏差; n.测定次数。 表1-1 t 值
4、表 ( t. 某一置信度下的几率系数),讨论: 1. 置信度不变时:n 增加, t 变小,置信区间变小; 2. n不变时:置信度增加,t 变大,置信区间变大;置信度真值在置信区间出现的几率 ;置信区间以平均值为中心,真值出现的范围;,第二节 定量分析数据的评价,一、可疑数据的取舍1Q 检验法2. 格鲁布斯(Grubbs)检验法 二、分析方法准确性的检验1. t 检验法法2. 检验法,定量分析数据的评价,解决两类问题: (1) 可疑数据的取舍 过失误差的判断方法:Q检验法;4d法。确定某个数据是否可用。 (2) 分析方法的准确性 系统误差的判断显著性检验:利用统计学的方法,检验被处理的问题 是否
5、存在 统计上的显著性差异。方法:t 检验法和F 检验法;确定某种方法是否可用,判断实验室测定结果准确 性。,1 Q 检验法步骤: (1) 数据从小到大排列 X1 X2 Xn(2) 求极差 Xmax Xmin(3) 求可疑数据与相邻数据之差 X?-X式中X?-可疑值X-与X?相邻之值(4) 计算:Q值= X?-X /( Xmax Xmin),一、可疑数据的取舍 过失误差的判断,(5) 根据测定次数和要求的置信度,(如90%)查表:,表1-2 不同置信度下,舍弃可疑数据的Q值表测定次数 Q90 Q95 Q99 3 0.94 0.98 0.994 0.76 0.85 0.938 0.47 0.54
6、0.63 (6)将Q与QX (如 Q90 )相比,若Q QX 舍弃该数据,若Q QX 保留该数据, 当数据较少时 舍去一个后,应补加一个数据。,2 4d法,4d法即4倍于平均偏差法,适用于4-6个平行数据的取舍。 基本步骤: (1)除了可疑值外,将其余数据相加求算术平均值X及平均偏差d (2)将可疑值与平均值X相减,若可疑值-X4d,则可疑值应舍去;若可疑值-X4d,则可疑值应保留 例:测得如下一组数据,30.18,30.56,30.23,30.35,30.32其中最大值是否舍去? 解:30.56为最大值,定为可疑值。 则 X=(30.18+30.23+30.35+30.32)/4=30.27
7、d=(0.09+0.04+0.08+0.05)/4=0.065 因 30.56-30.27=0.290.29 4d 故 30.56值应舍去。,当选用新的化验方法进行定量测定时,必须事先考察该方法是否存在系统误差。只有确认其法没有系统误差或者系统误差能被校正才能采用,才可信任用该法得到的数据。通常采用下列两种方法对化验方法可靠性进行检验。1. t 检验法t检验法又称标准物质法。将包含有被测组分和试样的基体相似的标准物质(样品),用测定试样所选用的分析方法进行n次测定,计算出标准物质(样品)中所含被测组分的算术平均值及标准偏差,然后将此算术平均值与标准物质所给出的该组分的含量比较。 步骤:a.计算
8、t值b. 查t值表 据自由度(f)=n-1,置信度P,查表,以t表表示之c.比较t计算与t表值若 t计算 t表,则x与 有显著差异,该法不能直接采用。,二、分析方法准确性的检验-系统误差的判断,2.F检验法 F检验法是将同一欲测试样用标准方法(或可靠的经典的分析方法)和 所选用的新分析方法,分别进行多次测定。 标准方法测得的为平均值x1,标准偏差s1及测定次数n1。 所选用的新方法测得的为平均值x2,标准偏差s2及测定次数n2。先用F检验法检验两法测定值或两组数值间的精密度有无显著性差异。如精密度无显著性差异,则再继续用t检验法检验x1 与x2也无显著性差异,则说明新分析方法可以采用,两组数值
9、相近。 步骤:a.计算F值式中S大、S小为S1与S2比较而得,S值较大的作为S大,与S大相应的那组数据的(n-1) 定为f大, S值较小的作为S小,与S小相应的那组数据的(n-1)定为f小。b.依据f大与f小,从F表查F值,得到F表值c.比较F计算和F表。若F计算F表,则两组测定值S1与S2差异不显著,可继续进行t检验;反之,则S1与S2差异显著,说明新的方法不能直接采用,不必往下检验。d .继续t检验的具体步骤:(1)计算t值,,(2)依据f=n1+n2-2与置信度P,查t值表,得到t表 (3)若t计算t表,即X1与X2无显著差异,一、有效数字 二、有效数字运算规则,第三节 有效数字及其运算
10、规则,一、 有效数字,1.有效数字的使用有效数字是指实际上能测量到的数字,通常包括全部准确数字和一位不确定的可以数字。有效数字保留的位数与测量方法和仪器的准确度有关。使用有效数字,应注意以下几点。 (1)记录测量所得数据时,应当、也只允许保留一位可以数字,即不允许增加位数,与不应减少位数。例如,化验中称量质量和测量体积,获得如下数字,其意义是有所不同的。12.5000g,是六位有效数字,这不仅表明试样的质量为12.5000g,还表示称量误差在0.0001g,是用分析天平称量的。如将其质量记录成12.50g,则表示该试样是在台称上称量的,其称量误差为 0.01g。(2)有效数字的位数还反映了测量
11、的相对误差。如称量某试剂的质量为0.5180 g,标示该试剂质量是(0.5180 0.0001 )g,其相对误差为:RE%= (0.0001)*100%/0.5180 0.02%,(3)有效数字位数与量的使用单位无关。如称得某物的质量是12 g,两位有效数字。 若以mg为单位时,应记为1.2*104 mg,而不应该记为12000 mg。 (4)数据中的“0”要作具体分析。数字中间的“0”,如2005中“00”都是有效数字。数字前边的“0”,如0.012kg,其中“0.0”都不是有效数字,它们只起定位作用。数字后边的“0”,尤其是小数点后的“0”,如2.50中“0”是有效数字,即2.50是三位有
12、效数字。 (5)计算有效数字的的位数时,若第一位数字等于或大于8时,其有效数字应多算一位。 (6)简单的计数、分数倍数,属于准确数或自然数,其有效位数是无限的 (7)分析化学中常遇到的pH,pK等,其有效数字的位数仅取决于小数部分的位数,其整数部分只说明原数值的方次。 2.有效数字的修约四舍六入五成双,即当尾数4时,舍去;尾数6时,进位;当尾数为5时,则应试保留的末尾数是奇数还是偶数,5前为偶数应将5舍去, 5前为奇数则将5进位。,二、有效数字运算规则,1.加减运算加减运算时,应以参加运算的各数据中绝对误差最大(即小数点后位数最少)的数据为标准,决定结果(和或差)的有效位数。 例:12.35+
13、0.0056+7.8903=? 解:绝对误差最大的是12.35。应以它为依据先修约,再计算。12.35+0.01+7.89=20.25 为稳妥起见,也可在修约时多保留一位,算完后再修约一次。12.35+0.006+7.890=20.24620.25,2.乘除运算 乘除运算中,应以参加运算的各数据中相对误差最大(即有效数字位数最少)的数据为标准,决定结果(积或商)的有效位数。中间算式中可多保留一位。遇到首位数为8或9时,可多算一位有效数字。 例1:求0.0121*25.64*1.05782=? 解:各数的相对误差分别为:0.0121数的相对误差=1/121*100%25.64数的相对误差=1/2
14、564*100%1.05782数的相对误差=1/105782*100% 即0.0121数的相对误差最大,有效数字位数最少,应以它为标准先进行修约,再计算:0.0121*25.6*1.06=0.328 或先多保留一位有效数字,算完后再修约一次。0.0121*25.64*1.058=0.3282,修约为0.328 例2:酸价检测,称油样4.522克,用0.01025mol/LKOH标液滴定时,消耗标液5.25毫升,直接代入计算公式如下:酸价(mgKOH/g)=5.25*0.01025*56.11/4.522=0.668 0.67 如以5.25为标准先进行修约,再计算: 酸价(mgKOH/g)=5.
15、25*0.0102*56.1/4.52=0.665 0.66,第四节 X-R控制图的应用,1.X-R控制图 对于计量数据而言,这是最常用最基本的控制图。它用于控制对象为长度、重量、强度、纯度、时间、收率和生产量等计量值的场合。X控制图主要用于观察正态分布的均值的变化,R控制图用于观察正态分布的分散或变异情况的变化,而X-R控制图将两者联合运用,用于观察正态分布的变化。,2.举例分析,选取我司某家面粉供应商近阶段吸水率进货检验数据,分析厂家面粉生产的过程能力。 数据如下:,以X-R控制图为例,分析厂家的过程能力。,步骤1:取预备数据,然后将数据合理分成25个子组,见上表 步骤2:计算各组样本的平
16、均数Xi 步骤3:计算各组样本的极差Ri 步骤4:计算样本总均值X与平均样本极差RXi=1538.1 R=22.5X=61.5256 R=0.9 步骤5:计算R图的参数当子组大小n=5,D4=2.114,D3=0,代入R图的公式,得到:UCLR=D4R=2.114*0.9=1.9026CLR=R=0.9LCLR=D3R=-,画R图:,见R图判稳。故接着再建立X图。由于n=5,查表知A2=0.577,再将X=61.5256 R=0.9代入X图:UCLX=X+A2R=61.5256+0.577*0.9=62.0449CLX=X=61.5256LCLX=X-A2R=61.5256-0.577*0.9
17、=61.0063,画X图:,此时过程的变异度与均值均处于稳态。,步骤6:与规范进行比较对于给定的质量规范TL=60.0,TU=66.0,利用R和X计算Cp=R/d2=0.9/2.326=0.38693Cp=(TU-TL)/6=(66.0-60.0)/(6*0.39)=2.5641由于X=61.5256与容差中心M=63.0不重合,所以需要计算Cpk K=(M-)/(T/2)=2(63-61.5256)/(66.0-60.0) =0.4914670.49 Cpk=(1-k)*Cp=(1-0.491467)*2.5641=1.30393 结论:无偏移情况的Cp表示过程加工的一致性,即“质量能力”,Cp越大,则质量能力越强;有偏移情况的Cpk反映过程中心与公差中心M的偏移情况,Cpk越大,则两者偏离越小,是过程的“质量能力”与“管理能力”两者综合的结果。故Cp与Cpk两者的着重点不同,需要同时加以考虑。,联合应用Cp与Cpk所代表的合格品率,查上表,我们可以得出此家面粉厂的统计过程状态满足设计的、工艺的和顾客的要求。,步骤7:以上步骤1-步骤6为分析用控制图,延长统计过程状态下的X-R 图的控制限,进入控制用控制图阶段,实现对面粉厂生产过程的日常控制,从而稳定我司制造的软水添加量,生产出更好口感的面饼。,THE END!,