ImageVerifierCode 换一换
格式:PPT , 页数:52 ,大小:407KB ,
资源ID:4775849      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-4775849.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(分析化学中的数据处理.ppt)为本站会员(hskm5268)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

分析化学中的数据处理.ppt

1、单击此处编辑母版标题样式单击此处编辑母版副标题样式* 1l 研究对象的某种特性值的全体叫 总体 ;从总体中随机取出的一组数据叫 样本 ;样本所含测量值的数目叫 样本容量 。例如,对某矿石中 Fe的含量作了无限次测定,所得无限多个数据的集合就是总体,其中每个数据就是个体,从中随机取出一组数据(例如 8个数据)就是样本,样本容量为 8。2.1 几个概念 (P241)l 设样本容量为 n,则其平均值为l 当测量次数无限多时,所得平均值 即为总体平均值 :l l ( 2 1)l 若没有系统误差,则总体平均值 就是真实值l 在分析化学中,广泛采用标准偏差来衡量数据的分散程度l 总体标准偏差l 当测量次数

2、为无限多次时,各测量值对总体平均值 的偏离,用总体标准偏差 表示:l ( 2 2)l 样本标准偏差l 当测量值不多,总体平均值又不知道时,用样本的标准偏差 s来衡量该组数据的分散程度。l 当测量次数非常多时,测量次数 n与自由度( n-1)的区别就很小了,此时 l 即 l 同时 sl 平均值的标准偏差l 单次测定值的标准差 S反映的是单次测定值l 之间的离散性l 平均值的标准差反映的是若干组平行测定,各平均值 之间的离散性l 若对某试样作 若干批 测定, 每批又作 n个平行测定l 则 l ( 2 4)l 由此可见 :l 平均值的精密度比单次测定的精密度更好 , ;平均值的标准偏差与测定次数的平

3、方根成反比 . 增加测定次数,可使平均值的标准偏差减小。 l 作 关系图如 P244图 7 1所示。开始时, 随 减少 很快, n5变化较慢,而当 n10时,变化很小,进一步增加测定次数,徒劳无益,对提高分析结果可靠性,并无更多好处。实际中,一般的分析作 3 5次平行测定即可,而标样、物理常数、原子量的测定则次数较多l 随机误差是由一些偶然因素造成的误差,其大小、方向都不固定,难以预计,不能测量也无法消除。它的出现似乎很不规律,但实质上,它的出现和分布服从统计规律2.2随机误差的正态分布 (P245)l 它在概率统计中占有特别重要的地位,因为许多随机变量都服从或近似服从正态分布,分析测定中的随

4、机误差也是这样的, P246图 7 3即为正态分布曲线,它的数学表达式为:l l ( 2 5)l 式中 y为概率密度 x为测量值1正态分布(高斯 GAUSS分布)l为总体平均值 ,即无限次测定数据的平均值,相应于曲线最高点的横坐标值,在没有系统误差时,它即为真值 ,它反映无限个测量数据分布的集中趋势l-总体标准偏差 ,是 到曲线两拐点之一的距离, 它表征数据的分散程度, 小,数据集中,曲线瘦高; 大,数据分散,曲线矮胖。lX 表示随机误差 ,若以 X 为横坐标,则曲线最高点横坐标为 0,这时表示的即为随机误差的正态分布曲线l 由图可看到随机误差有以下规律性:1)偏差大小相等、符号相反的测定值出

5、现的概率大致相等2)偏差小的测定值比偏差较大的测定值出现的概率大,偏差很大的测定值出现的概率极小,趋近于 03)大多数测定值集中在 的附近,所以为最可信赖值或最佳值l 正态分布曲线随 、 值不同而不同,应用起来不方便,为此,采用变量转换的方法,将其化为同一分布 标准正态分布l 即 令 代入( 2 5)式得l 又l 所以l 即将式( 2 5)转化为只有变量 的方程l l ( 2 6)l 因此曲线的形状与 大小无关,即不同 曲线皆合为一条l 标准正态分布曲线见 P247图 7 4,它以 总体平均值为原点,以 为横坐标l 正态分布曲线与横坐标 - 到 之间所夹的面积代表全部数据出现概率的总和,显然应

6、当是 100,即为 1l P= l ( 2 7)l 随机误差 或 测量值在某一区间出现的概率 可取不同 值对式( 2 7)进行定积分,求得面积(即为概率),并制得标准正态分布概率积分表。由于积分上下限不同,表的形式有很多种,为了区别,在表上方一般绘图说明表中所列值是什么区间的概率, 表中列出的面积与图中阴影部分相对应( P248表 7 2) , 表示随机误差在此区间的概率, 若是求 区间的概率,利用正态分布的对称性,必须乘以 22随机误差的区间概率随机 误 差出 现的区 间 测 量 值 出 现的区 间 概率 P 20.3413 68.320.4773 95.520.4953 99.120.49

7、87 99.7l 从计算结果可知, 95以上的测量值都会落在范围内,随机误差 x-超过 的大误差 (或测量值 )出现的概率 0.3,一般化学分析是作几次测定,所以可以认为实际上是不可能出现的,如一旦出现,可认为其不是由于随机因素引起的,应弃去。l 例: P248 例 3、例 4对无限次测量而言,总体平均值 衡量数据的集中趋势,总体标准差 反映了数据的离散程度,但是,分析化学中常常只作有限次测定。下面将讨论如何通过有限次测定结果对 和 进行估计,从而合理地推断总体的特性 2.3少量数据的统计处理正态分布是无限次测量数据的分布规律,而实际测定只能是有限次,其分布规律不可能完全相同。 英国的统计学家

8、兼化学家戈塞特( W.S.GOSSET)提出了 t分布规律l l ( 2 8) (书 P249 公式 7 15有误 )l 平均值的标准偏差一有限次测量时的随机误差l总体平均值,无系统误差时就是真值, t分布曲线如图 2 2( P249图 7 6)所示,纵坐标仍为概率密度,横坐标为 t, t分布曲线与正态分布曲线相似,只是 t分布曲线随自由度 f( f= n-1)而改变,当 时, ,t分布曲线即正态分布曲线。l 与正态分布曲线一样, t分布曲线下面一定范围内的 面积 , 即 是该范围内测定值出现的 概率 ,但应注意,对于正态分布曲线,只要 值一定,相应的概率也就一定;但对于 t分布曲线,当 t一

9、定时,由于 f不同,相应曲线所包括的面积,即概率也就不同。为此引入置信度的概念, 置信度 P人们对所作判断的把握程度,其 实质为某事件出现的概率 ,在此表示某一 t值时,平均值落在( )区间内的概率。 落在此范围之外的概率为( 1 P)称为显著性水平,用 表示。 l 不同概率 P与 f值所对应的 t值,表示为 t,f 。如 t 0.05,10 代表置信度 95,自由度为 10时的 t值。 t值表见书 P250表 7 3,概率 P都是指双边值,即虽然表中所列的 t值均为正值,实际上每个 t值对应的概率 p是指直线 tt表 和 t t表 之间所夹曲线下的面积,例如:当 f 3, p 0.95时,

10、t0.05, 3 3.18,是指在自由度 f 3的那条 t分布曲线下,直线 t3.18与直线 t 3.18之间所夹的面积为 0.95。 l 理论上当时,各置信度对应的 t值才与u值一致,但实际当 f 20时, t与 u已很接近。 多次重复测定得到一系列测定值,在报告分析结果时,要反映出数据的集中趋势和分散性,一般采用下列三项值, 是总体 的最佳估计值,反映数据的集中趋势。 S是 的估计值,反映数据的离散程度。 测定次数 n用于求自由度f,反映数据的可靠程度二一般分析结果的统计表示法l 例 测某铁矿样中 Fe的含量,得: 37.45,37.30, 37.20, 37.50, 37.25,报告分析

11、结果l 解: 37.34ldi( i 1, 25 )分别为: +0.11 , -0.04 , 0.14 ,+0.16 , -0.09 (%) l 所以分析结果报告如下: 37.34 ,s 0.13, n 5l 注意 :l1) S结果保留几位,要根据 值而定,l 如 =0.9987,则 s可为 0.0015,也可写为0.002, 最多与可疑位( 7)相齐。l2) 如 无,则 s不带 ,如 20.36, s可写为 0.04,此时才用 “ ”l 在一定置信度上,根据 (样本)估计 (总体平均值)可能存在的区间 ,只有当 , ,显然做不到,少数测量得到的总带有一定的不确定性,所以只能在一定置信度上,根

12、据 对 可能存在的区间作出估计l 由 t分布 (2 8)式 l ( 2 9)l 这表示在一定置信度下,以平均值 为中心,包括总体平均值 范围,就叫平均值的置信区间( P251)。三平均值的置信区间( P251)l 例 1:已知 =35.21%, S=0.06%, n=4,求 P=0.95, 0.99时,平均值的置信区间l 解: P 0.95 , t0.05, 3 3.18l 理解为:在区间 中包括总体平均值 的把握(概率)有 95。lP 0.99 t0.01, 3 5.84 l 例 2: P251例 5l 置信度越高, t曲线下面积越大,置信区间就越大,即所估计的区间包括真值的可能性也就越大。 但 P 100,则意味着区间无限大,肯定会包括,这样的区间毫无意义;分析中通常将P定在 95或 90l (一)显著性检验l 在分析工作中常遇到这样的情况,某人对标样进行分析,得到的平均值( )与标准值( )不一致;或采用两种不同的分析方法分析同一试样,得到的两组测定数据的平均值l 不一致;或两个不同分析人员对同一试样进行分析时,两组数据的平均值 不一致。如这种差异是由随机误差引起,则是不可避免的(正常的),可以认为差异不显著;如这种差异是由系统误差引起,则认为它们之间存在 “显著性 ”差异l四 测定数据的评价

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报