收藏 分享(赏)

离群值的判断和处理20141230.pdf

上传人:精品资料 文档编号:8277777 上传时间:2019-06-18 格式:PDF 页数:27 大小:3.80MB
下载 相关 举报
离群值的判断和处理20141230.pdf_第1页
第1页 / 共27页
离群值的判断和处理20141230.pdf_第2页
第2页 / 共27页
离群值的判断和处理20141230.pdf_第3页
第3页 / 共27页
离群值的判断和处理20141230.pdf_第4页
第4页 / 共27页
离群值的判断和处理20141230.pdf_第5页
第5页 / 共27页
点击查看更多>>
资源描述

1、1离群值的判断和处理上海市临床检验中心张健主要内容 离群值判断和处理的相关国家标准 离群值的定义 离群值的判断 离群值的处理GB/T 4883 作者:于振凡2离群值判断和处理的相关国家标准 GBT 4883-2008 数据的统计处理和解释正态样本离群值的判断和处理 GBT 6380-2008 数据的统计处理和解释 型极值分布样本离群值的判断和处理 GBT 8056-2008 数据的统计处理和解释 指数分布样本离群值的判断和处理3离群值的定义离群值 outlier 样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。注:离群值按显著性的程度分为歧离值和统计离群值。统计离

2、群值 statistical outlier 在检出水平下统计检验为显著的离群值4GBT4833检出水平与剔除水平检出水平: detection level 为检出离群值而指定的统计检验的显著性水平 注:除非根据本标准达成协议的各方另有约定,检出水平应为0.05剔除水平: deletion level 为检出离群值是否高度离群而指定的统计检验的显著性水平 注:除非根据本标准达成协议的各方另有约定,检出水平应为0.01GB/T 4883 5离群值的来源与判定按产生原因可分为两类: 总体固有变异的极端表现 由试验条件和方法的偶然偏离产生离群值判定的方法: 根据技术上或物理上的理由直接判定 应用统计

3、方法判定 GBT48336离群值的三种情形 GBT4833在下面三种情况下判断离群值 上侧情形:根据实际情况和以往经验,离群值都是高端值 下侧情形:根据实际情况和以往经验,离群值都是低端值 双侧情形:根据实际情况和以往经验,离群值可以是高端值,也可以是低端值7单个和多个离群值 检出离群值个数的上限 :应规定检出离群值的个数,当超过这个限制时,对样本应做慎重处理。 单个离群值情形:1.依据实际或经验,确定事宜的离群值检验方法2.确定显著水平3.确定检验临界值4.计算相应统计量值,与临界值比较做出判断 多个离群值情形:离群值大于 1的情况,重复单个离群值方法,当超出上限时,检验停止。8离群值处理

4、处理方式: 保留离群值并用于后续数据处理 在找到实际原因时修正离群值,否则予以保留 剔除离群值不追加观测值 剔除离群值并追加新的观测值或用适宜的插补值代替9处理规则 对检出的离群值,应尽可能寻找技术或物理的原因,根据问题性质,权衡寻找和判定产生离群值的原因所需代价、正确判定离群值的得益及错误剔除正常观测值的风险,以确定实施下述三个规则之一: 若技术或物理上找出离群值原因,则应剔除或修正,若找不到原因则不得剔除或修正 若技术或物理上找出离群值原因,则应剔除或修正;否则,保留歧离值,剔除或修正统计离群值;重复检验获得多个离群值,都要进行检验是否为统计离群值,并与前面的离群值一起剔除或修正 检出的离

5、群值都应剔除或修正10备案 被删除或修正的观测值及其理由应予记录,以备查询。11判断规则和检验方法已知标准差情形离群值的判断规则未知标准差情形离群值的判断规则A. 限定检出离群值个数不超过 1B. 限定检出离群值个数大于 112已知标准差情形离群值的判断规则一般原则:使用奈尔( Nair)检验法, 3N100离群值的判断规则上侧情形下侧情形双侧情形13已知标准差情形离群值的判断规则1415注:样本均值、样本标准差和 Grubbs统计量的保留位数至少要比原始数据多一位;即原始数据的修约间隔为 10n、 10-n时,样本均值、样本标准差和 Grubbs统计量的修约间隔为 10n+1、 10-n-1

6、。( n为正整数和零)。比原始数据多几位,要在相关的文件中作出明确规定。16未知标准差情形离群值的判断规则 离群值个数不超过 1时 一般原则:选择格拉布斯法和狄克逊方法 格拉布斯( Grubbs)检验法 上侧情形 下侧情形 双侧情形 狄克逊( Dixon)检验法 单侧情形 双侧情形17GB/T 4883 作者:于振凡1819202122未知标准差情形离群值的判断规则 离群值个数大于 1时 一般原则:选择格偏度峰度检验法或狄克逊方法 偏度峰度检验法 单侧情形偏度检验法 双则情形峰度检验法 狄克逊( Dixon)检验法23242526对检验方法的选择一、限定检出离群值的个数不超过 1时A、 n30,正态概率纸上线性好,使用偏度 -峰度检验法C、 n30,正态概率纸上线性不好,使用 Grubbs检验法二、限定检出离群值的个数可以超过 1时A、 n30,正态概率纸上线性好,使用偏度 -峰度检验法C、 n30,正态概率纸上线性不好,使用 Grubbs检验法27

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报