1、莱州市 XX机械有限公司作业文件文件编号:JT/C 7.6J004 版号:A/0(MSA)计数型测量系统研究分析作业指导书批准: 吕春刚 审核: 尹宝永 编制: 邹国臣 受控状态: 分发号: 2006 年 11 月 15 日发布 2006 年 11 月 15 日实施计数型测量系统研究分析作业指导书 JT/C7.6J004 1 目的为了配备并使用与要求的测量能力相一致的测量仪器,通过适当的统计技术,对计数型测量系统进行分析研究,使测量结果的不确定度已知,为准确评定产品提高质量保证。2 适用范围适用于公司使用的计数型测量仪器的测量系统的分析研究。3 职责3.1 检验科负责确定过程所需要的计数型测量
2、仪器,并定期校准和检定,对使用的测量系统进行研究分析,对存在的异常情况及时采取纠正预防措施。3.2 工会负责根据需要组织和安排计数型测量系统分析所需应用技术的培训。3.3 生产科配合对测量仪器进行测量系统分析。4 计数型测量系统简介计数型测量系统是一种测量数值为一有限的分类数量的测量系统,它与能获得一连串数值结果的计量型测量系统截然不同。通/止规(go/no go gage)是最常用的量具,它只有两种可能的结果;其它的计数型测量系统,目标 如目视标准,可能产生五到七个分类,如非常好、好、一般、差、非常差。所以,针对计量性测量系统所描述的分析方法不能用于评价这样的系统。当使用任何测量系统进行决策
3、时,都存在一定程度的风险。这些方法不能量化测量系统变异性,只有当顾客同意的情况下才能使用。选择和应用于这些技术应以基于一个良好的统计实践,了解影响产品和测量过程变差源,以及错误决定最终顾客的影响。计数型测量系统的变差来源,应该通过利用了人为因素和人机工程学的研究结果使之最小化。5 研究分析方法5.1 某生产过程处于统计受控状态,其性能指数为 Pp=PpK=0.5,这是不可接受的。由于过程正在生产不合格的产品,于是被要求采取遏制 LSL USL 措施,以便从生产过程中挑出不可接受的产品。见图 1:与测量系统有关的“灰色”区域JT/C7.6J004 LSL USL0.40 0.50 0.60图 1
4、 过程范例5.2 具体的遏制行动是,过程小组采用了一个计数型量具,来对每一个零件与一个指定的限定值进行比较。如果零件满足限定值就可接受该零件,不满足的零件则拒收(如通/止量具) 。许多这样的计数型量具基于一套基准零件来设定接收与拒收。不象计量型量具,计数型量具不能显示一个零件有多好或多么坏,它只能指示该零件可接受或拒收(即 2 个分级。通或不通) 。1)小组使用了一个%GRR 为公差的 25%的特定量具。由于这还没有被小组文件化,于是需要对这测量系统进行研究。小组已决定从过程中随机地选取 50 个零件,以获得涵盖了整个过程范围的零件。2)使用三名评价人,每位评价人对每个零件评价三次。3)设定
5、1 表示可接受的决定; 0 为不可接受的决定。表 1 中所示的参考决定和计量参考值在一开始还没有确定。表 1 还显示了“代码”列,还分别用“”、 “+”、 “”代表零件是否在第 I 区、II 区、及 III区。见表 1JT/C7.6J004 表 1计数型研究数据表零 件 A-1 A-2 A-3 B-1 B-2 B-3 C-1 C-2 C-3 参 考 参 考 值 代 码1 1 1 1 1 1 1 1 1 1 1 0.476 901 +2 1 1 1 1 1 1 1 1 1 1 0.509015 +3 0 0 0 0 0 0 0 0 0 0 0.576459 4 0 0 0 0 0 0 0 0 0
6、 0 0.566152 5 0 0 0 0 0 0 0 0 0 0 0.57036 6 1 1 0 1 1 0 1 0 0 1 0.544 951 x7 1 1 1 1 1 1 1 1 1 1 0.465454 x8 1 1 1 1 1 1 1 1 1 1 0.502295 +9 0 0 0 0 0 0 0 0 0 0 0.437817 10 1 1 1 1 1 1 1 1 1 1 0.515573 +11 1 1 1 1 1 1 1 1 1 1 0.488905 +12 0 0 0 0 0 0 0 0 0 0 0.559918 x13 1 1 1 1 1 1 1 1 1 1 0.542704
7、 +14 1 1 0 1 1 1 1 0 0 1 0.454518 x15 1 1 1 1 1 1 1 1 1 1 0.517377 +16 1 1 1 1 1 1 1 1 1 1 0.531939 +17 1 1 1 1 1 1 1 1 1 1 0.519694 +18 1 1 1 1 1 1 1 1 1 1 0.484167 +19 1 1 1 1 1 1 1 1 1 1 0.520496 +20 1 1 1 1 1 1 1 1 1 1 0.477236 +21 1 1 0 1 0 1 0 1 0 1 0.452310 x22 0 0 1 0 1 0 1 0 1 0 0.545604 x2
8、3 1 1 1 1 1 1 1 1 1 1 0.529065 +24 1 1 1 1 1 1 1 1 1 1 0.514192 +25 0 0 0 0 0 0 0 0 0 0 0.599581 26 0 1 0 0 0 0 0 0 1 0 0.547204 x27 1 1 1 1 1 1 1 1 1 1 0.502436 +28 1 1 1 1 1 1 1 1 1 1 0.521642 +29 1 1 1 1 1 1 1 1 1 1 0.523754 +30 0 0 0 0 0 1 0 0 0 0 0.561457 x31 1 1 1 1 1 1 1 1 1 1 0.503091 +32 1
9、1 1 1 1 1 1 1 1 1 0.505850 +33 1 1 1 1 1 1 1 1 1 1 0.487613 +34 0 0 1 0 0 1 0 1 1 0 0.449696 x35 1 1 1 1 1 1 1 1 1 1 0.498698 +36 1 1 0 1 1 1 1 0 1 1 0.543077 x37 0 0 0 0 0 0 0 0 0 0 0.409238 38 1 1 1 1 1 1 1 1 1 1 0.488184 +39 0 0 0 0 0 0 0 0 0 0 0.427687 40 1 1 1 1 1 1 1 1 1 1 0.50113241 1 1 1 1 1
10、 1 1 1 1 1 0.51377942 0 0 0 0 0 0 0 0 0 0 0.5665754331 0 1 1 1 1 1 1 0 1 0.462410 x44 1 1 1 1 1 1 1 1 1 1 0.470832 +45 0 0 0 0 0 0 0 0 0 0 0.412453 46 1 1 1 1 1 1 1 1 1 1 0.493441 +47 1 1 1 1 1 1 1 1 1 1 0.486379 +48 0 0 0 0 0 0 0 0 0 0 0.587893 49 1 1 1 1 1 1 1 1 1 1 0.483803 +50 0 0 0 0 0 0 0 0 0
11、0 0.446697 JT/C7.6J004 5.3 假设试验分析交叉表法范例 由于小组不知道零件的参考判断值,他们开展了了交叉表格(cross-tabuiations)来比较每个评价人与其它人之间的结果。A B 交 叉 表B.00 1.00 总计4415.7634.35050.0A .00 计算期望的计算1.00 计算期望的计算331.39768.7100100.0总计 计算期望的计算4747.0103103.0150150.0B C 交 叉 表C.00 1.00 总计4216.0531.04747.0B .00 计算期望的计算1.00 计算期望的计算935.09468.0103103.0总
12、计 计算期望的计算5151.09999.0150150.0A C 交 叉 表C.00 1.00 总计4317.0733.05050.0A .00 计算期望的计算1.00 计算期望的计算834.09266.0100100.0总计 计算期望的计算5151.09999.0150150.0 这些表格的目的在与确定评价人之间一致性的程度。为确定评价人一致性的程度,小组使用了(cohen 科恩的) kappa,这是用来衡量两个评价人对同一物体进行评价时,其评定结论的一致性。Kappa 为 1 时,表示有完全的一致性。为 0 时,表示一致性不比可能性来的好。Kappa 仅用于表格,表中两个变数有相同的分类值
13、,且两个变数具有相同的分类数量。 Kappa 一种对 评价人内部一致性 的测量。它测量在诊断区(获得相同评定的零件)中的数量与那些具与可能性期望的数量是否有差别。JT/C7.6J004 设 Po = 对角栏框中,观测比例的总和Pe = 对角栏框中,期望部分的总和则 Kappa =(Po - Pe)/(1 - Pe) Kappa 是一种程度而不是检验。通过使用一种渐进和标准误差以形成一个 t 统计值来判断其大小。通用的比例法则是 Kappa 值大于 0.75,则表示很好的一致性(最大的 Kappa 值1 ) ;Kappa 值小于 0.4 则表示一致性不好。Kappa 不考虑评价人间的不一致量有多
14、大,只考虑他们之间是不是一致。 通过以上对评价人计算了 Kappa 程度,小组得到以下结论:Kappa A B CA .86 .78B .86 .79C .78 .79 这分析表明所有评价人与其它评价人之间有良好的一致性。这种分析用来确定评价人之间是否有差异的需求。但不能告诉我们这测量系统从坏零件中挑出好零件的能力。在本分析范例中,小组使用一计量型测量系统来评价零件,并应用其结果来确定其参考决定。 使用新的信息建立了另一组交叉表,以便将每个评价人与参考决定进行比较。A 与基准判断交叉表基准.00 1.00 总计4516.0534.05050.0A .00 计算期望的计算1.00 计算期望的计算
15、332.09768.0100100.0总计 计算期望的计算4848.0102102.0150150.0JT/C7.6J004 B 与基准判断交叉表基准.00 1.00总计4515.0232.04747.0B .00 计算期望的计算1.00 计算期望的计算333.010070.0103103.0总计 计算期望的计算4848.0102101.0150150.0C 与基准判断交叉表基准.00 1.00总计4216.3934.75151.0A .00 计算期望的计算1.00 计算期望的计算631.79367.39999.0总计 计算期望的计算4848.0102102.0150150.0 小组也计算了
16、Kappa 值以确定每个评价人与参考决定之间的一致性。A B CKappa .88 .92 .77以上这些数据可被解释为每个评价人与标准之间有很好的一致性。然后,过程小组计算了这测量系统的有效性。有效性 =作出正确判断的次数 / 总决定次数JT/C7.6J004 评价人%评价人 A 评价人 B 评价人 C结果与归因的比较评价人 A 评价人 B 评价人 C50 50 50 50 50 5042 45 40 42 45 400 0 00 0 08 5 1093% 97% 90% 93% 97% 90%84% 90% 80% 84% 90% 80%71% 78% 66% 71% 78% 66%系统有
17、效结果 系统有效结果与参考的比较50 5039 3989% 69%78% 78%64% 64%注:1)在所有的测量中,评价人本身是一致的。2)评价人对所有测量与已知的标准一致。3)所有评价人本身与其它人之间是一致的。4)所有评价人本身与其它人之间一致,并与参考值一致。5)UCL 和 LCI 分别为置信区间边界的上限和下限。来源总受检数符合的错误的拒收(由于评价人偏移造成的拒收)错误的接受(由于评价人偏移造成的接受)不相配95%上限计算得分95%下限检查总数一致的结果95UCI计算所得的结果95LCI错误的拒收错误的接受 每对评价人间多次试验的的假设可用零假设来表示:Ho:两个评价人一致的有效性
18、。 经计算,由于每位评价人结果的计算值均落在其它人的置信度区间内,小组决定不能拒绝零假设。这结论进一步证实了 Kappa 测量得到的结论。JT/C7.6J004 为进一步分析,小组的一名成员得出下列数据表格,为每个评价人的结果提供指南:决定测量系统有效性 错误率(漏发警报的比例)错误警报率(误发警报的比例)评价人可接受 90% 2% 5%评价人可接受的边缘可能需改进 80% 5% 10%评价人不可接受需改进 5% 10%对他们所已得到的所有信息进行汇总,小组得出以下结论:有效性 错误率(漏发警报的比例)错误警报率(误发警报的比例)A 84% 6.3% 4.9%B 90% 6.3% 2.0%C
19、80% 12.5% 8.8%这些结果显示,各个评价人对于该测量系统,在有效性、错误率与错误警报率上都有不同程度的结果;在所有三个项目中,没有一位评价者是以被接受的。是否需要为这过程更改其接收标准?这些风险可以被接受吗?评价者是否要更好的培训?测量的环境可不可以被改善?重要的是:顾客对着测量系统与其研究结果会有什么看法?顾客原本预期的情况是什么?顾客是否接受这些风险。 关注点:1) 关于可接受的风险,并没有以理论为基础的决策准则。以上指南是探索性的。并且是基于怎样才是“接受”的个别“信念”下所发展的。最终的决定准则应该取决于对后续过程和最终顾客的影响(如风险) 。这是一个客观事物的决定而不是统计
20、上的决定。2) 上述分析是以数据为依据的。例如,如果过程能力指数为Pp=Ppk=1.00, 那么所有的结论都可能是正确的,因为不会有零 JT/C7.6J004 件落在测量系统的 II 区( “灰色”区域)中。图 3 Pp=Ppk=1.00 的过程范例在这新情况下,可以得出这样的结论:所有的评价人都是可被接受的,因为将不会有决定的误差。 通常对于交叉的结果的实际意义有一误解。以 B 的 结果为例:B 参考交叉表基准.00 1.00总计4593.8220.4731.3B .00 数量在参考值内的1.00 数量在参考值内的36.3.010098.010368.7总计 数量在参考值内的48100.01
21、02100.0150100.0由于检验的目的在于找出所有的不合格零件,许多人视左上角处一个测量找到坏零件的有效性。这个百分比表示将已经是坏的零件判定坏的零件的可能性:Pr(称为坏零件 一个坏零件)假设过程已经被改进到 Pp=Ppk=1.00,生产者关心的的概率是:Pr(零件是坏的 被称为怀的)JT/C7.6J004 从上面的数据中确定以上结果,必须应用贝叶斯 Baye 的理论。Pr(不合格 判不合格)= Pr(不合格 判不合格)= Pr(不合格 判不合格)= .11也就是说,以上这些结果指出,如果某零件被判定为坏的,实际上它只有十分之一的可能是坏的。 这种分析不必使用计量型数据信息,即是参考决定值已被确定,且为可获得时,也不需要安排这些相关的资料。Pr( 判 不 合 格 判 不 合 格 ) * Pr( 不 合 格 )Pr( 判 不 合 格 判 不 合 格 ) + Pr( 判 不 合 格 判 不 合 格 ) * Pr( 不 合格 ).938 * (.0027).938 * (.0027)+.020 * (.9973)