1、1,测量系统分析 Measurement System Analysis,2,课程内容 为什么要实施MSA? 什么是MSA? 如何实施MSA? 如何分析MSA?培训目标: 了解MSA5性分析,及应用5性分析确保量测系 统能满足测试过程中的要求.,3,第一章 测量系统基础 第二章 测量系统统计特性 第三章 测量系统变异性影响 第四章 测量系统分析,4,哪個製程較好呢?,5,第一章 测量系统基础,6,7.6.1测量系统分析 为分析在各种测量和试验设备系统测量结果存在的变差,应进行适当统计研究。 此要求必须适用于在控制计划中提出的测量系统。 所用的分析方法及接收准则,应符合与顾客关于测量系统分析的参
2、考手册的要求.。 如果得到顾客批准,也可采用其它分析方法和接收准则。 PPAP手册中规定: 对新的或进的量具测量和试验设备应参考MSA手册进行变差研究 APQP手册中规定:, MSA分析计划及分析报告为的输出之一.,0.MSA分析的对象,TS-16949 标准7.6 监视和测量设备的控制,7,1.测量系统分析的目的,确定所使用的数据是否可靠:测量系统分析还可以: 评估新的测量仪器 将两种不同的测量方法进行比较 对可能存在问题的测量方法进行评估 确定并解决测量系统误差问题,8,测量定义为赋值(或数)给具体事物以表示它们之间 关于特定性的关系。这个定义由美国标准局(NBS) cccEisenhar
3、t1963)首次提出。赋值过程定义为测量过ccc程,而赋予的值定义为测量值。量具:任何用来获得测量结果的装置,经常用来特指用在车间的装置;包括通过/不通过装置。测量系统:是用来对被测特性定量测量或定性评价的仪器或量具、标准、操作、方法、夹具、软件、人员、环境和假设的集合;用来获得测量结果的整个过程。,2.术语,9,3.量测过程,:标准 :零件 :仪器 :人/程序 :环境,S WI P E,量测,数 值,分析,输入,输出,可接受 可能可接受 需改善,量 测 系 统,如果测量的方式不对,那么好的结果可能被测为坏的结果,坏的结果也可能被测为好的结果,此时便不能得到真正的产品或过程特性。,10,4.测
4、量数据的质量,数据质量最通用的统计特性:准确度 ( Accuracy ) X或称偏移(BIAS): 量测实际值与工件真值间之差异,是指数据相对基准(标准)值的位置。精密度 ( Precision ) 或称变差(Variation): 利用同一量具,重复量测相同工件同一质量特性,所得数据 之变异性。是指数据的分布。,位置(Location ),宽度 (Width ),数据的质量:取决于从处于稳定条件下进行操作的测量系统中,多次测量的统计特性.,11,4.1低质量数据的原因和影响,低质量数据的普遍原因之一是变差太大 一组数据中的变差多是由于测量系统及其环境的相互作用造成的。 如果相互作用产生的变差
5、过大,那么数据的质量会太低,从而造成测量数据无法利用。如:具有较大变差的测量系统可能不适合用于分析制造过程,因为测量系统的变差可能掩盖制造过程的变差。,12,5.测量过程,为了有效地控制任何过程变差,需要了解:过程应该做什么?什么能导致错误?过程在做什么?规范和工程要求规定过程应该做什么。? 过程失效模式及后果分析(PFMEA)是用来确定与潜在过程失效相关的风险,并在这些失效出现前提出纠正措施。PFMEA的结果转移至控制计划。 通过评价过程结果或参数,可以获得过程正在做什么的知识。这种活动,通常称为检验, 确定或否认过程是以稳定的方式操作并符合顾客规定的目标。这种检查行为本身就是过程。,13,
6、1)足够的分辨率和灵敏度。 2)是统计受控制的。 3)产品控制,变异性小于公差。 4)过程控制: 显示有效的分辨率. 变异性小于制造过程变差.,6.测量系统的统计特性,14,6.1测量仪器-分辨率,分辨率(分辨力、可读性、分辨率): 别名:最小的读数的单位、测量分辨率、刻度限度或探测度 为测量仪器能够读取的最小测量单位。,测量分辨率描述了测量仪器分辨两个部件的测量值之 间的差异的能力,由设计决定的固有特性 测量或仪器输出的最小刻度单位 总是以测量单位报告 1:10经验法则,15,6.1测量系统的有效分辨率,1.要求不低于过程变差或允许偏差(tolerance)的十分之一. 2.零件之间的差异必
7、须大于最小测量刻度;极差控制图可显示分辨率是否足够看控制限内有多少个数据分级不同数据分级(ndc)的计算为:ndc=(零件的标准偏差/ 总的量具偏差)* 1.41. 一般要求它大于4才可接受,16,6.2敏感度(Sensitivity),敏感度是指能产生一个可检测到(有用的)输出信 号的最小输入。 它是测量系统对被测特性变化的回应。 敏感度由量具设计(分辨力)、固有质量(OEM)、使用中保养,以及仪器操作条件和标准来确定。 它通常被表示为一测量单位。,17,第二章 测量系统统计特性,18,数据变差的来源,仪器(量具),工作件(零件),扩大,量测系统变异,变异性,敏感性,接触几何,变形效应,一致
8、性,单一性,重复性,再现性,使用假设,稳健设计,偏移,线性,稳定性,校准,预防性维护,维护,创建公差,发展的变异,发展,设计变异 夹持 位置 测量站 测量探测器,相互关连 的特性,清洁,适合的 数据,工作的 定义,弹性变形,质量,弹性特性,支撑特性,隐藏的几何,可追溯性,校准,热扩散系数,弹性特性,人员/程序,环境,教育,身体的,限制,程序,目视标准,工作规定,工作态度,经验,培训,经验,培训,理解,技能,人因工程,照明,压力,振动,空气污染,几何的兼容性,阳光,人工光阳,光阳,温度,人员,空气流程,热的系统,平等化 系统构成要素,周期,标准与环境 的关系,标 准,19,测量系统的统计特性,B
9、ias偏倚(Bias) Repeatability重复性(precision精度) Reproducibility再现性 Linearity线性 Stability稳定性,20,偏倚:是测量结果的观测平均值与基准值的差值。 真值的取得可以通过采用 更高等级的测量设备进行多次测量,取其平均值。,1.偏倚(Bias),21,仪器需要校准 仪器、设备或夹紧装置的磨损 磨损或损坏的基准,基准出现误差 校准不当或调整基准的使用不当 仪器质量差设计或一致性不好 线性误差 应用错误的量具,不同的测量方法设置、安装、夹紧、技术 测量错误的特性 量具或零件的变形 环境温度、湿度、振动、清洁的影响 违背假定、在应
10、用常量上出错 应用零件尺寸、位置、操作者技能、疲劳、观察错误,1.1造成过份偏倚的可能原因,22,重复性,指由同一个操作人员用同一种量具经多次测量同一个零件的同一特性时获得的测量值变差 (四同),2.重复性(Repeatability),23,零件(样品)内部:形状、位置、表面加工、锥度、样品一致性。 仪器内部:修理、磨损、设备或夹紧装置故障,质量差或维护不当。 基准内部:质量、级别、磨损 方法内部:在设置、技术、零位调整、夹持、夹紧、点密度的变差 评价人内部:技术、职位、缺乏经验、操作技能或培训、感觉、疲劳。,环境内部:温度、湿度、振动、亮度、清洁度的短期起伏变化。 违背假定:稳定、正确操作
11、 仪器设计或方法缺乏稳健性,一致性不好 应用错误的量具 量具或零件变形,硬度不足 应用:零件尺寸、位置、操作者技能、疲劳、观察误差(易读性、视差),2.重复性不好的可能原因,24,由不同操作人员,采用相同的测量仪器,测量同一零件的同一特性时测量平均值的变差 (三同一异),3.再现性(Reproducibility),25,零件(样品)之间:使用同样的仪器、同样的操作者和方法时,当测量零件的类型为A,B,C时的均值差。 仪器之间:同样的零件、操作者、和环境,使用仪器A,B,C等的均值差 标准之间:测量过程中不同的设定标准的平均影响 方法之间:改变点密度,手动与自动系统相比,零点调整、夹持或夹紧方
12、法等导致的均值差,3.1再现性不好的可能潜在原因,26,评价人(操作者)之间:评价人A,B,C等的训练、技术、技能和经验不同导致的均值差。对于产品及过程资格以及一台手动测量仪器,推蕮进行此研究。 环境之间:在第1,2,3等时间段内测量,由环境循环引起的均值差。这是对较高自动化系统在产品和过程资格中最常见的研究。 违背研究中的假定 仪器设计或方法缺乏稳健性 操作者训练效果 应用零件尺寸、位置、观察误差(易读性、视差),3.1再现性不好的可能潜在原因,27,基准值,較小的偏倚,基準值,較大的偏倚,量測平均值 (低量程),量測平均值 (高量程),基準值,量測值,無偏倚,偏倚,線性(變化的線性偏倚),
13、在量具正常工作量程内的偏倚变化量 多个独立的偏倚误差在量具工作量程内的关系 是测量系统的系统误差构成,4.线性(Linearity),28,仪器需要校准,需减少校准时间间隔; 仪器、设备或夹紧装置磨损; 缺乏维护通风、动力、液压、腐蚀、清洁; 基准磨损或已损坏; 校准不当或调整基准使用不当; 仪器质量差;设计或一致性不好; 仪器设计或方法缺乏稳定 性; 应用了错误的量具; 不同的测量方法设置、安装、夹紧、技术; 量具或零件随零件尺寸变化、变形; 环境影响温度、湿度、震动、清洁度; 其它零件尺寸、位置、操作者技能、疲劳、读错。,4.1线性误差的可能原因,29,稳定性,时间1,时间2,是测量系统在
14、某持续时间内测量同一基准或零件的单一特性时获得的测量值总变差。,5.稳定性(Stability),30,仪器需要校准,需要减少校准时间间隔 仪器、设备或夹紧装置的磨损 正常老化或退化 缺乏维护通风、动力、液压、过滤器、腐蚀、锈蚀、清洁 磨损或损坏的基准,基准出现误差 校准不当或调整基准的使用不当 仪器质量差设计或一致性不好 仪器设计或方法缺乏稳健性 不同的测量方法装置、安装、夹紧、技术 量具或零件变形 环境变化温度、湿度、振动、清洁度 违背假定、在应用常量上出错 应用零件尺寸、位置、操作者技能、疲劳、观察错误,5.1不稳定的可能原因,31,理想的测量系统在每次使用时,应只产生“正确”的测量结果
15、。 每次测量结果总应该与一个标准值相符。 一个能产生理想测量结果的测量系统,应具有零变差、零偏倚和所测的任何产品错误分类为零概率的统计特性。,6.理想的测量系统,32,足够的分辨率和灵敏度。为了测量的目的,相对于过程变差或规范控制限,测量的增量应该很小。通常所有的十进制或10/1法则,表明仪器的分辨率应把公差(过程变差)分为十份或更多。这个规则是选择量具期望的实际最低起点。 测量系统应该是统计受控制的。这意味着在可重复条件下,测量系统的变差只能是由于普通原因而不是特殊原因造成。这可称为统计稳定性且最好由图形法评价。,7.测量系统应有的特性,33,对产品控制,测量系统的变异性与公差相比必须小于依
16、据特性的公差评价测量系统。 对于过程控制,测量系统的变异性应该显示有效的分辨率并与过程变差相比要小。根据6变差和或来自MSA研究的总变差评价测量系统。,偏倚、重复性、再现性、线性可接受,7.测量系统应有的特性,34,第三章 测量系统变异性影响,35,长期,过程变差,短期,抽样产生的变差,实际过程变差,稳定性,线性,重复性,准确度,量具变差,操作员造成的变差,测量误差,过程变差观测值,再现性,过程变差,1.测量系统变异性的影响,“重复性” 和 “再现性” 是测量误差的主要来源,36,1.1测量系统变异性的影响,测量零件后:1)确定零件是否可接受(在公差内)或不可接受 (在公差外)。2)零件进行规
17、定的分类 产品控制原理:测量零件进行分类活动。 过程控制原理:零件变差是由过程中的普通原因还是特殊原因造成的。,37,2.对产品决策的影响, I型错误:生产者风险误发警报好零件有时会被判为“坏”的, II型错误: 消费者风险或漏发警报 坏零件有时会被判为“好”的,I型错误:,II型错误,38,Bad is bad,2.对产品决策的影响,错误决定的潜在因素:测量系统误差与公差交叉时,产品状况判定:目标是最大限度地做出正确决定有二种选择:改进生产区域:减少过程变差,没有零件产生在II区。改进测量系统:减少测量系统误差从而减小II区域的面积, 这样就可以最小限度地降低做出错误决定的风险。,39,3.
18、对过程决策的影响,对过程决策的影响如下: 1)普通原因报告为特殊原因2)特殊原因报告为普通原因测量系统变异性可能影响过程的稳定性、目标以及变差的决定。,40,4.新过程的接受,新过程:如机加工、制造、冲压、材料处理、热新 过程的接受处理,或采购总成时,作为采购活动的一部分,经常要完成一系列步骤。 供应商处对设备的研究以及随后在顾客处对设备的研究。 如果生产用量具不具备资格却被使用。如果不知道是仪器问题,而在寻找制程问题,就会白费努力了。,41,第四章 测量系统分析,42,MSA分析方法的分类,重 复 性 分 析,再 现 性 分 析,线 性 分 析,稳 定 性 分 析,偏 倚 分 析,位 置 分
19、 析,变 异 分 析,稳 定 性 分 析,信 号 分 析,风 险 分 析,小 样 法,大 样 法,偏 移 分 析,稳 定 性 分 析,变 异 分 析,计量型,计数型,破坏型,MSA,极差法 均值极差法(包括控制图法) ANOVE法(方差分析法),43,1.稳定性分析之执行:,1) 获取一样本并确定其相对于可追溯标准的基准值。 2)定期(天、周)测量标准样本35次,样本容量和 频率应该基于对测量系统的了解。 3)将数据按时间顺序画在X&R或X&S控制图上结果分析-作图法 4)建立控制限并用标准化控制图分析评价失控或不 稳定状态。结果分析-数据法,44,1.稳定性分析之执行:,产品特性/控制计划中
20、所提及的过程特性,针对样本使用更高精密度等级的仪器进行精密测量十次,加以平均,做为参考值。,计算每一组的平均值/R值。 计算出平均值的平均值/R的平均值。,1.计算控制界限:A)平均值图:Xbarbar+-A2Rbar, XbarbarB)R值图:D4Rbar, Rbar, D3Rbar 2.划出控制界限,将点子绘上 3.先检查R图,以判定重复性是否稳定。 4.再看Xbar图,以判定偏移是否稳定。 5.若控制图稳定,可以利用Xbarbar-标准值,进行偏差检 定,看是否有偏差。 6. 若控制图稳定,利用Rbar/d2来了解仪器的重复性。,45,1.稳定性分析之执行:,1.后续持续点图、判图 2
21、.异常的判定 a)R图失控,表明不稳定的重复性,可能什么东西松动、阻塞、变化等。 b)X-BAR失控,表明测量系统不再正确测量,可能磨损,可能需重新校准。,46,2.偏倚BIAS分析之执行:,47,X1=0.75mm X6=0.8mm X2=0.75mm X7=0.75mm X3=0.8mm X8=0.75mm X4=0.8mm X9=0.75mm X5=0.65 mm X10=0.7mm,同一操作者对同一工件测量10次,如果参考标准是 0.80mm. 过程变差为0.70mm,= 0.75,Bias = 0.75-0.8= -0.05,% Bias=1000.05/0.70=7.1%,表明 7
22、.1% 的过程变差是偏倚 BIAS,2.偏倚BIAS 实例1:,48,2.偏倚也可以与过程的容差相比较判断准确度的简单标准为. 小于过程变差或容差的 1%, 可认为是精确的. 大于过程变差或容差的 1% 则需要研究和调整测量系统, 或者临时用补偿值来修正以后的测量值 3.偏倚的研究还可以通过作图的方式来进行, 即作出直方图, 然后根据经验判断是否可以接受. 4.偏倚的研究还可以通过计算置信区间来判断是否可以接受,2.偏倚BIAS 实例:,49,2.偏倚BIAS 实例:作图分析,50, 3.线性(Linearity)比较良好的情况,在测量范围全领域基准值和测量平均值一致/没有偏倚正确地测量.,在
23、测量范围全领域具有常数倍数的偏倚. / 虽有偏倚但是因为大小一定所以可以容易调整.,基准值,基准值,测 量 平 均,偏 倚,偏 倚,测 量 平 均,基准值,基准值,51,线性(Linearity)的分析, 线性不好的情况 测量范围全领域偏倚(正确度)不一定的情况 无法矫正.,偏 倚,基准值,偏 倚,基准值,52, 线性(Linearity)和偏倚(Bias)判定基准, 线性(Linearity)差时需要考虑的事项:,调查量具测量范围中上部或下部的刻度是否合适 检验基准值是否正确 检验测量位置是否正确 检验测量者是否正确的使用了仪器 检验量具磨损与否 检验量具校准与否 调查量具本身内部设计问题,
24、 电子式的话在测量全范围进行再校准. 机械式的话在测量范围中以经常使用的范围为中心进行校准后不允许在其他范围使用.,53, 利用Minitab分析线性,测量系统的操作范围内抽样5个部品进行精密的测试之后计算,要反复12次,54, 实行结果, 结果解释, Minitab使用方法(Stat Quality Tools Gage Linearity Study),StdDev Study Var %Study Var Source (SD) (5.15*SD) (%SV) Total Gage R&R 0.23894 1.2305 8.67 Repeatability 0.23894 1.2305
25、8.67 Part-to-Part 2.74576 14.1407 99.62 Total Variation 2.75613 14.1941 100.00,Linearity是总製程变異量的13.167%,因此线性是比较差,需要改善. Bias是0.4%,良好.,55, 计算Gage Linearity统计值,Bias(y) = 0.7367 - 0.13167 Master Linearity = 0.13167 * 14.1941 = 1.86889%Linearity = 倾斜度 *100 = 13.167%, 计算Gage Bias统计值,平均 Bias = -0.2667 / 5
26、=-0.05333 %Bias = ( |-0.05334| / 14.1941 ) * 100 = 0.4%, 线性的计算方法,56, Linearity = | 倾斜度 | x Process Variation, %Linearity =,在量具的测量范围内评价测量的一贯性,在量具的测量范围内如果Bias一定的话可以说线性较好. 为了评价线性必须要计算Bias.,* Process Variation = 6,= | 倾斜度 | x 100,%Linearity值如果接近0的话可以判定线性比较好., 回归模型 : y = a + bx,y : Bias x : 基准值 b : 倾斜度,
27、线性的计算公式,57,平均范围 = = (2+1+1+2+1)/5 = 7/5 = 1.4量具误差 = 5.15 * /d =5.15 / 1.19 * = 4.33 * = 4.33 * 1.4 = 6.1% Gage R&R = 量具误差Gage Error / 允差Tolerance = 6.1 / 20 * 100 % = 30.5%,4.快速GR&R(极差法/短期模式),d常数表,允差Tolerance = 20,= 最大值-最小值,58,5.计量型数据的 均值-极差法,1.选择三个测量人(A, B,C)和10个测量样品。测量人应有代表性,代表常从事此项测量工作的QC人员或生产线人员
28、10个样品应在过程中随机抽取,可代表整个过程的变差,否则会严重影响研究结果。 2.校准量具 3.测量,让三个测量人对10个样品的某项特性进行测试,每个样品每人测量三次,将数据填入表中。试验时遵循以下原则:盲测原则1:对10个样品编号,每个人测完第一轮后,由其他人对这10个样品进行随机的重新编号后再测,避免主观偏向。盲测原则2:三个人之间都互相不知道其他人的测量结果。 4.计算:,59,示范:MSA搜集数据的规划,60,搜集GRR的数据,示范:量测系统分析 计量,61,示范:量具再现性及再生性数据表,x,R,R,R,x,62,公式:%AV = 100 AV/TV%AV = 10.79% n =
29、零件数r = 量测次数,再现性作业者变异(AV) 公式:AV =n = 10 r = 2AV = 0.0304,公式:%EV = 100 EV/TV%EV = 12.59%,重复性设备变异(EV) 公式:EV =R* K1EV =0.0355,制程变异,量 测 单 元 分 析,量测次数,K1,2 3,0.8862 0.5908,作业者人数,2,3,K2,0.7071,0.5231,示范:量具重复性及再现性报告,63,全变异(TV)公式:TV =TV= 0.2839,公式:%PV=100PV/TVPV =98.62%公式:ndc=1.41PV/GRR ndc=8.3978,零件变异(PV)公式:
30、PV=Rp*K3PV= 0.2800,公式:%R&R=100GRR/TV%R&R = 16.58%,重复性&再现性(GRR)公式:GRR=GRR= 0.04668,制程变异,量 测 单 元 分 析,0.7071 0.5231 0.4467 0.4030 0.3742 0.3534 0.3375 0.3249 0.3146,2 3 4 5 6 7 8 9 10,K3,零件数,示范:量具重复性及再现性报告,64,3.对每个样品由三个人所测得的9个测试值求平均值,,4.总平均值的均值Xp 与极差的Ra,2.计算A测的所有样品的总平均值 3.总平均值的均值Xa与极差的Ra,1.计算A对每个样品三次测试
31、结果的均值/极差,,65,*AV计算中,如根号下出现负值,AV取值0,66,5.Gage R&R 判断原则,1.数值10%,表示该量具系统可接受。,2.10% 数值 30%,表示该量具系统可接受或不接受,决定于该量具系统之重要性、修理所需之费用等因素。,3.数值 30%,表示该量具系统不能接受,须予以改进。,判断原则,67,短期与长期方法的比较,短期模式 用生产设备 用生产操作员 快速 - 只需几个样品(5) 无反复(replicates) 估计总的变差(Total Gage R&R) 不能区分 AV 和EV 不能指导改进的方向 可用于破坏性测试,长期模式 用生产设备 用生产操作员 较多样品
32、(5) 要求反复 Replicates (3) 估计总的变差 (Total Gage R&R) 可以区分 AV 和EV 为测量系统的改进提供指导,68,NO-GO,GO,6.量测系统分析计数值:,69,Go-No Go 数据模式人为因素主导,情况复杂对于以“是”和“不是”为计数基础的定性数据,其 GR&R考察的概念是与定量数据一样的。但方法上完全不同. 定性数据测量系统的能力取决于操作员判断的有效性,即将“合格”判断成合格,将“不合格”判断成不合格的程度.,量测系统分析计数值:,70,有效性 Effectiveness(E) - 即判断“合格”与“不合格”的准确性E= 实际判断正确的次数/可能
33、判断正确的机会次数.2.漏判的几率 Probability of miss(P-miss) 将“不合格” 判为合格的机会;P(miss)=实际漏判的次数 / 漏判的总机会数.3.误判的几率 Probability of false alarm(P-FA) - 将“合格”判为不合格的机会.P(false alarm)=实际误判次数 / 误判的总机会数. 4.偏倚 Bias(B) - 指漏判或误判的偏向.B=P(false alarm) / P(miss)B=1, 无偏倚; B1, 偏向误判; B1, 偏向漏判,以下为判断所用的指标,71,量测系统分析(计数值)示范:,外观检验量测分析,两个人,1
34、5个样本,重复两次,数据如下,72,表示此量测系统是可靠的,示范:量测系统分析计数,Appraiser # Inspected # Matched Percent (%) 95.0% CI 小宝 15 15 100.0 ( 81.9, 100.0)志明 15 14 93.3 ( 68.1, 99.8) # Matched: Appraiser agrees with him/herself across trials.,73,属性数据测量系统分析 Attribute MSA,74,Kappa属性测量系统,属性/顺序测量系统使用了接受/拒绝标准或分级,例如, 用(1-5) 确定是否达到可以接受的
35、质量水平 Kappa技术可以用来评估这些属性和顺序测量系统,75,你真的拥有太多的属性数据吗?,很多检验过程能够收集连续数据,但选择属性数据以简化检验员的任务 例如,很多功能测验将连续地评估一项产品(温度、承载力,硬度等等)并以通过/失败记录其结果 设法获取连续数据,76,属性和顺序测量,属性和顺序测量经常依靠主观分类或分级 例子包括: 把部件特征分级为好或坏 在品尝之后分级葡萄酒的香味和口感 从1到5给雇员的表现分级 给体操打分 在利用这些测量系统之前,我们应该评估它们吗? 不评估它们的后果是什么呢?,77,测量系统分析 属性数据,什么方法适于评估属性测量系统? 属性系统 同等处理所有误分类
36、的Kappa技术 顺序系统 考虑误分类等级的Kappa技术 例如,如果我们从1到5判断一油漆产品的等级,检验员A把它评为1级,检验员B评为5级,比起检验员A把它评为4级而检验员B评为5级来,具有更大的误分类,78,数据类型,常态: 包含不具有排序基础或可以分别出量的差别的数字,例如 例子: 一公司中: A部门、B部门、 C部门一车间中: 机器1、机器2、机器3运输的类型: 船、火车、飞机顺序: 包含可以分等级的数字。但是不能根据该标度推断出数字之间差别。例子:产品性能: 优秀、很好、好、一般、差品尝试验: 味淡、辣、很辣、辣得难受客户调查: 强烈满意、满意、不满意、强烈不满意,79,Kappa
37、技术,Kappa适用于非定量系统,如 好或坏 通过/不通过 区分声音 (嘶嘶声、叮当声、重击声) 區分色彩亮度 通过/失败,80,Kappa技术,适用于属性数据的Kappa 同等处理所有误分类 要求单元之间相互独立,并且檢驗员或分级员是独立作出分级的 要求评估类别是相互排斥的,81,操作定义(检查标准),存在着一些质量特点,或者难以定义或者定义很耗费时间 要一致地评估分类,几个单元必须由一个以上的评估人或判定人作出分类 如果评估员之间达成足够的一致,那么就有可能,尽管不能保证,分级是正确的 如果评估员不能达成足够的一致,那么分级的可用性就很有限了,差劲的属性测量系统几乎总是可以归咎于 差劲的操
38、作定义,82, 留意事项 樣品应选定代表Process的樣品。 任意选定25个樣品时,以下能成为向导。把平时检查的作业者选定为作业者的选定对象,并成为Blind Appraisal.,计数型 Gage R&R,83,属性测量系统中的和风险,风险/生产者风险合格产品被拒绝 不必要的报废/返工的原因 被人为削减的过程性能 风险/消费者风险 接受了不合格产品 不满意的客户 夸大的过程性能,84,结果?,哪些是重要的应关心的问题? 如果检验员之间和内部不能达成很好的一致,会有什么风险呢? 次品正在流向下一步操作或客户吗? 优质品正在被返工或处理掉吗? 评估的标准是什么?如何度量一致性?,85,什么是
39、Kappa?,P observed判定员一致同意的单元的比率=判定员一致判定为优良的比率+判定员一致判定为次劣的比率 P chance 预期偶然达成一致的比率=(判定员A判定为优良的比率*判定员B判定为优良的比率)+(判定员A判定为次劣的比率*判定员B判定为次劣的比率)注意: 上述等式适用于两类分析,即优良或次劣,86,Kappa,要达成完全一致, P observed = 1 且 K=1 一般说来,如果Kappa值低于0.7,那么测量系统是不适当的 如果Kappa值为0.9或更高,那么测量系统是优秀的 Kappa的下限为0到 -1 如果 P observed = P chance 那么 K=
40、0 因而Kappa值为 0表示达成一致和随机偶然预期达成的一致是一样的,87,Kappa量测能力评价指标,上面的判断基准根据Project的目标有可能变更。 举个例,不良率0.1%0.001% 改善课题的情况下检出率必须为 100%. 满足指数40% 60% 改善课题时,如果检出率是70%以上就可以被选择。 基本上,达不到100%时,必须调查其原因。,计数型 Gage R&R,88,属性测量系统指导,在选择研究的部件时,要考虑以下几方面因素: 如果你只有两个类别,优良和次劣,你至少应该选择20个优良品和20个次劣品 最多可选择 50个优良品和50个次劣品 尽量保持大约50%的优良品和50%的次
41、劣品 选择不同程度的优良和次劣,89,属性测量系统指导,如果你的类别超过2种,其中一类是优良,其它类别是不同的缺陷方式,那么你至少应该选择大约50%的优良品和每種缺陷方式中的最少为10%的产品 你可以把一些缺陷方式合并称为“其它” 这些类别应该互相排斥,否则它们应该合并起来,90,分级员内部/重复性考虑,让每个分级员至少两次判定同一单元 为每个分级员建立独立的Kappa表,计算他们的Kappa值 如果某个分级员的Kappa测量值很小,那么该分级员自己没有很好地重复判定 如果分级员自己没有很好地重复判定,那么他也不能和其它分级员很好的做重复判定,这将掩盖其它分级员内部重复判定的好坏 根据每个分级
42、员的首次判定建立一个Kappa表,计算不同分级员之间的Kappa值 不同分级员之间的Kappa值将进行两两对比 (A和 B, B和C, A和C),91,Kappa 例子#1,Bill Blackbelt正在努力改进一个具有高退货率的油漆过程 在工程早期,由于很明显的检验员之间和检验员内部的差别,所以测量系统就是一个关注的问题 下一页的数据是在测量系统研究中收集的。 需要计算每个操作员的Kappa和操作员之间的 Kappa,92,考虑下列数据,93,分级员A的 交叉表,在每个单元格中填入收集到的信息,94,交叉表,第一格代表分级员A在第一次 和第二次测量中判定为优良的 次数,95,交叉表,第二格
43、代表分级员A在第一次测量中判定一个单元为次劣,在第二次测量中判定为优良的次数,96,交叉表,第三格代表分级员A在第一次测量中判定一个单元为优良,在第二次测量中判定为次劣的次数,97,交叉表,第四格代表分级员A在第一次测量和第二次测量中判定一个单元为次劣的次数,98,交叉表,边格的数字代表行和列的总和,99,交叉表-比例,分级员A比例,下表代表上表的数据,其中每个单元格用总数的百分比来表示,代表10/20,100,交叉表-比例,由行和列的总和计算而得,101,对Kappa的定义将有所不同,取决于我们是在定义分级员内部Kappa,还是在定义分级员之间的Kappa,记得怎样计算Kappa吗?,Pob
44、served 判定员一致同意的单元的比率=判定员A/B一致判定为优良的比率+判定员A/B一致判定为次劣的比率Pchance 预期偶然达成一致的比率=(判定员A判定为优良的比率*判定员B判定为优良的比率)+(判定员A判定为次劣的比率*判定员B判定为次劣的比率),102,Pobserved 等于上表对角线上概率的总和:P observed =(0.500 + 0.350) = 0.850Pchance 等于每个分类概率乘积的总和:Pchance =(0.600*0.55) + (0.400*045) = 0.51那么 Krater A=(0.85 - 0.51)/(1 - 0.51)=0.693,
45、计算分级员A的Kappa,103,K Rater B =,数字,比例,计算分级员B的Kappa,104, 利用Minitab的 二元分类 系数型 Gage R&R的 Study,Ex) 为了分析以Go/No-Go Gage判定合格/不合格的系数型测试系统 选了15 EA 样品 (合格品 8个,不合格品7个)之后由3名测试人员反复测了3次后得到了如下的Data.,105,Attribute Gage R&R Study Attribute Gage R&R Study for Measurem Within Appraiser Assessment Agreement Appraiser # I
46、nspected # Matched Percent (%) 95.0% CI A 15 14 93.3 ( 68.1, 99.8) B 15 13 86.7 ( 59.5, 98.3) C 15 13 86.7 ( 59.5, 98.3) # Matched: Appraiser agrees with him/herself across trials., 测量一致性 评价,-评价每个测试人员反复测试出的值之间的测量一致性,* 各测试人员的反复测量的结果的一致性的比率,100,106,Each Appraiser vs Standard Assessment AgreementApprai
47、ser # Inspected # Matched Percent (%) 95.0% CI A 15 14 93.3 ( 68.1, 99.8) B 15 12 80.0 ( 51.9, 95.7) C 15 12 80.0 ( 51.9, 95.7)# Matched: Appraisers assessment across trials agrees with standard. Assessment Disagreement Appraiser # NG/G Percent (%) # G/NG Percent (%) # Mixed Percent (%) A 0 0.0 0 0.0 1 6.7 B 1 6.7 0 0.0 2 13.3 C 0 0.0 1 6.7 2 13.3 # NG/G: Assessments across trials = NG / standard = G. # G/NG: Assessments across trials = G / standard = NG. # Mixed: Assessments across trials are not identical.,