收藏 分享(赏)

六西格玛基本统计.ppt

上传人:天天快乐 文档编号:1387676 上传时间:2018-07-09 格式:PPT 页数:87 大小:2.70MB
下载 相关 举报
六西格玛基本统计.ppt_第1页
第1页 / 共87页
六西格玛基本统计.ppt_第2页
第2页 / 共87页
六西格玛基本统计.ppt_第3页
第3页 / 共87页
六西格玛基本统计.ppt_第4页
第4页 / 共87页
六西格玛基本统计.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、六西格玛内训课件基础统计,基础统计理论,目录,统计目的,数据分类,统计概述,基本图表,六西格玛度量的种类,第一部分统计目的,你看到了什么?,你需要整个图片!,数据的重要性,数据是来自观察的,由一个过程所搜集得来的数据可让我们描绘过程,了解过程,改善过程甚至控制过程.,Data,数据驱动决策和行动,数据对六西格玛很重要,使用统计学来解决真实的问题,真实的解决方案,统计学解决方案,统计学问题,真实的问题,把问题转换为数字 (Y)定义 Y 的规格(可接受范围),理解(xi) 与流程输出(Y)的关系Y = f(x1, x2, x3.)影响流程表现的关键因子是什么?,找到因子(xi)的水平和操作窗口,

2、保证输出 (Y) 是在可接受范围内,控制输入 (xi) 避免输出/缺陷,统计思想,所有作业是相互关联的工序的系统,例) 线路板作业过程,原料投入,贴插装,清洗喷胶,所有工序中都存在散布,可避免原因,不可避免原因,同样原料,同样生产工艺,同样作业者,同样方法,发生散布,统计思想是 遵守以下四种根本原则的学习,思考和实践的一种哲学。,调查散布和减少散布的活动,减少工序散布的活动,减少产品质量散布,顾客满足,费用降低,考虑判断失误的错误,注意从样本数据的结果判断时发生错误,统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是思考的过程。统计思想不是统计知识或工具,更不是软件的具体操作,

3、而是学会用统计思维看待和分析问题,避免只看到表面层次的现象就去下结论作决策。,统计思想,举例:去年公司的顾客满意率为80%,今年调查了100位顾客,有85位顾客表示满意,满意率达到85%。能否说今年的顾客满意率比去年提高了5%?,当重复测量时,经常产生不同的结果,这就是偏差,偏差的类型: 通常原因的偏差: 测量中的差异是被期望的并可以预测的 特殊原因的偏差(随机): 测量中的差异是不可预测的,偏差,我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真实性.,偏差的存在使我们的工作更有挑战性我们通常不相信来源于单个数据的结果,通常收集多个

4、数据并注意收集的方法以减少偏差,结论:偏差是自然存在的,被期望的并是统计的基础,偏差,统计领域用下列方法处理偏差,描述型统计-用图表或总结性的数字(中心值,方差,标准偏差)来描述一系列数据的特征. 统计推论-当结果的差异可能因为随机偏差或不能归属为随机偏差时所作的决定。(置信区间和假设检验) 试验设计(DOE)-收集并分析数据,以估计过程并改变效果.,统计领域中偏差的处理,过程偏差,确定过程是否稳定 如果过程不稳定,鉴别并消除不稳定的要因 确定过程的平均值的位置 - 它在目标线上吗?如果不在,确定影响平均值的变量,并决定最优的设置以达到目标值 估计总散布的幅度 - 与顾客的要求(规格限)比起来

5、,是可接受的吗? 如果不是, 确定散布源,而后消除或减少他们对过程的影响。,第二部分数据分类,数据的种类,不间断的总是可以以更小的单位来测量经常与测量系统一起出现,不可以以更小的单位来测量只能选择几个有限的数值,连续型的,离散型的,举例时间, 重量, 金额, 长度,举例二元的: 男/女, 好/坏, Yes/no分类的: 周一-周日, 地点 (Paris, London, Beijing, .)计数: 一张发票上的错误数目, 一个月内发生意外的次数,连续型数据,益处 :1.能够为使用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率3. 能够预估发展趋势和情况,缺点 :1.通常较难得到数据2.

6、分析更为复杂,离散型数据,益处 :容易得到数据,并且计算方法简单2. 数据容易理解3. 数据随时可得,缺点 :1.无法显示缺陷怎样发生及过程如何变化2.不适合低缺陷率(需要大量的抽样)3.不能预测发展趋势和情况,数据类型比较,练习: 这是什么种类的数据 ?,申请贷款所需要的时间每张发票上的错误数目每张发票上的缺陷百分比一天内销售酒的数量导线的长度办公室的地点申请贷款所需要的时间 (天)销售人员一天内拜访的客户数量赢得招标的百分比销售人员的销售额销售人员的名字,第三部分统计概述,总体 想要测量对象的全部参数 用总体的所有数据计算出的数值(如均值, 标准差), 称为总体的参数,x,参数总体平均值总

7、体标准差,总体,统计学基本术语,统计学基本术语,样本 从总体抽出的部分数据统计量 用样本的所有数据计算出的数值(如均值, 标准差), 称为样本的统计量,x,统计量样本平均值样本标准差,总体,样本,描述计量型数据集,一组计量型数据能显示以下3个特性:中央趋势 (均值, 中值, 众数)变异(全距, 标准差, 方差)形状,参数和统计量符号,Mean 均值Variance 方差Standard Deviation标准差Proportion 比例,总体(参数),样本(统计量) s2sp,数据位置测量,中心趋势均值中值众数四分值,样本均值若样本(样本量为n)的观测值为x1,x2,xn,则样本均值为: 类似

8、地,一个有着大量但限个(N个)观测值的总体,其总体均值 为:,均值,练习三10个连接线的拉拔强度为 : 230 240 236 248 252 278 265 262拉拔强度的均值是多少?10个观测值的均值为:,均值,练习四199X年一个行动中,战机进行了3000次战斗,总共用时6900小时。那末每次战斗平均用时多少?每次战斗平均用时为:,注意所使用的符号,均值,均值的计算使用了每个观测值;每个观测值对均值都有影响。所有观测值对均值的偏差的总和为零。均值对极端的观测值很敏感,极端值会导致均值向他偏移。,均值的特性,将一组观测值按大小顺序排列,位于中心的数值即为中值 若观测值的个数为偶数,则中值

9、为中间2个数值的平均 若观测值的个数为奇数,则位于中心的数值即中值,中值,样本中值 假如x (1),x (2) ,x (n) )是按大小排序的样本值,则样本中值为: 中值的优点是不受极端大或极端小的观测值的影响。,中值,练习五假设一个样本观测值为 : 3 1 2 4 7 8 6 样本均值和样本中值是多少? 这2个值是测量数据中心趋势的合理指标吗?,中值,(b) 假如最后一个数值改变为 : 3 1 2 4 7 8 2680 则样本平均值和样本中值是多少? 据此你有何结论?,中值,Median vs Mean 中值与均值 因为中值不象均值对极端值敏感,因此,当有极端大或极端小值时,中值比均值更能代

10、表数据的位置 典型的例子是一个城市居民的收入中位值,中值,中值有时会有欺骗性,50%-50% Rule ? 一半一半准则? 以下一组数据的中值是多少? 2,2,2,2,2,2,90可以用一半一半准则吗?,众数是样本中出现次数最多的观测值。众数可以是唯一的,也可以有不止一个,有时并不存在众数。,众数,练习六如果样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 4 3 7 2 6 8 1众数是什么? 具有一个众数,两个众数或多于两个众数分布的数据分布叫什么?(单峰分布),众数,为何使用众数? 当

11、观测值为分类式(如名义数据, 序列数据)时.众数是描述数据位置的最好的指标.典型的例子是,一个公司内员工收入的众数,众数的重要信息当众数不止1个时,从中抽取样本的总体通常是多个总体 的混合,众数,均值、中值、众数的比较,正态分布,偏上分布,偏下分布,四分值,将一组按大小顺序排列的数据平均分为四部分,分界点即四分值. 第一四分值(低四分值),约25%的观测值小于它.第二四分值,约50%的观测值小于它, 即中值.第三四分值(高分值),约75%的观测值小于它.,练习七 以下为20个电灯泡失效期间的观测值, 已按递增顺序排列.210 216 252 300 366 454 624 720 816 92

12、4 12161296 1392 1488 1542 2480 2856 3192 3528 3710请确定三个四分值.,计算方法:先确定位置再计算四分值Q1的位置:(n+1)/4Q2的位置:2(n+1)/4=(n+1)/2Q3的位置:3(n+1)/4,四分值,答案 Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75则:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(

13、2480-1542)*0.75=2245.5,四分值,数据散布的测量(变异),Range 极差Variance 方差Standard Deviation 标准差Inter-Quartile Range 四分植极差,极差,样本极差为样本中最大和最小观测值之间的差别,即:极差是测量数据散布或变异的最简单的方法但它忽略了最大和最小值之间的所有信息,r =xmax - xmin,试考虑以下的2个样本: 10 20 50 60 70 90 and 10, 40, 40, 40, 90具有相同的极差(r= 80)但是,第二个样本的变异只是2个极端数值的变异,而在第1个样本,中间的数值也有相当大的变异. 当

14、样本量较小(n10)时,极差丢失信息的问题不是很严重,极差,方差与标准差,若x1, x2, ,xn 是一个具有N个观测值的样本,则样本方差为:样本标准差是样本方差的算术平方根,即:,方差计算,练习八:计算下列观测值的方差和标准差.30 50 70 90 110 130,方差计算,方差与标准差,再考虑以下2个样本. Sample A : 10 20 50 60 70 90 Sample B : 10 40 40 40 40 90 Sample A Sample BRange 极差 80 80Variance 方差 ? ?Standard Deviation 标准差 ? ?,类似于样本方差S2,用

15、总体的所数据计算出总体变异总体方差(2)总体的标准差()是总体方差的算术平方根 对于包含N个数值的有限总体,其方差为: 2=,方差与标准差,方差特性,方差计算使用了所有观测值,每个观测值对方差都有影响 方差对极端值很敏感,因平方的缘故,极端大的观测值会严重的放大方差。,四分值极差,四分值极差是测量散布的另一指标:IQR=Q3-Q1 四分值极差不如极差对极端值敏感 当分布显著不对称时,用它衡量散布会更好 样本(10,20,50,60,90)和(10,40,40,40,90)的四分值极差分别是40和0.,正态分布,正态分布是一种具有特定的、非常有用的特性的数据分布 这些特性对我们理解所研究之过程的

16、特性十分有用大部分自然现象和人造过程是正态分布或可有正态分布描述,标准正态分布,标准正态分布,也叫Z分布,有下列参数:Z代表距离均值的标准差的数量,=0 =1,特性 1 :只需知道下述两项参数就可完整描述正态分布均值标准差,分布 1,分布 2,分布 3,此三项正态分布有何区别?,正态分布,正态曲线和概率,特性 2 :曲线下面的面积可用来估算某一特定事件发生 的累积概率,得到在两个值之间的某个价值的累积概率,99.73%,95%,68%,离均值的标准差数目,样本值的概率,40%-30%-20%-10%-0%-,正态分布特点,Standard Deviation标准差,Average标准差,正态曲

17、线下的区域,分析过程能力时,我们运用正态曲线下的区域预测超过规格界限的产品所占的比例.,5%,5%,规格上限USL,规格下限LSL,标准差的经验规则,当一组数据不是最理想正态分布时,前述累积概率规则仍可 应用比较理论(理想)正态分布和经验(现实)分布,长期和短期能力(Z-偏差),ZLT=ZST-1.5,第四部分基本图表,这是什么?,顾客等待时间,例如: 你是 Pizza Hut 的一个门店的经理. 你要求你的助理记录每个顾客的等待时间, 今天你已经有了100个数据.,观察顾客等待时间(Rate)打开PUMPING.MPJ RATE 转换为变量.,时间序列图,时间序列图,垂直轴(Y)显示被测变量

18、的规模,每个点代表一个实际的价值,点是用一条线连接帮助视觉分析,运行秩序,等待时间(分钟),水平轴(X)反映了一段时间或序列,顾客等待时间,观察顾客等待时间(Rate)打开PUMPING.MPJ RATE 转换为变量.,直方图,等待时间(分钟),一个类别或等待的时间间隔,Class “j”,Class “k”,Class “l”,频率,直方图,产生具有正态曲线的直方图,直方图,频率最高,频率(数量的点),等待时间(分钟),顾客等待时间的直方图,水平轴(x)显示测量范围的变量,钟形曲线,纵轴(y)显示的频率,直方图,观察顾客等待时间(Rate) 打开PUMPING.MPJ 文件RATE 作为变量

19、.,点图,Minitab 结果,采集100位顾客实际的等待时间,作图如上。每一个点代表一个具有给定值输出的“事件”。随着点的积累,顾客等待时间的实际表现的特性可被看作一个 “分布”。,点图,是各分布差异容易把握的数据调查方法.,让我们顾客等待时间打开文件 PUMPING.MPJ用列RATE 作为变量,箱线图,Minitab 结果,箱线图可以体现数据扩散性及中心. 注意 ! 箱线图中的中心线不是 平均 而是 中心值.,箱线图,第五部分六西格玛度量的种类,Defect 缺陷 Unit 单位 Opportunity 机会 DPU(Defects Per Unit) 单位的缺陷数 DPO(Defect

20、s Per Opportunities) 单位缺陷机会数 DPMO(Defects Per Million Opportunities) 百万单位缺陷机会 RTY(Rolled Throughput Yield) 过程通过率(受率) Sigma Level (Z值) Z值的转换方法 Cp&Cpk (工程能力指数),6Sigma度量的种类,Defect(缺陷): - 所有诱发顾客不满足的 - 所有与规定基准不一样的 - 所有导致产品和服务质量下降的 Unit(单位) - 产品和服务等流程过程中的对象或传递给顾客的最终产品和 服务(一块单板,一批原材料,一个合同,一笔贷款,一份报表等) Oppor

21、tunity(机会) - 一个产品和服务可能脱离基准的机会数 - 是可测量的,用语的意思,DPU (Defects Per Unit): - 单位缺陷数 - 例如:一个数据报表上有100个数据,其中有5个数据错误 -DPU= Defects/ Unit=5/1=5 DPO (Defects Per Opportunities) - 机会缺陷数(每个机会出现缺陷的概率) - 例如:一个数据报表上有100个数据,其中有5个数据错误 - DPO= Defects/(Unit数*Opportunity)=5/(1*100)=0.05 DPMO (Defects Per Million Opportun

22、ities) - 百万机会缺陷(PPM) - DPMO=DPO*1,000,000=50000PPM,用语的意思,注意:机会只有在被评价时才计算为机会,例) ZXJ10交换机中的一种单板在生产过程中缺陷发生的机会数为100,000次.但是在正常生产过程中只对其中1,000次机会进行评价,且在一个单板中发现了10个缺点.下列计算中哪一个正确?DPO = 10/100,000DPO = 10/1,000,例题,下面单板例子中计算DPU与DPMO.圆圈表示评价元器件的个数,黑色表示功能失效元器件.,例题,一个单位发生的总缺点机会数,1,000,000,x,DPU,=,DPMO,一般说6 SIGMA水

23、平时把不良率说成3.4DPMO比3.4PPM更恰当 适于互相不同的Process或产品间,制造范筹和非制造范筹间的比较,DPMO的计算,例题,总缺点数,=,DPU,总生产单位数,DPU的计算,例题,例题:,为了掌握固定资产申购过程的现况,整理了今年1月份到6月份的固定资产申购单,总共有678份,每份申购单要求事业部填写12项内容的信息,经过整理发现共有124项填写不完整,68项填写有错误。请问填写固定资产申购单过程的DPU、DPO、DPMO为多少?过程能力为多少Sigma?,例题,DPMO 计算例,适用连续性的数据,不良率= 0.02275,Probability of良品率= 0.97725

24、,规格上限,DPMO = 0.02275 * 1,000,000 = 22,750,适用离散性的数据缺点数某一PCB有800个熔接点与200个部品此PCB中发现6个焊接不良点与2个不良部品DPMO =(6+2)/(800+200) * 百万 = 8,000,例题,RTY:一个产品或服务过程提供无缺陷的概率,例题 2. 某一投诉处理由 A, B, C, D, E 五个作业构成,各作业的 通过率为0.99, 0.95, 0.90, 0.90, 0.95.,计算投诉处理的通过率?,直通率,数据种类的确认,离散型数据,Unit的确认,计算 DPU,计算 DPO,计算 DPMO,连续型数据,正态性验证,

25、数据转换(必要时),工程能力分析(利用MINITAB),引出DPMO,DPMO值在 Sigma Chart转换为Z值,掌握SIGMA水平,大家是否记得Z值是怎么来的?,SIGMA水平(Z值)的计算程序,1) 离散型数据的SIGMA水平,缺陷数据(泊松分布)的情况求DPMO从SIGMA表读对应于DPMO的 Z.st值过程通过率数据的情况计算过程每一个步骤的通过率求出整个过程的通过率从SIGMA表读百万个 = (收率)*1,000,000相对应的Z.st值,不良率(二项分布)数据的情况从不良率计算PPMPPM=(不良率)*1,000,000从SIGMA表读与PPM值一样的 DPMO值相应的Z.st值.,SIGMA水平(Z值)的计算程序,2) 连续型数据的SIGMA水平,规格中心和规格上限或下限间的距离是标准偏差的多少倍?,SIGMA水平(Z值)的计算程序,CP:产品的品质特性的分布没有向两面规格倾斜的情况 下的工程能力指数-理论工程能力指数 Cp=(USL - LSL)/6 ,Cpk:产品的品质特性的分布没有位于规格的中央,而是 向一面倾斜时,考虑倾斜度的工程能力指数-实 际的工程能力指数. Cpk=(USL-X)/3 或(X-LSL)/ 3 中的小值,工程(过程)能力,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报