1、6SIGMA常用工具,课程大纲,流程图 因果图 排列图 失效模式分析FMEA 关联图与矩阵图 质量功能展开QFD 测量系统分析MSA DOE与方差分析 一元线性回归分析,流程图Flow Diagram,流程图的分类,1. 概要流程图例:销售部供货过程:,概要流程图有助于团队 达成共识 界定范围 选择团队成员,2. 详细流程图(Detailed Flow Diagram),开始,定货,给办事员 的信件,拆信,定货?,检查完整性,完整?,C,退邮寄室,查客户电话号,有否?,查客户地址,有否?,A,D,放入客户服务档案,完成格式信件,信封上写地址,交邮寄室,B,是,是,否,否,是,否,是,否,详细流
2、程图有助于团队对过程更充分了解发现问题推测原因寻找解决办法保持收益,3. 上下流程图采购件进货过程,供应商 发运零件,仓库接收并通 知质量控制部,需要样品吗?,试验合格吗?,将零件搬入仓库,送交 评审委员会,可以使用吗?,质量控制部门 在S-150签字,准备好有关文 件并发运零件,供应商 收到零件,将S-150 送交仓库,准备S-150,S-150,S-150,否,是,是,否,否,是,4. 矩阵流程图采购件进货过程,供应商,仓库,质量控制,评审委员会,发运零件,接收并 通知QC,抽样吗?,试验合格吗?,可用吗?,送交评审会,接收零件,填单并发运,在S-150上 签字交仓库,准备S-150,结束
3、,结束,移入仓库,S-150,S-150,是,否,是,是,否,否,分析流程图,寻求改进机会:1. 调查每个菱形符号2. 调查每个循环3. 调查每项活动符号4. 调查每个文件或数据库符号,改进前、后的对比,开始,乘客在售票处 排队购票,乘客有无机票?,乘客往入口处,在入口处排队,座位安排,结束,发放登记卡,乘客有无行李?,预订记帐卡,发售机票,检查行李,开始,乘客在售票 处排队购票,乘客有无机票?,乘客有无行李?,乘客前往入口处,结束,检查行李,发售机票发 放登记卡,预订记帐卡,座位安排,是,是,否,是,是,否,否,否,项目改进措施:票柜人员使用座位数据库项目改进效果:减少了一次排队加快了客流优
4、化了机场秩序,乘客满意,因果图 Cause-Effect Diagram,因果图 Cause-Effect Diagram 又称: 鱼刺图(Fish Bone Diagram )石川图(Ishikawa Diagram )由20世纪50年代初日本著名质量管理专家石川馨教授发明。,1.“汽车失控”因果图,2.因果树型图,如何建立因果图1. 列出所有影响质量问题的可能原因方法:团队活动头脑风暴法(Brainstorming)质量记录的归纳,2. 分层次展开原因间的因果关系,5M(适用于制造业)Manpower 人力, Materials 材料,Methods 方法,Machine 机器,Measu
5、rements 测量。,5P(适用于服务业)People 人员, Provisions 供给, Procedures 程序, Place 地点, Patrons 客户。,何时使用因果图因果图是分析阶段(A阶段)的重 要工具。用于:设想产生问题的原因,聚类,展开、逐一识别、判断,最 终找出问题的主要根本原因。,应用案例:分析焊接质量缺陷原因,排列图 Pareto Analysis,排列图(Pareto Analysis)又名:帕累托图十九世纪末意大利经济学家Vifredo Pareto采用此数学模式描述社会财富的不均匀分布。数学家M.O.Loreng通过图表形式阐述。Joseph Juran博士
6、在廿世纪50年代将其发展成为一种普遍原理。,排列图含义,将引起质量问题的相关因素按作用大小顺序排列,通过作出累积百分比曲线,识别相关因素中的“关键的少数”,从而确定关键因素的一种直观图形。,排列图作用1. 抓主要矛盾;2. 事半功倍;3. 形象直观。,如何建立排列图2. 对结果产生影响的因素,按序排列; 3. 每个因素的大小用数值表示; 4. 计算每个排序因素的累计百分比值, 描曲线。,开具票据过程返回环排列图,应注意:,分界点累计百分比曲线斜率明显趋 于“平坦”的点模糊区斜率变化不明显时,可,暂定累积影响达60%的少数因素,为“关键”,对其诊断、分析、改进第2轮排列图分析,识别新的“关键”。
7、,何时使用排列图,D阶段:识别项目,寻找改进机会 A阶段:分析原因 C阶段:验证、改进效果,识别新的 改进项目,排列图结合分层法的识别改进机会问题陈述:病假、工伤缺勤过多改进目标:工伤、职业病发生率降低 60%,相关成本减少82%,应用案例:,工伤按类型排列,工伤按身体部位排列,失效模式,影响及致命度分析Failure Mode and Effect Criticality Analysis (FMEA),(一)基本概念失效 一个产品(或过程或一个系统)不能正常工作 。失效模式 失效的表现形式。失效影响 失效给顾客带来的后果。顾客 终端用户,后续或下一工序的使用者。,FMEA是一组系统化的活动
8、,其目的是:1)发现,评估产品/过程中潜在的失 效及影响(KPOV)2)列出所有可能产生失效的原因 (KPIV)3)找到能够避免或减少这些潜在失效的措施4)书面总结,(二)FMECA的类型设计DFMEA评估最终产品及每个与之相关的系统、子系统、部件。过程PFMEA识别和消除产品/服务过程中每一环节的潜在隐患。,失效模式的风险评价,应综合考虑:影响的严重程度(SSeverity)失效发生的频度(OOccurrence)不易探测度(DDetection),QS 9000的分级标准(110级): 设计失效严重度评价准则,设计失效发生频度评价准则,设计失效探测度评价准则,纠正措施建议:对风险顺序级别最
9、高的失效模式应制订纠正措施,通过降低严重度/频度/探测度以降低风险顺序。 纠正措施的落实:建议的措施具体责任部门/责任人明确完成日期 考核,纠正措施的有效性的跟踪:重新估算采取措施后的严重度(S)、频度(O)、探测度(D)计算风险顺序数RPN=SO D是否明显下降如不满意,再采取进一步纠正措施直至达到满意水平,2. 过程PFMEA输入: 设计文件 工艺文件 法律、法规、标准、规范,过程PFMEA的步骤:列出所要分析的过程路线(工艺流程) 说明每一步活动及功能要求 每一步活动潜在的失效模式(可能发生) 潜在失效对过程活动的影响 导致潜在失效的原因/机理,失效模式的风险评价:风险顺序数=严重度频率
10、探测度RPN=SOD,为了达成统一认识,应制定过程失效模式的严重度(S)、频率(O)、探测度(D)的分级评价准则。 案例PFMEA案-1.doc,关联图与矩阵图Interrelated Diagram & Matric Diagram,关联图与矩阵图适用于多因素分析 的统计方法 对于两个以上结果和原因互相缠绕的复杂因果关系,采用关联图分析有助于展开问题的全貌,在诸多因素中确定主要原因。,(一)不合格品率的关联图,(二)矩阵图以矩阵形式分析成对因素组之间关联关系。常用于:新产品研制开发合格分承包方选择产品缺陷与原材料、工艺、 设备关系市场与产品战略决策管理职能分配,L形矩阵图:适用于两个因素组一
11、个对应关系,设备故障停机原因分析 L型矩阵图,T型矩阵图:适用于三个因素组二个对应关系,现象,软胶囊压丸质量 T 型矩阵图,Y型矩阵图:适用于三个因素组三个对关系,蜜丸外观质量 Y 型矩阵图,(三)关联矩阵在质量功能展开(QFD) 中的应用质量要素展开顾客需求是确定产品质量功能的依据顾客要求应转变为一系列相应的产品质量特性/要素质量要素与顾客需求不仅仅是一一对应关系质量要素之间存在相互关联与相互制约关系,“玛格丽塔鸡尾酒”的案例,质量功能展开QFD,质量经济性管理,(1) 增加收入 提高顾客满意度,(2) 降低成本 减少符合与非符合性成本,4.质量功能展开方法,3.质量表质量存在于每个人的房中
12、,2.质量功能展开(QFD),1.市场为导向和源流管理,5.并行原理和QFD的四个阶段,一、质量功能展开概述, 1. 质量功能展开(QFD)所谓质量功能展开(Quality Function Deployment 缩写 QFD),就是将市场(顾客)的需求转换成代用特性,以确定产品的设计质量,并将其系统地(关联地)展开到各功能部件的质量,个别零件的质量以至过程要素。,2.质量表,变换,市场需求,抽出,质量表,质量要素展开表,需求质量展开表,重要度,设计质量,重要度,策划质量,3.质量功能展开方法,(1) 需求质量展开 (2) 质量策划(计划质量设定) (3) 质量要素展开(性能特性展开) (4)
13、 质量表编制 (5) 设计质量设定,4.平行原理和QFD的四个阶段,零件展开,生产过程展开,质量保证要素展开,顾客需求质量展开,二、质量功能展开步骤,案例QFD案例-1.doc,1.需求质量展开,1,(1)收集信息,(2)整理,备注:此处的5WIH是指谁使用(WHO)、 在何时使用(WHEN)、在何地使用(WHERE)、为何使用(WHY)、使用的目的为何(WHAT)以及如何使用(HOW)。,(2)聚类 KJ法(亲和图),用一个整句来描述需要讨论的问题就所讨论的问题,提出至少20条意见或争论点将意见同时分成5到10个相关的类别(不交流),需求质量展开表,2. 质量策划,质量策划(计划质量的设定)
14、项目 重要度 比较分析 计划目标 权重,1,2,(1) 确定需求质量的重要度,计划目标,计划目标:计划质量目标点 水平提高率=计划质量目标点/本公司产品的评价点 商品特性点:特别重要 ;重要o;,需求质量权值确定,(1) 求出绝对权值 绝对权值=(平均重要度)x(水平提高率)x(商品特性点)其中:商品特性点:记值为1.5;o:记值为1.2;其他为1.(2) 需求质量权值=绝对权值/(各个项目绝对值之和)x 100%,需求质量D1 不易脏 D2 普遍适用 D3 易于立住 D4 挂在墙上 D5 易从墙上拿下 D6 易于打开 D7 保 护,其中D1=41.51.0=5.0,需求质量权值=(5.0/8
15、3.2)100=6D2= 191.31.5=35.6,需求质量权值=(35.6/83.2)100=43案例QFD案例-1.doc,3. 质量要素展开 将顾客语言转化为技术语言,抽出质量要素性能指标的确定,1,2,3,(2)每个需求质量至少要有确定一个性能指标快速地,转化,安成时间或频率范围,(3) 性能指标系固有特性指标固有特性是内在的特性,而不是人为赋予的特性电视机,固有特性:功率、尺寸、图像清晰度,人为赋予特性:价格、交货期,(1)性能指标:用来评价产品质量性能的衡量标准,质量要素展开,抽出质量要素案例QFD案例-1.doc,4 . 质量表编制,需求质量展开顾客的世界 质量要素展开技术的世
16、界 质量表:顾客的世界,1,2,3,4,技术世界,4.1 关系矩阵质量表,把需求质量展开表与质量要素性能指标特性展开表分别按纵横排列组合成矩阵形式,以此揭示需求与特性以相互关连性,4.2 相互关联性确定,5. 设计质量的设定,特性重要度评价 比较分析 设计目标,1,2,3,4,5,质量要素(特性)重要度的评价质量要素(特性)重要度的变换评价按下列公式进行:Wj=Xij aij式中Xij对应的需求质量的重要度(权值)aij 对应的强度:若属“”记为aij=3,“” 记为aij=2,“”记为aij=1,i,决定应采用改进计划,第一行:是价值排序。 第二行:用5级法确定达到目标的技术困难。5是非常困
17、难,1是可以在内部或外 部解决。 第三行:是现有特性指标下的过程能力Cp(Cpk)。 第四行:判断“”表明选用的计划,“”表明没有计划可用特别努力。 案例QFD案例-2.doc,6. 平行原理和QFD模式四个阶段,质量保证要求,测量系统分析MSA,测量: 包括过程,产品,服务的输入,输出及性 能的量化信息.是一整套以确定量值大小为目标的作业 测量系统: 测量特定特性有关的作业,方法,步骤,量具,设备,软件,人员的集合.为获得测量结果的完整过程,测量系统的基本要求,真值=观测值-测量误差统计稳定性-普通原因/特殊原因测量精度- 测量误差/过程变差,测量系统的精度要求,分辨力(Discrimina
18、tion)1. 最小测量单位/容差10%2. 最小测量单位/过程变差10%,准确度(Accuracy)表示测量结果(单值或平均值)与真值的接近程度准确度=基准值-多次测量平均值,影响准确度的因素:环境: 温度,湿度,大气污染,噪声,光 设备校准: 定期校准/校准的方法和程序 操作人员: 对标准的理解,对仪器的使用差异 时间: 随时间变化而引起其它测量条件/环境变化,精密度(Precision)在相同的条件下,重复测量或试验其结果相互间的一致性精密度通常用测量的标准差来表示,标准差越大,精密度越低随机误差和系统误差,三个图形,轴与孔均采用同一量具时,首先关心的是精密度. 轴与孔使用同一量具时,首
19、先关心的是准确度,测量系统的误差类型系统误差: 偏倚 ,线性,稳定性 随机性误差: 重复性, 再现性,相同的测量人员,使用同一设备,在同一校准期间,同一实验室,采用相同的方法,在较短的时间内,对同一零件的同一特性测量的结果,其相互接近的程度,重复性(Repeatability),再现性(Reproducibility),不同的测量人员,使用不同的设备,在不同的实验室,在不同的时间,采用相同的方法对同一零件的同一特性测量的结果,其结果相互接近的程度,偏倚(Bias)测量系统与基准值之间的差值.属于系统误差,重复测量无法避免. 偏倚可能来源于测量人员,设备,程序及实验室环境等要素的变动,线性(Li
20、nearity)量具在预期的工作范围内,在不同的测量点偏倚值的差值,稳定性(Stability)测量系统在某持续时间内, 在不同时间测量点, 测量单一零件单一特性时,测量值的总变差,计量型测量系统误差的估计1. 确定偏倚B ias2. R&R的研究,确定偏倚 选定基准值x0 重复测量并记录(x1,x2) 计算平均值X 偏倚量=平均值-基准值 偏倚百分比:偏倚量/过程变差X100%,产生偏倚的原因:校准环境不符合规定的要求 不合理延长校准周期 测量人员变动,测量程序未形成文件 测量时间规定不严,条件变动 疏忽与失误 设备,程序及实验室环境等要素的变动,常见的疏忽与失误 测量前仪器/量具未校零 忽
21、略了多次测量取平均值的要求 测量位置不正确 未识别不合要求的测量/试验程序 对被失准的量具测量的产品未进行识别,隔离和重新评价,R&R的研究方法:小样法 大样法 图法,R&R研究中的主要因素:,R&R研究的准备:确定方法,人员,被测产品零件数,重复次数 被测零件应为生产线上的产品,变差范围能代表允差范围. 由日常从事该测量活动的人员进行并事先培训,小样法实例:给出测量系统的综合误差,但无法给出引起的原因是人为还是量具,计算平均极差R= 总极差/零件数=1.4 量具综合误差GRR=5.15XR/d2=1.4X4.33=6.1 容差的百分率GRR%=GRR/容差=6.1/20=30.5%(容差为2
22、0)容差百分率大于30%, 被拒绝,大样法实例至少2名测量人员, 至少10个工件, 每人对每个零件至少测量2遍,零件逐一编号 量具校准 人员A对零件进行测量(随机顺序) 人员B,C对零件进行测量(随机顺序) 上述循环重复2次,测量次序打乱,测量步骤:,子组极差: 平均极差 标准差 重复性变差: e,确定重复性:,标准差: 再现性变差: 0测量系统的标准偏差: m,确定再现性,容差百分率%R&R:5.15X m/容差X100% 过程变差百分率:m/ t X100%可接受条件: 两者=10%,测量系统是否可接受的判定条件:,拒绝条件: 容差百分率和过程变差百分率均=30% 有条件接受:10%=容差
23、百分率和过程变差百分率均=30%此时应考虑: 被测特性的重要程度,测量系统的复杂程度, 成本因素等 案例R&R案例-2.doc,两种方法的比较:小样法:简单,快捷,综合反映测量系统的 R&R误差 大样法: 数据量大,更加可信,可区分重复性和再现性误差的比重,对计算结果分析: 当重复性误差比重大时,可能表明: 测量设备需要保养 测量设备刚性不足 测量过程中的零件的定位方式需要改进 零件内变差影响过大,当再现性误差比重较大时, 可能表明:,需要对测量人员进行操作培训 应更明确规定校准的方法和要求案例R&R案例-1.doc,DOE与方差分析,主要内容:,一、几个概念 二、单因子方差分析 三、两因子方
24、差分析 四. 正交试验设计,方差分析与试验设计是英国统计学家兼遗传学家费希尔(Fisher)在进行农业实验时发展起来的一套通过实验获取数据并进行分析的统计方法。 试验设计: 通过对实验进行精心的设计,使得在有限的物质条件下(事件、金钱、人力)所得到的数据能够在尽可能少的试验中最大限度地包含有用的信息 方差分析: 就是相应的从试验数据中提取这种信息的统计方法,一、几个概念 1.因子: 试验中要加以考察而改变状态的因素称为因子,常用大写的英文字母A、B、C来表示。 2.水平: 因子在试验中所处的状态称为因子的水平。 3.试验条件:在一次试验中每个因子总取一个特定的水平,4.指标: 衡量试验结果的特
25、性称为指标,譬如: 质量特性:强度,放大系数,寿命, 产量特性:收率,亩产量, 其它:成本,时间, Y表示试验中所考察的指标, y是随机变量,它 表示在给定试验条件下指标全体 均值是一个依赖于试验条件的常量 方差是一个常量。,5.单因子试验: 如果一个试验中所考察的因子只有一个,这样的试验称为单因子试验问题。,例 现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如下表所示,试问三个工厂的零件强度是否相同?表 三个工厂的零件强度工厂 零件强度 甲 103 101 98 110 乙 113 107 108 116
26、丙 82 92 84 86,在这一例子中,考察一个因子:因子A:工厂 该因子有三个水平:甲、乙、丙试验指标是:零件强度为检验上述各总体均值是否一致这一假设,需要从每一总体中抽取样本。,方差分析的实质是检验若干个具有相同方差的正态总体的均值是否一致的一种统计分析方法。,只考察一个因子A 它有r个水平 每个水平测量m次三个假定:(1)在水平Ai下,指标服从正态分布(2)在不同水平下,各方差相等(3)各数据yij相互独立 在这些假定下检验如下假设:H0: H1: 不全相等,当 H0不真时,表示不同水平下的指标的均值 有显著差异,此时称因子A显著,否则称因子A 不显著。 试验中所考察的因子有两个,称为
27、两因子试验 问题。采用的数据分析方法是两因子方差分析。,二、单因子方差分析假定因子A有r个水平,在Ai水平下指标服从正态分布,其均值为 ,方差为 ,i=1,2, , r 。每一水平下的指标全体便构成一个总体,共有r个总体,这时比较各个总体的问题就变成比较各个总体的均值是否相同的问题了,也就是检验假设H0,H1的问题, 检验这一假设的统计方法便是方差分析。,设在一个试验中只考察一个因子A,它有r个水平,在每一水平下进行m次重复试验,其结果用 表示,i=1,2, , r。 常常把数据列成如下表格形式:表 单因子试验数据表 水平 试验数据 和 均值 A1 T1A2 T2 Ar Tr,记第i 水平下的
28、数据均值为 ,总的均值 为 。此时共有n=rm个数据,这n个数据不全相同,它们的波动可以用总的偏差平方和ST去表示引起数据波动的原因不外如下两个:,组间偏差: 由于因子A的水平不同,当假设 不真时,各个水平下指标的均值不同,这必然会使试验结果不同,我们可以用组间偏差平方和来表示,也称因子A的偏差平方和:,组内随机偏差: 由于存在随机误差,即使在同一水平下获得的数据间也有偏差.组内偏差平方和表示:可以证明有如下平方和分解式:,分析SA,Se与H0的关系: 当H0不真时, SA比例大 当H0为真时,Se比例大 自由度的概念: 自由度是独立变量的个数,例如 在ST中有rm个数据,有一个约束条件: ,
29、故有rm-1个独立变量数,故自由度为rm-1,记 作 = 试验次数-1 SA,Se的自由度。,ST、SA、Se 的自由度分别用 表示, 它们也有分解式: ,其中:因子或误差的偏差平方和与相应的自由度之 比称为因子或误差的均方和,并分别记为:两者的比记为: 当 时认为在显著性水平 上因子 A是显著的。,表 单因子方差分析表来源 偏差平方和 自由度 均方和 F比 因子A =r-1 误差e =n-r 总计T =n-1,各个偏差平方和的计算:,对上例的分析 (1)计算各类和:每一水平下的数据和为:数据的总和为T=1200 (2)计算各类平方和:原始数据的平方和为:每一水平下数据和的平方和为 (3)计算
30、各偏差平方和: ST=121492-12002/12=1492, fT=34-1=11 SA=485216/4-12002/12=1304, fA=3-1=2 Se= 1492-1304=188, fe=11-2=9,表 单因子方差分析表来源 偏差平方和 自由度 均方和 F比 因子A =1304 =2 误差e = 188 =9 总计T =1492 =11,(4)列方差分析表:,(5)结论:如果给定 =0.05,从F分布表查得由于F4.26,这表明不同的工厂生产 的零件强度有明显的差异。,当因子A是显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。在单因子试验的场合,第i个水平
31、指标均值的估计为:在本例中,三个工厂生产的零件的平均强度的的估计分别为:,为直观起见,可以画一个各水平的均值图:,误差方差的估计: 这里方差 的估计是Ve。 在本例中: 的估计是20.9。的估计是 。案例单因子方差分析案例.doc,三、两因子方差分析在一个试验中需要同时考察两个因子A与 B,并设因子A有 r 个水平,因子B有 s 个水 平,这时共有n=rs个不同的试验条件,也就 是说有n个总体。假定每一个总体的分布是 正态分布,其均值为 ,它与因子A及B的 水平有关,方差都相同,都是 。 一个因子的水平好坏或好坏的程度受另 一因子水平制约的情况,称为因子A与B的 交互作用。其直观表示如下面的图
32、(b)与(c)所示。,(一) 因子A与B不存在交互作用设在Ai与Bj条件下的试验结果用yij表示, Ai水平下的均值用 表示,Bj水平下的均值 用 表示,总的数据均值用 表示,现在 数据的总偏差平方和ST可以分解成三项:ST=SA+SB+Se 其中SA、SB及Se分别称为因子A、因子B及 误差的偏差平方和,它们的表达式和计算 公式如下:,各偏差平方和的自由度也有分解式:fT=fA+fB+fe 其中fT =n-1, fA =r-1,fB =s-1, fe = fT-fA-fB。,(二) 因子A与B间存在交互作用设在Ai与Bj条件下的m个试验结果用 表示,AiBj条件下的数据均值用表示,Ai水平下
33、的均值用 表示,Bj 水平下的均值用 表示,总的数据均值用 表示,现在数据的总偏差平方和ST可 以分解成四项:ST=SA+SB+SAB+Se 其中SA、SB、SAB及 Se分别称为因子A、 因子B、交互作用AB及误差的偏差平方 和。,它们的表达式和计算公式:,各偏差平方和的自由度也有分解式:fT=fA+fB+fAB+fe 其中fT =n-1, fA =r-1,fB =s-1,fAB= fA fB,fe = fT-fA-fB-fAB。,四. 正交试验设计(DOE),多因素试验次数太多 单循环法不一定找到最佳条件 用正交表选择部分条件进行试验,少量的试 验获得多的信息,正交表的特点:,每列中不同的
34、数字重复次数相同 将任意两列的同行数字看成一个数对, 那么一切可能数对重复次数相同. L n(q ) n=q k=2,3,4. P=(n-1)/(q-1) L 4(2 ) L 8(2 ) L 16(2 ),k,k,7,3,15,L 9(3 )正交表,4,无交互作用的试验设计步骤:,根据正交表进行试验设计 进行试验获得试验结果 对数据的方差分析 据试验结果验证数据 案例两因子DOE实验案例-无交互.doc,有交互作用的试验设计步骤:,根据交互作用表和正交表进行试验设计 进行试验获得试验结果 对数据进行方差分析 验证数据 案例DOE试验案例.doc,一元线性回归分析,相关系数 一元线性回归模型 回
35、归方程的显著性检验 利用回归方程作预测,回归分析 Regression Analysis,回归分析是研究一个随机变量y与另一些变量x1,x2,xk之间关系的统计方法.x带有“原因”的性质,为自变量. y带有“结果”的性质,为因变量.,例1 由专业知识知道,合金的强度y(107Pa)与合金中碳的含量x(%)有关。为了生产强度满足用户需要的合金,在冶炼时如何控制碳的含量?如果在冶炼过程中通过化验得12组数据,列于下表中:,画散点图。为了研究两个量间存在什么关系,可以画一张散点图,具体见下图:,两 类 关 系确定性关系与相关关系:(1)儿子的身高与父亲的身高(2)教育投资与家庭收入(3)体重与身高(
36、4)合金钢强度与合金钢中的碳含量,相 关 系 数(correlation coefficients)散点图的n个点基本在一条直线附近,但又不完全在一条直线上,我们希望用一个量来表示他们的密切程度,这个量称为相关系数:可以证明有-1r1。,在合金钢的例子中可算得:,相关系数r 示意图与说明,当r0时,当r0时,当r=0时,称两个变量不相关.,相关系数的检验 在正态分布假设下,对假设 H0:r=0 ,H1:r0 其拒绝H0的拒绝域为:n为样本量,是显著性水平, 为自由度为n-2的r的 分位数.譬如在合金钢例子中n=12,若取=0.05,拒绝域为|r|0.576,如今r=0.9705,可以显著性水平
37、=0.05认为,合金强度y与其碳含量x间存在线性关系。,一元线性回归模型x是自变量,非随机变量。y是因变量,随机变量。y由两部分迭加而成: 1. 是随x变化的趋势,用0+1x表示 2. 是其它随机因素影响的总和,用表示,常设N(0,2)。故有如下的数据结构式: yi=0+1x+i,i=1,2,n,回归系数的最小二乘估计。按最小二乘法:记 若 满足如下等式: 则称 , 为0 ,1的最小二乘估计。,0 与1的最小二乘估计可以验证: , 使Q(0,1)达到最小.回归方程: 此回归方程总经过 和 两点,计算步骤,回归方程的显著性检验回归方程的检验有两种方法:1. 对于给定的显著性水平,当相关系数r的绝
38、对值大于临界值 时,两个变量间存在线性相关关系 2. 方差分析的方法,误差分解方法总的波动可用总偏差平方和ST表示:波动的原因有二:1. 由于自变量x取不同值引起y的变化;2. 其它因素(除x以外)引起y变化的随机误差.,方差分析表各平方和的计算:,利用回归方程作预测当x=x0时, y是随机变量, 只能对其平均取值作出估计:案例一元线性回归案例.doc 案例线性回归分析案例.doc,下图给出在不同x值上预测区间的示意图:当n较大时(如n30),t分布可以用正态分布近似,进一步,若x0与 相差不大时,可以近似取为:其中u1-/2是标准正态分布的1-/2分位数,6SIGMA常用工具概念回顾,流程图 因果图 排列图 失效模式分析FMEA 关联图与矩阵图 质量功能展开QFD 测量系统分析MSA DOE与方差分析 一元线性回归分析,谢谢!,