收藏 分享(赏)

yaming 6sigma-05.ppt

上传人:精品资料 文档编号:5043110 上传时间:2019-02-02 格式:PPT 页数:148 大小:3.38MB
下载 相关 举报
yaming 6sigma-05.ppt_第1页
第1页 / 共148页
yaming 6sigma-05.ppt_第2页
第2页 / 共148页
yaming 6sigma-05.ppt_第3页
第3页 / 共148页
yaming 6sigma-05.ppt_第4页
第4页 / 共148页
yaming 6sigma-05.ppt_第5页
第5页 / 共148页
点击查看更多>>
资源描述

1、介绍独立性X2检验的基本概念 将独立性X2检验与六西格玛 DMAIC原理联系起来,内容,独立性X2检验,定义 范围和界限 定义缺陷 小组任务书和小组领导人 估计经济影响 领导层批准,DMAIC,流程,Y = f (x1, x2, x3, x4, . . . xn),Y在一段时间中的绩效,Y的差异,过程图,初始能力评估,FMEA 减少 “错误输入” 引起的差异及其影响,因果关系矩阵,FMEA,多变量,多变量研究有助于确立Y和关键 X之间的联系,x1, x7, x18, x22, x31, x44, x57,多变量分析确认噪声变量,减少 实验设计中的X,Y = f (x7, x22, x57),实

2、验设计确定关键X及其与Y的关系,对关键X进行适当控制,实际差异,测量差异,我们从 “Y”开始:,分析方法框架,评估 X、Y关系的工具,人力资源部想看看应聘者的年龄(年轻或年长)和他是否受聘之间是否有联系,Y 是什么? _ 数据类型? _,X 是什么? _ 数据类型? _,你将使用哪种工具? _,例子,你得出什么结论?,数据,问题:年龄和是否受聘用有关系吗?是否一个年龄组的人比另一个年龄组的人有更大的受聘机会?受聘机会是否不受年龄影响?,独立性X2检验,假定变量间相互独立。要证明相互关系:H0: 数据间相互独立 (聘用决定不受应聘者年龄的影响) Ha: 数据间相互影响 (聘用决定受 应聘者年龄的

3、影响) 如果聘用决定和年龄无关,那么受聘者中年长者的比例应和应聘者中年长者的比例大致相当。 X2检验决定统计显著性水平,X2检验,对下列观测值进行计数: 受聘和未受聘的年长的应聘者 受聘和未受聘的年轻的应聘者 如果聘用决定和年龄无关,数字应该是多少 应聘者中年长者所占百分比? 如果受聘者中年长者的比例恰好等于应聘者中年长者的比例,将聘用多少年长者? 针对年长的未受聘者、年轻的受聘者和未受聘者,重复上述步骤 使用 Minitab中的X2检验 如果P值小于 0.05,则否定 H0,收集数据并计算行和列总值,第1步,计算观测到的频率,第2步,创建一张 期望频率 表 如果两个因子确实相互独立,该表应该

4、是怎样的?,40% 的应聘者是年长者 (180/455).,因而我们预计受聘者中年长者应占40% (75*(180/455).,结果如何?,期望频率和实际观测频率之差与期望频率的比率决定了检验统计值和P值差值越大,表明信号和噪声的比率越大,P值越小,分析 Minitab 中的数据,X2检验期望数值列于观测数值下方受雇 未受雇 总计1 27 153 18029.67 150.332 48 227 27545.33 229.67总计 75 380 455X2 = 0.240 + 0.047 +0.157 + 0.031 = 0.476 DF = 1, P值 = 0.490,注: 期望数值和观测数值

5、与你刚才计算的值相同,你得出什么结论?,结果,示例: Post-it 消费者账户调查,(2) 结果:所有地区 电子商务 列表的统计数据:网上送货,电子商务定购比例(%)行:网上送货 列:电子商务(%)是 否 合计 备注是 72 16 88 电子商务定购中网上送货比例更高 64.74 23.26 88.00 否 31 21 5238.26 13.74 52.00合计 103 37 140103.00 37.00 140.00X2 = 8.287, DF = 1, P值 = 0.004单元格内容 数值随机的期望频率,来自于增加指示标签纸销量的黑带项目。利用X2检验分析对电子商务定购和网上送货进行比

6、较的调查数据。表明针对电子商务的营销手段应包含网上送货。,如果数据没有列表,该怎么办?,使用Store descriptive statistics选项 (Stat Basic Statistics) 打开 GB Chi-Square.MPJ Abrasives 工作表 多变量研究针对是使用不同研磨材料切割带子的问题 Y 代表材料是否正确切割 废品或合格品 X 代表材料类型 5 类 (Trizact, Alum. Oxide Paper, Regalite, Alum. Oxide Cloth, ScotchBrite),计算总数,X2分析,结果:研磨材料 X2检验:废品,合格品 期望数值列于

7、观测数值下方废品 合格品 总计1 493 48127 486201129.67 47490.332 154 8681 8835205.28 8629.723 1860 23356 25216585.89 24630.114 222 14187 14409334.79 14074.215 188 28277 28465661.38 27803.62总计 2917 122628 125545,X2 =358.821 + 8.535 +12.809 + 0.305 +2.8E+03 + 65.910 +37.998 + 0.904 +338.816 + 8.060 = 3602.946DF = 4,

8、 P值 = 0.000,X2检验评注,X2检验显示了最少的情况,通常是本周学习使用的工具中“较难分析”的一个 属性数据的结果 要满足假设,X2检验的期望频率至少应为5 如果期望频率小于1,Minitab无法计算出P值 我们可以通过合并类别来解决这个问题 确保所收集的数据的随机性 注意其它隐含因子(变量 X),回到Abrasive工作表,分析在其它变量 X下的 Y值(废品或合格品) 磨料(粗或细) 宽度(窄或宽) 长度(短或长) 是否有变量X影响废品 /合格品的件数?,可选练习,销售 客户偏好一个对北美送货情况的分析显示美国、加拿大对三种产品的定购数量。两国消费者的偏好是否相同?,如果不同,造成

9、差异的原因是什么? 下一步应该怎么做?,2 x 2 试验,DOE-实验设计,目的:,目标:,介绍实验设计(DOE)概念,作为研究多个自变量“ X”、以量化其对“ Y”响应值的影响的方法。本部分将讨论2 x 2 DOE - 具有两个水平上的两个因素 (“ X”)。,认识实验设计相对于盲目实验的优势回顾几种2X2实验设计实例(滚筒式洗衣机,直升机和顾客呼叫中心)采用Minitab,以图形方式分析 2 x 2因素 DOE,设计的实验(DOE)可以用来同时有效地研究多个变量。,同时研究多个变量的好处是: 更迅速地迭代出答案 (设计更有效) 寻找自变量之间的关系 (交互作用) 降低对效果的估计值的误差

10、降低实验费用,增加第4个点给我们: 两倍的温度对比值 两倍的密度对比值 检查交互作用的机会 (影响的一致性),假设: Y = 产出 X1 = 温度 X2 = 密度 可能的实验方法: 仅改变温度 (记录 Y),然后仅改变密度 (记录 Y) 问题:两个“ X”同时变化的影响无法评估。 更好的方法: 先单独改变温度和密度,然后一起改变。这种方法可量化同时改变多个变量时的 交互作用。,设计的实验:因子排列,场景: 洗衣机的新设计已完成,并已制造了几台模型。我们希望做一个实验,量化洗涤时间和水量对衣物洁净程度的影响。,Y : 衣物的“ 清洁度” X1: 以分钟表示的洗涤时间水平1: 10分钟水平2: 2

11、0分钟 X2: 以加仑表示的水量水平1: 4加仑水平2: 8加仑,有两个变量分别具有两个水平,那么,总共有4种可能的组合:X1 X2 低 10 低 4 高 20 低 4 低 10 高 8 高 20 高 8,由于总共做16次实验,我们将重复(重新设置)每种可能的“ X”组合4次。这样每个不同的设置就有多个数据,因此结果的置信度就越大。,“ 因素”设计: 一种检验各因数在所有水平的所有组合的试验设计,例1: 滚筒式洗衣机,注: 反射系数变化大 = 衣物更干净,响应值对两个自变量图:,* 请参阅附录中的在Minitab中生成此图道德内容,例1: 滚筒式洗衣机 (Y对应值 = “ 清洁度”),20分钟

12、洗涤效果比10分钟洗涤效果高出3个单位。 4加仑效果比8加仑效果高出4个单位。 8加仑水量洗涤10分钟时效果最差。,差值 让我们看一下单元之间“ Y”的差值。是否存在明显的差异?,实验结果评估 (续),我们看一下评估实验结果的数学方法: 置信区间 置信区间提供的是主要影响和交互作用的可能的取值范围。 假如在高水平和低水平下响应值相等,那么差异应为0。 Ho: “ X”从低变为高,响应值不会有差异。 Ha: “ X”从低变为高,响应值会有差异。,实验结果评估 (续),自由度 设计的实验的自由度 (df)反应了可用于得到统计结论的信息量大小。对于我们的例子: 每个单元有4个数据点 (n = 4)。

13、df = n - 1, 因此每个单元的自由度 = 3 共有4个单元,因此: - 实验的自由度 = (每单元自由度 3 )*(4个单元) = 12,交互作用的置信区间,时间: 2.8 +/- 3.4 区间范围: -0.6 至 6.2 由于“ 0”包含在置信区间内,我们不能说当时间值由低向高变化时,响应变量值间存在差异。 时间不是具有统计显著性的“ X”。 注: 尽管时间不具有统计显著性,它可以将清洁度提高6个单位! 加仑: 3.6 +/- 3.4 区间范围: 0.2 至 7.0 由于“ 0”不包含于置信区间内, 我们有95%的置信度说明,水量从4变到8加仑确实对“ Y”具有统计显著性影响。 加仑

14、 是 一个关键少数“ X”! 交互作用: 1.4 +/- 3.4 区间范围: -2.0 至 4.8 由于“ 0” 位于置信区间内,我们不能说 “ Y” 的改变是由于“ X”间的交互作用引起的。 交互作用不具有统计显著性。,水量是控制滚筒式洗衣机衣物清洁度的少数关键的自变量之一,需要重点关注。,置信区间解释,滚筒洗衣机的Minitab分析 (续),观察数据窗口(ctrl-d)-出现你的设计!键入反射系数结果,如图C6栏中所示。,选择StatDOEFactorial Plots . . . 创建主要影响图、交互作用图和立方图,如何解释主要影响图? 直线斜度越大,在测试区域内对Y对应值的“ 影响”越

15、大 (记住,Y = 反射系数,它等于清洁度) 洗涤时间从10分钟增加到20分钟,反射系数也增大 水量从4加仑增加到8加仑时,反射系数减小 (水量减少可使衣物更清洁!),以下是主要影响图,以下是交互作用图:,如何解释交互作用图? 首先,记住Y轴始终是对应值(这里即反射系数)。Minitab显示Y轴上对应值的均值。X轴是 加仑,而图中的两条线代表高水平和低水平的 时间 。 如果没有交互作用,则两条线平行。斜度差异越大,交互作用也越大。 在洗涤时间为10分钟时,水量似乎使差异更明显(在水量是4加仑时,反射系数在洗涤时间是10分钟时比洗涤时间是20分钟时差异大) 用4加仑水总比用8加仑水衣物洗得更干净

16、 (反射系数值更高)。,20分钟,10分钟,以下是立方图:,如何解释立方图? 立方图是最容易解释实验设计的图形-只需选择优胜者! 在我们的例子中,较高的反射系数较好(较干净的衣物),因此最好的操作条件就是4加仑水20分钟洗涤时间。注: 立方图也可以提示从什么地方开始下一个实验-可能是较长的洗涤时间(20分钟)和较少水量(4加仑)?,最高Y-值,选择: StatDOEAnalyze Factorial Design 采用图形和数据分析您的实验结果。 选择: 我们实验中的对应值是“ 反射系数” 单击OK。,数字式分析 (续),Term Coef Constant 25.100 time -0.16

17、0 gallons -1.994 time*gallons 0.072,Fractional Factorial FitEstimated Effects and Coefficients for ref (coded units)Term Effect Coef StDev Coef T P Constant 17.206 0.7743 22.22 0.000 time 2.712 1.356 0.7743 1.75 0.105 gallons -3.662 -1.831 0.7743 -2.37 0.036 time*gallons 1.438 0.719 0.7743 0.93 0.37

18、2Analysis of Variance for ref (coded units)Source DF Seq SS Adj SS Adj MS F P Main Effects 2 83.086 83.086 41.543 4.33 0.038 2-Way Interactions 1 8.266 8.266 8.266 0.86 0.372 Residual Error 12 115.098 115.098 9.591Pure Error 12 115.097 115.097 9.591 Total 15 206.449Unusual Observations for ref Obs r

19、ef Fit StDev Fit Residual St Resid8 24.0000 17.4500 1.5485 6.5500 2.44R R denotes an observation with a large standardized residualEstimated Coefficients for ref using data in uncoded units,两种图形的结果相同,而且数字式统计分析。 记住! 正如ANOVA, p .05表示具有统计显著性!,由于我们运用洗衣机时间和加仑的实际设置,我们可以得出所拟合的方程中各变量的系数。如果只用离散因素设置,就得不出这些系数.

20、,数字式分析 (续),目的: 介绍具有2个水平的多个(大于2个)因素(X)的实验。讨论各种实验和解释规则。,目标: 回顾23 实验设计的例子 解释常见的DOE术语 解释用于优化“ Y”响应变量的平均值和标准差的DOE的用途 用Minitab,以图形方式生成并分析23 因素 DOE,2k 实验,DOE流程图在前一部分,我们讨论了具有2个水平的双因素(X变量)实验设计。大多数情况下, 您需要检测的潜在X往往多于2个。在这一部分中,我们将扩展实验设计,包含更多的因素。全因素设计阵列: 全因素实验指检测所有因素各水平的所有组合。,因素DOE 分析,前一章的滚筒式洗衣机具有以下设计:因素数量: 2 水量

21、和时间每个因素的水平数量: 2 水量 4和8 时间 10和20分钟如果所有因素都有2个水平,则设计就称作 2k 因素实验设计, 其中k表示因素数量 (X)实验由多次“运行”组成。每次实验各因素水平的组合都互不相,不同的组合总共有2K个。在前一部分,22即2X2(即4)个可能组合,或称“ 运行”。Minitab可以生成包含2至15个因素的2K设计。,23 (读作 “ 2的三次方”)实验是一种包含 3个独立变量,每个变量 具有2个不同水平的实验。 即23 = 8种可能组合 24 (读作“ 2的四次方”)实验是一种包含 4个独立变量,每个变量 具有2个不同水平的实验。即 24 = 16种可能组合 实

22、验由多次“运行”组成,每次“运行”变量组合的设置都不尽相同。,23 和 24 全析因实验定义:,试想喷水洗涤式清洗机:小金属部件由传送带运送,进入喷水洗涤机进行清洗。 喷水洗涤的效果是带有强力溶剂的冲刷器件决定的。这种溶剂通过预加重过滤机过滤。溶剂蒸发后,再通过过滤器过滤。过滤器中的物体就是不能被喷水洗涤器消除的残值物。 残值物越少,清洁过程越好。 我们想证明残值的数量如何受3种变量的影响:温度、时间 (传送带速度)和(清洁剂)浓度。 在此实验中,我们将研究这三个变量(每个变量都有两个水平)对平均值和标准差的影响。水平变量 -1 +1温度 暖 热时间 短 长浓度 低 高 此实验的八种组合见下页

23、,例1: 清洁过程,上表称为“ 设计阵列”。它表明实验“运行”变量的排列方式。 表中所示的每种变量的-1和+1顺序称为标准顺序。 -1和+1分别代表变量设置中的“ 低”和“ 高”。 由于阵列包含了三个变量的每种可能组合,它被称为 全因素阵列。 由于有八种变量组合,因此要求部件清洗机运行八种不同的设置。,实验设计的目的是确定每种因素对响应变量值产生的影响,这种影响与其它因素无关。如果设计矩阵是正交的,就可以估计由一种自变量产生的、且不受其它变量干扰的影响。解释 正交描述实验因素之间的独立性。如果因素所有可能的组合的观测值数量相等,设计矩阵就平衡。如果您的实验 平衡 ,则它就是正交。,DOE术语

24、-“正交,*参见附录中的设计阵列正交检验方法。,分区,“ 分区” - 将整个设计阵列分为较小的区段。 一个 区段 是一组同类单元。 常常根据时间(如天或周)、地区或物料批次分组。,例: 检测4个钢样本的4种镀层 (A, B, C, D)。,分区变量一般是“ 起障碍作用”的变量。 您可以将其看作另一个独立变量。,分区的好处: 给予所有独立变量相等的机会 (公平检测) 避免混合或隐匿变量的影响 减少变差,使估测更精确,分区,在零件清洗机实例中,假设我们注重的是另一种隐藏变量可能对结果产生影响-一种我们不一定能控制的变量。 例如,有些我们不能控制的环境条件可能在一夜之间改变,如温度或湿度。 如果条件

25、的改变会影响实验结果,我们应设置实验,使某些实验在一天内完成,而其余实验在另一天完成。 照此方法,我们可以保证实验是正交的,并排除环境条件对实验的影响,而实验在统计上仍有效的。 在此例中,我们按天进行分区。我们选择在第一天进行4个实验,而在第二天进行另外4个实验。,第 1天 温度 时间 浓度- - - + + - + + -,第 2天 温度 时间 浓度- - +- + -+ - -+ + +,重复还是反复?取决于不同的情况,最好反复,但重复也很有用。,清洁过程举例: 对于每次“实验”, 将洗衣机运行一小时,以确保在抽样前的运行状态稳定。支持小组决定重复5次,并对所有样本进行残值检测。,固体残值

26、量(毫克),(接上页),创建设计(23全析因) 每个实验进行5次,分析DOE的3个图是: 主要影响图 交互作用图 立方图,我们如何分析结果?,重复的平均值的主要影响图: 第一种图是重复残值的平均值主要影响图。下面的计算是针对下一页的主要影响图:,对于每个X,观察高水平平均响应值减去低水平平均响应值的结果。,影响 -12.3 -6.7 0.3,DOE图1: 主要影响图,从残值平均值的主要影响图中,我们得出结论: 温度对平均残值影响最大 时间对平均残值影响较小 浓度对平均残值影响很小或几乎没有(在测试范围之内),这些栏中8种组合的+和- 值表示3个变量所有可能 组合的列表。,这些栏中的+和-值根据

27、 标题中的变量值 相乘得出。,下一步是确定交互作用栏的“ 影响”,交互作用栏,2个水平时独立变量间的交互作用,主要影响栏,2个水平独立变量的交互作用,65.0,60.0,55.0,50.0,45.0,平均 残值,时间,40.0,-1,+1,暖 (-1),热 (+1),交互作用图: 温度和时间对平均残值的影响,温度,(43.1),(43.5),(49.0),(62.1),有时所研究变量的影响取决于一种或更多变量的水平。在此例中: 当温度为暖时,时间对平均残值的影响很大;但当温度为热时,时间的影响很小或没有。 在测试范围内,温度为热时,无论时间怎样,部件将更清洁 (低残值)。,HOT,DOE图2:

28、 交互作用图,65.0,60.0,55.0,50.0,45.0,40.0,暖 (-1),热 (+1),交互作用图: 温度和浓度对平均残值的影响,(55.7),(55.4),(43.7),(42.9),温度,温度和浓度之间存在多大的交互作用?,浓度,现在,我们看一下温度和浓度的交互作用,65.0,60.0,55.0,50.0,45.0,平均 残值,密度,40.0,交互作用图: 时间和密度对平均残值的影响,时间,(53.9),(51.7),(47.4),(44.7),时间 = - 1,时间 = 1,时间和浓度之间存在多大交互作用?,时间和浓度交互作用图,主要影响和交互作用,56,51,46,41,

29、毫克,时间、温度和时间x温度 交互作用在测试范围内的影响最大,最大影响,浓度,高 (1),时间,温度,暖 (-1),热 (1),低 (-1),短 (-1),长 (1),(46.6),(42.8),(51.4),(43.4),(59.4),(64.8),(43),(44),DOE图3: 立方图 (续),温度 影响841522,平均值 12,在立方图中,我们可以在时间和浓度保持不变的条件下,对高低温度做4次比较。 在4次比较中,高温时产生的残值较低。 在矩形底部(短时间)温度影响要大于矩形顶部(长时间)的温度影响。对于时间和浓度的影响,可做相似的比较。,24实验立方图,X5 高,X5 低,X4 低

30、,X4 高,25实验立方图,在制定测试计划时普遍关心的是确定测试样本的数量。在第二章中我们讨论过样本容量,我们应该记得: 因为观测值会有变化,我们知道不能总相信测试一个样本得出的结果。 在下列条件下,发现差异的可能增大:样本容量(n)增大平均值()差异增大标准差() 减小 测试敏感度等于/ (用于连续数据样本容量表格中) 测试大数量样本可能耗费较高的资金和时间成本。有时较大量的样本也不容易(或不可能)收集。 目标是以较低成本测试足量的样本,以使结果拥有充分的置信度。同时达到两个目标并不总是可能。样本量的收集几乎总是在精确度和成本之间进行权衡。,DOE和样本容量,会话窗口输出结果,由于没有选中R

31、andomize runs 选项,运行顺序将与标准顺序相同。,确切的因素名称和数值按在Options 对话框中的输入而出现在工作表中。,数据窗口输出结果,记住我们进行实验的时候,包括5次重复实验。这使我们有条件分析影响变差也影响平均值的因素。5次实验的结果如下所示。将其添加到您工作表的 C7栏至 C11栏。 然后,为每次实验添加平均值和标准变差栏。用CalcRow Statistics并在C12和C13栏中存储结果。,进行实验:,您已有了数据,就该对其进行分析第一步是什么? 将其制图!,主要影响图告诉我们什么? 平均值图:我们的目的是找到产生最佳清洁效果的设置。(在本例中,响应变量是遗留残渣值

32、,因此,残渣值越小越好。)什么因素看上去对平均残渣值最重要? 什么因素看上去对平均残渣值没有影响? 标准差图:标准差看上去受时间的影响最大 ,受浓度的影响较小。 注意: 时间对均值和对标准差的影响正好相反。,平均值 标准变差,图1:残值平均值和标准变差的主要影响图,平均值残值主要影响图,温度*时间交互作用水温对残值的作用取决于时间。与两种设置的其它组合相比,暖水温和短洗涤时间这个组合导致的残渣值水平高。 温度*浓度交互作用无论洗涤剂的浓度如何,热的水温产生的残渣值较少。在测试范围内不存在交互作用。 时间*浓度交互作用洗涤时间长总是产生较小的残渣值。时间的作用在浓度低的情况下更明显。在测试范围内

33、存在一定的交互作用。,记住: 各图的Y轴总是代表响应值。栏标题代表在X轴上的因素,行标题代表图的正文。 平均残渣值的交互作用图告诉我们什么?,平均值残渣值的交互作用图,平均值残值的交互作用图,无明显 交互作用,较强的 交互作用,无明显 交互作用,温度*时间交互作用在测试范围内,温度和时间对残渣值标准差的交互作用最小。 温度*浓度交互作用在测试范围内,温度和浓度对残渣值标准差的交互作用最小。 时间*浓度交互作用时间的影响取决于浓度。它们之间存在一种很强的交互作用。较长的洗涤时间和低浓度对响应值(残渣值)的影响明显比其它组合大。当浓度高时,洗涤时间长短对响应值几乎没有影响。,残渣值的标准差交互作用

34、图,残渣值标准差的交互作用图告诉我们什么?,残渣值标准变差的交互作用图,不点击 Interaction 按钮,点击 Cube 按钮点击矩形 Setup.,返回 Factorial Plots. 主对话框(StatDOEFactorial Plots., 或按 Ctrl-e ),输入响应值: Avg Resi 和 Std.Dev.Resi选择所有因素 ,用于我们的例子 ()。点击 OK,DOE图3: 平均值和标准差的立方图,记住:立方图可以让我们很快看到产生最高和最低响应值的变量水平。 平均残渣值立方图告诉我们什么? 在立方图右面的平均残值是最低值(我们的目标)-只要温度在热水平,浓度和时间对残

35、渣值几乎没有影响(在洗涤过程中选择较少的洗涤剂和较短时间)。 你下一步会再做什么实验吗?(可能是低浓度、较短时间实验),残渣值平均值的立方图,工序的标准变差在短时间、暖和低浓度设置情况下最小。从上页中我们看到这种设置产生的残渣值最高!现在您怎样做:你需要热温度,把平均残渣值降到最低!我们可用不同的温度范围,再进行一次实验,看标准差是否仍有问题。 或者,残渣值标准差的立方图,残渣值标准差的立方图告诉我们什么?,我们可以问:我们是否可以容忍标准差 = 1? (长时间、暖温度、任何浓度时的数值),在改进阶段,我们将创建一种工序模型。模型就是工序)的数学体现Y=f(X) 。 要创建模型,可使用Mini

36、tab中的因素设计: StatDOEAnalyze Factorial Design.,既然我们观察了所有图表,让我们用数学方法分析实验设计,Minitab在缺省情况下模型包括所有项。保留缺省值,以便评估所有可能项点击“ OK”,要增加或删除项,可从模型中单击 Terms.,在主对话框,键入 响应值-让我们先从平均残值开始,我们未得到 p值 ! 这是因为与总的自由度相比,我们在模型中试图估计的变量较多。 我们必须从模型中消除不重要的项,才能估计残值误差项。注:您总是想使可利用的自由度数最大以评估误差。记住从ANOVA得出的经验,评估误差用的自由度数越小,要说明因素重要性所需要的F-临界值就越大

37、。,会话窗口中的分析结果,要确定哪些因素不重要,我们可以观察主要影响图、交互作用图以及ANOVA表中系数的相对作用。在主要影响图中,我们看到浓度似乎对平均残渣值不产生影响。,同样,我们从交互作用图中看到,浓度对平均残渣值没有明显的交互作用。,从ANOVA表中的系数,我们看到浓度,温度*浓度*,时间*浓度和温度*时间*浓度的相对影响较低。,我们从模型中消除这些项,并重新分析,相对低影响,在新模型里, 温度、时间和温度*时间交互作用都很明显。SS误差表明,尽管浓度及其相关的交互作用都综合到误差项中,我们仍可以解释工序中存在的94.6%的变差(SS误差/SS总量)。,点击Ctrl-e调出对话框,并单

38、击 Terms,用箭头删除浓度 和浓度交互作用点击两次 OK ,运行模型,正交 从数学角度看,正交指排列纵、横平衡。如果每栏中的高、低值数目相等,这种排列叫竖平衡。对每项因素的每一水平,如果所测试的其它每项因素的高、低值数均衡时,这种排列就叫做“ 横平衡”。正交是垂直性的一种测量方法。如果两列是正交,则两列点乘值为0。如果我们让两列点值相乘并相加,则其和为0。,栏,栏,栏,Run,X1,X2,X3,X1 * X2,X1 * X3,X2 * X3,1,-1,-1,-1,1,1,1,2,1,-1,-1,-1,-1,1,3,-1,1,-1,-1,1,-1,4,1,1,-1,1,-1,-1,5,-1,

39、-1,1,1,-1,-1,6,1,-1,1,-1,1,-1,7,-1,1,1,-1,-1,1,8,1,1,1,1,1,1,总计 =,0,0,0,此设计(按标准顺序)是正交的,因为所有可能列组合的点乘值=0,Response surface analysis 响应面分析,设计响应面实验,目的:在本部分中,我们将把实验设计的概念扩展到用于分析潜在的非线性关系以及优化所选择的变量。 目标: 对响应界面的实验性设计进行探讨,旨在模拟具有两个以上水平的X变量的过程。 了解何时使用响应界面设计。,二级实验,两水平全析因(2k)和部分析因(2k-1)实验用于: 确定若干个自变量中哪一个最重要 确定自变量间是

40、否存在重要的交互作用 确定两个水平中的哪一个性能更优 估计响应变量与独立变量之间的线性等式: y=b0+bixi+ bijxixj+ error,具有两个以上水平的实验,二水平析因实验无法用于对曲线关系进行估计,从而无法用于寻找最优值。Y与X间的对应关系可能为曲线,因此,使用二次等式将更为合适。 单个自变量的情况: y=b0+b1x1+ b11x12+error(注意:该等式平方项应用于x1) 两个独立变量的情况: y=b0+b1x1 +b2x2 + b12x1x2 + b11x12 + b22x22 + error 三个独立变量的情况: y=b0+b1x1 +b2x2 +b3x3 + b12

41、x1x2 + b13x1x3 + b23x2x3 + b11x12 + b22x22 + b33x32 + error,切记:任何时候,只要等式中存在二次项(平方项),那么必须对X变量进行对中变换! (参见多重回归 -第二部分第九节),对二次关系进行建模或优化的最佳方法是什么呢?,两水平实验的备择方案,让我们重新回顾一下滚筒洗衣机的实例:,如果我们猜想衣物的“ 反射度/清洁度”(“Y”变量)与洗涤时间和水量(加仑)(“X”变量)间存在二次关系,怎么办?,两水平实验的备择方案(续),记录在洗涤时间为15分钟、水量为6加仑附加实验情况下的响应值,以添加一中心点。,对衣物反射系数的非线性影响到底来自

42、于洗涤时间还是水量呢?我们无法得出结论!,一个中心点并未能提供足够的附加数据,来精确地模拟Y与X间的二次关系。,三水平析因(3k)实验给2k析因设计空间(立方体)的每一个自变量增加了一个中间点或水平。二级设计中使用-1和+1(低、高)代表测试的水平。类似地,三水平设计使用-1、0和+1(低、中、高)。以下的表格总结了用于估计二次关系的三水平设计:,三水平实验,具有三水平的3个X变量的实验设计,在33析因实验中,设计立方体上有27次实验或27个数据点: 8个因素(立方体)点 1个中心点 6个表面点 12个边缘点 共27个点,使用响应面设计,我们无须进行27次实验便可对3变量过程建模。,我们将:

43、不使用边缘点 复制中心点 将表面点外移,以创建“星”点,23因子(立方体点),表面点,边缘点,中心点,为什么使用响应面设计?,为了用尽可能少的实验运行对非模拟线性关系,一个响应面模型(RS模型)与线性模型相比能够为响应变量提供更为通用的近似。如果响应变量的确是非线性的,那么RS模型将更为适用。 如果你知道响应变量是一种非线性关系(平方、立方等),那么响应面设计将创建一个能最好拟合其相互关系的模型。 为了对过程进行优化,RS模型将生成一个等值线图,以便你能够轻松看出最优的过程设置。 如果RS模型过于复杂,可将不显著的项从模型中清除而加入误差项中,以简化模型。,回顾一下先前所讨论的33设计3个“X

44、”变量,3个水平。表面点位于设计立方体的表面,如果6个表面点都从表面向外扩张并距表面有一段称为“”的距离,那么该设计可以变换为一个5水平实验,此类响应面设计称为中心合成循环设计。,响应面模型的一个特殊案例:中心合成设计,表面点由表面移出用于创建:“星点”,中心合成设计,如果你从设计空间的中间位置观察交叉部分(立方体加上中心点和“星点”),你能够发现5个不同水平的组合(参见以下图表):,由于中心合成设计(CCD)对每一个独立变量(X)都应用了5种不同的水平,因此,它是适用于二次关系的最佳模型。,级别 说明1 -星点2 立方体点3 中心点4 立方体点5 +星点,d = distance from

45、center point to the face of the cube,22 factorial cube point,Star pointL= d x ,Star point,Center point,计算星点取值级别,“星点”到设计立方体中心的距离依照以下原则进行选择: a=(设计中立方体点的个数).25 (四次方根) 对于我们的3个变量的范例来讲,设计中存在8个立方体点(还记得原始的23全因子设计么?)。在距设计中心点的等距离处,预测响应值的变差。这称为循环性。,立方体点的个数,a=四次方根,高变化性,低变化性,为了对星点上的因素进行设置,需要确定中心点(高低立方体点的中间点)。确定两

46、点间的差值,并用该差值与中心点因数相乘。,例如: 一个使用两个X变量的实验:+1高值级别=30-1低值级别=100 中心点 =20,立方体点与中心点的差值为10。由于存在两个X变量,所以星点因子为1.4。将星点因子乘以差值,即( 1.4 )*(10),我们可以看到由中心点到星点的距离为14。因此,星点为6和34。,(6=20-14) =10 (34=20+14),复制中心点,需要大量的中心点来保证二次项的“正交性”。切记必须保证设计的正交性,以能够独立地估计各因素的影响。 这些中心点对于变差的可重复性提供了一种完全的估计。 通常建议大家复制中心点3到6次。 复制也意味着测试次数的增加。,模块化

47、,如果实验需要分两天进行,那么: 在第一天进行立方体点以及某些中心点实验。 在第二天进行星点和其他中心点实验。Minitab在你设置实验时能够将实验模块化。 为什么使用模块化? 两天的平均值的变化不会影响到对斜率的估计(系数)。,响应界面范例,在前面章节里所述的直升机范例中,我们确定机翼的宽度和长度是影响飞行时间的重要X变量。,响应界面中心合成设计实验能够用于确定最佳的机翼宽度和长度,以极大的延长飞行时间。 让我们来对这项实验进行设置:Y响应:飞行时间X1:机翼宽度X2:机翼长度,用于三个X变量的中心合成设计,三个变量的CCD允许我们: 对3个变量中的每一个测试5个取值级别。 估计三个线性项, 估计三个平方项,并 估计三个交互项, 完成以上工作只需20次实验。,范例:为以下三个X变量的实验创建一个CCD(使用两个模块),目标:估计以下参数的影响: 指标(100*异氰酸盐的摩尔数/多羟基化合物中羟基的摩尔数+水的摩尔数) 气体成分(R141b的比率,残留物为碳的二氧化物) 气体体积(标准条件下气体的摩尔数/泡沫的克数) 对于R141泡沫的抗压强度(psi)的影响。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报