1、internal training,实 验 设 计 基 础,内容提要,DOE简介 正交实验 DFM(design for manufacture)简介,实验设计的意义: 应用数理统计学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。在工程学领域是改进制造过程性能的非常重要的手段。在开发新工序中亦有着广泛的应用。 在工序开发的早期应用实验设计方法能得出以下成果: 1. 提高产量; 2. 减少变异性,与额定值或目标值更为一致; 3. 减少开发时间; 4. 减少总成本;,实验设计的意义及其发展过程,实验设计的意义及其发展过程,实验设计的发展过程:试验设计
2、始于20世纪20年代,其发展过程大致可分为三个阶段: 1. 早期的方差分析法: 20世纪20年代由英国生物统计学 家、数学家费歇(R.A.Fisher)提出的,开始主要应用于农业、生物学、遗传学方面,取得了丰硕成果。二战期间,英、美采用这种方法在工业生产中取得显著效果; 2. 传统的正交试验设计法:以日本的田口玄一为代表; 3. 信噪比试验设计与三阶段设计:1957年,田口玄一提出信噪比设计法和产品的三阶段设计法。他把信噪比设计和正交表设计、方差分析相结合,开辟了更为重要、更为广泛的应用领域。 4. 谢宁法 (多变差分析,成对比较,过程参数研究),实验设计在生产/制造过程中的位置:,生產/ 制
3、造 造程,可控制因素,不可控制因素,資 源,產 品,统计技术在 生产/制造程过程 中的应用是对 过程中输入 的变量 (人,机,料,法,环) 進行有目的地优化, 使输出的結果更加理想. 实验设计 是其中较为有效的一种工程工具.,通过实验 进行优化设计,通过实验,控制其不良 的影响程度,DOE 基础培训目标,理解术语建立简单的试验解释基本结论,响应(Response): 试验输出的结果因素(Factor): 试验过程中的不同输入变量水平(Level): 试验中对因素的不同设定值.干扰(Noise):人不可控制的事物Blocking:将干扰最小化的方法主要影响(Main Effect):对单个因素而
4、言, 从一个水平到另一个水平的变化对输出的平均影响,术语,Interaction(交互作用):两 个因素合起来对总输出的影响将高于两个单独的因素造成的影响重复 (Replication): 以随机次序重新做一次试验随机化 (Randomization):以一种无固定模式的次序做试验,试 验 策 略,定义问题 确定试验目的 试验输出方式(试验) 确定试验的限制条件 选择输入因素(试验输入变量) 试验因素的水平 选择试验方案 收集数据 分析数据 得出结论 在执行结论之前,做一次确认试验 达到试验目的,试验的目的是 更好地试验真实的世界 , 而不是试验试验数据。William Diamond IBM
5、 - Retired Statistician,我将有多少种组合方案 ?,总的方案数取决于 有多少种因素 每种因素有多少水平 如果知道因素的个数及每个因素的水平数,将各因素的水平数相乘即得到方案的个数。方案 = 因素1的水平数 X 因素2的水平数 X 因素3的水平数 X 例如: 因素 水平 方案数3 2, 2, 2 2 X 2 X 2 = 83 2, 3, 3: 2 X 3 X 3 = 182 5, 5 5 X5 = 256 2, 2, 2, 2, 2, 2 2X2X2X2X2X2 = 64,确定试验限制条件,确定限制试验可采用方案数与试验次数的限制条件。试验限制条件可以是试验,钱,人力资源,
6、物质限制等。决定你将做多少次试验。结合你的试验目的,选择最佳试验设计及你可以采用的最多的试验次数。,注意: 1. 不要在第一次试验中用完你所有的资源成功的DOE 不是一次试验就能试验的,需要有反复,曲奇饼DOE,烘烤时间(A) 烘烤温度(B) 目标:改进曲奇的口味和外观,试验设计- 例子1,DOE设计及结果,烘烤时间 烘烤温度 (min) () 口味 A B 6 375 41 10 375 50 6 450 47 10 450 35,问题: 那一个因子比较重要? 如何设定重要的因子?,全因子实验示例1曲奇饼DOE,图形分析,烘烤时间 烘烤温度 (min) () 口味 A B 6(-) 375
7、(-) 41 10(+) 375 (-) 50 6(-) 450 (+) 47 10 (+) 450 (+) 35,全因子实验示例1曲奇饼DOE,定量分析,开始分析之前,用()、()号表示每一个水平,烘烤时间 烘烤温度 (min) () 口味 A B 41 50 47 35,烘烤时间 烘烤温度 (min) () 口味 A B 6 375 41 10 375 50 6 450 47 10 450 35,全因子实验示例1曲奇饼DOE,定量分析,烘烤时间 烘烤温度 (min) (oF) 口味 A B 41 50 47 35,因子的影响高水平平均值低水平平均值 在本例中,A的主要影响 42.5 - 4
8、4 = - 1.5B的主要影响 41- 45.5 = - 4.5,全因子实验示例1曲奇饼DOE,交互作用 一个因子的影响取决于另一个因子的水平,烘烤时间 烘烤温度 (min) (oF) 口味 A B AB 6(-) 375 (-) 41 10(+) 375 (-) 50 6(-) 450 (+) 47 10 (+) 450 (+) 35,全因子实验示例1曲奇饼DOE,交互作用 交互作用的水平可由因子的水平值相乘得出,烘烤时间 烘烤温度 (min) (oF) 口味 A B AB 6(-) 375 (-) 41 10(+) 375 (-) 50 6(-) 450 (+) 47 10 (+) 450
9、 (+) 35,A x B = AB 1 - x - = + 2 + x - = - 3 - x + = - 4 + x + = +,交互作用的影响AB= (41+35)/2 - (50+47)/2 = - 10.5,全因子实验示例1曲奇饼DOE,DOE结果分析总结,因子 影响 时间 1.5 温度 4.5 时间温度 10.5,内容提要,DOE简介 正交实验 DFM(design for manufacture)简介,为什么要进行正交试验:在实际生产中,影响试验的因素往往是多方面的,我们要考察各因 素对试验影响的情况。在多因素、多水平试验中,如果对每个因素 的每个水平都互相搭配进行全面试验,需要
10、做的试验次数就会很多. 比如对三个7水平的因素,如果三因素的各个水平都互相搭配进行 全面试验,就要做73=343次试验,对6个7水平的因素,进行全面试 验要做76=117649次试验。这显然是不经济的。 我们应当在不影响试验效果的前提下,尽可能地减少试验次数。正 交设计就是解决这个问题的有效方法。 正交设计的主要工具是正交表。,正交试验、正交表及其用法,正交试验、正交表及其用法,正交实验所需要的实验次数.,普通实验所需要的实验次数,为什么说正交实验节约成本,提高效率:,右图是一個比较典型 的正交表. “L”表示此为正交表, “8”表示实验次数, “2”表示两水平, “7”表示实验最多可 以有7
11、个因素 (包括单 个因素及其交互作 用).,正交试验、正交表及其用法,正交表:,正交表的表示方法:一般的正交表记为Ln(Mk),n是表的行数, 也就是要安排的试验次数; k 是表中的列数,表示因素的个数;m 是各因素的水平数;常见的正交表:2水平的有 L4(23), L8(27), L12(211), L16(215)等; 3水平的有 L9(34), L27(313)等; 4水平的有 L15(45); 5水平的有 L25(56);,正交试验、正交表及其用法,正交表的两条重要性质:1) 每列中不同数字出现的次数是相等的,如L9(34)中,每列中不同的数字是1,2,3,它们各出现3次;,正交试验、
12、正交表及其用法,2) 在任意两列中,将同一行的两个数字看成有序数对时,每种数对出现的次数是相等的,如L9(34)中有序数对共有9个: (1,1), (1,2), (1,3) ,(2,1), (2,2), (2,3), (3,1), (3,2), (3,3), 它们各出现一次。 所以,用正交表来安排试验时,各因素的各种水平的搭配是均衡的, 这是正交表的优点。,例1:(单指标的分析方法) 某炼铁厂为提高铁水温度,需要通过试验选择最好的生产方案 经初步分析,主要有3个因素影响铁水温度,它们是焦比、风 压和底焦高度, 每个因素都 考虑3个水平,具体情况见表。问 对这3个因素的3个水平如何安排,才能获得
13、最高的铁水温度?,正交试验、正交表及其用法,解:如果每个因素的每个水平都互相搭配着进行全面试验,必 须做试验33=27次。现在我们使用L9(34)正交表来安排试验。,正交试验、正交表及其用法,我们按选定的9个试验进行试验,并将每次试验测得的铁水温 度记录下来:为了便于分析计算,我们把这些温度值和正交表列在一起组成 一个新表。另外,由于铁水温度数值较大,我们把每一个铁水 温度的值都减去1350,得到9个较小的数,这样使计算简单。,正交试验、正交表及其用法,分析表:,正交试验、正交表及其用法,解释: K1这一行的3个数分别是因素A, B, C的第1水平所在的试验中对应的铁水温度之和; K2这一行的
14、3个数分别是因素A, B, C的第2水平所在的试验中对应的铁水温度之和; K3这一行的3个数分别是因素A, B, C的第3水平所在的试验中对应的铁水温度之和; k1, k2, k3这3行的3 个数,分别是K1, K2, K3这3行中的3个数的平均值; 极差是同一列中, k1, k2, k33个数中的最大者减去最小者所得的差。极差越大,说 明这个因素的水平改变时对试验指标的影响越大。极差最大的那一列,就是那个 因素的水平改变时对试验指标的影响最大,那个因素就是我们要考虑的主要因素.通过分析可以得出:各因素对试验指标(铁水温度)的影响按大小次序应当是C (底 焦高度) A (焦比) B (风压);
15、最好的方案应当是C2A3B2。与此结果比较接近的是第9 号试验。为了最终确定上面找出的试验方案是不是最好的,可以按这个方案再试验一次, 并同第9号试验相比,取效果最佳的方案。,正交试验、正交表及其用法,内容提要,DOE简介 正交实验 DFM(design for manufacture),Introduction,What is DFM? DFM is product design considering manufacturing requirements DFM is the first step in which a team approach is taken to develop t
16、he product DFM is an umbrella which covers a variety of tools and techniques to accomplish a manufacturable product Why DFM? Lower development cost Shorter development time Faster manufacturing start of build Lower assembly and test costs Higher quality,Introduction,How do all the pieces fit togethe
17、r? The objective of DFM is to identify product concepts that are easy to manufacture Focus on component design for ease of manufacture and assembly Integrate manufacturing to ensure the best match of needs and requirements. DFM in industry is typically divided into 2 main activities: A team which wi
18、ll be responsible for the product development and delivery. (cross functional team: ME, EE, MFG., CE, PE, Quality) The tools and methods to enable DFM that ensure the design meets the objectives.,DFM Product Considerations,Product Considerations Environmental Ergonomics Safety Pollution Recycling Sh
19、ock/vibration Temperature,Customer Depth of product line Customization Test requirements,Process and Tooling Cycle time Quality Ease of Assembly Ease of Testing Rework Shipping and Handling Tooling Costs,Suppliers Partnerships Supplier tolerance capability Merging mechanical sub-assemblies Costs,Int
20、roduction: Product Design,Product Design Today Development Cycle Endless engineering changes Non standard parts have long lead times Quality “Designed and thrown over the wall” Lower due to more parts, manual processes, and untested parts Customer configuration management Cost Higher due to unique d
21、esigns and specialized parts Equipment and Tooling Reliability and quality problems,DFM Typical Approach,Product Development Process Conceptual DESIGN and development Product optimization, TEST TOOL BUILD (ease of assembly) LAUNCH, ramp, ship, and deliver Product Team Product requirements and delive
22、rables Collaborative cross functional team (ME, EE, MFG, Test, Quality, etc.). Not “designed in a vacuum” Uses DFM tools and methods,Technology Roadmap Challenges,65nm Lithography OPC/PSM integr. w/ photo-window Front-end/TransistorLayout dependent performance Parametric variation,45nm LithographyLa
23、yout pattern dependence Immersion litho, OPC/PSM integration w/ photo window Front end/Transistor New gate/oxide architectures Reliability,90nm Back-end integration Low-k CMP Product ramp issues Yield vs. performance,Random defects are no longer the dominant yield loss mechanism Yields are limited b
24、y design features,The Evolution of Product Yields,DFM characterization Of IP libraries,Characterize IP library for yield Extract design attributes of yield models Include random, design systematic and litho effects New yield library view Enable hierarchical large capacity DFM chip analysis,Random Yi
25、eld Loss: Physical Mechanisms,Contact and via opens due to formation defectivity,Active, poly and metal shorts and opens due to particle defects,Random,Yield Loss Mechanisms,Type,Material opens,Material shorts,Random Yield Loss: Test Structures,Extract Metal layer open and short defectivity,Extract
26、Metal layer open and short Defect Size Distribution (DSD),Systematic Yield Loss: Physical Mechanisms,Misalignment, line-ends/borders,Contact/via opens due to local neighborhood effects (e.g. pitch/hole size),Leakage from STI related stress,Impact of micro/macro loading design rule marginalities,Syst
27、ematic,Yield Loss Mechanisms,Type,Printability Yield Loss: Physical Mechanisms,Material opens,Poor contact coverage due to misalignment and defocus/pull back,Systematic,Yield Loss Mechanisms,Type,Poly/Metal shorts,Printability Yield Loss: Modeling,Layout Metric,Misalignment,Mask Error,Defocus,Exposu
28、re,Yield Loss,coverage,BEOL1 CV Test Chip Experiment Design Strategy,Baseline high resolution on typical design-rule compliant structures Defect Size distribution for metal opens and shorts at and above design rule Fail rate for via and via stacks with typical product environments Defect localizatio
29、n on stacked layers to enable accurate Defect Source Analysis Sub-Chip level break-down to enable edge defectivity observability from different layers 75% of the die area is dedicated to estimating baseline fail rates Margin Measure impact of environment on via fail rates and systematic opens and sh
30、orts Characteristics of via environment in metal and via layers Process-design interactions for opens and shorts at edges and corners Impact of contact processing on M1 shorts Impact of lower metal layer density and width on upper metal layer shorts and opens Measure impact of misalignment on yield
31、and parametric responses Parametric Impact of environment on Metal Rs and Via Rc CMP and Lithography effects for metal Rs Via environment effects,Baseline Improvement Experiment Summary,Metal Rs baseline extracted using Van der Pauw structures Metal kelvins can be used for this purpose when Parametr
32、ic test is not performed Metal Defectivity consists of two types of structures Stacked M1/M2/M3 combSnakes are SEMVision compatible for defect localization NEST structures stacked on top of V1 chains and under V2 chains to extract defect size distribution (not SEMVision compatible) Both structure ty
33、pes can be tested for inter-layer shorts Via and Stack baseline Via chains to mimic typical environments and configurations Process Margin variants Baseline DOEs include “PXMargin” variations which are used to test the effect of process variation on baseline performance (misalignment) These portion
34、of the experiments is analyzed with the process and pattern margin experiments,BEOL1 CV Reticle Floorplan,10700,10700,10700,Client will ensure that internal scribe widths are the same as external scribe widths as shown in diagram to left.Having the same width for internal and external scribes is cri
35、tical to “essential set” testing and edge observabilityA and B to be determined,BEOL CV Defect Density Observability: Spatial Resolution,Select defectivity structures will have identical placement in each block. (Essential Sets) High spatial resolution for defectivity Allows for defectivity testing
36、of partial die along wafer edge.,Partially Printed Die,Structures with identical placement in each block still testable on this block,Structures with identical placement in each block.,Will require 2 pass testing on pdFastest Essential set (Includes partial die at edge) Fully printed die (excluding
37、the Essential set),2,1,3,4,Definitions,PXMargin = “Process Margin” Intended to characterize the effects of process variations on the baseline performance MAL = Misalignment, Vertical runner, lateral direction MAI = Misalignment, Vertical runner, inline direction LWM = Line width margin LSM = Line sp
38、ace margin NOM = with-in ground rulecellOrientation V = Vertical structure orientation parallel to padframe H= Horizontal structure orientation perpendicular to padframeppb = parts per billion or failures per billion Do = defect density in defects/cm2 Fail rate = probability of failure in ppb,谢谢大家,A
39、ppendix:,第一节:问题的提出 第二节:单因素试验的方差分析 第三节:双因素试验的方差分析 第四节:因子设计的一般概念 第五节:2k 因子设计 第六节:3k 因子设计,方差分析和2k因子、3k因子设计,Appendix:,第一节:问题的提出,先看一个例子: 考察温度对某一化工厂产品的得率的影响,选了五种不同的度, 同一温度做了三次试验,测得结果如下:要分析温度的变化对得率的影响,总平均得率=89.6%,第一节:问题的提出,从平均得率来看,温度对得率的影响? 1) 同一温度下得率并不完全一样,产生这种差异的原因是由于试 验过程中各种偶然性因素的干扰及测量误差等所致,这一类误差 统称为试验误
40、差; 2) 两 种温度的得率在不同的试验中的倾向有所差别。如 65oC 与 70oC相比较,第一次65oC比70oC 好,而后二次70oC比65oC 好。 产生这种矛盾的现象也是由于试验误差的干扰。由于试验误差的存在,对于不同温度下得率的差异自然要提出疑 问,这差异是试验误差造成的,还是温度的影响呢?,第一节:问题的提出,1) 由于温度的不同引起得率的差异叫做条件变差;例中的全部15个数据,参差不齐,它们的差异叫做总变差(或总离差)。产生总变差的原因一是试验误差,一是条件变差。 2) 方差分析解决这类问题的思想是: a. 由数据的总变差中分出试验误差和条件变差,并赋予它们的数量表示; b. 用
41、条件变差和试验误差在一定意义下进行比较,如两者相差不大,说明条件的变化对指标影响不大;反之,则说明条件的变化影响是很大的,不可忽视; c. 选择较好的工艺条件或确定进一步试验的方向;,第一节:问题的提出,变差的数量表示: 有n个参差不齐的数据 x1, x2, , xn, 它们之间的差异称为变差。 如何给变差一个数量表示呢? 1) 一个最直观的想法是用这n个数中最大值与最小值之差,即极差来表达,用R记之; 2) 变差平方和,以S记之。S是每个数据离平均值有多远的一个测度,它越大表示数据间的 差异越大。,其中,第一节:问题的提出,对变差平方和的进一步讨论: 例:测得某高炉的六炉铁水含碳量为: 4.
42、59,4.44,4.53,4.52, 4.72,4.55,求其变差平方和。,第一节:问题的提出,对变差平方和的进一步讨论(2): 我们看到S的计算是比较麻烦的,原因是计算x时有效位数增加了 因而计算平方时工作量就大大增加。另外,在计算x时由于除不 尽而四舍五入,在计算S时,累计误差较大。为此常用以下公式:,对于前面的例子,第一节:问题的提出,对变差平方和的进一步讨论(3): 这样计算虽然计算误差较小,但工作量还较大,因此常采用如下 的办法: 1. 每一个数据减(加)去同一个数a, 平方和S仍不变。 如在此例中令 ,即每个数同减去4.50,这时与以上结果是完全一样的。,第一节:问题的提出,对变差
43、平方和的进一步讨论(4): 2. 每一个数据乘(除)同一个数b, 相应的平方和S增大(缩小)b2倍。 如在此例中令 , 则相应数据变为9, -6, 3, 2, 22, 5, 这时把原来的平方和S放大了1002倍。,第一节:问题的提出,自由度的提出: 例2:在上例的基础上在同样的工艺条件下又测了四炉铁水,它 们是:4.60, 4.42, 4.68, 4.54, 加上原来的六炉共十炉,求其平方 和。将数据减去4.50然后乘上100得,第一节:问题的提出,自由度的提出(2): 平均数与过去的结果是相近的,但平方和是显著地变大了。我们 要设法消除数据个数的多少给平方和带来的影响。 一个直观的想法是用平
44、方和除以相应的项数,但从数学理论上推 知这不是一个最好的办法,而应把项数加以修正,这个修正的数 就叫做自由度。,第一节:问题的提出,自由度的提出(3): 设有n个数y1, y2, , yn, 它们的平方和 的自由度是多 少呢? 这就看yi 之间有没有线性约束关系,如果有m个(0mn) 线性约束方程a11y1+a12y2+ +a1nyn = 0a21y1+a22y2+ +a2nyn = 0am1y1+am2y2+ +amnyn = 0 并且这m个方程相互独立,即方程系数矩阵的秩等于m, 则S的自 由度是n - m.,第一节:问题的提出,自由度的提出(4): 根据这个定义,如令yi = xi -
45、x (i=1, 2, , n) 则 显然 yi之间有一个线性约束关系,即即m = 1, a11 = a12 = = a1n = 1 所以变差平方和的自由度 = n - m = n - 1,第一节:问题的提出,均方的概念: 平均平方和(简称均方)等于变差平方和除以相应的自由度f. 平均平方和以MS表示, 它的开方叫做均方差 对例1、MS = 0.043483/5 = 0.0086966, 均方差为0.09326 对例2、MS = 0.07949/9 = 0.0088322,均方差为0.09398 我们看到六炉和十炉的MS是很相近的,这与工艺条件相同是吻 合的,说明用MS反映波动的大小是更为合理的
46、。,假设: 单因素A有a个水平A1,A2, , Aa,在水平Ai (i=1, 2, , a)下,进行ni次独立 试验,得到试验指标的观察值列于下表:我们假定在各个水平Ai下的样本来自具有相同方差2,均值分别为i的正 态总体XiN(i , 2 ),其中i , 2均为未知,并且不同水平Ai下的样本之间 相互独立。可以取得下面的线性统计模型: xij = +i +ij , i = 1, 2, , a; j = 1, 2, , ni, ij N (0, 2) 其中i = i -,第二节:单因素试验的方差分析,方差分析的任务就是检验线性统计模型中a个总体N(i,2)中 的各i的相等性,即有:原假设 H0
47、: 1 =2 = =a 对立假设H1: i =j 至少有一对这样的i, j, 也就是下面的等价假设: H0: 1 =2 = =a = 0 H1 : i = 0 至少有一个i,第二节:单因素试验的方差分析,总离差平方和的分解: 记在水平Ai 下的样本均值为样本数据的总平均值为总离差平方和为将ST改写并分解得,第二节:单因素试验的方差分析,总离差平方和的分解(2): 上面展开式中的第三项为0 若记 SA=SE=则有: ST = SA + SE ST表示全部试验数据与总平均值之间的差异 SA表示在Ai水平下的样本均值与总平均值之间的差异, 是组间差 SE表示在Ai水平下的样本均值与样本值之间的差异,
48、 是组内差,它是由随机误差引起的。,第二节:单因素试验的方差分析,自由度的概念:在实际计算中,我们发现在同样的波动程度下,数据多的平方和要 大于数据少的平方和,因此仅用平方和来反映波动的大小还是不够 的。我们要设法消去数据个数的多少给平方和带来的影响。为此引 入了自由度的概念。一个直观的想法是用平方和除以相应的项数, 但应把项数加以修正,这个修正的数就叫自由度。 ST的自由度为 ( n - 1); SE的自由度为 ( n - a); SA的自由度为 ( a - 1);均方: MSA = SA/ (a-1); MSE = SE/ (n-a),第二节:单因素试验的方差分析,方差分析: 在H0成立的条件下,取统计量 F = MSA/MSE F (a - 1, n - a) 对于给出的,查出F(a - 1, n - a)的值, 由样本计算出SA和SE, 从 而算出F值。从而有如下判断:若F F (a - 1, n - a),则拒绝H0; 若F F(a - 1, n - a),则接受H0为了方便计算,我们采用下面的简便计算公式: 记 i= 1, 2, , a, 则有,