1、1,第八章 方差分析与正交试验设计,单因素方差分析双因素方差分析正交试验设计,2,在科学试验和生产实际中,影响一事物的因素往往很多.例如,在药品生产中,有原料成分、原料比例、温度、时间、机器设备、操作人员水平等许多因素,每一个因素的改变都可能影响产品的质量和数量.在众多影响因素中,有的影响较大,有的影响较小. 因此,常常需要分析哪几种因素对产品质量和产量有显著影响.为了解决这类问题,一般需要做两步工作.,引 言,3,第一步是设计一个试验,使得这个试验一方面能很好地反映我们所感兴趣的因素的作用,另一方面试验的次数要尽可能地少,尽可能地节约人力、物力和时间.,其次是如何充分地利用试验结果的信息,对
2、我们所关心的事物(因素的影响)作出合理地推断. ;,前者通常称为试验设计,后者最常用的统计方法就是方差分析,1 单因素方差分析,5,方差分析按影响试验指标的因素个数进行分类,可分为:单因素方差分析双因素方差分析多因素方差分析,1 实例 例1 灯丝的配料方案选优某灯泡厂用四种不同配料方案制成的灯丝生产了四批灯泡,在每批灯泡中随机地抽取若干个测得其使用寿命(单位:小时),所得数据如表81.试问:这四批灯丝生产的灯泡,其使用寿命有无显著差异?.,一 数学模型,表81 灯泡使用寿命数据表,在这个例子里,灯泡使用寿命称为试验结果或试验指标,试验中,除灯丝外其它条件相同,灯丝的配料方案本身称为因素,四种配
3、料方案称为四个水平,因此本例称为一个因素四个水平的试验.,2 基本概念,方差分析根据试验的结果进行分析,鉴别 各个有关因素对试验结果的影响程度.,试验指标试验中要考察的指标.,因 素影响试验指标的条件.,因素,可 控 因 素,不可控因素,水 平因素所处的状态.,单因素试验在一项试验中只有一个因素改变.,多因素试验在一项试验中有多个因素在改变.,在每一个水平下进行独立试验,结果是一个随机变量,将数据看成是来自四个总体的样本值.,例1,问题分析,倘若使用寿命无显著差异,我们就可以从中选一种既经济又方便的配料方案;如果有显著差异,则希望选一种较优的配料方案,以便提高灯泡的使用寿命.,检验假设,进一步
4、假设各总体均为正态变量,且各总体的 方差相等,但参数均未知.,问 题检验同方差的多个正态总体均 值是否相等.,解决方法方差分析法,一种统计方法.,例2 设有三台机器,用来生产规格相同的铝合金薄 板.取样,测量薄板的厚度精确至千分之一厘米.得结 果如下表所示.,试验指标: 薄板的厚度,因素: 机器,水平: 不同的三台机器是因素的三个不同的水平,假定除机器这一因素外, 其他条件相同, 属于单因素试验.,试验目的: 考察各台机器所生产的薄板的厚度 有无显著的差异. 即考察机器这一因素对厚度有无 显著的影响.,例3 下表列出了随机选取的、用于计算器的四种 类型的电路的响应时间(以毫秒计).,试验指标:
5、电路的响应时间,因素:电路类型,水平: 四种电路类型为因素的四个不同的水平,单因素试验,试验目的:考察电路类型这一因素对响应时间有无显著的影响.,例4 一火箭用四种燃料,三种推进器作射程试验. 每种燃料与每种推进器的组合各发射火箭两次,得 射程如下(以海里计).,试验指标: 射程,因素: 推进器和燃料,水平: 推进器有3个,燃料有4个,双因素试验,试验目的: 考察推进器和燃料两因素对射程有无显著的影响.,数学模型,假设,单因素试验方差分析的数学模型,需要解决的问题,1.检验假设,数学模型的等价形式,检验假设,二 统计分析,1 假设检验下面我们来构造检验假设用的统计量.首先分析一下各个 为什么不
6、相等?即引起 波动(差异)的原因是什么?这里有两个原因:,其一,当假设 成立时,有 ,各个 的波动完全由重复试验中的随机误差引起.其二,当假设 不成时, ,各个 的数学期望不同,当然取值也不会一致.,因此,我们想用一个量来刻划各个 之间的波动程度,并且把引起波动的两个原因区分开来,这就是方差分析的总偏差平方和分解方法,并由此构造检验用的统计量.,数据的总平均,总偏差平方和(总变差),平方和的分解,证明:,定理一(平方和分解定理)在单因素方差分析模型中,平方和有如下的恒等式,注: 定理一的意义是将试验中的总偏差平方和分解为试验随机误差的平方和与因素A的偏差平方和.,误差平方和,效应平方和,定理二
7、 在单因素方差分析模型中,有 (1) , (2) ,此时 .,注:定理二(2)没有用到假设 ,因此不论 成立与否,定理二(2)都成立.,证明:,(2),定理三 在单因素方差分析模型中,当假设成立时,则有 (1) (2) 与 相互独立,因而, .,因此,根据定理三,当假设 成立时,单因素方差分析模型构造的检验统计量为(1.15)我们把上述统计分析过程,归纳为方差分析表,如表83,由试验数据计算得 的观察值.,表8-3 单因素试验方差分析表,若 ,则拒绝 ,即认为因素A对试验结果的影响显著;若 , 则接受 ,即认为因素A对试验结果的影响不显著.,方差分析的科学依据是什么?,例5 例1归结为检验假设
8、( )解 计算方差分析表得如下,对给定的 ,查表得 , 因为 ,所以接受 ,即这4种配料方案生产的灯泡寿命之间无显著差异.换句话说,配料方案对灯泡的寿命没有显著的影响.,注: 在这个问题中,四个总体均值的点估计分别是如果不作方差分析,只根据四个样本均值不同会做出甲种灯泡使用寿命最长的结论,但经过方差分析,发现在使用寿命上4种灯丝制成的灯泡没有显著的差别.因此.灯泡厂在选择灯丝材料时就可以从其它方面去考虑,例如在四种灯丝材料中选择能使灯泡成本较低的材料等等.,例6 设有三台机器,用来生产规格相同的铝合金薄 板.取样,测量薄板的厚度精确至千分之一厘米.得结 果如下表所示.,解,方差分析表,各机器生
9、产的薄板厚度有显著差异.,2 参数估计,(1) 的点估计由定理二,不论 成立与否, ,此时 ,所以(1.16)是 的无偏估计.,(2) ( )的点估计,因为 , ,故 (1.17)分别是 无偏估计.,(3) 的区间估计,当拒绝假设 时,常常要作出总体 和 , 的均值差 的区间估计.其做法: 由于 , 由于 与 独立,于是据此得均值差 = 的置信水平为 的置信 区间为(1.18),(4) 的点估计,若拒绝 ,这意味者效应 不全为零.由于知 (1.19)是 的无偏估计.,(5) 的区间估计,因为 ,所以 . 所以的 区间估计与 的区间估计一样.,例7,解,小结,1. 随机试验: 单因素试验、多因素试验,2. 单因素试验方差分析步骤,(1) 建立数学模型;,(2) 分解平方和;,(3) 研究统计特性;,(4) 进行假设检验;,(5) 估计未知参数.,练习1 下表列出了随机选取的、用于计算器的四种 类型的电路的响应时间(以毫秒计).,考察电路类型这一因素对响应时间有无显著的影响.,练习2 抽查某地区三所小学五年级学生的身高数据 如下表, 试判断这三所学校学生的平均身高是否有 显著差异 (取显著性水平为 0.05)?,51,其它示例:,定义 设随机试验下样本空间,定理 设 为随机事件,则有证明 可以由,性质1 .,说明,注等等,思考,练习,