1、演讲者: XXX第九章 方差分析管理 统计学Management statistics管 理 统 计 学Management statistics一、方差分析及其基本思想二、单因素方差分析三、双因素方差分析目录学习目标1. 解释方差分析的概念2. 解释方差分析的基本思想和原理3. 掌握单因素方差分析的方法及应用4. 理解多重比较的意义5. 掌握双因素方差分析的方法及应用管 理 统 计 学Management statistics方差分析方差分析就是针对一定因素( factor)分析各总体的各个因素水平( factor level)是否有差异。单因素方差分析( one-way analysis
2、of variance)针对一个因素所 进行。双因素方差分析( two-way analysis of variance)针对两个因素 进行。管 理 统 计 学Management statistics方差分析前提条件是被检验的样本为服从正态分布总体中的随机样本,各个总体的标准差相等,并且样本的选择是独立的。管 理 统 计 学Management statistics相关术语1.因素或因子 (factor) 所要检验的对象2.水平或处理 (treatment) 因子的不同表现3.观察值 在每个因素水平下得到的样本值管 理 统 计 学Management statistics相关术语4.数据的误
3、差用平方和 (sum of squares)表示,称为 方差5.水平内方差 (within groups) 因素的同一水平 (同一个总体 )下样本数据的方差 比如,零售业被投诉次数的方差 组内方差只包含 随机误差6.水平间方差 (between groups) 因素的不同水平 (不同总体 )下各样本之间的方差管 理 统 计 学Management statistics相关术语7.随机误差 因素的同一水平 (总体 )下,样本各观察值之间的差异 比如,同一行业下不同企业被投诉次数是不同的 这种差异可以看成是随机因素的影响,称为 随机误差 8.系统误差 因素的不同水平 (不同总体 )下,各观察值之间
4、的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异 可能 是由于抽样的随机性所造成的, 也可能 是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为 系统误差管 理 统 计 学Management statistics方差分析的基本思想和原理比较两类误差,以检验均值是否相等比较的基础是方差比( F分布)如果系统 (处理 )误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的误差是由各部分的误差占总误差的比例来测度的管 理 统 计 学Management statistics1234F分布方差分析中所用到的概率分布管 理 统 计 学Management sta
5、tistics单因素方差分析分析步骤:管 理 统 计 学Management statistics建立原假设选择显著性水平确定决策点计算并决策建立原假设一 般提法 : H0: m1 = m2 = = mk 自变量对因变量没有显著影响 H1: m1 , m2 , , mk不全相等 自变量对因变量有显著影响 注意 : 拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 管 理 统 计 学Management statistics选择显著性水平 显著水平不同,拒绝域也就不同,方差分析得到的结论也有可能会不同,实际中通常选择 0.05的显著水平。管 理 统 计 学Managem
6、ent statistics确定决策点F 分布F(k-1,n-k)0拒绝 H0不拒绝 H0F管 理 统 计 学Management statistics计算并决策方差分析表方差类型 离差平方和 SS自由度 df 均方 MS F值因素水平间方差SSA k-1因素水平间方差SSE n-k总差异 SST n-1管 理 统 计 学Management statistics计算并决策1.总离差平方和 SST2.因素水平间离差平方和 SSA3.因素水平内离差平方和 SSE为样本观测值;因素的 每一个的观测值之和;因素的每一个水平包含的观察值的个数 。管 理 统 计 学Management statisti
7、cs单因素方差分析的多重比较1.区间置信法 ( CID)式中, 为参加检验的两个样本中第一个样本的均值;为第二个样本的均值;的取值根据自由度 n-k可以在 t分布表中查得;MSE为因素水平内方差,根据方差分析表可以计算得到;为第一个样本中观察值的个数;为第二个样本中观察值的个数。 管 理 统 计 学Management statistics单因素方差分析的多重比较2.最小显著性差异法( LSD)公式成立,则可认为两个因素水平的样本均值有显著差异;反之,则认为两个因素水平的样本均值没有显著差异。管 理 统 计 学Management statistics双因素方差分析分析步骤 :管 理 统 计
8、学Management statistics建立 原假设和备择假设选择显著性水平确定决策点计算并决策建立原假设和备择假设H0: m1 = m2 = = mj = = mr (mj为第 j个水平的均值 )H1: mj (j =1,2, r) 不全相等管 理 统 计 学Management statisticsH0: m1 = m2 = = mi = = mk (mi为第 i个水平的均值)H1: mi (i =1,2, , k) 不全相等对 行因素提出的假设 对 列因素提出的假设选择显著性水平显著水平不同,拒绝域也就不同,方差分析得到的结论也有可能会不同,实际中通常选择 0.05的显著水平。管 理
9、 统 计 学Management statistics确定决策点 对于行因素, F临界值为: 对于列因素, F临界值为:管 理 统 计 学Management statistics计算并决策方差类型 离差平方和 SS自由度 df 均方 MS F值行因素 SSR k-1列因素 SSC b-1随机性误差 SSE (k-1)(b-1)总差异 SST n-1管 理 统 计 学Management statistics双因素方差分析表计算并决策1.总离差平方和 SST2.因素水平间离差平方和 SSR3.因素水平内离差平方和 SSC列因素的每一个水平的观察值之和; k为列因素的每一个水平包含的观察值的个数。管 理 统 计 学Management statisticsThe End管理 统计学Management statistics