1、方差、相关与回归分析,主要内容,方差分析 方差分析的过程 单因素方差分析 二因素方差分析 相关分析 相关分析的过程 回归分析 一元回归 多元回归,方差方析,方差分析是检验两个或两个以上样本均数间差异是否显著的方法。 在比较几个组时,H0假设通常是设各组平均值相等。 检验两个均数间差别的显著性可以用t检验法,也可用方差分析法。,方差分析的基本概念,样本均数间所以有差别,可能有两 种原因造成: 首先它们必须有抽样误差(个体间变异的影响; 其次,如果各组所接受的不同处理方法是有不同的作用的,那么,它也是由于处理不同所造成的。,常用的方差分析法有以下种:,单因素方差分析 多元方差分析 重复测量方差分析
2、,3. 举例,例1完全随机设计资料的方差分析(单因素方差分析) 下面列出了15名英语专业学生四次听力测验的成绩。这四次测验的内容与主题各不相同,第一次的主题是科普读物,第二次的是时事新闻,第三次的是名人轶事,第四次的是美国文化方面的短文。这四次听力考试的平均成绩是否有显著差异,即听力材料的主题与内容对考试成绩有没有影响。,表1,相关与回归,在医学上人的身高与体重、体温与脉搏次数、年龄与血压、药物剂量与疗效等均有一定的联系。说明客观事物或现象相互关系的密切程度并用适当的统计指标表示出来,这是相关分析的任务。把客观事物或现象间的关系用函数形式表示出来,则是回归分析所要解决的问题。,CORR过程计算
3、变量间的相关系数,包括PEARSON积矩相关系数等,同时给出单变量描述统计。REG过程是SAS中通用的基本的回归分析过程,它是用最小二乘法原理求解线性回归方程的有效过程。此外,因为逐步回归分析的方法在实际工作中应用甚广,故将其单独提出来介绍如何使用REG过程进行逐步回归分析。,CORR 过程,相关分析 相关是研究随机变量之间相互关系的统计分析方法,它研究随机变量之间相互关系的密切程度。 线性相关,又称简单相关。其统计指标是PEARSON 相关系数 r 。 相关分析的取值在-1与+1之间,当数值越接近+1或-1时,说明关系越密切,接近0时,说明几乎没有关系。,相关分析要回答的问题就是:变量x的一
4、组高数值是不是与变量y的一组高数值有必然的联系,或者变量x的高数值就导致了变量y的数值变低。作为根据的变量就是自变量,发生对应变化的就是因变量。,当研究多个随机变量之间的相互关系时,可对变量进行多元线性相关分析。多元线性相关的统计量是全相关系数R和各偏相关系数。在多元线性相关分析中,变量之间的关系是错综复杂的,两个变量间的简单线性相关系数往往不能正确说明两者的真实关系,只有在其它变量固定,即扣除了其它变量的影响后,计算两变量间的偏相关系数才能反映此两变量的真实情况。,当变量不服从正态分布时,例如按等级分类或相对数资料,这时需用非参数相关分析方法,如等级相关分析法等。,二变量相关分析,12名英语
5、专业学生参加了语音、听写和语法三项考试:语音考试与听写考试之间的相关程度?语音考试与语法考试之间的相关程度?听写与语法之间的相关程度?,偏相关分析(partial correlations),云南省西双版纳地区是傣族同胞聚居区,他们的母语是傣语,但那里的儿童小学开始学习汉语,上中学时又学习英语。研究人员在该地区对30名受过高等教育的傣族成年人进行了傣、汉、英三种语言水平的测试,REG 过程,回归是研究随机变量(学习成绩)和非随机变量(学习时间)之间的数量依存关系的统计分析方法。当自变量X与因变量Y之间呈直线关系时,称为直线回归。直线回归要求因变量是服从正态分布的且方差相等。,当自变量不只一个时,可进行多元线性回归分析。研究一个因变量与多个自变量之间的线性依存关系,称为多元线性回归。REG 过程是用最小二乘法原理求解线性回归方程的过程。,只有弄清楚两个变量之间存在显著的相关 关系时,才能使用直线回归模型。,举例,简单线性回归分析 某一中学高三老师在多次实践的基础上建立了一个试题库。今年年初以来,他们从该题库中提出三套试卷,对高三学生进行摸底考试。最近,高考前一个月,他们又根据今年最新考试大纲要求,设计了一份新的模拟考试,用该试卷对高三学生再次进行摸底考试。题库试题成绩在多大程度上能预测新模拟试卷的成绩。,