1、回归分析,回归分析主要解决以下几方面的问题: 通过分析大量的样本数据,确定变量之间的数学关系式。 对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。 利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确度。,2.1 统计学上的定义和计算公式,定义:一元线性回归分析是分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想化的。其实,在现实生活中,任何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。, 研究问题 合成纤维的强度与其拉伸倍数有关,测得
2、试验数据如表9-1所示。求合成纤维的强度与拉伸倍数之间是否存在显著的线性相关关系。,2.2 SPSS中实现过程,表1 强度与拉伸倍数的试验数据, 实现步骤,图1 在菜单中选择“Linear”命令,图2 “Linear Regression”对话框,图3 “Linear Regression: statistics”对话框,与回归系数相关的统计量,异常值诊断,报告残差超过2个标准差的被试,图4 “Linear Regression:Plots”对话框,调整预测值,输出标准化残差相对于因变量的散布图,标准化残差图,对应x值的残差图,图5 “Linear Regression:Save”对话框,预测
3、值,残差,本对话框用来定义存储进入数据文件的新变量,(1)输出的结果文件中的第一部分:,2.3 结果和讨论,1)决定系数R2 它表示在因变量y的总变异中可由回归方程所解释部分的比例。 0R21, 越接近于1, 说明回归方程效果越好。,2)校正的决定系数Adj R2 05或10,严重 3) Tolence(容忍度): .1 严重,图6 “Linear Regression:Options”对话框,(1)输出结果文件中的第一部分:,3.3 结果和讨论,(1)输出结果文件中的第一部分:,3.3 结果和讨论,2)输出的结果文件中第二部分:,F检验的结果显示,三个回归方程都显著 1 H0 : B1=0
4、2 H0 : B1= B2=0 3 H0 : B1= B2= B3=0,非标准化回归方程: Y=7.337+.276Z1+e Y=14.129+.227Z1-3.301Z4+e Y=4.335+.268Z1-6.286Z4+10.188Z5+e,标准化回归方程: Y=.413Z1+e Y=.340Z1- .336Z4+ e Y=.401Z1- 6.639Z4 + .477Z5+e,多重回归的矩阵表达 1. 一般公式 2. 矩阵表示 3. 最小二乘估计,Zero-Order,零阶相关/简单相关,Part Correlation,部分相关,Part correlation Correlation
5、between Y and X1 when variable due to X2 has been partialed out of X1, but not out of Y.,Partial Correlation,偏相关,partial correlation of Y and X, controlling for other predictors. Simple correlation of Y and X, after all influences of predictors have been partialed out of both Y and X.,作业,等距、等级和分类变量的相关 一元回归 二元回归 各做一个分析,数据“作业.sav”,