1、第四章 常用统计分析功能的实现,4.1 基本统计分析 4.2 均值比较与检验 4.3 相关分析 4.4 回归分析,4.1 基本统计分析,频数分布表 描述统计分析探索分析列联表,频数分布表,Frequencies对话框,Frequencies对话框,Frequencies对话框,输出结果:,本例均选系统默认项,描述统计分析,Descriptives对话框,Descriptives对话框,输出结果:,探索分析,Explore对话框,Explore对话框,输出结果:,选项均为系统默认,输出结果:,列联表,定义变量(形成数据集3),指定freq为加权变量,Crosstabs对话框,Crosstabs对
2、话框,本例中选择chi-square,Crosstabs对话框,本例中选择频数及频率输出项,输出结果:,输出结果:,第四章 常用统计分析功能的实现,4.1 基本统计分析 4.2 均值比较与检验 4.3 相关分析 4.4 回归分析,4.2 均值比较与检验,Means过程,Means过程的基本功能是分组计算,比较指定变量的描述统计量,包括均值、标准差、总和、方差等一系列单变量描述统计量,还可以给出方差分析表和线性检验结果。,Means对话框,Means对话框,输出结果:,选项均为系统默认,单一样本t检验,单一样本t检验过程是检验某个变量的总体均值与指定的检验值之间是否存在显著差异,其前提是样本来自
3、的总体应服从正态分布; 单一样本t检验过程可通过One-Sample T Test对话框实现。,One-sample T Test 对话框,输出结果:,P值=0.6530.05,应接受原假设,即可以认为该市青少年身高达到了160cm的标准。,在SPSS中, 值被定义为所对应 值分布一侧面积的双倍。因此双侧检验时,可直接比较 值与 值的大小,若为单侧检验,则需比较 值与 值的大小,独立样本t检验,独立样本t检验过程用于检验两独立总体的均值是否具有显著差异,其前提是两样本彼此独立,且其来自的总体均服从正态分布; 独立样本t检验可通过Independent-Samples T Test对话框实现。,
4、Independent-Samples T Test 对话框,分组变量,输出结果:,P值=0.1440.10,应接受原假设,即可以认为该市男女青少年的身高不存在显著差异。,配对样本t检验,用于检验两配对总体的均值是否具有显著性差异,其前提是两样本具有配对关系,且其来自的总体均服从正态分布; 实质是检验每对测量值差值变量的均值与零之间差异的显著性,若差异不显著,则说明配对变量均值之间的差异不显著; 可通过Paired-Samples T Test对话框实现。,配对样本t检验,Paired-Samples T Test 对话框,指定配对变量,输出结果:,P值=0.0020.05,应拒绝原假设,表明
5、两种促销形式对商品销售额的影响具有显著差异。,单因素方差分析,用于检验由单一因素影响的一个(或几个相互独立的)因变量按因素各水平分组的均值之间是否具有显著性差异,也可用于进行两两组间均值的比较; 前提是因变量服从正态分布; 可通过One-Way ANOVA对话框实现。,单因素方差分析,One-Way ANOVA 对话框,One-Way ANOVA 对话框,多重比较选择项对话框,对照比较选择项,指定输出统计量及缺失值处理方法,One-Way ANOVA 对话框,由于F=10.544,P值=0.0000.05,故应拒绝原假设,即可认为不同颜色饮料的销售量之间具有显著差异。,第四章 常用统计分析功能
6、的实现,4.1 基本统计分析 4.2 均值比较与检验 4.3 相关分析 4.4 回归分析,4.3 相关分析,二元变量相关分析,二元变量相关分析通过Bivariate命令项调用Correlations过程和Nonpar Corr过程来实现,可以按指定项显示变量的描述统计量,选择计算指定两变量间的相关系数,同时对相关系数进行检验等。,Bivariate Correlations 对话框,Bivariate Correlations 对话框,由于身高与体重的相关系数为0.780,P值为0.000,说明学生的身高与体重具有高度相关关系。,偏相关分析,偏相关分析通过Partial命令项调用Partial
7、 Corr过程来实现,用于计算在控制了其他变量影响的情况下,两个变量间的线性相关关系,用偏相关系数表示。,Partial Correlations 对话框,Partial Correlations 对话框,第四章 常用统计分析功能的实现,4.1 基本统计分析 4.2 均值比较与检验 4.3 相关分析 4.4 回归分析,回归分析研究的是自变量与因变量之间的非确定性的因果关系; SPSS提供的回归分析过程有:线性回归(Linear)、曲线估计(Curve Estimation)、二分变量逻辑回归 (Binary Logistic)、多分变量逻辑回归(Multinomial Logistic)、序回
8、归(Ordinal)、概率单位回归(Probit)、非线性回归(Nonlinear)、加权估计(Weight Estimation)、最优编码回归(optimal Scaling)和二阶段最小平方法(2-Stage Least Squares )。,4.4 回归分析,线性回归分析,Linear Regression对话框,Linear Regression对话框,Linear Regression对话框,(系统默认为不输出图形),Linear Regression对话框,本对话框用来定义存储进入数据文件的新变量,Linear Regression对话框,输出结果(部分):,输出结果(部分):,曲线估计,曲线估计,生产率与废品率的散点图,曲线估计,Curve Estimation对话框,输出结果(1)-直线模型,输出结果(2)-二次曲线模型,不能通过显著性检验,输出结果(3)-指数曲线模型,输出结果(4)-模型拟合图,