1、二零一二年四月二十二日,SPSS统计分析基础教程,目录,SPSS数据的基本操作,Statistic pakage for social science 认识SPSS基本界面 SPSS数据运行的基本步骤 如何对数据文件进行操作(打开其他类型的数据文件、保存等),SPSS界面,数据输入页面,变量定义页面,文件(File) 编辑(Edit) 视图(View) 数据(Data) 转换(Transform) 统计分析(Analyze ) 作图(Graphs) 工具(Utilities) 窗口转换(Windows) 帮助(Help),SPSS运行的基本步骤,单击Variable View 进入;,单击,
2、定义 变量 名,单击,定义变量类型,定义变量标签,变量标签值,定义测度层次,定义变量宽度,定义对齐方式,定义变量定义缺省值,SPSS运行的基本步骤,图标,菜单栏,标题栏,输入数据栏,数据显示区: 变量名 观察序号,数据录入页面(Data view),SPSS运行的基本步骤,a key step数据统计,所有的最终生成的分析结果都由“数据分析”这一个菜单项目来设置,包括检验所抽取的样本是否具有代表性,包括分析频数、百分比、数据集中还是分散、数据是否呈正态分布等,SPSS运行的基本步骤,输出结果(output),目录树,输出数据表,输出图表,频数,百分比,有效百分比,累加百分比,SPSS运行的基本
3、步骤,SPSS只是工具,关键是分析输出结果!,目录,数据的频数分析,频数分布表 Spss频数分析操作 频数分析可输出的图形,频数分布表,频数 百分比 有效百分比 累计百分比,可以利用SPSS迅速查找出某一个具体百分比处的数据在什么地方,图形输出,图表设置按钮,条形图,饼图,生成正太曲线,图形类型,条形图,饼图,直方图-以矩形面积来表示变量频数(一般用于分组数据),目录,数据的描述性统计,描述数据集中趋势的统计量 描述数据离散趋势的统计量 在Spss中进行数据的描述性统计,分析数据的集中趋势,测量一组数据分布是否集中和集中在哪里的因素有: 众数(mode):一组数据中出现频数最多的变量值 平均数
4、(mean) 中位数(medium):一组数据按频数从小到大排列,位于中间的变量值,众数、平均值、中位数取值相同,众数,中位数,平均数,众数,中位数,平均数,分析数据的离散趋势,当一组数据比较分散且各观察值之间的差异性较大时,就需要分析数据的离散趋势。 极差 四分位差 方差 标准差 标准差系数,最常用的两种方式,方差和标准差的作用在于:当两组数据均值相同时,可以通过SPSS软件直接得出的方差和标准差来分析出这两组数据哪一组的差异性比较大,其均值是否具有代表性。,SPSS中对于数据的描述性统计,体现数据集中趋势的变量,体现数据离散程度的变量,目录,数据的分组比较,分组的两种情况 在spss中进行
5、变量的组间比较,分组的两种情况,用一个自变量进行分组,用两个或多个自变量进行分组,在spss中进行变量的组间比较,Analyze Compare Means Means,若要添加多个变量,点击此按钮,因变量,自变量,输出结果一元方差分析表,在做分析前默认假设为:学生的分数按照性别来分是没有差异的。 从上述分析结果可以看出:显著性水平高于0.05,即接受原假设,也就是说分析的结果是: 分数不会因为性别差异而有差异,根据性别将分数分组是没有意义的。,显著性水平,目录,数据的交互分析,交互分析表 在交互表中添加控制变量 在spss中进行交互分析,交互分类表,横排变量,竖排变量,交互分类:顾名思义,就
6、是用来分析两个变量之间关系的方法,在交互表中添加控制变量,控制变量,在spss中进行交互分析,Analyze Descriptive Statistics Crosstabs,数据设置,升序和降序排列,目录,一元方差分析,方差分析用来检验按某个标准分成的N个组中的样本是不是来自于一个正态总体。 原假设:这N个组的数据的平均值不具有差异 备择假设:这N个组的数据的平均值具有差异 若显著性水平(sig)大于或等于0.05,则接受原假设,若小于0.05,则拒绝原假设Analyze Compare Means One-way ANOVA,在spss中操作一元方差分析,在做分析前默认假设为:学生的分数按
7、照性别来分是没有差异的。 从上述分析结果可以看出:显著性水平高于0.05,即接受原假设,也就是说分析的结果是: 分数不会因为性别差异而有差异,根据性别将分数分组是没有意义的。,目录,散点图,简单散点图 最常使用 向日葵散点图 矩阵散点图 重叠散点图 三维散点图 旋转三维散点图,在spss中绘制简单散点图,Graphs Scatter/Dot,Y轴变量,X轴变量,纵向分组,目录,利用样本数据推断总体是否符合正态分布的方法,图示法: P-P图 Q-Q图 直方图 盒须图 茎叶图 统计方法: 计算偏度系数和峰度系数 K-S检验,最常用也最简便(前面已提到),最常用也最简便,K-S检验,单样本K-S检验 双样本K-S检验 多样本K-S检验 配对样本K-S检验,最常用,单样本K-S检验,在总体分布未知的情况下,利用样本数据对总体的分布形态进行推断。 基本假设Ho:总体服从正态分布。 Asymp. Sig值小于0.05,则接受基本假设,也即总体服从正态分布 Analyze Nonparametric tests 1-Sample K-S,Asymp.sig值大于0.05,说明此数据所代表的总体不呈正太分布,The End,