1、基本统计分析的报表制作,SPSS提供了基本统计分析的报表制作功能,根据报表制作的侧重点不同,分为3种:,个案简明统计报表(Cases Summary):计算指定变量的分组统计量。,行形式报表(Report Summaries in Rows):以行为对象生成各种统计结果。,列形式报表(Report Summaries in Columns) 以列为对象生成各个列相应的统计信息。,某公司两个部门共有20名员工,收集到员工的基本工资、奖金和分红信息,生成个案简明统计报表,数据如下:,Page 1 部门 基本工资 奖金 分红_ _ _ _ 0 Mean 836 1155 518 Minimum 80
2、0 1000 400 Maximum 1000 1500 800 1 Mean 911 1144 522 Minimum 800 1000 400 Maximum 1100 1500 800 Grand Total Mean 870 1150 520 Minimum 800 1000 400 Maximum 1100 1500 800,Page 1基本工资 奖金 分红 部门 Mean Mean Mean Total _ _ _ _ 0 836 1155 518 25091 911 1144 522 2578,某公司两个部门共有20名员工,收集到员工的基本工资、奖金和分红信息,生成个案简明统计报
3、表,数据如下:,Analyze菜单Reports中选择Case Summaries命令,个案简明统计表的SPSS实现过程:,Display cases复选框,将显示个案信息,包括:,Limit cases to first:显示前面的一些个案信息。,Show only valid cases:仅显示准确的个案信息。,Show case numbers:显示个案顺序号。,样本数据的分布特征,一、峰度(Kurtosis),二、偏度(Skewness),峰度(Kurtosis),偏度(Skewness),峰度大于0表示比正态分布高峰更加陡峭,为尖顶峰;反之,峰度小于0,为平顶峰。,偏度为0,表示数据
4、分布形式与正态分布偏度相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一长尾巴拖在左边;反之,小于0表示负偏差数值较大,为负偏或左偏,即有一长尾巴拖在右边。,行形式报表的SPSS实现过程:,Analyze菜单Reports中选择Report Summaries In Rows命令.,Blank Lines before Summaries:分组标签和报告内容之间的间距,最多为20行空白区。,Options对话框用于页面控制,其中:,Skip lines before break:在后面的框中行间距数值,最多为20行的空白区。,Begin next page:在新的一页开始下一个分组变量的
5、输出。,Begin new page&reset page number:在新的一页开始下一个分组变量输出,并重新设置下一个页面页码。,Page 1 部门 基本工资 奖金 分红 0 Mean 836 1155 518 Minimum 800 1000 400 Maximum 1000 1500 800 1 Mean 911 1144 522 Minimum 800 1000 400 Maximum 1100 1500 800 Grand Total Mean 870 1150 520 Minimum 800 1000 400 Maximum 1100 1500 800,列形式报表的SPSS实现
6、过程:,Minimum of columns:各列变量值中的最小值。,Maximum of columns:各列变量值中的最大值。,column column:第一列变量的值减去第二列变量的值。,column/ column:第一列变量的值除以第二列变量的值。,% column/ column:第一列变量的值除以第二列变量的值再乘以100。,Product of column:各列变量的乘积。,Page 1基本工资 奖金 分红 部门 Mean Mean Mean Total _ _ _ _ 0 836 1155 518 25091 911 1144 522 2578,多选项问题,就是一个问题的
7、答案都是顺序变量或名义变量,并且允许选择的答案可以有多个问题,如考试中的多选题。,多选项分析,多选项分类法(Multiple Category Method),多选项二分法(Multiple Dichotomies Method),多选问题的分解(编码方案)的方法有两种:,由于多选项问题的答案不只一个,因此需要设计一个编码方案对原问题进行重新编码,即将一个问题转换成多个子问题,设置多个SPSS变量分别存放几个答案。,将每个可能的答案都设置为一个SPSS变量,变量的取值有两个:选中和没选中。,多选项二分法 (Multiple Dichotomies Method),该方法的缺点:需要的变量数比较
8、多,如一道题有6个选项,则一道多选题目就需要有6个变量来表示。,该方法的优点:比较简单。,例题,Match Variables across response sets项,表示如果交叉列联表的行、列变量均为多选项变量时,第一个变量集中的第一个变量和第二个变量集中的第一个变量作交叉分组,第一个变量集中第二个变量和第二个变量集中的第二个变量作交叉分组,以此类推。,该方法进行普通的频数分析或交叉列表分析时,可能无法达到要求,如要了解某选项的选中次数需要将3个变量中该选项的次数累加,而不仅仅是一个变量中该选项的累加。为此,SPSS提供了多选项分析方法,专门针对多选项问题。 SPSS在处理的过程中会自动
9、的将3个变量中相同答案的频率累加起来。,多选项分类法(Multiple Category Method),首先估计多选项问题可能出现的答案。如一个多选题最多有3个答案,则就设置3个SPSS变量,分别存放3个可能的答案,如某个案的答案只有2个,那么第3个SPSS变量取值为缺失值。,例题,样本数据的基本特征,图形表示,频次与频率,计算,延伸,累计频次与频率,样本数据的位置特征,对数据的 离散描述,对数据的集中描述,点状描述,区间描述,样本数据的特征,样本数据的综合特征描述箱型图,样本数据的分布特征峰度和偏度,1.饼图(Pie Chart),(1)适用范围:适用于所有测度级别的数据。,(2)SPSS
10、实现:,Analyze,Graphs,Chart,Frequencies,Descriptive Statistics,Pie,2.条形图(Bar Chart),(1)适用范围:适用于顺序级以上的数据,也可以“强行”用于名义级。,(2)SPSS实现:,Analyze,Graphs,Chart,Frequencies,Descriptive Statistics,Bar,(2)SPSS实现:,3.直方图(Histogram),(1)适用范围:适用于顺序级以上的数据。,Graphs,Histogram,Explore,Analyze,Descriptive Statistics,Frequenci
11、es,Descriptive Statistics,Analyze,(3)与条形图的关系:条形图是直方图的特例。,Factor levels together :为每个因变量生成一个箱形图,比较同一因变量在分组变量值不同水平上的分布情况。 Dependents together:所有因变量生成一个箱形图,比较分组变量同一水平上各个因变量值的分布情况。,图1 男生身高数据普通箱形图,图2 男生身高数据修正箱形图,(3)“茎节”的宽度,确定原则:,茎节是有变化的,123,1.23,茎节宽度为100,12.3,茎节宽度为10,样本值=“茎节.叶”表达“茎节”的宽度,(4)茎节的长度,茎节长度=“允许
12、的最大叶值最小叶值+1”。,茎节长度=,4.茎叶图,(1)适用范围:适用于顺序级以上的数据。,(2)基本含义:,某班级男生的身高数据(单位:厘米),(5)SPSS实现:,Analyze,Descriptive Statistics,Explore,某商品价格(单位:元) Stem-and-Leaf PlotFrequency Stem & Leaf1.00 99 . 31.00 99 . 53.00 99 . 6777.00 99 . 88899998.00 100 . 000011115.00 100 . 223334.00 100 . 44551.00 100 . 6Stem width: 0.1000Each leaf: 1 case(s),