1、第二节:利用SPSS进行统计描述,在经济与管理等学科的研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总体水平与分布状况做出评价判断。因此,必须采用一些适当的方法对这些资料进行处理,使之简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做出客观的评价。,统计描述方法,是研究简缩数据并描述这些数据的统计方法。将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。,一、数据资料的整理和表示,1、数据检查,主要检
2、查数据的完整性与正确性。统计资料完整性的检查,就是要根据调查项目检查是否填写齐全,避免遗漏,删去重复。正确性检查,就是检查搜集的资料是否真实可靠。特别是统计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。,2、数据分类,数据分类就是把搜集来的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混淆,一般又可分为品质分类和数量分类。,品质分类:是按事物性质划分为不同的组别、种类。,数量分类:是按数量的属性分类。,如企业规模的大、中、小; 成绩的优、良、中、及格、不及格;,如:收入层次:1000以下、10003000、30005000、50007000、7000以上,例:将“高数
3、”百分制转化为中文五级制, 调入“09110311-312成绩.sav” SPSS数据文件;, 按照Transform Recode Into defferent Variables 调出分级模块,出现如下对话框,在对话框左侧的原变量中选取“高数” 变量,单击向右箭头按钮,将其送入Numeric Variable框中,在Output Variable的Name中输入分组变量名“高数等级” ,在Label中输入“高数成绩分组” ,单击Change。,单击Old and New Values出现下面的对话框。按图示进行分组,先在Old Value中Range:Lowest through中输入59
4、,在New Value的Value中输入1,在Old New栏单击Add按钮(表明59分以下的是第1组),下面以此类推,最后单Continue。,点击按钮,则多出一变量列“高数等级”,调整小数位数为0后得:, 在Variable View页面点击Value定义变量级别,出现下面对话框, 如图所示定义“1=不及格”、“2=及格”、“3=中”、“4=良”、“5=优”,分别按Add按钮;,3、数据的排序,数据排序是将各数据从大到小或从小到大进行排列。,【例】将“西经”成绩从高到低排序。, 选择“DataSort Cases”命令,弹出“Sort Cases”对话框, 把“西经”变量选入“Sort b
5、y”中,并在Sort Order中选择“Descending(降序)”选项,将学生成绩按降序排列, 点击按钮,得排序结果,4、数据统计表,就是把所研究的教育技术现象和过程的数字资料,以简明的表格形式表现出来。它可以避免文字的冗长叙述,便于比较各项目之间的相互关系,便于总计、平均和其他统计值的计算,便于检查计算错误和项目遗漏。,注:后面叙述,5、数据的图示法,数据的图示法是利用几何图形或其他图形等的描绘,把所研究对象的特征、内部结构、相互关系和对比情况等方面的数据资料,绘制成整齐简明的图形。它是用以说明研究对象和过程的量与量之间对比关系的一种方法。它能准确地表现统计资料,有助于对统计资料进行比较
6、、对照、分析和研究。图示法,具有直观、形象,便于记忆和思考以及表达语言难以说清的内容之优点。,【例】将“电话通话情况.SAV”调入数据窗,输出“电话区间”的频数图,利用菜单中“GraphsBarSimple”绘制单一条图,(1)条图,再选择“GraphsBarClusteredf” 绘制综合条图,再选择“GraphsBarstacked” 绘制综合条图,(2)饼图,利用菜单中“GraphsPieSummaries for groups of cases”绘制饼图),(3)线图,利用菜单中“GraphsLine Summaries for groups of cases”绘制线图,(4)直方图,
7、利用菜单中“GraphsHistogramVariable”电话通话次数 Display normal curve绘制直方图),(5)散点图,【例】将“时间序列.SAV”调入数据窗,输出“能源消耗”的散点图,如下图利用菜单中“GraphsScatterSimple ”绘制直方图,二、频数分析及特征参数的计算, 简单统计指标,最大值、最小值、组距(极差)、频数(frequency)、累计频数、频数比例、累计频数比例、百分比、累计百分比, 定距变量的集中趋势统计指标,众数(众值,mode):频数最多的变量值 中位数(中位值,mediam):将一系列数值由小到大排列,位于中间位置的那个数值 平均数(
8、均值,mean):是综合性最强的中心测量尺度,它涵盖了所有的个体值,在没有极端值的情况下,用平均数代表中心趋势最合适,而如果由极端值存在,则用中位数更适合。,(1)统计分析背景知识,定距变量的离散趋势统计指标,极差(range):最大值与最小值的差 四分位差(quartiles):用对应于累计频率为75的变量值和对应于累计频率为25的变量值相减而得 方差(variance)与标准差(std.deviation):表示分布对平均数的偏离程度或伸展程度 方差:观测值与其均值之差的平方和除以全部观测总数N 标准差:方差的平方根,(2)简单数列频数分析, 调入“09110311-312成绩(分类).s
9、av” SPSS数据文件,输出“高数”的频数分布; 选择“AnalyzeDescripitive Statistic Frequencies” ,弹出对话框,在对话框左侧的原变量中选取选中“高数”变量,单击向右箭头按钮,将其送入Variable(s)框中;,选中“Display frequency tables”复选框,表示显示次数分布表。,选择需要分析的项目:mean, medium, sum, std.deviation, variance, range,按continue,回到Frequencies对话框;,再单击Charts 按钮,进行图的设置,显示Frequencies: Chart
10、s对话框,选择“Histograms”(直方图)和“With normal curve”(带有正态曲线)两项,按continue,, 单击Statistic按钮,显示Frequencies: Statistics对话框;, 回到Frequency对话框,单击OK,得描述统计结果。,频数分布结果:,注:此方法更适合分组数据的频数显示,频数分布图:,【例】“高数成绩分组”数据的频数分析,在Frequencies对话框左侧的原变量中选中“高数成绩分组”变量,单击向右箭头按钮,将其送入Variable(s)框中;, 单击Statistic按钮,将Frequencies: Statistics对话框内清
11、空,单击Charts 按钮,选择“Histograms”(直方图)和“With normal curve”(带有正态曲线)两项,按continue,确定。,(3)原始数据的描述统计量的计算, 调入“09110311-312成绩(分类).sav” SPSS数据文件,输出“高数”的描述统计量;, 利用菜单中“AnalyzeDescriptive StatisticsDescriptives”求描述统计量,出现如下对话框, 选取 “高数”变量,将其送入Variable(s)框中;, 单击Options按钮,显示对话框;选择需要分析的项目,点击“Ccntinue”,再点OK按钮,输出结果,各科成绩综合
12、结果显示, 选取 “高数、西经、英语口语、英语听力、英语阅读、计算机、近纲、体育”变量,将其送入Variable(s)框中;,(4)数据的“数据探测”, 调入“09110311-312成绩.sav” SPSS数据文件,输出“班级与高数”的统计结果,, 利用菜单中“AnalyzeDescriptive StatisticsExplore”,出现如下对话框,如图选择“高数”送入Dependent List对话框,选择“班级”送入Factor List对话框;点击OK,输入结果,输出结果,(5) 按类别计算描述统计量,SPSS提供的Descriptives过程仅仅可以计算单一组别的均数和标准差,Me
13、ans过程也可同样实现;但若用户要求按指定条件分组计算均数和标准差,如分性别计算各组的均数和标准差,则用Means过程更显简单快捷。,分类计算描述统计量的步骤:, 调入“09110311-312成绩.sav” SPSS数据文件,输出“高数”的描述统计量;, 利用菜单中“AnalyzeCompare MeansMeans” 分组求均值,出现如下对话框,如图选择“高数”送入Dependent List对话框,选择“班级”送入Independent List对话框;,点击“Ccntinue”,再点OK按钮,输出结果,单击Options按钮,显示对话框;选择需要分析的项目,如进一步“分班级”同时“分性
14、别”计算, 在如下对话框中,点击“Next”,将“性别”送入右框中,确定后,输出如下结果,注:可利用此指令进行进一步差异性检验,(6)数据拆分, 调入“09110311-312成绩.sav” SPSS数据文件,欲分别输出1班和2班的“高数”统计结果,,选择“DataSplit File”命令,弹出“Split File”对话框,激活“Organize by group”选项,选择“班级”变量进入“Groups Based on”栏目,最后激活“Sort the file by grouping variables”选项,单击“OK”按钮。,计算统计量, 与计算总平均分与标准差相同,选择“Ana
15、lyzeDescripitive StatisticDescripitives,从左侧将“高数”变量选入“Variables”栏中。单击“OK”按钮,提交运行,输出结果如下所示,(7)交互分析的描述统计量, 对“09110311-312成绩.sav” ,欲输出“班级与高数等级”的交互分析结果;,利用菜单中“AnalyzeDescriptive StatisticsCrosstabe” ,出现如下对话框,如图所示选择变量和选项,输出结果如下,更进一步, 若单击“Cells”,弹出Crosstabs:Cell Display对话框,选择Percentages中Total选项,确定后,得如下形式结果
16、。,(8)“多项选择的频数分布” 步骤,将“手机问卷统计表.SAV”调入数据窗,输出“平时常用的交往方式”的频数表,利用菜单中“AnalyzeMultiple ResponseDefine Sets”定义Group R(label:交往方式),出现如下对话框,如下图一样将变量送入Variables in Set中,形成一个变量群,不妨命变量名为T,说明为“交往方式”,其它如图所设,单击Add按钮,单击Close。, 再选择“AnalyzeMultiple ResponseFrequencies”进行频数统计,出现如下对话框。, 将变量“交往方式”送入Table(s) for中,单击OK。,输出结果如下:,Pct of Pct of Dichotomy label Name Count Responses Cases 电话 T01 1091 22.9 54.8 会面 T02 757 15.9 38.0 书信 T03 74 1.6 3.7 手机短信 T04 1797 37.7 90.3 网络 T05 1041 21.8 52.3 其它 T06 5 .1 .3- - -Total responses 4765 100.0 239.3,