1、SPSS(社会科学统计软件)学习资料周次 日期 课程内容 1 0305 课程安排,SPSS 浏览2 0312 SPSS 数据编辑和定义3 0319 数据变换4 0326 描述性统计5 0402 列联表6 0409 相关分析7 0416 样本的差异性考验(1)8 0423 样本的差异性考验(2)9 0430 研究应用举例10 0507 期中测验11 0514 综合应用举例 (1):文件合并,制表,图12 0521 方差分析 (1)13 0528 方差分析 (2)14 0604 多元线性回归 (1)15 0611 多元线性回归 (2) ;判别分析16 0618 因素分析(1)17 0625 因素分
2、析(2) ;聚类分析18 0702 综合应用举例 (2)参考书:SPSS for Windows: Base System User s Guide. Marija J. Norusis. SPSS Inc. 卢纹岱等编著:SPSS for Windows 从入门到精通。电子工业出版社,1996 年.SPSS for Windows made Simple. 3rd ed. Paul R. Kinnear & Colin D. GrayPsychological Press,Ltd.,1999Electronic Statistical Textbook (from StatSoft) htt
3、p:/ 期中考试,和作业,出勤。期末考试 40%期中考试30% 作业,出勤30% 总成绩100Comment Y1: 代号即你给变量名起的名字,可以是随意的,但最好尽量用自己容易分辨和记忆的方式命名,如拼音或者英语。代号不可以太长,一般要求在 8个字符以内SPSS软件简介SPSS是 Statistics Package for Social Sciences(社会科学统计软件包)的缩写,是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件(SPSS、SAS)之一。自 1985年以来,SPSS 公司推出了一系列不同版本的SPSS软件。我们这里主要简介 SPSS10.0版本。第一章 数
4、据和文件1准备分析用数据1.1数据收集主要是通过测量方法收集必需的数据。测量方法可以是实验、测验、问卷调查等等。应尽可能包括自己所需要的所有变量,因为从分析中排除不必要的变量比收集附加变量要容易得多。1.2数据编码当我们通过问卷或测验收集了很多的数据回来后,接下来的工作就是把这些数据录入到计算机里。为了输入数据简单,一种方法是在录入前用数据或符号表述被试的回答,这就是数据编码。下面是一个编码表:变量名 代号 位数 位置 备注编号 Num 3 13学校 Sch 1 4 1-南武 2-晓园 3-97 中性别 Sex 1 5 1-男子 2-女设置一个能唯一标记 Case的变量是很有用的,它可以帮助人
5、们很容易找到某些特殊信息的 Case。(编码示例)不管你自己对 SPSS使用多么熟悉,在数据录入前对数据进行系统的编码是非常必要的,它可以使你避免混乱,清楚了解数据的意义。Comment Y2: 指明文件所在的文件夹Comment Y3: 指明所引用的文件。本例中数据为用 SYNTAX 文件录入,所以文件名会有“.sps”的后缀Comment Y4: 变量代号。如“Num ”为“编号”的代号Comment Y5: 指明 num这个变量的数据所在的位置,即 1-3列数据是“编号” 。注意,当位数有 2位以上时,在起与止数据中间用“-”连接Comment Y6: 如果每个变量的位数是一样的,在写变
6、量名时可以使用 to,使命令简单些。但后面的位数必须是刚好被前面的变量平均分配的Comment Y7: 记住:在写完一个命令的时候,都要加“.”作为结束。1.3数据文件SPSS有三种文件:SYNTAX 文件(文本文件,以.sps 为后缀) 、DATA 文件(数据文件,以.sav 为后缀) 、OUTPUT 文件(结果文件,以.spo 为后缀) 。SYNTAX 文件主要是保存命令及相关的文本资料;DATA 文件则是保存供 SPSS统计的数据,只有这种文件里的数据才可以直接进行统计使用;OUTPUT 文件保存统计的结果。SPSS所用的数据文件有很多种,主要是根据自己分析数据的量及每一 Case包括变
7、量多少来选择适当的文件形式。当数据较少及 Case不多时,可以直接在 SPSS的数据文件里加入数据。(录入数据示例)当数据较多时,一般习惯用一编辑系统来录入数据(如 SPSS中的 SYNTAX文件) ,然后再通过定义命令把数据读入统计用的数据文件里。这样录入的速度较快,不过可能不容易查找在录入过程中的错误。这里只介绍用 SPSS中的 SYNTAX 文件录入数据的方法,并且在以下的其它内容中,也相应只介绍一些习惯的方法。(录入数据示例)2数据定义与转换2.1数据定义(DATA LIST)在用 SPSS中的 SYNTAX 文件录入的数据文件中,每一个人的资料都排在一行上(可以多行) 。这样任何一个
8、变量的数据都在相同的列里。SPSS 在使用这些数据时,必须对这些数据进行定义。即告诉计算机各列数据代表什么。DATA LIST命令用以给变量命名,并定义它们在 Case中的位置和属性,把数据变成能被 SPSS命令或过程使用的现用文件。下面只介绍用固定格式引用外部数据文件的命令:DATA LIST FILE=C:YLXSTRESS.SPS/num 1-3 sch 4 sex 5 chi 6-7a1 to a10 8-17.FILE子命令指定从外部文件 C:YLXSTRESS.SPS读入数据。接着是各个变量的名称及所在位置(字符宽) 。(1)当数据里有小数应该怎么表示?如,语文成绩里有 85.3分
9、,小数点不用录入,我们只要在程式里告诉电脑Comment Y8: 这里我们用 ITEM1为该题的变量名Comment Y9: 用 1代表原来的 1和 2Comment Y10: 用 2代表原来的 3,4 和 5Comment Y11: LO 即 LOWEST,最低Comment Y12: HI 即 HIGHEST,最高哪位是小数就可以了。如:DATA LIST FILE=C:YLXSTRESS.SPS/num 1-3 sch 4 sex 5 chi 6-8(1)a1 to a10 9-18 chi 6-8(1)中括号里的 1表示有一位小数。如果是两位小数就用(2) 。(2)当你的数据中每个被试
10、的数据有两行或者多行时应该怎么办?下面的例子是一个 case有三行数据的情况:data list file=d:data2002study.spsrecords=3/1 school 1 numb 2-3 sex 4 grade 5 chinese 6-7 math 8-9 english 10-11 s1 to s60 12-71/2 s61 to s90 1-30 b1 to b44 31-74/3 a1 to a41 1-41 d1 to d42 42-83.用 records=3指明每个被试有三行数据,在定义的时候,用/1 /2 /3 指明是第几行的数据。(结合学生前面录入的数据示例)
11、2.2变量值的重编码(RECODE)在统计数据处理时,经常需要对数据进行某些变换以适应不同处理的要求。所谓数据变换是利用现存变量,或改变它们的值,或利用它们产生新的变量。RECODE可以对现存变量的值作指定的变换。如我们有一个题目是:“我不能满足学生的期待。 ”要求老师在下面五个选择中选一个“1 从来没有、2 很少、3有时、4 经常、5 总是” 。我们在录入数据时只是按老师选择的数字录入。但现在我们想统计“有时+经常+总是”和“从来没有+很少”的人数及比例。这时我们可以用 RECODE命令进行变换。RECODE ITEM1(1,2=1) (3,4,5=2).这样我们就用 1代表“从来没有+很少
12、” ,用 2 代表“有时+经常+总是” 。另,如年龄这一变量,我们可能在录入时是按实际年龄的数字录入,但如果我们想把它们分老、中、青三组以比较三种年龄的人的差异时,就可以用 RECODE命令对原数据中的年龄变量进行变换。RECODE AGE(LO THRU 35=1) (36 THRU 45=2) (46 THRU HI=3).把最小到 35岁为青年组,用 1表示;36 到 45岁为中年组,用 2 表示;46到最老为老年组,用 3 表示;这样就对原来变量的值重新进行了编码。这里大家应该记住:THRU 表示“至” 。第一个命令里是确定的值“(1,2=1) ”,而第二个命令是一个范围“(LOWES
13、T THRU 35=1) ”。(结合学生前面录入的数据示例)2.3 计算变量(COMPUTE)有时我们想对数据进行组合,形成一个新的变量。如我们用 10 道题来测量学生对学校的态度,但我们并不想对这 10 道题进行一一的分析,我们想对它们进行合并来说明该学生对学校的态度情况。这时我们可以用 COMPUTE 命令来组合成新的变量。COMPUTE ATTITUDE=(ITEM1+ITEM2+ITEM3+ITEM4+.+ITEM10)/10.把十个项目的分析的相加的平均分成一个新的变量 ATTITUDE。也可以是其它的运算关系,如减、乘、除、平方、开方等。当然你可以不除以 10,这样得到的是 10
14、道题的总分,除以 10 是项目平均分。但有时因为可能有几个维度,而这几个维度的项目数不一样多,我们又想比较各维度的水平,这时我们除以项目数,得到项目平均分以利于比较。又如你用学生的语文、数学、英语三科的总成绩作为学生的学业成绩。compute total=chinese+math+english.除以 3 就可以得到平均每科的成绩。写成:compute total=(chinese+math+english)/3.(结合学生前面录入的数据示例)2.4 条件变换(IF)IF 命令根据逻辑条件执行类似于 recode 的变换。如当我们想把男生且考试分数不合格的作一组,男生且考试分数合格至良好的作一
15、组,男生且考试分数优秀的作一组,以比较三组学生在某一方面的差异时,我们可以用 IF 命令来形成一个新的变量。IF(SEX=1 AND SCORE60 AND SCORE80)SEXSC=3.这样我们就变换成一个新的变量 SEXSC,进而比较 SEXSC 在某一方面的差异,即上述三组学生的差异。(结合学生前面录入的数据示例)当然,我们可以 IF 命令来获得很多种我们想要的变换。注意和 RECODE 的差异。其实 RECODE AGE(LO THRU 35=1) (36 THRU 45=2) (46 THRU HI=3).也可以用 IF 来实现:IF(AGE35 AND AGE45)AGE1=3.
16、不过,这样就会产生了一个新的变量“AGE1” ,当然原来的变量“AGE”也保持不变。(结合学生前面录入的数据示例)2.5 缺失数据的定义(MISSING)我们在做调查时,经常遇到一些被试对某一问题漏答的情况。但由于该被试的其他资料还是可以用的,不想把他剔除。在编码时,我们用一个答案上没有的数字表示缺失。一般习惯是用“0” 、 “9”或“00” 、 “99”等,但注意这些数字必须是答案中没有的,否则重复了会把原来具有其它意义的变成了缺失。在用 SPSS 进行统计,我们就必须告诉计算机,某一变量如果数值是“0” 、“9”或“00” 、 “99”时,就表示缺失。如某些学生忘记填写性别,我们用 9 来
17、表示缺失。MISSING VALUE SEX(9).告诉计算机,当 SEX 是 9 时,表明该学生没有填写性别。在做涉及到该变量的某些计算时,如比较男女学生的差异,可以考虑剔除丢失该变量资料的人。第二章 描述统计过程1 频数这是对数据的一般整理,了解样本的分布:离散性、变异性和规律性。统计学中的分布是指一个变量的各种情况或取值出现的次数或频数,所以又叫做频数分布。如家长的职业,我们可以用变量名“JOB” ,不同的职业我们给予不同的数字表示:1-干部、2-教师、3-研究员等,分布是指被调查的学生中各种职业的家Comment Y13: 有效样本数Comment Y14: 缺失的人数Comment
18、Y15: 频数Comment Y16: 百分数Comment Y17: 有效百分数Comment Y18: 累加百分数长数。频数分布反映出落入每一组的观察值个数。还可以用分数、小数或百分数表示。1.1命令 FREQUENCESFREQUENCES计算单个变量值的频数、百分数和各种描述统计量。如上述,我们要计算各种职业的父母的人数。FREQUENCES VARIABLES=JOB. (可以简写成:FRE VAR=JOB.)1.2输出结果的解释StatisticsJOB N Valid 192Missing 5JOBFrequencyPercent Valid PercentCumulative
19、PercentValid 1 46 23.4 24.0 24.02 85 43.1 44.3 68.23 61 31.0 31.8 100.0Total 192 97.5 100.0Missing System 5 2.5Total 197 100.01.3分位点的确定子命令 PERCENTILES和 NTILE利用子命令 PERCENTILES和 NTILE得到所有待分析变量的百分位数。如果指定多个 PERCENTILES和 NTILE子命令,显示所有选择的百分位数的一个表。1.3.1 PERCENTILES子命令PERCENTILES子命令显示落在指定值(或者值列表)的 case的百分数。
20、如命令:FREQUENCES VARIABLES=SCORE /PERCENTILES=10 25 50 75.计算变量 SCORE在百分位点 10,25,50,75 的值。1.3.2 N分位点NTILE 子命令NTILE计算百分数,它把一个分布划分成指定类数。并显示一个值,case 的请求百分数落在那个值下。如:FREQ VAR=math/NTILE=4.确定 math的四分位点值。2平均数、标准差、最大/最小值某一变量得分的平均数、标准差及最大/最小值,可以说明数据的一般情况:Comment Y19: 人数Comment Y20: 最小值Comment Y21: 最大值Comment Y2
21、2: 平均数Comment Y23: 标准差均数、离散程度等信息。计算这些数据的命令是 DESCRIPTIVES或 MEANS。2.1命令 DESCRIPTVESDESCRPTIVES可以计算单个数值变量的描述性统计量,包括平均数、标准差、最大/最小值等。如我们想了解学生语文考试的平均分与标准差,就可以用DESCRIPTIVES命令来计算。DESCRPTIVES VARIABLES=CHINESE.(可以简写成:DES VAR=CHINESE.)输出结果的解释:Descriptive StatisticsN MinimumMaximum Mean Std. DeviationCHINESE 5
22、34 43 94 77.41 8.48Valid N (listwise) 534如果我们想还同时知道数学、英语等科的平均数分与标准差,可以把该命令写成:DESCRIPITVES VARIABLES=CHINESE MATH ENGLISH.计算机就会同时告诉我们这三门学科学生的平均等分、标准差、最大/最小值、有效 Case数等。输出结果的解释:Descriptive StatisticsN MinimumMaximum Mean Std. DeviationCHINESE 534 43 94 77.41 8.48MATH 534 31 99 82.15 14.47ENGLISH 534 16
23、 99 76.14 13.52Valid N (listwise)5342.2命令 MEANSMEAANS与 DESCRIPITVES不同,MEANS 是计算由一个或多个独立变量定义的分组内,因变量的平均数、标准差和组数。如我们要了解男女学生的语文、数学和英语的平均数、标准差等,就可以用MEANS计算。MEANS TABLES= CHINESE MATH ENGLISH BY SEX.执行这一命令,会给出男女学生的语文、数学和英语的平均分、标准差等。MEANS命令还可以计算更多的变量的分组。如不同性别、不同年级学生的语Comment Y24: 指明标本的情况:有效样本、缺失和总样本数文成绩平均
24、数与标准差等。命令可写成:MEANS TABLES= CHINESE BY SEX BY GRADE.输出结果的解释:Case Processing SummaryCasesIncluded Excluded TotalN Percent N Percent N PercentCHINESE * SEX * GRADE534 98.0% 11 2.0% 545 100.0%ReportCHINESE GRADE SEX Mean N Std. Deviation1 1 83.59 41 5.732 85.30 63 4.45Total 84.62 104 5.042 1 77.32 50 8.
25、072 80.37 68 7.04Total 79.08 118 7.613 1 76.31 48 8.372 79.76 68 5.79Total 78.34 116 7.154 1 71.35 49 5.152 73.96 51 5.99Total 72.68 100 5.725 1 68.50 44 10.142 73.75 52 7.85Total 71.34 96 9.30Total 1 75.28 232 9.152 79.04 302 7.54Total 77.41 534 8.48第三章 相关分析和回归分析1相关1.1相关分析的意义我们常用相关系数来表示两变量的关系程度。当然我
26、们在计算相关,应该考虑这两个变量之间的关系是否线性。如果不是线性的关系,而使用相关系数来表示两变量间的关系的话,就会错误估计它们的关系。如生活压力与心理健康之间的关系,很多研究结果都表明,它们之间关系应该是一倒 U型的曲线,也就是非线性的关系。因此,我们就不能用相关系数来表示它们之间关系的量。但很多变量之间关系是线性的,如学习的努力程度与学习成绩的关系,我们可以用相关系数来说明它们之间关系的程度。当然,计算相关有很多种公式,对公式的选择与Comment Y25: Pearson相关系数Comment Y26: 显著性(双尾检验) ,即 pComment Y27: 输出结果是一个相关矩阵变量的性
27、质有关:是连续变量还是二分变量或是等级变量等等。一般没有注明的时候是用皮尔逊积差相关。1.2命令 CORRELATION如我们要计算学生的语文成绩(CHINESE)与英语成绩(ENGLISH)之间的关系,可以用以下命令:CORRELATION VARIABLES=CHINESE WITH ENGLISH.输出结果的解释:CorrelationsENGLISHCHINESE Pearson Correlation.502Sig. (2-tailed) .000N 534这一命令还可以同时计算多个变量与多个变量两两之间的相关。如语文成绩、数学成绩、英语成绩之间的两两相关,可以用如下命令:CORRE
28、LATION VARIABLES=CHINESE MATH ENGLISH WITH CHINESE MATH ENGLISH.或:CORRELATION VARIABLES=CHINESE MATH ENGLISH.输出结果的解释:CorrelationsCHINESE MATH ENGLISHCHINESE Pearson Correlation1.000 .515 .502Sig. (2-tailed) . .000 .000N 534 534 534MATH Pearson Correlation.515 1.000 .566Sig. (2-tailed) .000 . .000N 5
29、34 534 534ENGLISH Pearson Correlation.502 .566 1.000Sig. (2-tailed) .000 .000 .N 534 534 534* Correlation is significant at the 0.01 level (2-tailed).结果除给出两两相关系数(相关矩阵)外,还显示出双尾显著性检测的结果。SPSS可以指定所用的相关公式,如果没有指定,一般默认为皮尔逊积差相关。用什么公式,应该要根据数据来决定。2回归分析Comment Y28: 变量列,即把要用于回归的变量名在这里列出。这是的变量列要包括自变量和因变量Comment
30、Y29: 变量列:这是要指明因变量是哪个Comment Y30: 因变量名Comment Y31: 回归方法,可以是上述五种方法之一。本例为逐步选择方法Comment Y32: 自变量名列回归分析的目的是建立两列或多列变量之间的数量关系模型(即回归方程) 。也就是确定了自变量与因变量的关系模型,利用这个数学模型,我们可以从一个变量或多个变量来预测或估计另一个变量的变化。例如,我们知道学习基础(X)对成绩(Y)有密切关系,我们想建立一个回归方程,根据学生原来的学习水平高低来估计其未来成绩:Y=a+bX。这里所提到的是指线性关系的,而对于非线性关系的回归,则是另一回事。2.2 命令 REGRESS
31、IONREGRESSION是计算多元回归的命令。提供五种建立回归方程的方法:向前选择(Rorward) 、向后剔除(Backward)、逐步选择(Stepwise)、强制进入(Enter)和强制剔除(Remove)。假如我们用逐步选择方法进行回归分析,命令格式如下:REGRESSION VARIABLES=varlist/dependent=varlist/method=stepwise.或:REGRESSION/DEPENDENT varlist/METHOD=STEPWISE varlist.DEPENDENT里的变量名必须在前面的变量名里。一般如果不指定方法,即为默认的逐步选择方法。23
32、 输出结果的解释第四章 差异检验1 两组平均数的差异检验11 平均数的差异检验的意义当我们想检验两样本之间是否存在差异,可以使用平均数的差异检验。例如比较男女学生在数学学习上是否存在差异。一般我们可以用 T检验来证明两组是否差异显著。12 命令 T-TESTT-TEST用以检验独立样本或配对样本的平均数差异显著性。当两列变量的样本不一样时,统计是不同的。13 独立样本例如:比较男女学生在学习上(包括数学、语文、英语成绩)是否存在差异。T-TEST GROUPS=SEX(1,2)/VARIABLES=MATH CHINESE ENGLISH.结果会告诉我们男女学生在数学、语文、英语三门学科的平均
33、数、标准差、T 值、显著水平。14 相关样本:例如:为了比较单眼与双眼对深度知觉的影响,50 名学生分别用单眼与双眼进行了实验,等到单眼观察的一列数(A)双眼观察的一列数(B).我们比较这两列数的差异是否显著,以了解单、双眼对深度知觉的差异。T-TEST PAIRS=A WITH B.结果会给出两列数的平均数、标准差、T 值、显著水平等。15 输出结果的解释2 单因素方差分析21 单因素方差分析的意义但大多数时,我们要比较不止两组平均数的差异,而可能是两个以上的样本平均数。这种多个样本平均数差异的检验需要通过方差分析进行。在这种意义上,可以把方差分析看作 T 检验扩展。有很多也用 T 检验来两
34、两样本进行差异检验,但这是不对的。22 命令 ONEWAYONEWAY 命令用以检验单因素的几个组间的差异。例如,要比较初一、初二、初三学生心理健康(SCL)是否存在差异,可用如下命令格式:ONEWAY VARIABLES=SCL BY GRADE(1,3).执行这一命令后,计算机会告诉我们三个年级学生在心理健康上的是否存在差异,即给出 F 值、显著性水平等。23 输出结果的解释24 多重比较但当三个年级之间存在显著差异时,我们并不知道哪两个年级之间差异显著或差异不显著。这就需要进行多重比较。命令格式为:ONEWAY VARIABLES=SCL BY GRADE(1,3)/RANGE=SCHE
35、EFE.多重比较的方法有好几种,可以根据需要选择。我们一般用费舍法或涂凯法。以上是用费舍法。执行以上命令,会告诉我们 F 值、显著性水平,如果差异显著,还会告诉我们各组的平均及哪两组之间差异显著。3 多因素方差分析31 多因素方差分析的意义前面介绍的方差点分析是属于单因素实验设计,即实验中只有一个自变量。但心理的影响因素是多种的,单因素设计只是人为地只取一个因素作为自变量。大多数情况下,是多因素的设计。例如:不同的教学方法(因素 A)和不同的教学态度(因素 B)对学生的学习成绩(因变量)的影响。这种情况下,我们必须使用多因素方差分析方法对自变量的影响进行检验。32 命令 ANOVAANOVA
36、执行多因素实验设计的方差分析,一个 ANOVA 可以分析多个因素(多个自变量)和几个因变量。例如:我们考察不同年级(初一、初二、初三) 、不同性别(男、女)学生心理健康情况的差异,可用以下命令格式工:ANOVA VARLABLES=SCL BY GRADE(1,3)SEX(1,2).执行这一命令,会给出一个方差分析表,包括各因素的效应的 F 值、显著性、因素间的交互作用的效应的检验。若交互作用效应不显著,主效应的检验是非常重要的,但当交互作用显著时,主效应的检验意义就不大了。 33 输出结果的解释第五章 因子分析1 因子分析的意义因子分析的目的是用少数几个变量(即因子)去代替原来较多的变量间,
37、而这些较少的变量应该尽可能反映原来变量的信息。因子分析主要是基于这样的思想:根据相关性的大小把变量分组,使得同组内的变量之间相关较高,不同组变量间的相关较低。这样每变量代表一个基本结构,或称因子。如 SCL-90,有 90道题,也即个原来的变量,我们对那么多的变量进行分析的话会太每繁且不容易清楚。因此,我们可以通过因子分析的方法,发现阶段这 90 个变量可以归于 9个因子。这样我们就可以对象 9 个因子进行分析,以代替 90 个变量。2 命令 FACTORFACTOR 可以完成因子分析的工作。如上例,对 SCL-90 的题的结果进行因子分析。FACTOR VARIABLES=ITEM1 TO
38、ITEM90.执行这一命令,计算机会对象 90 个题进行因子分析。告诉我们各题的共同性、因素矩阵、解释量、因素负荷等。但因为分析较为繁复,需要较大的内存,当题目太多时可能做不了。我们还可以选择因子提取方法、因子数及因素旋转方法(正交、斜交)等。3 因子数的确定我们可以确定我们所需的因子个数。确定因子个数的方法主要有两种:根据特征与根据碎石图。一般以特征值大于等于 1 为原则选取因子数。也可根据碎石图的明显折点确定因子个数。4 输出结果的解释第六章 X 2检验1 X2检验的意义前面所介绍的统计方法,基本都是针对连续变量的。但在很多时候,研究问题只能划分为不同性质的类别,各类别之间没有量的联系。例
39、如:性别分为男、女,职业可以分为干部、教师、.,教师的职称又可分为教授,副教授、讲师.等。另外,有些问题虽然有量的关系,因研究需要将其按一定的标准分为不同的类别。例如学习成绩、能力水平等等,都有连续性的数量描述它们,只是研究者依一定标准将其划分为优、良、中、差等少数类别。这样的数据我们称为计数数据。这种数据不能使用前面所介绍的统计方法进行统计。对计数数据的统计方法是 X2检验。例如:某校对学生的课外活动内容进行调查,结果整理成一个二维表,示于表达式。 表 1 课外活动调查表课外活动内容体育 文娱 阅读性 男 11 23 23别 女 6 7 29这个表包括两个因素:性别和课外活动内容,而自变量又
40、分成两类(男、女)和三类(体育、文娱、阅读 ) 。这就是一个列联表。我们的问题也许是想看看男女学生的课外活动内容是否有差异?这时就应该用 X2 检验。62 命令 CROSSTABS要产生列联表和对计数数据进行差异检验,SPSS 里用 CROSSTABS 命令来执行。CROSSTABS 可以产生两个或多个变量的列联表。如上例,我们只需把各个 Case 的命令就可以生成上述的列联表。CROSSTABS TABLES=ACT BY SEX.以上命令将生成一个列联表。如果我们还想对它们的差异进行检验,应该把命令写成:CROSSTABS TABLES=ACT BY SEX/STATISTIS=1.结果将会显示列联表、 X2、S 2值、自由度、显著性等。63 输出结果的解释