1、1统计信息应用软件上机实验指导书(编写人 李灿)湖南商学院信息系2005-4-102编写说明为了方便教师教学,提高学生运用统计信息应用软件的能力,以更好的适应信息社会对现代化定量分析人才的需求,为社会培养现代化的高级专门人才,以及更好地配合统计信息应用软件课程的案例教学改革,我在教学的过程中精心编写了此本统计信息应用软件上机试验指导书(SPSS12.0 统计软件)。在编写的过程中得到了信息系领导龚曙明教授、欧阳资生博士以及统计学教研室各位老师的支持,在此我表示感谢。由于时间仓促,本人水平有限,错误之处敬请各位专家学者指正,本人邮箱:。李 灿200433目 录试验一、数据统计处理3试验二、单变量
2、频率分配分析4试验三、T-TEST 过程.6试验四、聚类分析9试验五、因子分析.14试验六、判别分析17.试验七、多元方差分析214试验一、数据统计处理试验目的:通过上机试验,使学生掌握数据统计处理基本原理,熟悉数据文件的处理,具体包括数据的输入、数据变量的定义、数据资料的统计处理等软件操作过程,能对软件输出结果进行分析。实验题目:某班进行其中考试成绩分析,首先输入全班 36 人的学号、性别、数学、无力、化学、外语和语文成绩,如表 1 所示:存为 aa.sys 文件,现按以下要求操作。表 1 某班期终考试成绩学号 性别 数学 物理 化学 外语 语文 学号 性别 数学 物理 化学 外语 语文03
3、01 女 88 93 65 72 86 0319 女 56 64 66 75 740302 女 87 93 68 78 91 0320 女 598 71 70 74 780303 女 82 98 71 81 86 0321 男 68 74 76 78 750304 男 70 83 缺考 90 92 0322 女 71 68 71 70 820305 男 80 88 79 88 85 0323 女 74 56 64 68 840306 男 78 90 78 82 88 0324 男 76 84 82 92 940307 女 70 80 72 76 90 0325 男 91 88 88 94 90
4、0308 男 71 78 83 78 94 0326 女 87 91 90 88 900309 男 74 74 76 78 86 0327 男 93 95 94 96 880310 男 77 78 81 缺考 76 0328 男 84 86 86 88 920311 男 66 86 85 83 85 0329 女 90 92 90 91 890312 女 73 70 74 75 91 0330 男 61 68 70 74 820313 男 68 82 72 76 76 0331 男 76 75 81 56 620314 女 81 89 91 88 91 0332 女 81 68 78 88 8
5、10315 女 55 84 86 91 84 0333 男 67 71 90 68 720316 女 64 75 74 78 89 0334 女 78 76 81 91 790317 男 61 66 68 70 80 0335 男 85 81 72 89 690318 女 缺考 54 58 68 72 0336 女 88 91 72 76 92(1) 定义缺失值。(2) 计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的 3个同学。(3) 求这 5 门课的平均成分和标准差。(4) 将各门成绩按 5 级分类(优、良、中、及格和不及格)贴标签,求其频数分布,查看哪一分数段人最多
6、。(5) 将数学和物理成绩做一散点分布图。(6) 将数据文件、输出结果和图形分别存盘保存。5试验二、单变量频率分配分析试验目的:通过上机试验,使学生掌握频率分配分析基本原理,熟悉频率分配分析软件操作过程,能对软件输出结果进行分析。实验题目:某单位对100名健康女大学生测定了血清蛋白含量(serum,克/升)如下表所示。试做单变量频率分配分析并作直方图。74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.579.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.075.0 73.5 78.8 74.3 75.8
7、65.0 74.3 71.2 69.7 68.073.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.575.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.074.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.373.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.737.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.775.8 73.5 75.0 72.7 73.5 73.5 7
8、2.7 81.6 70.3 74.373.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4实验分析:频率分配表Frequency Percent Valid PercentCumulative Percent65以下 3 3.0 3.0 3.065-70 13 13.0 13.0 16.070-75 46 46.0 46.0 62.075-80 31 31.0 31.0 93.080以上 7 7.0 7.0 100.0ValidTotal 100 100.0 100.0 从以上频数分布表中可以知道,100名健康女大学生血清蛋白含量在65克/升的占3%
9、,65-70克/升的占 13%,70-75克/升的占46%,75-80克 /升的占31%,80克/升以上的占67%。 5.04.03.02.01.050403020100Std. Dev = .88 Mean = 3.3N = 100.001、 65 克/升以下2、 65-70 克/升3、 70-75 克/升4、 75-80 克/升5、 80 克/升以上从以上直方图可以看出 100 名健康女大学生血清蛋白含量基本上与正态曲线一致,这说明,健康女大学生血清蛋白含量基本合理。7试验三、T-TEST 过程试验目的:通过上机试验,使学生掌握 T-TEST 过程基本原理,熟悉 T-TEST 过程分析软件
10、操作过程,能对软件输出结果进行分析。实验题目: 10 个病号每人都做了 3 种不同的减肥治疗。下面的数据和命令用来表示体重减轻的变化情况(单位:公斤/月) 。ID(个案号) T1(治疗1)T2(治疗2)T3(治疗3)01 1.35 1.27 1.3302 1.28 1.31 1.2603 1.40 2.05 2.0104 1.28 1.37 1.3205 1.36 1.27 1.3506 .99 1.32 1.4807 1.65 1.58 1.7308 1.01 1.08 1.2109 1.15 1.18 1.6610 1.33 1.34 1.321、请用 SPSS 的 T-TEST 过程,检
11、验治疗 1 于治疗 3,治疗 2 于治疗 3 之间体重变化的“均值相等的原假设” 。2、创建一个新变量 T,它等于治疗 1 于治疗 3 体重减轻之差,并使用 Frequencies过程。试比较 1 题与 2 题的结果。计算变量 T 的均值、标准偏差和标准误差。实验分析:1、由于三种减肥治疗效果具有相关性,因此采用配对样本 T 检验。Analyze 菜单中选择 compare means,进而选择 paired-samples T test 。分别将 T1 与 T3 同时选入 paired variables 栏,然后将 T2 与 T3 同时选入,确定。得结果:T-Test表18Paired S
12、amples Statistics1.2800 10 .19408 .061371.4670 10 .25517 .080691.3770 10 .26940 .085191.4670 10 .25517 .08069业 业 1业 业 3Pair 1业 业 2业 业 3Pair 2Mean N Std. Deviation Std. ErrorMean表2Paired Samples Correlations10 .396 .25710 .814 .004业 业 1 & 业 业 3Pair 1业 业 2 & 业 业 3Pair 2N Correlation Sig.表3Paired Sampl
13、es Test-.1870 .25202 .07969 -.3673 -.0067 -2.346 9 .044-.0900 .16035 .05071 -.2047 .0247 -1.775 9 .110业 业 1 - 业 业 3Pair 1 业 业 2 - 业 业 3Pair 2 MeanStd.Deviation Std. ErrorMean Lower Upper95% ConfidenceInterval of theDifferencePaired Differencest df Sig.(2-tailed)由表1可见,各类治疗方法减轻体重的平均数,标准差和标准误差。可见治疗1的减肥
14、效果比较稳定,治疗3次之,治疗2效果因个人身体状况不同差异较大。由表2可见,治疗1与治疗3的相关性不明显(Sig值0.2570.05,未通过显著性检验),而治疗2与治疗3的效果比较相似,呈现较强的相关性(Sig值0.0040.05,未通过显著性检验),可见与表2得出的结论一致。2、通过 transform中的compute菜单可计算得到新变量T,通过frequencies程序结果如下:StatisticsT 100-.1870.07969.25202ValidMissingNMeanStd. Error of MeanStd. Deviation由上表可见新变量T的平均值为-0.187 ,标准
15、误差为0.07969,标准差为0.25202。与第一题的结果比较可见,T的均值、标准误差和标准差与第一题中的治疗 1与治疗3配对T检验的结果一致,可见配对样本T检验的原假设是将两样本之差与 0比较,H 0:X1-X2=0, 9H1:X1-X20 ,其中t= 。meanES.练习题:1、用大白鼠配成八对,每对分别喂以正常饲料和缺乏维生素 E 饲料,过一段时间,测得两组大白鼠肝中维生素 A 的含量如下:大白鼠对号 正常饲料组 缺乏维生素 E 饲料组123456783550200030003950380037503450305024502400180032003250270025001750试比较两
16、组维生素 A 含量有无差别?2、用某药物治疗不同病情的老年慢性支气管炎病人,疗效如下表。某药疗效数据:疗效 单纯性 单纯性合并肺气肿控制 65 42显效 18 6有效 30 23无效 13 11试比较两种病情的疗效?10试验四、聚类分析试验目的:通过上机试验,使学生掌握聚类分析的基本原理,熟悉快速聚类分析与分层聚类分析操作过程,能对软件输出结果进行分析。实验题目 1:快速聚类分析某集团公司为研究下属不同企业的经营特点,调查了 20 个企业的盈利能力、领导才干、组织文化和员工发展等 4 项指标(变量) ,将这 20 个企业按照各自的特点分成 4 种类型。数据表:实验分析:11Cluster Me
17、mbershipA 3 14.361B 2 11.785C 3 9.014D 2 7.993E 2 16.415F 1 9.718G 1 10.541H 2 15.366I 3 17.500J 2 4.082K 3 12.162L 3 13.769M 4 9.682N 4 9.682O 2 8.819P 3 14.361Q 1 12.693R 2 9.860S 2 13.540T 2 12.910Case Number1234567891011121314151617181920业 业 Cluster DistanceFinal Cluster Centers78 87 63 8853 83
18、62 8063 81 82 5867 78 77 63业 业 业 业业 业 业 业业 业 业 业业 业 业 业1 2 3 4ClusterDistances between Final Cluster Centers37.663 27.500 29.09537.663 32.896 28.32127.500 32.896 41.78329.095 28.321 41.783Cluster12341 2 3 4Number of Cases in each Cluster3.0009.0006.0002.00020.000.0001234ClusterValidMissing(1)第一类的企业有
19、F、G和Q,盈利能力比较强,其他方面相对较弱;12第二类的企业有B、D、E、H、J、O、R、S和T,各方面的能力比较平衡,综合能力强;第三类的企业有A、C、I、K、L和P,组织文化和员工发展比较突出;第四类的企业有M和N,盈利能力和领导才干比较强。(2)每一例的各案数(Numbers of case in each cluster),可见3例在第一类中,9例在第二类中,6例在第三类中,2例在第四类中。(3)最终聚类中心间的距离(distances between final cluster centers),即4种聚类中心两两间的欧氏距离。第一类到第二类的距离是37.663,第一类到第三类的距
20、离是27.500,第一类到第四类的距离是29.095,第二类到第三类的距离是32.896,第二类到第四类的距离是28.321,第三类到第四类的距离是41.783。实验题目 2:分层聚类分析为了研究世界各国森林、草原资源的分布规律,共抽取了 21 个国家的数据,每个国家 4 项指标,原始数据见表 1。试用该数据对国别进行聚类分析。国别 森林面积(万公顷)森林覆盖率(%) 林木蓄积量(亿立方米)草原面积(万公顷)中国 11978.00 12.50 93.50 31908.00美国 28446.00 30.40 202.00 23754.00日本 2501.00 67.20 24.80 58.00德
21、国 1028.00 28.40 14.00 599.00英国 210.00 8.60 1.50 1147.00法国 1458.00 26.70 16.00 1288.00意大利 635.00 21.10 3.60 514.00加拿大 32613.00 32.70 192.80 2385.00澳大利亚 10700.00 13.90 10.50 45190.00前苏联 92000.00 41.10 841.50 37370.00捷克 458.00 35.80 8.90 168.00波兰 868.00 27.80 11.40 405.00匈牙利 161.00 17.40 2.50 129.00南斯拉
22、夫 929.00 36.30 11.40 640.00罗马尼亚 634.00 26.70 11.30 447.00保加利亚 385.00 34.70 2.50 200.00印度 6748.00 20.50 29.00 1200.00印度尼西 2180.00 84.00 33.70 1200.00尼日利亚 1490.00 16.10 .80 2090.00墨西哥 4850.00 24.60 32.60 7450.00巴西 57500.00 67.60 238.00 15900.0013实验分析:由于是对个案聚类,采用 R 型聚类。在数据编辑器中打开该数据文件,运行结果如下:表 1:样本总体统计结
23、果:Case Processing Summary(a,b)CasesValid Missing TotalN Percent N Percent N Percent21 100.0 0 .0 21 100.0a Squared Euclidean Distance usedb Average Linkage (Between Groups)表 2:聚结表Agglomeration ScheduleStage Cluster CombinedCoefficientsStage Cluster First Appears Next StageCluster 1Cluster 2 Cluster
24、1Cluster 2 1 7 15 4580.650 0 0 62 11 16 6395.170 0 0 53 4 14 11551.170 0 0 44 4 12 61130.685 3 0 65 11 13 72812.905 2 0 76 4 7 114992.105 4 1 77 4 11 410706.019 6 5 98 6 18 532624.580 0 0 109 4 5 871022.475 7 0 1110 6 19 959232.110 8 0 1111 4 6 2810959.030 9 10 1212 3 4 3764010.613 0 11 1313 3 17 34
25、176880.902 12 0 1414 3 20 60118208.169 13 0 1815 1 9 178051698.960 0 0 1816 2 8 473998139.930 0 0 1717 2 21 853922083.445 16 0 1918 1 3 1542260836. 15 14 191437319 1 2 1829449692.582 18 17 2020 1 10 8299084550.993 19 0 0表 3:冰柱图(省去)图 4:树状图* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S
26、I S * * * * * *Dendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +-+-+-+-+-+意大利 7 罗马尼亚 15 德国 4 南斯拉夫 14 波兰 12 捷克 11 保加利亚 16 匈牙利 13 英国 5 法国 6 印度尼西 18 尼日利亚 19 日本 3 印度 17 墨西哥 20 中国 1 澳大利亚 9 美国 2 加拿大 8 巴西 21 前苏联 10 15试验五、因子分析试验目的:通过上机试验,使学生
27、掌握因子分析的基本原理,熟悉因子分析操作过程,能对软件输出结果进行分析。实验题目:选择 10 名游泳选手作为受试者,观察他们的气力、耐力、速度和协调 4 方面,所得测验成绩如表 5 所示。试分析这 4 项体能的共同因素。表 51(气力) 2(耐力) 3(速度) 4(协调)12345678910119986251215198111356711126711515694411441341411985136Correlation Matrix1.000 .796 .379 .242.796 1.000 .561 .311.379 .561 1.000 .826.242 .311 .826 1.000业
28、 业业 业业 业业 业Correlation 业 业 业 业 业 业 业 业KMO and Bartletts Test.52221.1116.002Kaiser-Meyer-Olkin Measure of SamplingAdequacy.Approx. Chi-SquaredfSig.Bartletts Test ofSphericityTotal Variance Explained2.569 64.232 64.232 2.569 64.232 64.232 1.834 45.857 45.8571.092 27.304 91.535 1.092 27.304 91.535 1.82
29、7 45.679 91.535.237 5.926 97.462.102 2.538 100.000Component1234Total % ofVariance Cumulative % Total % ofVariance Cumulative % Total % ofVariance Cumulative %Initial Eigenvalues Extraction Sums of SquaredLoadings Rotation Sums of SquaredLoadingsExtraction Method: Principal Component Analysis.16Scree
30、 PlotComponent Number4321Eigenvalue3.02.52.01.51.0.50.0Component Matrixa.750 .582.838 .450.870 -.409.740 -.619业 业业 业业 业业 业1 2ComponentExtraction Method: Principal Component Analysis.2 components extracted.a. Rotated Component Matrixa.942 .116.912 .272.328 .904.088 .960业 业业 业业 业业 业1 2ComponentExtract
31、ion Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.Rotation converged in 3 iterations.a. 答:对于 10 名游泳选手的因素:“气力” , “耐力” , “速度” , “协调” ,经过转轴后,可看出气力和耐力为一类,将其命名为“体能因子” ,速度和协调为一类,将其命名为“致胜因子” ,所以经过分析可以分为以上两个因子。17练习题:已知某地 1922 岁年龄组城市男学生身体形态指针包括身高(x1,cm) ,坐高(x2,cm) ,
32、体重(x3,kg) ,胸围(x4,cm) ,肩宽(x5,cm)与骨盆宽(x6,cm)的数据如表 16.8 所示。表 16.8D-f X1 X2 X3 X4 X5 X61 173.28 93.62 60.10 86.72 38.97 27.512 172.09 92.83 60.38 87.39 38.62 27.823 171.46 92.73 59.74 85.59 38.83 27.464 170.08 92.25 58.04 85.92 38.33 27.295 170.61 92.36 59.67 87.46 38.38 27.146 171.69 92.85 59.44 87.45
33、38.19 27.107 171.46 92.93 58.70 87.06 38.58 27.368 171.60 93.28 59.75 88.03 38.68 27.229 171.60 92.26 60.50 87.63 38.79 26.6310 171.16 92.62 58.72 87.11 38.19 27.1811 170.04 92.17 56.95 88.08 38.24 27.6512 170.27 91.94 56.00 84.52 37.16 26.8113 170.61 92.50 57.34 85.61 38.52 27.3614 171.39 92.44 58.
34、92 85.37 38.83 26.4715 171.83 92.79 56.85 85.35 38.58 27.03对这 6 项体验指针的作因素分析。18试验六、判别分析试验目的:通过上机试验,使学生掌握判别分析的基本原理,熟悉判别分析操作过程,能对软件输出结果进行分析。实验题目:从心电图的 5 个不同指针中对健康人(c=1)、硬化症患者冠心病患者的数据如下表,试作判别分析。19实验分析:Group Statistics7.4373 2.33287 11 11.000238.5500 45.03760 11 11.00013.8918 2.88074 11 11.0005.4727 .421
35、55 11 11.0007.6736 1.80803 11 11.0006.8886 2.14427 7 7.000342.8471 77.58641 7 7.00014.9971 3.79894 7 7.0005.2586 .42188 7 7.0009.2471 1.42264 7 7.0005.2540 1.82185 5 5.000310.2420 68.13816 5 5.00018.1760 3.39008 5 5.0004.8880 .43814 5 5.00010.4920 2.47790 5 5.0006.7957 2.25388 23 23.000285.8778 75.4
36、6786 23 23.00015.1596 3.56056 23 23.0005.2804 .46675 23 23.0008.7652 2.12169 23 23.000X1X2X3X4X5X1X2X3X4X5X1X2X3X4X5X1X2X3X4X5c-业 业1-业 业 业2-业 业 业 业 业3-业 业 业 业 业TotalMean Std. Deviation Unweighted WeightedValid N (listwise)Tests of Equality of Group MeansWilks Lambda F df1 df2 Sig.X1 .853 1.729 2 20
37、.203X2 .598 6.713 2 20 .006X3 .773 2.939 2 20 .076X4 .754 3.266 2 20 .059X5 .701 4.272 2 20 .029EigenvaluesFunction Eigenvalue % of Variance Cumulative %Canonical Correlation1 1.229(a) 71.4 71.4 .7432 .493(a) 28.6 100.0 .575a First 2 canonical discriminant functions were used in the analysis.20Stand
38、ardized Canonical Discriminant Function CoefficientsFunction1 2X1 .655 .241X2 -1.477 1.000X3 -.196 -.449X4 .979 .138X5 1.321 -.850Canonical Discriminant Function CoefficientsFunction1 2X1 .300 .110X2 -.024 .016X3 -.060 -.137X4 2.303 .326X5 .709 -.456(Constant) -12.611 -1.068Unstandardized coefficien
39、tsPrior Probabilities for Groups.333 11 11.000.333 7 7.000.333 5 5.0001.000 23 23.000c-业 业1-业 业 业2-业 业 业 业 业3-业 业 业 业 业TotalPrior Unweighted WeightedCases Used in AnalysisClassification Function Coefficients8.027 7.468 7.306-.463 -.400 -.433.082 .112 .356107.502 102.841 102.55330.071 28.244 29.178-3
40、85.845 -360.048 -359.993X1X2X3X4X5(Constant)1-业 业 业 2-业 业 业业 业 3-业 业 业业 业c-业 业Fishers linear discriminant functions21主要结果分析:(1)输出各组变量的统计量(Group Statistics),总变量的均数(Mean),标准差(std. deviation)等。(2)WilksLambda检验:x1(p0.05) x2(p0.05) x4(p0.05) x5(p0.05红细胞计数(x2,万/mm3) F=0.284 p(Sig.=0.755)0.05表明本数据符合方差齐性假设条
41、件.(4)单变量 x1,x2 各组(group) 之间的方差分析血红蛋白浓度(x1,%) F=7.302 p(Sig.=0.003)0.01红细胞计数(x2,万/mm3) F=3.965 p(Sig.=0.031)0.05表明本数据血红蛋白浓度(x1,%)在 A 组,B 组与 C 组之间有非常显著性差异(p0.05B 组与 C 组 均数差异(Mean Difference)=1.070 p(Sig.=0.005)0.05A 组与 C 组 均数差异(Mean Difference)=-50.21 p(Sig.=0.012)0.052526实验题目 2:一位教师想要检查 3 种不同的教学方法的效果
42、,为此随机地选取了水平相当的 15 位学生。把他们分成 3 组,每组 5 人,每一组用一种方法教学,一段时间以后,这位教师给这 15 位学生进行统考,统考成绩(单位:分)如下 :方法 成绩甲 75 62 71 58 73乙 81 85 68 92 90丙 73 79 60 75 81要求检验这 3 种教学方法的效果有没有显著差异(假设这 3 种教学方法的效果没有显著差异) 。定义变量,学生成绩为观察变量,不同的教学方法为控制变量。进行单因素方差分析。实验分析:一、描述统计量Descriptives成绩 95% Confidence Interval for MeanN MeanStd. Dev
43、iationStd. ErrorLower BoundUpper Bound Minimum MaximumBetween- Component Variance甲 5 67.80 7.396 3.308 58.62 76.98 58 75 乙 5 83.20 9.524 4.259 71.37 95.03 68 92 丙 5 73.60 8.234 3.682 63.38 83.82 60 81 Total 15 74.87 10.204 2.635 69.22 80.52 58 92 Fixed Effects 8.430 2.177 70.12 79.61 ModelRandom Eff
44、ects 4.490 55.55 94.19 46.280这 15 名学生的平均成绩为 74.87 分。各教学方法从高到低依次为:乙、丙、甲。同时,也可以看出学生成绩在各教学方法内部也不平衡。以丙方法为例,最低的 60 分,最高的81 分,差距较大。二、单因素方差分析的前提检验首先,各个教学方法下的学生成绩,能够看作是从服从正态分布的总体中,随机抽取的样本。Test of Homogeneity of Variances成绩Levene Statistic df1 df2 Sig.27.097 2 12 .908T=0.097, p=0.9080.05,通过方差齐次性检验,属于方差相等时的方差
45、分析问题。三、单因素方差分析的多项式检验ANOVA成绩 Sum of Squares dfMean Square F Sig.(Combined) 604.933 2 302.467 4.256 .040Contrast 84.100 1 84.100 1.183 .298Between Groups Linear TermDeviation 520.833 1 520.833 7.329 .019Within Groups 852.800 12 71.067 Total 1457.733 14 从中可以看出:学生成绩的总的离差平方和为 1457.733,其中,由控制变量不同水平造成的组间平方
46、和为 604.933,由随机变量造成的组内平方和为 852.8。组间平方和中能够被控制变量线性解释的平方和(回归平方和)主 84.1,其余不能被线性解释的平方和为520.833,它与组内平方和相加即为回归分析中的剩余平方和。F 统计量 4.256 是平均的组间平方和除以平均的组内平方和的结果,其对应的相伴概率值为 0.04,小于显著性水平 0.05,因此应拒绝零假设,说明不同教学方法在学生成绩上存在显著差异;F 统计量 1.183 和 7.329 分别是:平均的回归平方和除以平均的组内平方和、不能被控制变量线性解释的平均平方和除以平均的组内平方和的结果,它们对应的相伴概率值分别 为: 0.29
47、8 和 0.019,前者通过检验,后者拒绝原假设,说明本例所选择的线性均值多项式成立,即第一组均值的 1.2 倍与第二组均值在这一条直线上。 Contrast Coefficients方法Contrast 甲 乙 丙1 1.2 1 0Contrast TestsContrastValue of ContrastStd. Error t dfSig. (2-tailed)Assume equal variances1164.56(a) 5.889 27.944 12 .000成绩Does not assume equal variances1164.56(a) 5.822 28.266 7.96
48、1 .000a The sum of the contrast coefficients is not zero.上两表分别为多项式比较系数和多项式比较结果。在多项式比较结果中,本题属于方差齐次。从表中可以看出:p=0.0000.05,拒绝原假设,认为1.2倍的第一组均值与第二组均值存在显著差异。所以只能说, 甲、乙两种教学方法下学生成绩存在较强的线性关系,28但所选的多项式比较系数欠妥。(学生实在找不到那神秘的系数)四、单因素方差分析的多重比较检验Multiple ComparisonsDependent Variable: 成绩 95% Confidence Interval(I) 方法 (J) 方法Mean Difference (I-J) St