收藏 分享(赏)

Mean过程和T检验过程.doc

上传人:精品资料 文档编号:10999603 上传时间:2020-01-30 格式:DOC 页数:13 大小:640KB
下载 相关 举报
Mean过程和T检验过程.doc_第1页
第1页 / 共13页
Mean过程和T检验过程.doc_第2页
第2页 / 共13页
Mean过程和T检验过程.doc_第3页
第3页 / 共13页
Mean过程和T检验过程.doc_第4页
第4页 / 共13页
Mean过程和T检验过程.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、一、Means 过程1简单介绍Means 过程计算指定变量的综合描述计量,包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计。当观测量按一个分类变量分组时,Means 过程可以进行分组计算。例如,要计算某地区高考的数学成绩,Sex 变量把考生分为男生和女生两组,Means 过程可以分别计算男女生的数学成绩。Means 过程还可以给出方差分析表和线性检验结果。使用 Means 过程求若干组的描述统计量的目的在于比较,因此必须求均值。这是与 Descriptive 过程不同之处。2完全窗口分析Means 过程的大部分功能可以完全由窗口实现,这给用户带来了很大的方便。(1)Means 主对

2、话框按 Analyze Compare Means Means 的顺序单击,即可打开 “Means”主对话框,如图 1 所示。图 1 Means 主对话框(2)Dependent 框该框中的变量作为因变量,通常认为受自变量影响或决定,因此被用来预测或建模。要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。(3) Independent 框该框中的变量是自变量,又被称为预测变量或解释变量。要运行 Means 过程,该框中必须至少有一个变量。要从源变量框中选取变量进入该框,同样只需激活所要选取的变量,然后按向右的箭头即可。选中变量进入该框后,可以看到上方的【Next】按

3、钮有效,单击该按钮进入下一层,在下一层的自变量将再细分样本。要回到上一层,单击【Previous】按钮即可。(4)Options 对话框单击 Options 按钮,即可打开“Options”对话框,如图 2 所示。图 2 Options 对话框 Cell Statistics 框从左边框中选择要输出的统计量进入该框,该框中的统计量是输出时显示的统计量,其排列顺序即是输出时显示的顺序。可供选择的统计量的意义如下:Sum(总和) 、Number of cases(观测量数目) 、Mean(均值) 、Median (中位数) 、Grouped median(分组中位数) 、Standard erro

4、r of the mean(均值标准误差) 、Minimum (最小值) 、Maximum(最大值) 、Range(范围) 、Standard deviation(标准差) 、Variance(方差) 、Kurtosis(峰度) 、Standard error of kurtosis(峰度的标准差) 、Skewness(偏度) 、Standard error of Skewness(偏度的标准差) 、First (首值) 、Last(尾值) 、Percentage of total sum(占总和的百分比) 、Percentage of total N(占观测量总数的百分比) 、Geometr

5、ic mean(几何均数) 、Harmonic mean(调和均数) 。 Statistics for First Layer该栏中有两个复选框,决定对第一层自变量的有关分析。 ANOVA table and eta 复选框选中该复选项对第一层自变量给出方差分析表和 eta 统计量 和 2。方差分析的零假设是,第一层自变量各水平上的因素量均值都相等。 统计量表明因变量和自变量之间联系的强度。 2 是因变量中不同组中差异所解释的方差比,是组间平方和与总平方和之比。 Tests for linearity 复选框选中该复选框产生 R 和 R2。只有早控制变量有基本的数量级(例如自变量表示年龄或人种

6、,不能是房子颜色或居住城市等) ,且自变量有三个水平以上。其检验的假设是因变量均值是第一层自变量值的线性函数。R 和 R2 测度线性拟合的良好度。R 是观测值与预测值之间的相关系数。3例题分析某医师测得如下血红蛋白值(g%) ,用 Means 过程对其做基本的描述性统计分析。表 1 血红蛋白值编号 性别 年龄 血红蛋白 编号 性别 年龄 血红蛋白1 1 18 13.66 21 2 16 11.362 1 18 10.57 22 1 16 12.783 1 16 12.56 23 1 18 15.094 2 17 9.87 24 2 18 8.675 2 17 8.99 25 2 17 8.56

7、6 2 17 11.35 26 2 18 12.567 1 17 14.56 27 2 17 11.568 1 16 12.40 28 1 16 14.679 2 16 8.05 29 1 16 7.8810 1 18 14.03 30 1 18 12.3511 2 18 12.83 31 1 16 13.6512 1 16 15.50 32 2 16 9.8713 2 18 12.25 33 2 18 10.0914 2 17 10.06 34 2 18 12.5515 1 16 10.88 35 1 18 16.0416 1 18 9.65 36 1 18 13.7817 2 16 8.3

8、6 37 1 17 11.6718 1 18 11.66 38 1 17 10.9819 2 18 8.54 39 2 16 8.7820 2 17 7.78 40 1 16 11.35(1)操作步骤 激活数据管理窗口,输入数据文件,定义变量名:性别为sex,年龄为age,血红蛋白值hb。按顺序输入数据( sex变量中,男为1,女为2) 。 按Analyze Compare Means Means 的顺序单击,即可打开“means”主对话框。 在对话框左侧的变量中选hb,单击向右按钮使之进入Dependent List框,选sex单击向右按钮使之进入Independent List 框。 单击

9、败【Options】按钮打开“Options”对话框,从中选择统计项目:在Cell Displays项中,选中Mean、Standard deviation、Variance、Number of Cases和 Sum五个复选框。 在Statistics for First Layer项中,将为第一层的分组选择计算方差分析(ANOVA table and eta)和线性检验(Test of linearity) 。单击【Continue 】按钮返回“Means ”主对话框。 选age单击向右按钮使之进入 Independent List框。重复和步骤,返回“Means” 主对话框。 在主对话框中

10、单击【OK】钮完成。(2)输出结果及分析表2是我们造已熟悉的观测量摘要表,说明了观测量总个数为40,其中有效值为40 个,无效值有0。表2 观测量摘要表Case Processing SummaryCasesIncluded Excluded TotalN Percent N Percent N Percent血红蛋白值*性别*年龄 40 100.0% 0 .0% 40 100.0%表 3 分为三部分,第一、第二部分先按性别分组(分男性和女性) ,再按年龄分组(16,17,18 岁三组)计算观测值合计、均值、标准差、方差和个数;第三部分是之按年龄分组,最后一行表示 40 个观测值合计为 457

11、.79,均数为11.4448,标准差为 2.2690,方差为 5.1484,个数为 40。若在 Independent List 中未分层次,即 sex 和 age 一起在 Layer 1of 1 中,则结果是分别计算男性与女性(不作年龄分组) 。16、17、18 岁三组(不作性别分组)的观测值合计、均值、标准差、方差和个数,如表 4、5 所示。表 3 分组描述统计量Report血红蛋白值性别 年龄 Mean N Std. Deviation Variance Sum男 16 12.4078 9 2.2455 5.042 111.6717 12.4033 3 1.8993 3.607 37.2

12、118 12.9811 9 2.0933 4.382 116.83Total 12.6529 21 2.0531 4.215 265.71女 16 9.2840 5 1.3494 1.821 46.4217 9.7386 7 1.4036 1.970 68.1718 11.0700 7 1.9158 3.670 77.49Total 10.1095 19 1.6989 2.886 192.08Total 16 11.2921 14 2.4649 6.076 158.0917 10.5380 10 1.9421 3.772 105.3818 12.1450 16 2.1827 4.764 194

13、.32Total 11.4448 40 2.2690 5.148 457.79表 4 按性别分组的描述统计量Report血红蛋白值性别 Mean N Std. Deviation Variance Sum男 12.6529 21 2.0531 4.215 265.71女 10.1095 19 1.6989 2.886 192.08Total 11.4448 40 2.2690 5.148 457.79表5 按年龄分组的描述统计量Report血红蛋白值年龄 Mean N Std. Deviation Variance Sum16 11.2921 14 2.4649 6.076 158.0917

14、10.5380 10 1.9421 3.772 105.3818 12.1450 16 2.1827 4.764 194.32Total 11.4448 40 2.2690 5.148 457.79表 6 是方差分析表,共有六列,第一列说明方差的来源,Between Groups是组间的,Within Groups 是组内的,Total 是总的。第二列为平方和,其大小说明了各方差来源作用的大小。第三列为自由度。第四列为均方,即平方除以自由度。第五列 F 值只 F 统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化没有解释能力。第六列是 F 值统计

15、量的显著值,由于这里显著性小于 0.05(我们的检验水平) ,所以模型是显著的,性别对血红蛋白有显著影响。由于性别分组只有两个水平,所以没有设计计算线性检验。表 6 方差分析表ANOVA TableSum of Squares df Mean Square F Sig.血红蛋白值* 性别 Between Groups (Combined) 64.526 1 64.526 17.995 .000Within Groups 136.261 38 3.586Total 200.787 39a With fewer than three groups, linearity measures for 血

16、红蛋白值 *性别 cannot be computed.表 7 是 eta 统计量表, 统计量表明因变量和自变量之间联系的强度,0.567 的值处于中等水平, 2 是因变量中不同组间差异所解释的方差比,是组内平方和与总平方和之比,即由 64.5256 除以 200.787 得到。表 7 eta 统计量Measures of AssociationEta Eta Squared血红蛋白值* 性别 .567 .321表 8、表 9 是将年龄作为第一层自变量得到的方差分析表和 eta 统计量表。表 8 中多了两行,Linearity 是假设因变量均值是第一层自变量值的线性函数,Deviation f

17、rom Linearity 是不能由线性模型解释的部分。表 9 中是 R 和 R2 测度线性拟合的良好度,R 是观测值与预测值之间的相关系数。表 8 按年龄分组的方差分析表ANOVA TableSum of Squares dfMean Square F Sig.血红蛋白值*年龄 Between (Combined) 16.394 2 8.197 1.645 .207Groups Linearity 5.952 1 5.952 1.194 .282Deviation from Linearity 10.441 1 10.441 2.095 .156Within Groups 184.394 3

18、7 4.984Total 200.787 39表 9 按年龄分组的 eta 统计量表Measures of AssociationR R Squared Eta Eta Squared血红蛋白值*年龄 .172 .030 .286 .082二、单一样本 T 检验1简单介绍单一样本 T 检验(One-Sample T Test)是检验单个变量的均值是否与假设检验值(给定的常数)之间存在差异。例如,研究某地区高考数学平均分数与去年分组(定值)的差异。如果已知总体均数,进行样本均数与总体均数之间差异显著性检验也属于单一样本的 T 检验。例如,研究某地区高考数学平均分数与全省高考数学平均分数的差异,这

19、样的问题就是依靠进行样本均数与总体均数之间差异显著性检验,即进行单一样本的 T 检验来解决的问题。单一样本 T 检验过程对每个检验变量给出的统计量包括观测量个数、均值、标准差和均值的标准差,它还给出了每个数据值与假设检验值之间的差的平均值以及进行该差值为 0 的 T 检验和该差值的置信区间,并且用户可以指定这个显著性水平。2完全窗口分析(1)One-Sample T Test 主对话框按 Analyze Compare Means One Sample T Test 的顺序单击,就可以打开主对话框,如图 3 所示。图 3 单一样本 T 检验主对话框(2)Test Variable 框Test

20、Variable 框中的变量是要作检验的变量,要从源变量框中选取变量进入该框,只需选中所要选的变量,然后按向右的箭头即可。(3)Test Valeu 参数框在该框中输入一个定值作为假设检验值。(4)Options 对话框在主对话框中单击【Options】键,即可打开“Options”对话框,如图 4 所示。图 4 Options 对话框 Confidence Interval 参数框在该框中输入置信区间,必须在 199 之间,一般取为 90、95、99 等,过程将给出这个置信区间的上下限。需要说明的是,计算置信区间的变量不是样本值,而是样本值和假设检验值(Test Value )的差。 Mis

21、sing Value 框在该框中选择缺失值的处置方式。 Exclude cases analysis by analysis 选中该框,在检验变量中含有缺失值的观测将不被计算。 Exclude cases listwise 选中该框,在任何一个变量中含有缺失值的观测都将不被计算。3例题分析仍以上例来说明。已知另一地区 1618 岁少年血红蛋白平均值为 11.657g%,检验这一地区 1618 岁少年血红蛋白值是否与另一地区的平均值相等。(1)操作步骤 按 Analyze Compare Means One Sample T Test 的顺序单击,就可以打开主对话框。 将变量 hb 选入 Tes

22、t Variable 框。 在 Test Value 框中输入 11.657。单击【OK】完成。(2)输出结果及分析表 10 是血红蛋白值的一些统计量,包括观测量个数、均值、标准差和均值标准误差。表 10 单个样本统计量One-Sample StatisticsN Mean Std. Deviation Std. Error Mean血红蛋白值 40 11.4448 2.2690 .3588从表 11 中可以看出,t 值为0.592,自由度为 39,显著值为 0.558,样本均值与检验值的差为0.2122,该差值 95%的置信区间是0.93790.5134。表 11 单个样本检验One-Sam

23、ple TestTest Value = 11.657t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the DifferenceLower Upper血红蛋白值 -.592 39 .558 -.2122 -.9379 .5134三、独立样本 T 检验1简单介绍独立样本 T 检验(Independent Samples T Test)用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应该使用陪对 T 检验(Paired Samples T Test) 。如果分组比止一个

24、,应该使用 One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量,应该使用 Crosstable 功能。独立样本 T 检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应该使用一种非参数检验过程(Nonparametric test) 。2完全窗口分析在完全窗口分析过程中将要遇到的各个对话框和选择项如下。(1)主对话框按 Analyze Compared Means Independent-Samples T Test 的顺序单击,即可打开“Independent-Samples T Test”主对话框,如图 5 所示。图 5 独立样本 T 检验主对话框(2)

25、Test Variable 框Test Variable 框中的变量是要作检验的变量,要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。(3)Grouping Variable 框该框中的变量是分组变量,只能有一个,该变量将样本分为两组来检验。分组变量必须是两值变量或具有某种分类特征的变量,前者如性别,后者如体重,例如以 60kg 为分界值分为两组。(4)Define Groups 对话框在主对话框中单击【Define Groups】 ,打开 Define Groups 对话框。 Use Specified Values选中该栏,在 Group 1 和 Group

26、2 后的框中分别输入分组变量的取值调价,就把样本按该分组变量分成了两组。例如,如果分组变量是性别, “1”代表“男” , “2”代表“女” ,那么在 Group 1 后的框中输入“1” ,Group 2 后的框中输入“2” ,就按性别把样本分成了两组。 Cut Point选中该框,并在参数框中输入分界点值,即把样本按该分界点分成了两组。例如,如果分组变量是体重,选中该框并输入 60kg,就把样本分成了两组。(5)Options 对话框在主对话框中单击【Options】即可打开 Options 对话框。该框中可以设置置信区间和对缺失值的处理方法(参见单一样本 T 检验中的 Options 对话框

27、操作) 。3例题分析仍以上述为例来说明。(1)操作步骤 按 Analyze Compared Means Independent-Samples T Test 的顺序单击,即可打开“Independent-Samples T Test”主对话框。 将变量 hb 选入 Test Variable 框中作为检验变量。 将变量 sex 选入 Grouping Variable 框作为分组变量。 单击【Define Groups】 ,打开 Define Groups 对话框。在 Group 1 后的框中输入“1” ,Group 2 后的框中输入“2” ,单击【 Continue】返回。 单击【OK】结

28、束。(2)结果输出及分析输出结果见表 12 和表 13。表 12 是分组统计量表,列出的统计量包括观测量个数、均值、标准差和均值的标准误差。表 12 分组统计量Group Statistics性别 N Mean Std. Deviation Std. Error Mean血红蛋白值 男 21 12.6529 2.0531 .4480女 19 10.1095 1.6989 .3898表 13 是独立样本 T 检验结果,Equal variances assumed 行是假设方差相等进行的检验,当方差相等是非分明考察这一行的结果;Equal variances not assumed 行是假设方差

29、不等进行的检验,当方差不等时考察这一行的结果。在Livenes Test for Equality of Variance 列中,显著值为 0.5440.15,可认为方差是相等的,所以应考察第一行的结果。可以看到,显著值为 0.0000.05,所以认为均值是不等的。表 13 独立样本 T 检验结果Independent Samples TestLevenes Test for Equality of Variancest-test for Equality of Means95% Confidence Interval of the DifferenceF Sig. t dfSig. (2-t

30、ailed)Mean DifferenceStd. Error DifferenceLower UpperEqual variances assumed.376 .544 4.242 38 .000 2.5434 .5996 1.3296 3.7571血红蛋白值Equal variances not assumed4.283 37.722 .000 2.5434 .5938 1.3409 3.7458四、配对样本 T 检验1简单介绍配对样本 T 检验(Paired-Sample T Test)用于检验两个相关的样本是否来自具有相同均值的总体。比如考察同一组人在参加一年的长跑锻炼前后的心率是否有

31、显著差异。这里,每个人一年前的心率和一年后的心率是相关的,心率较快的人锻炼后仍然相对其他人较快。所以,检验这样的成对总体的均值不能使用独立样本 T 检验的办法,因为独立性条件不再满足。这时,我们可以检验两个变量间的差值的均值是否为零,这等价于检验两组测量值的平均水平有无显著差异。例如,我们想知道 MATH 和 ENGLISH 这两门考试的成绩有无显著差异(MATH 平均值为 84.5,ENGLISH 平均值为 80.6,我们希望知道差异是否显著) ,因为这两个成绩是同一个学生的成绩,所以它们之间是相关的(学得好的学生两科一般都好,学得差的一般两科都差) ,不能用独立两个样本的 t 检验,但可以

32、计算两变量间的差 DMEMATHENGLISH,检验差值变量的均不值是否为零。2完全窗口分析(1)Paired Sample T Test 主对话框按 Analyze Compared Means Paired-Samples T Test 的顺序单击,即可打开“Paired Sample T Test”主对话框,如图 6 所示。图 6 Paired Sample T Test 主对话框(2)Paired Variables 框在主对话框中可以看到 Paired Variables 框,该框中的变量作为分析变量,总是成对出现。要从左边源变量框中选择变量进入此框,只需在源变量框中选择两个变量,此

33、时,可以在 Current Selections 栏中看到所选择的变量,然后单击向右键即可在 Paired Variables 框中看到这两个变量,中间用“-”相连。例如,在源变量框中选择好两个变量 MATH 和 ENGLISH,此时,可以在Current Selections 栏中看到所选择的变量,然后单击向右键即可在 Paired Variables 框中看到 “MATH-ENGLISH”。(3)Current Selections 栏在该栏中显示被选中的成对变量,在源变量框中选择两个变量后,就可以在 Current Selections 栏中看到所选择的变量。(4)Options 对话框

34、在主对话框中单击【Options】即可打开“Options”对话框,如图 7 所示,该框的主要功能是确定置信水平和对缺失值的处理办法(参见单一样本 T 检验中的 Options 对话框操作) 。图 7 Options 对话框3例题分析某单位研究饲料中缺乏维生素 E 与肝中维生素 A 含量的关系,将大白鼠按性别、体重等配为 8 对,每对中两只大白鼠分别喂给正常饲料和维生素 E 缺乏饲料,一段时间后测定其肝中的维生素 A 含量( mol/L)如下,现在想知道饲料中缺乏维生素 E 对鼠肝中维生素 A 含量有无影响。表 14 配对样本 T 检验数据肝中维生素 A 含量(mol/L)大白鼠配对编号正常饲

35、料组 维生素 E 缺乏组1 37.2 25.72 20.9 25.13 31.4 18.84 41.4 33.35 39.8 34.06 39.3 28.37 36.1 26.28 31.9 18.3(1)操作步骤 打开数据管理窗口,输入数据,并定义变量名:正常饲料组测定值为x1,维生素 E 缺乏饲料组测定值为 x2。按 Analyze Compared Means Paired-Samples T Test 的顺序单击,即可打开“Paired Sample T Test”主对话框。 从对话框左侧的变量列表中单击 x1,这时在左下方的 Current Selections框中 Variable

36、 1 处出现 x1,再从变量列表中单击 x2,左下方的 Current Selections 框中 Variable 2 处出现 x2,单击向右键使 x1、x2 进入 Variables 框。 单击【OK】即完成分析。(2)输出结果及分析表 15 配对 T 检验描述统计量Paired Samples StatisticsMean N Std. Deviation Std. Error MeanPair T 正常组 34.750 8 6.649 2.351缺乏维E组 26.238 8 5.821 2.058表 15 说明了一些基本的描述统计量,从中可以看出,变量 x1 的均数(Mean ) 、标

37、准差(SD) 、标准误(SE of Mean)分别为34.7500、6.649、2.351;变量 x2 的均数、标准差、标准误分别为26.2375、5.821、2.058。表 16 配对 T 检验相关性Paired Samples CorrelationsN Correlation Sig.Pair T 正常组缺乏维E组 8 .586 .127表 16 说明本例共有 8 对观察值,相关系数(C)为 0.586,相关系数的显著性检验表明显著值为 0.127。表 17 配对样本 T 检验结果Paired Samples TestPaired Differences95% Confidence In

38、terval of the DifferenceMean Std. Deviation Std. Error MeanLower Upper t dfSig. (2-tailed)Pair 正常组-缺乏维E组 8.513 5.719 2.022 3.731 13.294 4.210 7 .004表 17 说明变量 x1、x2 两两相减的差值均数、标准差、差值均数的标准误差分别为 8.513、5.719、2.022,95%可信区间(95%CI)为 3.730,13.295。配对检验结果表明 t 为 4.21,自由度为 7,显著值为 0.004,差别具高度显著意义,即饲料中缺乏维生素 E 对鼠肝中维生素 A 含量确有影响。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报