1、第 3 次实验报告实验项目名称:均值过程和 T 检验一、 均值过程均值过程是 SPSS 计算各种基本描述统计量的过程。均值过程就是按照用户指定条件,对样本进行分组计算均数和标准差。用户可以指定一个或多变量作为分组变量。如果分组变量为多个,还应指定这些分组变量之间的层次关系。层次关系可以使同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二分组变量进行分组。实际操作:案例来源:SPSS 统计分析大全:清华大学出版社5.1比较不同性别学生的成绩平均值。分析:按照用户指定条件,对样本进行分组计算均数和标准差。
2、用 SPSS 软件操作,得出结果如下表所示,男生的成绩均值为 85.50,标准差为4.232;女生的平均成绩为 88.17,标准差为 4.324;即女生的平均水平比男生的平均水平要高,但是男生的成绩相对于女生更为集中分布。表1 案例处理摘要案例已包含 已排除 总计N 百分比 N 百分比 N 百分比成绩 * 性别 24 100.0% 0 0.0% 24 100.0%表2 报告成绩性别 均值 N 标准差男 85.50 12 4.232女 88.17 12 4.324总计 86.83 24 4.400二、 T 检验(一) 单样本 T 检验1. 原理:单样本 T 检验的目的是利用来自某总体的样本数据,
3、推断该总体的均值是否与指定检验值之间存在显著性差异。这里前提是要求样本来自的总体服从正态分布。2. 步骤:1) 根据题意提出原假设 H0 和备择假设 H12) 选择检验统计量当总体分布为正态分布时,样本均值的抽样分布仍为正态分布,该正态分布的均值为 ,方差为 2/n,即N(, 2/n)式中, 为总体均值,当原假设成立时,= 0, 2为总体方差。n 为样本数。总体分布近似服从正态分布时,通常总体方差是未知的,此时可以用样本方差 S2 替代,得到的检验统计量为 t 统计量,式中,t 统计量服从自由度为 n-1 的 t 分布。单样本 T 检验的统计量即为 t 统计量。当认为原假设成立时用 代替 0。
4、3) 计算检验统计量的观测值和概率值该步目的是计算检验统计量的观测值和相应的概率 P 值。SPSS 将自动将样本均值、 0 样本方差、样本数带入式中,计算出 t 统计量的观测值和对应的概率 P值。4) 给定显著性水平 ,并作出决策如果概率 P 值小于显著性水平 ,则应拒绝原假设;反之,则应接受原假设。3. 实际操作案例来源:SPSS 统计分析大全:清华大学出版社5.2某药物在某种溶剂中溶解后的标准浓度为 20.00mg/L。先采用某种方法,测量该药物溶解液 11 次。问:用该方法测量所得的结果是否与标准浓度值有所不同?分析:目的是利用来自某总体的样本数据,推断该总体的均值是否与指定检验值之间存
5、在显著性差异,假设样本来自的总体服从正态分布,用单样本 T 检验。过程:H0:用该方法测量所得的结果与标准浓度值相同H1:用该方法测量所得的结果与标准浓度值不同使用 SPSS 得出下表表中显示 N=11,均值为 20.9836,标准差为 1.06750;在检验值为 20.00,置信水平为 0.05的数值下的 t 统计量为 3.056,不在(0.2665,1.7008)之内;P 值=0.0120.05所以拒绝 H0,暂时接受 H1表3 单个样本统计量N 均值 标准差 均值的标准误浓度 11 20.9836 1.06750 .32186表4 单个样本检验检验值 = 20.00差分的 95% 置信区
6、间t df Sig.(双侧) 均值差值下限 上限浓度 3.056 10 .012 .98364 .2665 1.7008(二) 独立样本 T 检验1. 原理:利用两个总体的独立样本,推断两个总体的均值是否存在显著差异。这个检验的前提要求是:(1)独立。两组数据相互独立,互不相关;(2)正态,剂量组样本来自的总体符合正态分布;(3)方差齐性。即两组方差相等。2. 步骤:1) 提出零假设2) 选择检验统计量A. 当量总体方差未知且相等,即 1= 2时,采用合并的方差作为两个总体的方差估计,数学定义为:(t 统计量服从个自由度的 t 分布)B. 当量总体方差未知且不相等,即 12 时,分别采用各自的
7、方差,此时两样本均值差的抽样分布的方差 212 为:(t 统计量服从修正自由度的 t 分布)于是,两总体均值差的检验统计量为 t 统计量:3) 计算检验统计量观测值和概率 P 值4) 给定显著性水平 ,并作出决策3. 实际操作案例来源:SPSS 统计分析大全:清华大学出版社5.3现希望评价两位老师的教学质量,是比较其分别任教的甲、乙两班(设甲、乙两班原成绩相近,不存在差别)考试后的成绩是否存在差异?分析:有两个总体的独立样本,推断两个总体的均值是否存在显著差异。过程:H0:考试后的成绩不存在差异H1:考试后的成绩存在差异甲班样本数为 20,均值为 83.30,标准差为 6.906;乙班样本数为
8、 20,均值为75.45,标准差为 9.179。说明甲班成绩均值高于乙班且标准差小于乙班,波动较小。95% 置信区间里, t 统计量在置信区间的上下限范围之内,因此,我们选择接受原假设,即甲乙两班考试后的成绩不存在差异。表5 组统计量class N 均值 标准差 均值的标准误甲班 20 83.30 6.906 1.544score乙班 20 75.45 9.179 2.053表6 独立样本检验方差方程的 Levene 检验均值方程的 t 检验差分的 95% 置信区间F Sig. t df Sig.(双侧)均值差值标准误差值下限 上限假设方差相等 .733 .397 3.056 38 .004
9、7.850 2.569 2.650 13.050score假设方差不相等 3.056 35.290 .004 7.850 2.569 2.637 13.063(三) 配对样本 T 检验1. 原理:利用来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。在配对设计得到的样本数据中,每对数据之间都有一定的相关,如果忽略这种关系就会浪费大量的统计信息,因此配对样本 T 检验的前提要求为:(1)两样本必须是配对的。配对可以从两个因素考虑,首先,两样本的观察值数目相等;其次,两样本的栓差值的书序不能随意更改。 (2)样本来自的两个总体应服从正态分布。2. 步骤1) 提出原假设2) 选择检验统
10、计量3) 计算检验统计量观测值和概率 P 值4) 给定显著性水平 ,并作出决策3. 实际操作案例来源:SPSS 统计分析大全:清华大学出版社5.4某地区随机抽取 12 名贫血儿童的家庭,实行健康教育干预三个月,干预前后儿童的血红蛋白(%)测量结果如 sav,试问干预前后该地区贫血儿童血红蛋白( %)平均水平有无变化?分析:干预前后的数据可以当成是来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。过程:H0:干预前后该地区贫血儿童血红蛋白( %)平均水平有变化H1:干预前后该地区贫血儿童血红蛋白( %)平均水平没有变化结果:表所示为配对样本 T 检验分析的结果,干预前的均值为 49
11、.50,标准差为11.334,干预后的均值为 60.17,标准差为 10.599,说明干预后该地区贫血儿童血红蛋白(%)平均水平有增长,且波动幅度不大。结果显示统计量 t=-3.305,P 值=0.0070.05,因此接受原假设,即可以认为干预前后该地区贫血儿童血红蛋白(%)平均水平有变化,且变化方向为增长。表8 成对样本统计量均值 N 标准差 均值的标准误干预前 49.50 12 11.334 3.272对 1干预后 60.17 12 10.599 3.060表9 成对样本检验成对差分差分的 95% 置信区间均值 标准差 均值的标准误下限 上限t df Sig.(双侧)对 1干预前 - 干预后 -10.667 11.179 3.227 -17.769 -3.564 -3.305 11 .007成绩评定:该生对待本次实验的态度 认真 良好 一般 比较差本次实验的过程情况 很好 较好 一般 比较差对实验结果的展示 很好 良好 一般 比较差文档书写符合规范程度 很好 良好 一般 比较差成绩 指导教师签名 刘静静 日期 2016.5.26