1、医药数理统计实验指导书(2012 年 6 月修订版)广东药学院数学部(2012 年 6 月)电邮:2目 录前言 SPSS 概述和 实验指导使用 说明实验一 频数分析表分析实验二 正态性检验(单样本 K-S 检验)实验三 配对样本 T 检验实验四 独立样本 T 检验实验五 单因素方差分析实验六 总体分布的 检验2实验七 交叉列联表分析实验八 一元线性回归分析实验九 综合实验参考文献:1 马斌荣.SPSS for Windows 在医学科研统计中的应用.科学出版社,2000.82 三味工作室.SPSS V10.0 for windows 实用基础教程.北京希望电子出版社, 2001.2前言 SPS
2、S 概述和实验指导使用说明SPSS(Statistical Package for Social Science,社会科学 统计软件包)是世界上最优秀的统计分析软件包之一。1968 年,3 位美国斯坦福大学的学生开 发了最早的 SPSS 统计软件系统,并基于这一系统于 1975 年在芝加哥合伙成立了 SPSS 公司。伴随着 SPSS 产品服务领域的扩大和服务深度的增加,SPSS 公司已决定将它的英文全称更改为 Statistical Product and Science Solutions,意 为“统计产品与服 务解决方案”。SPSS 已广泛应用于自然科学、社会科学中,其中涉及的 领域包括工
3、程技术、 应用数学、经济学、商业、金融、生物学、医疗卫生、体育、心理学、 农林等等。只要有需要 对 各种数据如数值型、字符型、 逻辑型等进行统计分析3的地方,就有 SPSS 的用武之地。与 SAS 统计软件相比,SPSS 除了功能强大、 应用广泛的 优点之外, 还具有一个对于同学来说最大的优点,就是易学易用。它不需要编写任何程序,故就不用担心编程中的微小 错误,导致计算机不运行。从这个意义上来说,它是非统计专业学生的首 选统计学习软件。SPSS 在面向用户的使用方面主要有以下三个突出的优势:(1)Windows 的窗口方式和界面友好的对话框;(2)得出的结果均以直观易懂的图表示,在这些图表当中
4、尽可能地使用通用数学符号;(3)拥有全面生动的帮助,例如在 Help 菜单中 Statistics Coach 命令项当中就有动画演示。因此对于一般的用户只要会基本的 Windows 操作和对数理统计有初步的基础,就能使用该软件。对于一个繁杂的统计计算,几乎瞬间电脑 就给出正确的结果,我 们何 乐而不为呢?本实验指导包括基础的统计分析有:描述性统计、t 检验、方差分析、列联表分析、回归分析、相关分析、非参数检验等专业统计分析。实验 指导分为九个实验。 为了便于学 习,每一章节主要分为六部分:问题、实验目的、原理、实验内容与要求、结果解释、 练习。 实验九包含有一个真实的实例,通过此练习题,我
5、们将学会从建立数据文件、到选择相应的统计方法,以及对其结果的正确解释的整个 统计分析过程。我们要求每一位同学,在上机实验前,应详细、认真地阅读实验指导,以便能更快、更好地掌握这门处理和分析数据的强有力的统计工具。相信通 过同学们的努力,你们一定能熟 练使用这一有用的软件。事 实证 明,电脑高手不是老师完全能教出来的,是玩出来的。如果你想成为一位高手的 话,那就赶 紧动手大胆地使用它吧!值得一提的是,统计软件包的使用 虽然给我们的学习带来极大的便利,但是仍然不能忽视统计理论知识的学习。 有一项最新研究结果显示,能够熟练地操作计算机的学生在学 习方面不一定优秀,拥有计算机的学生学习的东西往往较少。
6、因此,我们期望同学们要充分重视统计理论知识的学习,因为没有对统计基本原理和统计方法的熟练掌握,就根本谈不上正确使用 统计软件,甚至 还可能误 用、滥用和错用统计方法。教学实践证实,那些统计概念不清的同学在综合运用软件时会感到困惑和不知所措,例如,不能合理设置变量,不能正确选择统计方法,对输出结果也不能正确解释等等。编者实验一 频数分析表分析问题例 1 某地 25 例健康男子的血清总胆固醇值测定结果如下,请根据 这些数据, 绘 制出频数表、直方图 ,并 计算其均数、标准差、方差、变异系数 CV、标准 误、极差、中位数、众数。4.40 4.55 5.38 3.89 4.60 4.47 4.08 4
7、.79 3.37 6.14 3.95 3.56 4.23 3.64 4.34 5.16 5.30 4.97 3.18 3.97 44.77 5.10 4.31 4.71 5.02二、实验目的(1)认识 SPSS 11.0 for windows 界面,了解 SPSS 的基本命令。(2)掌握数据文件的建立:定义变量、数据 录入。(3)掌握描述性统计中最常用的方法频数分析表分析(Frequencies)三、原理(一)常用的描写变量值的集中趋势的统计量有:1.算术均值(Mean):其计算公式为: 1nix2.中位数(Median ):若样本含量 n 为奇数时,那么把观察值按大小顺序排列后,取中间那个
8、即为中位数。若样本含量 n 为偶数时,那么把 观察值按大小 顺序排列后,取中间的两个,求其平均值为中位数。3.众数(Mode):指在一组数据中出 现次数最多的那一个数。(二)常用的描写变量值的离散程度(或变异程度)的统计量有:1. 极差(Range) Range max-min2. 方差(Variance) 222211()()nni ii iSxx3. 标准差(Std.deviation) SDS 21()nii4. 标准误(S.E.Mean) SE nD5. 变异系数(CV) CV (此结果必须手工 计算,软件没有计算)%10xS四、实验内容与要求(1)建立数据文件 .sav。(2)单击
9、SPSS 11.0 for windows 界面左下方(第二栏)“variable view(变量界面)”,定义变量名 X1(在 SPSS变量名中字母没有大写,只有小写);单击(第一栏)“Data view(数据界面)”, 输 入数据。也可以保存或利用已输入的数据。(3)从菜单“Analyze”“Descriptive Statistics”“Frequencies(频率)”, 单击进5入 Frequencies 对话框,将 X1 选入 Variables(变量) 框。(4)在 Frequencies 对话框的下方,单击(第一栏)“statistics(统计 )”按钮进入 statistics
10、 对话框,按题目需要选中 Mean(算术均值)、Median(中位数)、Mode(众数)、 Std.deviation (标准差 SD)、Variance (方差)、Range(极差)、S.E.Mean(标准误) 、Minimum(最小值)、Maximum(最大值) 、Sum(总和)等。单击“continue” 按钮,返回 Frequencies 对话框。(5)在 Frequencies 对话框的下方,单击(第二栏)“charts”按钮,进入 charts 对话框,选中 Histograms(柱状图)、以及 with normal curve(正 态曲线 )。单击“continue”按钮,返回
11、 Frequencies 对话框。 (6) 单击“ok”按钮。(7) 得出结果后手工计算出 CV(变异系数)。 (CV )%10xSD注意:计算新题目之前,切记清除原有数据。输入命令:clear 或重新进入 SPSS 系统。五、结果解释输出结果如下: Frequencies X1 表 1.1 统计结果6S tatisticsX12504.4752.138504.47003.18a.69249.479542.96ValidM issingNM eanStd. Error of M eanM edianM odeStd. D eviationVarianceRangeM ultiple m ode
12、s exist. The sm allest value is show na. X1 图 1.1 直方图X16.256.005.755.505.255.004.754.504.254.003.753.503.25X1Frequency543210Std. Dev = .69 Mean = 4.48N = 25.00从表 1.1 统计结果可知,均数 Mean4.4752,标准误 Std. Error of Mean0.13850,中位数Median4.4700,众数 Mode(注意不是最小值 3.18,7在表 1.1 的下方有注明“a.Multiple modes exist. The sma
13、llest value is shown”),(表明:有多个众数存在,只显示最小者)。标 准差 Std. Deviation0.69249, 方差 Variance0.47954, 极差Range2.96。六、练习1.设 20 名新生婴儿体重(单位:g)如下, 请根据这些数据,绘制出频数表、直方图,并计算其均数、标准差、方差、变异系数 CV、标准误、极差、中位数、众数。3020 3200 2440 3600 2620 3210 3500 2700 2880 38603080 2900 3000 3100 3040 3180 3440 3300 3420 3500实验二 正态性检验(单样本 K-
14、S 检验)一、问题例 2 从某批袋装散剂中抽取 100 称重,得 频数结果如下,试判断 该样本的总体是否服从正态分布? 组中值 0.78 0.81 0.84 0.87 0.90 0.93 0.96 0.99 1.02 1.05频数 1 4 7 22 24 24 10 6 1 1 二、实验目的掌握正态性检验方法,能判断 样本的总体是否服从正态分布。三、原理单样本 K-S 检验(one-smple Kolmogorov-Smirnov test)是以俄罗斯数学家 Kolmogorov 和 Smirnov 命名的一种非参数检验(Nonparametric Test)方法。 该方法利用样 本数据推断样
15、本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索 连续型随机变量的分布。SPSS 中单样本 K-S 检验能检验理论分布主要包括正态分布、均匀分布、泊松分布、指数分布等。单样本 K-S 检验的零假设为样本来自的总体与指定的理论分布无显著差异。四、实验内容与要求: (在进 行新题目之前,切 记清除原有数据或重新 进入 SPSS 系统。 )(1)建立数据文件 *.sav。此例题的数据录入有 2 种方法。方法一:定义变量名 X1,输入例 2 中的 100 个数据,如 图 2.1 所示。8图 2.1 袋装散剂的 100 个数据方法二:定义变量名 X1,输入例 2 中的 10 个组中
16、值;定义变量名 f,输入每个组中值所相对应的频数,以变量 f 标识 各组中值出现 的频数。如图 2.2 所示。图 2.2 袋装散剂的组中值及相其对应的频数从菜单“Data”“Weight Cases”,如图 2.3 所示。把“频数f” 放入 Frequency 栏中, 单击“ok”按钮。图 2.3 Weight Cases 对话框(2)从菜单“Analyze”“Nonparametric Test”“one smple K-S test”。9(3)选中“X1”进入 Test Variable List 框,选择 Test Distribution(检验分布) 中的 Normal(正态分布),
17、如图 2.4 所示。图 2.4 one-smple Kolmogorov-Smirnov Test 对话框(4)单击“ok”按钮即可。五、结果解释输出结果表2.1 One-Sample Kolmogorov-Smirnov Test(单样本K-S检验)从表 2.1 中的 K-S 正态性检验结果显示, Z 值=1.277,双尾 检验 概率 P 值=0.0770.05,可以认为该样本来自的总体服从正态分布。10六、练习1 从一批药物中随机抽取了 10 份样品, 测定其某种成分的含量 X,结果如下(单位:mg),试判断这批药物内该成分的含量是否服从正态分布?X 0.99 1.04 1.14 1.17
18、 1.17 1.26 1.30 1.39 1.43 1.51 2试判断下列数据是否来自正 态分布总体?组中值 120 150 170 190 210 230 250频数 12 12 27 23 12 8 73随机抽查了 100 个零件上的疵点数,结果如表 2.2表 2.2 疵点数的频数疵点数 0 1 2 3 4 5 6频 数 14 27 26 20 7 3 3试判断该样本的总体是否服从泊松分布? 实验三 配对样本 T 检验T 检验 用于对 两组计量资料的均数显著性检验。它要求该两组资料都分别服从正态分布或近似正态分布。它可分为两配 对样本 T 检验(paired-Samples T test)
19、和两独立 样本 T 检验(Independent-Samples T test)。本实验为配对样本 T 检验。一、问题例 3. 10 名失眠患者,服用甲乙两种安眠药。 以 X、Y分别表示使用甲乙两种安眠药后各个患者睡眠的延长小时数,结果如下:患者号 1 2 3 4 5 6 7 8 9 10服甲药 X 1.9 0.8 1.1 0.1 -0.1 4.4 5.5 1.6 4.6 3.4服乙药 Y 0.7 -1.6 -0.2 -1.2 -0.1 3.4 3.7 0.8 0.0 2.0d 1.2 2.4 1.3 1.3 0 1 1.8 0.8 4.6 1.4 =1.58d试问这两种安眠药的疗效有无显著性
20、差异?11二、实验目的掌握配对样本下 T 检验(paired-Samples T test)的统计分析方法。三、前提要求、零假设、原理配对样本 T 检验 的前提要求:1)两个样本应是配对的;2)样本来自的两个总体应服从正态分布。配对样本检验的零假设为:两总体均值间无显著性差异。配对样本 T 检验 用于比较两个正态总体的均值的差异是否显著,一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。四、实验内容与要求 (在进 行新题目之前,切 记清除原有数据或重新 进入 SPSS 系统
21、。 )(1)建立数据文件 .sav。(2)定义变量名 X1、X2,注意输入数据时,数据文件中一对数据必须作为同一观测量中的两个变量值,如图 3.1 所示。图 3.1 10 名失眠患者服用甲乙两种安眠药的数据文件(3)从菜单“Analyze”“Compare Means”“paired-Samples T Test”。进入配对样本 T 检验主12对话框并激活它,将 X1、X2 组成配对,全部选入Paired Variables(配对变量)框。(4)单击“option”按钮,进入 option 对话框,可修改“Confidence Interval” 后面的值(系统默认的置信度为 95%)。单击
22、“continue”按钮,返回主对话框。(5)单击“ok”按钮提交运行。五、结果解释输出结果如下:T-Test表3.1 Paired Samples Statistics(配对样本统计量)Paired Samples Statistics2.3300 10 2.00225 .63317.7500 10 1.78901 .56573X1X2Pair 1Mean N Std. DeviationStd. ErrorMean表3.2 Paired Samples Correlations(配对样本相关系数)Paired Samples Correlations10 .795 .006X1 & X2P
23、air 1N Correlation Sig.表3.3 Paired Samples Test(配对样本检验结果)13Paired Samples Test1.5800 1.23000 .38896 .7001 2.4599 4.062 9 .003X1 - X2Pair 1Mean Std. DeviationStd. ErrorMean Lower Upper95% ConfidenceInterval of theDifferencePaired Differencest df Sig. (2-tailed)(1)从表 3.1 统计结果可知,X1 的均数 Mean2.3300,标准差 S
24、td.Deviation2.00225, 标准误 Std. Error of Mean 0.63317;X2 的均数 Mean0.7500, 标准差 Std.Deviation1.78901,标准误 Std. Error of Mean0.56573。(2)从表 3.2 统计结果可知,两配 对变量的样本相关系数 r0.795,P0.0060.05,可以认为服甲药与服乙药有显著相关关系。(3)从表 3.3 统计结果可知,服甲 药与服乙药配对值差的均数 Mean1.5800,标准差 Std. Deviation1.23000,标准误 Std. Error of Mean 0.38896,置信区 间
25、为 0.7001 到 2.4599。对于服甲药与服乙药,t4.062,自由度 df9,双尾检验概率 P=0.0030.05,故拒绝假设,可以认为这两种安眠药的疗效有显著性差异。注:sig 即 significance 的缩写;例如,significance of difference(差异显著性) ,statistical significance(统计显著性)六、练习1.在例 3 中,试问这两种安眠 药的疗效有无极其显著性差异?( 0.01)2.为了考察一种新药治疗矽肺病的效果,抽 查服用该药的 10 名矽肺病患者, 记录他们治疗前后血红蛋白含量如下:病人号 1 2 3 4 5 6 7 8
26、9 10治疗前 X 11.3 15.0 15.0 13.5 12.8 10.0 11.0 12.0 13.0 12.3治疗后 Y 14.0 13.8 14.0 13.5 13.5 12.0 14.7 11.4 13.8 12.0 问该药是否会引起血红蛋白的变化? 3为了比较新旧两种安眠药的 疗效, 10 名失眠患者先后( 间隔数日一以消除先期药物的影响)服用了两种安眠药测得延长睡眠时数如下:试验号 1 2 3 4 5 6 7 8 9 10新药延长时数 x 1.9 0.8 1.1 0.1 -0.1 4.4 5.5 1.6 4.6 3.4旧药延长时数 y 0 0.7 -0.2 -1.2 -0.1
27、2.0 3.7 0.8 3.4 2.4假定睡眠延长时数服从正态分布, 试问两种安眠药的疗效是否有 显著性差异?实验四 独立样本 T 检验一、问题例 4. 用 A、B 两种分析方法分析同一 药物中某成分的百分含量,得数据如下:A 法:41 45 41 62 46B 法:65 57 64 58 54 70 72 56试判断(1)两种分析方法的总体方差是否相等? (2)两种分析方法均值有无显著性差异?二、实验目的掌握独立样本的 T 检验(Independent-Samples T test)的统计分析方法14三、前提要求、零假设、原理独立样本 T 检验的前提要求:1)两个样本应是相互独立的;2)样本
28、来自的两个总体应该服从正态分布。两独立样本 T 检验的零假 设为:两总体均值间无显著性差异。所谓独立样本是指两个样本之间彼此独立没有任何关联。独立样本 T 检验用于比较两个独立样本来自的正态总体的均值的差异是否显著。 值得注意的是,在两个正态总 体的方差相等和不相等时,构造的检验统计量不同(参见下面注释)。因为我们未知两个正态总体的方差信息,故 应先通过 F 检验来判断。 (假设 F 检验给定显著水平为 (一般约定 =0.10),11T 检验给 定显著水平为 ,也可 )2121.如果 F 检验得出的相伴概率 P(概率 P 值) ,则认为两个总体的方差无显著性差异(即可以认为两总体具有方差齐性)
29、。1在分析判断 T 检验结果时选用 Equal variances Assumed(假定方差相等,即方差齐性)栏给出的相伴概率(检验结果表中第一栏数据)(双尾检验概率 P 值),如果 p 0.10,可以认为两总体方差相等(从而 T 检验的数据应看“Equal variances assumed”这一行)。(2)t-3.505,自由度df11,双尾 检验概率P=0.0050.05,故 这两种分析方法分析某成分含量有显著性差异。(3)A法样本的均数Mean47.0000 ,标准差Std.Deviation8.68907,标准误Std. Error of Mean3.88587;B法样本的均数Mea
30、n62.0000, 标准差Std.Deviation6.74007 ,标准误Std. Error of Mean2.38298;两样本均数之差-15.0000,均数之差的标准误4.27997,置信区间为-24.42016到-5.57984。六、练习1.在例 4 中,试问这两种分析方法的均 值有无极显著性差异?( 0.01)2.在研究防霉剂三乙基硫酸锡 (TSS)的毒性作用时,对 有关影响皮肤吸收的因素进行18nS试验。在皮肤干试(直接涂 TSS)状态下分别用密闭(污染皮肤与空气隔 绝)和敞开(暴露空气中)的方法处理二组小白鼠,经三小时后杀死,测定肝中 含量如下:18n密闭组(A 组) 1.49
31、 0.83 0.75 0.71 0.66 敞开组(B 组) 0.97 0.59 0.42 0.42 016试比较不同情况下肝中含 量(g/g)的差别有无显著差异? 18nS3. 为了比较两种安眠药的疗效,将 20 名年龄、性 别、病情等状况大体相同的失眠患者随机平分为两组,分别服用新旧两种安眠 药, 测得的睡眠延 长时数如下表: 新药组 1.9 0.8 1.1 0.1 -0.1 4.4 5.5 1.6 4.6 3.41x旧药组 0.0 0.7 -0.2 -1.2 -0.1 2.0 3.7 0.8 3.4 2.42假定两组睡眠延长时数均服从正态分布, 试检验两种安眠 药的疗效是否有显著性差异?4
32、. 为试验某中药在改变兔脑血流图方面的作用, 对 5 只兔子分 别测得给药前后的数据如下:给药前 4.0 2.0 5.0 6.0 5.0给药后 4.5 3.0 6.0 8.0 5.5试分别用配对比较的 t 检验( 实验三方法)和两组比较的 t 检验(实验四方法),说明该中药是否有改变兔脑血流图的作用。正确的应该是上述两种方法中哪一种? 为什么?实验五 单因素方差分析(oneway)一、问题例 5 某种药物合成试验中,仅 考虑温度 A 的不同水平: (0), (15), (30), 12A3(45), (60)对收率的影响。每一水平做 4 次试验,得数据如下,问不同温度对收率是否有显著影响。4A
33、表 5.1 五种温度下收率(%)的观测数据温度试验次数 (0) (15) (30) (45) (60)1A23A45A123495 43 65 61 9988 78 83 73 5098 32 86 42 5494 65 82 41 96二、实验目的掌握单因素方差分析(oneway )统计分析方法,以及多重比较检验。三、前提要求、零假设、原理方差分析的前提要求是各个水平下的总体服从方差相等的正态分布。在此检验方差相等的零假设为各水平总体方差无显著性差异,检验 方法与独立样本检验中方差是否相等的 检验方法完全相同。单因素方差分析的零假设为:各组均值间无显著性差异。单因素方差分析测试某一个控制变量
34、的不同水平是否给观察值造成了显著差异和变动。例如培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等等。在实际研究中,经常需要比 较两组以上样本均数的差别 ,这时就不能使用 T 检验方法作两两间的比较,而必须使用方差分析的方法,当然此方法亦适用于两组均数的比 较。 (注:多因素方差分析中的控制变量在两个或两个以上。例如,在获得教学效果的时候,不仅单纯考虑教学方法,还要考虑不同风格教材的影响,因此 这是两个控制变量交互作用的效果 检验)四、实验内容与要求 (在进行新 题目之前,切 记清除原有数据或重新 进入 SPSS 系统。 )17(1)建立数据文件 .sav 。(2)定义变量
35、名 X、group,其中 group 为分组变量,用 “1”标识 (0)水平,用“2” 标识 (15)水平,用“3”标1A2A识 (30)水平,用“4”标识 (45)水平,用“5”标识 (60)水平,用 变量 X 存放测量值,如 图 5.1 所示。3A4A5图 5.1 五种温度下收率(%)的 观测数据文件(3)从菜单“Analyze”“Compare Means”“One-way ANOVA”,进入“单因素方差分析主对话框”。(4)将变量“收率X” 选中,移入 Dependent List 独立列表栏,将变量“group” ,移入 Factor 栏。(5)点击“post Hoc”按钮,展开 p
36、ost Hoc Multiple comparisons 多重比较对话框,选择 Least-significant difference(LSD)。单击“continue”按钮,返回主对话框。(6)单击“ok”按钮 即可。五、结果解释 输出结果如下: Oneway表5.1:单因素方差分析 结果 ANOVAANOVAX4592.500 4 1148.125 3.888 .0234429.250 15 295.2839021.750 19Between GroupsWithin GroupsTotalSum ofSquares df Mean Square F Sig.表5.2:均数多重比较检验结
37、果18Multiple ComparisonsDependent Variable: XLSD39.2500* 12.15079 .006 13.3512 65.148814.7500 12.15079 .244 -11.1488 40.648839.5000* 12.15079 .005 13.6012 65.398819.0000 12.15079 .139 -6.8988 44.8988-39.2500* 12.15079 .006 -65.1488 -13.3512-24.5000 12.15079 .062 -50.3988 1.3988.2500 12.15079 .984 -25
38、.6488 26.1488-20.2500 12.15079 .116 -46.1488 5.6488-14.7500 12.15079 .244 -40.6488 11.148824.5000 12.15079 .062 -1.3988 50.398824.7500 12.15079 .060 -1.1488 50.64884.2500 12.15079 .731 -21.6488 30.1488-39.5000* 12.15079 .005 -65.3988 -13.6012-.2500 12.15079 .984 -26.1488 25.6488-24.7500 12.15079 .06
39、0 -50.6488 1.1488-20.5000 12.15079 .112 -46.3988 5.3988-19.0000 12.15079 .139 -44.8988 6.898820.2500 12.15079 .116 -5.6488 46.1488-4.2500 12.15079 .731 -30.1488 21.648820.5000 12.15079 .112 -5.3988 46.3988(J) GROUP2.003.004.005.001.003.004.005.001.002.004.005.001.002.003.005.001.002.003.004.00(I) GR
40、OUP1.002.003.004.005.00MeanDifference(I-J) Std. Error Sig. Lower Bound Upper Bound95% Confidence IntervalThe mean difference is significant at the .05 level.*. 由表 5.1、5.2 可得出以下结论 :注意:表 5.2 底行表明显著性水平取 0.05,当 P 值0.05,故可认为孟德尔的试验结果符合理论结果。2六、练习1一个正 20 面体,每个面上都标有 0,1,2,3,9 中的某一个数字,并且这 10 个数中的每一个都标在两个面上。 现
41、在抛掷这个正 20 面体 800 次, 标有数字 0,1,2,3,9 中的各面朝上的次数如下所示。朝上的数字 0 1 2 3 4 5 6 7 8 9频数 81 93 84 79 82 69 74 71 91 76判断这个正 20 面体是否由均匀材料制成的?2投掷两枚硬币有三种情况:两枚都正面朝上;两枚都正面朝下;一枚正面朝上一枚正面朝下。某人认为这三种情况机会相等,因此他实地投掷了 100 次,结果这三种情况出现的次数分别为 25、23 和52。试判断其机会相等的认识 是否正确。实验七 交叉列联表分析一、问题例 7.1 为比较甲乙两种药物是否同样有效, 对 80 名患者使用甲种 药物, 100
42、 名患者使用乙种药物,治疗效果如下,试判断两种药物是否同样有效。 表 7.1 使用两种药物治疗效果的频数表有 效 无 效 合计用甲药 58 22 80用乙药 60 40 100合计 118 62 180例 7.2 为了解某种药品对某种疾病的疗效是否与年龄有关,共调查了 300 名服药患者。若将疗效分为“显著” 、“一般” 、“较差”三等,将年龄分成“儿童”、 “中青年”、 “老年”三级,试判断该药的疗效是否与年龄有联系? 表 7.2 某药疗效与年龄分类频数表22年龄疗效 儿童 中青年 老年 合计显著 58 38 32 128一般 28 44 45 117较差 23 18 14 55合计 109
43、 100 91 300二、实验目的掌握列联表资料的 检验统计方法。2三、零假设、原理在实际分析中,需要掌握多个 变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为 交叉列联表分析交叉列联表的卡方检验零假设为:行变量所涉及的因素与列变量所涉及的因素之间无关(即相互独立)。 (具体问题时要将行变量与列变量所代表的因素具体描述出来)例如,我们需要了解不同专业 学生的高考成绩是否有较大的不同,就需要两变量的交叉列联表分析,这两个变量分别称为交叉列联表分析的行变量和列变量四、实验内容与要求 (在进 行新题目之前,切 记清除原有数据或重新 进入 SPSS 系统。
44、 )(一)例 7.1 的实验操作(1) 建立数据文件 *.sav。定义变量名 r、c、f,如图 7.1 所示。以变量 r 标识使用的不同药物,r=1 标识使用甲药, r=2 标识使用乙药;变量 c 标识治疗效果, c=1 标识有效,c=2 标识无效;以变量 f 标识治疗有效或无效的患者数。图 7.1 使用两种药物治疗效果的比较数据文件(2)从菜单“Data”“Weight Cases”,把“频数f” 放入 Frequency 栏中,单击“ok”按钮。(3)从菜单“Analyze”“Descriptive Statistics“Crosstabs”,把“r” 放入 Row(s)栏中,把 “c”
45、放入 Column(s)栏中。(4)点击“Statistics”按钮,展开 Statistics(统计)对话框, 选择 Chi-square,单击“continue”按钮,返回 Crosstabs 主对话框。(5)点击“Cell”按钮,展开 Cells Display 格子显示对话框,在 Counts 框中,“打”选择 Observed(观测频数)和Expected(理论频 数), 单击“continue”按钮,返回 Crosstabs 主对话框。(6)单击“ok”按钮 即可。(二) 例 7.2 的实验操作(1) 建立数据文件 *.sav。定义变量名 r、c、f,输入数据,如图 7.2 所示。
46、图 7.2 某药疗效与年龄的数据文件(2) 其它步骤同例 7.1 的实验操作。五、结果解释 (一)例 7.1 的 统计分析, 输出结果如下:23表 7.3 Case Processing Summary(数据处理摘要)Case Processing Summary180 100.0% 0 .0% 180 100.0%R * CN Percent N Percent N PercentValid Missing TotalCases表7.4 R * C Crosstabulation (22列联表)R * C Crosstabulation58 22 8052.4 27.6 80.060 40
47、10065.6 34.4 100.0118 62 180118.0 62.0 180.0CountExpected CountCountExpected CountCountExpected Count1.002.00RTotal1.00 2.00CTotal表7.5 Chi-Square Tests (卡方检验)Chi-Square Tests3.075b 1 .0792.547 1 .1113.109 1 .078.085 .0553.058 1 .080180Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers E
48、xact TestLinear-by-LinearAssociationN of Valid CasesValue df Asymp. Sig.(2-sided) Exact Sig.(2-sided) Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is27.56.b. 由表 7.5 可以得出 N=180,且最小期望 频数为 27.56, =3.075,连续性校正的 =2.547(注意:只有22的列联表才有 连续性校正的 值),df=1, P=0.1110.05,故两种药物的疗效彼此独立,即这两种药物的疗22效没有显著性差异,或者说这 两种药物同样有效。(二)例 7.2 的统计分析,输出 结果如下: 表7.6 Case Processing Summary(数据处理摘要)Case Processing Summary3