收藏 分享(赏)

计算机及SPSS在现场流行病学中应用.doc

上传人:春华秋实 文档编号:2828324 上传时间:2018-09-28 格式:DOC 页数:20 大小:231.50KB
下载 相关 举报
计算机及SPSS在现场流行病学中应用.doc_第1页
第1页 / 共20页
计算机及SPSS在现场流行病学中应用.doc_第2页
第2页 / 共20页
计算机及SPSS在现场流行病学中应用.doc_第3页
第3页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、.计算机及 SPSS 在现场流行病学中的应用第一节 概 述一、 计算机在现场流行病学中的地位和作用计算机具有高速度、自动控制、精确可靠、计算功能强、能同时处理大量信息等优点,且便携式计算机和打印机可以用公文包被带到现场,并能通过电池或标准电源进行工作,因此,计算机在现场流行病学领域有着重要的地位和作用,已成为流行病学现场调查的重要工具,是流行病学工作者不可缺少的好帮手。计算机在现场流行病学中的应用包括:1. 数据库建立及其管理同其他学科有着显著不同的是,现场流行病学工作往往需要面对庞大的数据,如果没有计算机的帮助,大量的数据输入、储存、查询、修改、分组等工作将牵涉到大量的人力、物力和财力,且工

2、作进度十分缓慢,给现场流行病学工作的及时分析和及时处理带来极大不便。可以说,计算机的应用使得极其繁重的数据库管理过程变得轻松,工作效率大幅度提高。2. 统计分析人们对疾病发生模式的认识已由原来的生物医学模式转变到生物-社会- 心理医学模式,对疾病发生原因的认识也得到了进一步澄清。现场流行病学调查观察的对象数量大,考虑的因素多,且多种因素之间的关系非常复杂,要揭示某一规律及其影响因素,则对统计分析方法的要求增强,如逐步回归分析、判别分析、Logistic 回归、Cox 回归等。有些资料的多因素分析靠手工的方法是根本行不通的,只有运用计算机及其应用软件才能实现。3.数学模型在现场流行病学中,如何根

3、据流行病学方法对有关因素进行高度概括,建立合适的现场流行病学数学模型,从而分析变量变化对疾病发生、发展的影响是非常有意义的。计算机的应用,使得由数据到数学公式,由数学公式到预测变量变化对疾病发生发展的影响的模拟研究成为可能,甚至结合多媒体技术,可以形象地观察到疾病的发展变化。4.情报检索通过计算机检索,可以极大地帮助现场流行病学工作者全面了解某领域的最新信息和动态。一、 二、 计算机应用于现场流行病学应注意的有关问题1. 1. 软件流行病学现场调查中使用的软件是否有效是一个非常重要的问题。因为在一次现场调查中,软件需要快速有效地完成许多工作,如文字处理、数据库管理、数据统计和分析、文献检索等等

4、。软件包括系统软件、统计分析软件、数据库软件和文字处理软件等。.(1)系统软件:计算机的性能如何,主要取决因素之一是系统软件的性能。系统软件包括管理计算机的操作系统程序,检查计算机工作状态是否正常的诊断程序,方便用户修改和书写各种语言程序的编辑程序及汇编程序、编译和解释程序等。在现场流行病学工作中,常用的系统软件有 Windows 98、Windows 2000、Windows XP。(2)统计分析软件:即适用于数据分析的应用软件。目前常用于流行病学研究的统计软件主要有 SPSS、SAS、BMDP、SYSTAT、EPI INFO 等。(3)数据库软件:即建立数据集合的应用软件。每种数据库都各有

5、一定的模式。建立数据库的方法较多,可用于现场流行病学中的常用数据库软件主要有 Excel 2000、FoxPro 、 dBase、Access 2000 等。(4)文字处理软件:即具有对文字进行输入、编辑、修饰、排版及表格处理等功能的应用软件。目前常用的软件主要有 Word2000、WPS 等。2. 计算机及其工作环境在现场调查中,尽量选择和使用性能稳定、重量轻、携带方便和兼容性好的计算机。计算机工作间应避免阳光直射和灰尘的污染。电源线应固定,以免意外中断。本章目的主要是针对在现场调查中获取流行病学资料之后,如何利用计算机及有关应用软件对资料作出快速准确的分析和合理的解释。第二节 SPSS 统

6、计软件在现场流行病学中的应用前面已述,目前常用于现场流行病学研究中的应用软件较多,本章将主要介绍 SPSS 11.0 for Windows 统计软件的应用。一、SPSS 统计软件简介SPSS(Statistics Package for Social Science)是目前世界上最优秀的统计分析软件之一。它用命令方式选择各种统计方法,能极其方便地与 Excel、SAS、dBase、 Lotus1-2-3、SYSTAT 等软件交换数据,与许多绘图软件如 Harvard Graphics、CHART-MASTER、Microsoft CHART 等有接口。该软件统计方法较齐全、运行速度快、容量大

7、、应用广泛、易学易用,深受广大流行病学工作者的青睐。(一)SPSS 窗口及其功能1. 数据编辑窗口启动 SPSS 后,屏幕显示在主画面上的激活窗口即为数据编辑窗口(图 7-1) 。该窗口最上方标有“SPSS Data Editor” ,表明现在所看到的是 SPSS 的数据编辑窗口。窗口中有一个可扩展的平面二维表格,由若干行和列组成,每行对应一条记录,每列对应一个变量,可进行数据文件的编辑。.主画面的最上行是由 10 个菜单项组成的主菜单,其说明见表 7-1。每个菜单项包括一系列功能。 表 7-1 主菜单及其说明顺 序 主菜单名 说 明1 File 文件操作2 Edit 文件编辑3 View 视

8、图编辑4 Data 数据文件建立与编辑5 Transform 数据转换6 Analyze 统计分析7 Graphs 统计图表的建立与编辑8 Utilities 实用程序9 Window 窗口控制10 Help 帮助在窗口的左下角有两个标签,左侧是“Data View” ,表明当前的界面是数据视图窗口;如果要定义变量,则将画面切换到其右侧的“Variable View” ,即变量视图窗口(图 7-2) 。2. 2. 输出窗口有两种方法产生输出窗口:(1)当使用“Analyze”进行统计分析产生数据输出时,输出窗口自动激活(图 7-3) 。输出窗口最上方标有“Output1SPSS Viewer”

9、。该窗口显示 SPSS 处理的输出,如果处理成功,则显示处理结果,否则显示系统给出的错误信息。(2)从“File” “New” “Output” ,可产生输出窗口。语句窗口语句窗口如图 7-4,图 7-5,其最上方标有“Syntax1SPSS Syntax Editor”。语句窗口主要用于查看程序和修改编辑程序。有两种方法打开该窗口:(1)从“File” “New” “Syntax” ,可产生语句窗口,如图 7-4。(2)通过对话框中的“Paste”按钮,如图 7-5。 “Paste”按钮在几乎所有的 SPSS 对话框中均存在,它是专门为编程准备的,其作用是把过程语句粘贴到 Syntax 窗口

10、上。4. 统计图形编辑窗口.统计图形编辑窗口如图 7-6,其最上方标有“Chart1SPSS Chart Editor”。它是一个图形编辑器,在该窗口可以对图形进行编辑、修改和打印。该窗口最上行的“Chart”和“Format”菜单项包括一系列图形编辑功能。5. 帮助窗口在 SPSS 的对话框中都有一个“Help”按钮,用鼠标键单击该按钮即可打开一个“Help”帮助窗口。它显示的帮助信息与当时的操作有关,或与当时打开的对话框中的内容有关。(二)常用对话框及其使用1. 文件操作对话框从 SPSS 的主菜单“File”中可打开各种功能的对话框。如从“File” “Open” “Data”的“Ope

11、n File”打开的数据文件对话框,见图 7-7;此外,还有保存文件、打印文件等功能项打开的对话框均为文件操作对话框。2. 统计分析对话框从 SPSS 主菜单“Analyze”中的每一个子菜单对应一个过程分析,进入子菜单打开的第一个对话框即为统计分析对话框。选择参与分析的各类变量、分析中的算法、不同的选择项等是该对话框的主要任务。如图 7-8 的 Descriptive 对话框。3. 3. 其他选择项对话框即指 SPSS 主菜单的其他菜单项各功能对应的对话框或统计分析菜单项各分析过程的二级对话框。它只在限定范围内提供选择的内容,如图 7-9 的 Descriptive:Options 对话框。

12、二、SPSS 在现场调查中的应用例 7.1 某年 8 月 31 日,在某地某学校的职工和家属中发生较多的腹泻病人,其临床表现轻重不一,多为轻型,但仍有不少病人需要住院治疗,特别是老人和儿童。临床初步印象为细菌性痢疾。由于病人数不断增加,要求流行病学医师前往指导调查与现场防疫工作。下面将结合该现场流行病学实例演示和说明 SPSS 的应用。(一)现场调查表的设计及应注意的问题调查表是数据收集的工具,在制定调查表时,可采用计算机技术对调查表项目进行处理,将调查表中的全部变量进行编码,便于计算机认读和输入。为适合现阶段计算机输入及统计资料的要求,调查表设计应注意以下问题:1. 调查表应分成若干部分,如

13、(1)一般情况;(2)膳食情况;(3)患病与治疗情况;(4)其他。.2. 对每一个变量予以英文字母命名,且在每一部分内顺序编号。一般来说,在调查表中除了“一般情况”这一部分中的变量采用易于识别的英文缩写外,其他各部分可分别用A、B、C 等大写英文字母表示,其中的各个变量再以数字加以区别,如 A1、A2、An。若各变量还有子变量,可在其后再加数字以示区别,如某一变量为 A1,若 A1 项又包含 3 个子项,则分别编为 A11,A12,A13,这样编码便于统计分析。3. 编码尽量细一些。因为编码过粗,分析时想细一些,则需要重新录入数据。4. 编码分类必需明确,不能模棱两可。5. 各调查项目的编码应

14、尽量采用一致的顺序,如食物或饮用史,未吃均为“1” ,吃均为“2” 。6. 调查表一般分为左右两部分,左边写问题或变量,右边写编码及输入框。对于不详或不清楚项应统一以“99”或“9”等不可能出现的数字进行编码。该例调查表中的部分变量及其计算机编码如下:一、一般情况(A)序号 NO 住址 AD 楼层 F 户号 FA性别 女=1 男=2 S年龄 AG 职业 附属医院=1 本部=2 中学=3 小学=4 O幼儿园=5 托儿所=6 在家=7 外单位=8 不详=99 二、可疑暴露情况(B)用膳地点 附属医院=1 本部=2 在家=3 外单位=4 不详=99 B1患病与否 未发病=1 发病=2 不详=99 B

15、2治疗史 未住院=1 住院=2 在家治疗=3 不详=99 H冷饮史 有=1 无=2 B4 31 日冰棒史 未吃=1 吃=2 不详=99 B4130 日豆浆史 未吃=1 吃=2 不详=99 B4230 日冰棒史 未吃=1 吃=2 不详=99 B4329 日冰棒史 未吃=1 吃=2 不详=99 B44在设计调查表时,对计算机处理和分析数据程序多一些理解可使调查表的设计更完善和方便,同时了解计算机术语对数据输入和分析大有帮助。根据调查表进行现场流行病学调查,收集资料,并确保资料的真实性、可靠性和完整.性。(二)数据输入及其核查现场调查一般都具有规模大、变量多的特点,因此,资料的数量往往非常大,数据输

16、入的工作艰巨而重要。有时,在现场直接将数据输入计算机比通过填好的调查表再输入效果更好,直接输入用于挨家挨户的调查和从医学记录中提取数据。然而,在大多数疾病爆发调查中,调查表用于面对面的询问,然后再将调查内容输入计算机。在数据输入之前应对一切原始资料再次进行核查、验收,剔除不合格的或对遗漏的加以补救。资料输入也是整理数据的过程,输入数据时必须仔细,以防产生误差。为避免调查表输入过程中由于某种选择性偏倚,将病例和对照的资料轮流输入是一个有效的办法。在资料输入时,也可采取一人读数据,一人输数据的方法,以保证输入结果的准确性。在大多数数据输入系统中,光标出现在即将输入的位置,且会自动地从一个字段跳到另

17、一个字段。进行资料输入时,检查项目的正确类型,检查文件中的附加程序也将被执行,如果出现问题,程序将显示错误信息并跳回该字段等待纠正。在资料输入时,应注意经常存储数据,以防断电而造成数据的丢失。对已输完的书面调查表作上标记,以免重复输入。数据输入工作完成后,应进行数据的核查。如采用逻辑检查法,或采用两个输入员同时对一个资料分别录入生成两个数据文件,然后比较和纠正两个文件的不同之处。SPSS 输入该资料的具体流程如下:1. 启动 SPSS,进入 SPSS 主画面,如图 7-1。2. 进入 SPSS 变量视图窗口并定义变量,如图 7-2。本例需要建立多个变量,如序号NO,住址 AD,性别 S,年龄

18、AG,等等。将这些变量名分别输在变量视图窗口第一列“Name”下的各行,SPSS 会在其他列自动填入默认值,根据实际资料定义小数位数“Decimals”,本例所有变量的小数位数均为“0” ,如图 7-10。变量定义后的数据视图窗口如图 7-11。3. 输入数据:按调查序号逐条输入各变量值。本次共调查 820 例,所以最终该数据集应有 820 条记录。4. 保存数据:选择菜单“File” “Save as” ,在保存路径框内键入文件存放处,然后在文件名框内键入“痢疾”并按“保存” ,这时可以看到系统回到数据编辑窗口,其左上角已经由 Untitled 变换成了“痢疾”, 如图 7-12,表明当前编

19、辑文件的名称为 “痢疾.sav” 。 “*.sav”文件为 SPSS 的数据格式文件。(三)数据分析现场流行病学除了可以应用一般统计分析方法外,还需要流行病学一些独特的统计分析方法进行资料分析和统计推断。现场调查资料既有连续型变量资料,又有离散型变量资料,其资料分析可应用的统计方法较多,这里主要结合该例介绍其有关的数据分析方法:.1.描述性统计分析方法例 7.1.1 根据调查资料,描述不同用膳地点的调查人数及发病人数。SPSS 操作步骤如下:(1) 打开已输入完毕的数据编辑窗口,如图 7-12。(2) 选择菜单“Analyze” “Descriptive Statistics” “Freque

20、ncies(如图 7-13) ,将需描述的变量,即变量 B1 键入“Variable (s) ”框内 点击“OK”按钮(图 7-14) ,即可获得不同用膳地点的调查人数(表 7-2) 。(3) 表 7-2 显示输出窗口中获得的结果。即共调查在附属医院用膳者 274 例,占总调查人数的 33.42%,在本部用膳者 355 例,占总调查人数的 43.29%,依次类推。表 7-2 各用膳地点调查人数用膳地点 B1 例数 百分比 累积百分比 1274 33.42 33.42 2355 43.29 76.71 3160 19.51 96.224 26 3.17 99.3999 5 0.61 100.00

21、Total 820 100.00 若欲了解不同用膳地点的发病人数,则操作步骤如下:(1)打开已输入完毕的数据编辑窗口,如图 7-12。(2)进入统计分析对话框:“Analyze” “Reports” “Case Summaries”( 图 7-15) 键变量 B2 入“Variables”框,B1 入“Grouping Variable(s)”框(图7-16) 点击“OK”钮。(3)在输出窗口获得输出结果,如表 7-3。 即在附属医院用膳者中有 87 人发病,在本部用膳者中有 45 人发病,依次类推。表 7-3 Case Summaries用膳地点 B1 发病人数 B2 187 2.45 33

22、74 499 2Total 175 若需要对不同用膳地点与发病情况绘制图形,可操作如下:在数据编辑窗口选择菜单“Graphs” “Bar” 进入“Bar Charts”对话框 选择“Simple”框 点击“Define”钮 进入“Define Simple Bar: Summaries for Groups of Cases” 对话框 激活“other summary function”处,将变量 B2 键入“Variable”选择框内,B1 键入“Category Axis”选择框 点击“OK”钮,即在输出窗口可获得不同用膳地点与发病情况的直条图(图 7-17) 。横轴为用膳地点,纵轴为发病

23、人数。994321人人100806040200不 不 不 不不 不不 不不 不 不 不 不图 7-17 不同用膳地点与发病关系直条图2.推断性统计分析方法例 7.1.2 在该调查中获知吃过冷饮的人数共 485 例,其中发病 170 例,未吃冷饮的人数共 335 例,其中发病 5 例,资料见表 7-4,问两组发病率是否有差别?表 7-4 冷饮史与发病的关系冷饮史* 未发病 发病 合 计 发病率(%)有 315 170 485 35.1.无 330 5 335 1.5合 计 645 175 820 21.3*“冷饮史有”指 B41B44 中只要有一项为阳性者;“冷饮史无”指 B41B44 均为阴性

24、者该例需用到 22 表 2检验。SPSS 操作如下:(1)数据输入与保存:由于该例给出的是频数表,在建立数据集时可直接输入三个变量行变量 exposure,列变量 disease,记录每个格子中频数的变量 count。且令exposure 取值为 1 代表“有” ,取值为 2 代表“无” ;disease 取值为 1 代表“发病” ,取值为 2 代表“未发病” 。建立数据集“冷饮.sav” ,如图 7-18。(2)用“Data” “Weight Cases”过程指定频数变量(图 7-19) ,点击“OK”按钮。(3)调用 Crosstabs 过程进行 2检验:选择菜单“Analyze” “De

25、scriptive Statistics” “Crosstabs” 进行 2检验。有关界面说明如下:【主对话框】如图 7-20。Rows 框用于选择行变量;Columns 框用于选择列变量;Layer 框用于选择分层变量。【Statistics 子对话框】如图 7-21。Chi-square进行 2检验。Kappa计算 Kappa 值,即一致性系数,它是评价一致性程度的指标,适用于行与列有相同的分类。Kappa0.75 表明两者一致性较好;0.75 Kappa0.4 表明两者一致性一般;KappaT1 时,用校正的 2检验;3) 3) 当 n40 或 T1 时,用 Fisher 精确概率法。本

26、例满足条件 1,则检验结果为 2=132.929,P=0.000。可认为两组发病率有差别,以有冷饮史组的发病率较高。表 7-7 Chi-Square TestsValue df Asymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square 132.929b 1 .000 Continuity Correction a 130.938 1 .000 Likelihood Ratio 169.947 1 .000 Fishers Exact Test .000 .000Linear-by-Linear

27、 Association132.767 1 .000 N of Valid Cases 820 a Computed only for a 2x2 tableb 0 cells (.0%) have expected count less than 5. The minimum expected countis 71.49.表 7-8 显示危险度估计。分别给出了 OR 值、以变量 DISEASE 的不同取值为准的 RR 值以及相应的可信区间。该例显示的 RR=23.485,说明有冷饮史组的发病率是无冷饮史组发病率的 23.5 倍,且其可信区间不包括 1,可认为该 RR 值具有统计学意义。表 7

28、-8 Risk EstimateValue 95% Confidence Interval Lower Upper Odds Ratio for EXPOSURE (1 / 2)35.619 14.444 87.839 For cohort DISEASE = 123.485 9.757 56.526 For cohort DISEASE = 2.659 .617 .705 N of Valid Cases820 例 7.1.3 对用膳地点进行分层(见表 7-9) ,分析冷饮史与发病的关系。表 7-9 用膳地点、冷饮史与发病的关系用膳地点 冷饮史 发病例数 未发病例数附属医院有无8521246

29、3本部有无432119191SPSS 操作如下:(1)建立数据集“分层.sav”, 如图 7-23。其中,B1 表示用膳地点(1 为附属医院,2为本部) ,B4 表示冷饮史(1 为有,2 为无) , disease 表示发病情况(1 为发病,2 为未发病) ,count 表示频数。(2)指定频数变量,过程同例 7.1.2 的步骤(2) 。(3)调用 Crosstabs 过程进行 2检验,同例 7.1.2 的步骤(3) ,但在【Statistics 子对话框】中选择“Cochrans and Mantel-Haenszel statistics” ,如图 7-24,7-25。(4)在输出窗口获得

30、 2MH=80.187,P=0.000,RR=27.089,说明在控制用膳地点之后,冷饮史与发病仍有非常明显的关系,用膳地点不是冷饮史与发病联系中的混杂因素。有冷饮史组的发病率是无冷饮史组发病率的 27.1 倍。3. 相关性研究例 7.1.4 对所调查资料如表 7-10,求不同用膳地点与发病的相关关系。表 7-10 不同用膳地点与发病的关系用膳地点 (X) 发病例数(Y)不 详 (0)小 学 (1)中 学 (2)本 部 (3)附属医院(4)24374587合计 175SPSS 操作过程如下:.(1)作散点图:用于判断两变量之间有无相关趋势及是否呈线性。该数据已输入为文件 corr.sav,用膳

31、地点和发病数分别为变量 X 和 Y。 选择菜单“Graphs” “Scatter” “Simple” 在 Simple Scatterplot 对话框分别选变量 Y 和 X 入“Y Axis”框和“X Axis”框,点击 OK,获得变量 X 和 Y 的散点图,如图 7-25。可见变量 X 与 Y 呈线性趋势。X543210Y100806040200图 7-26 用膳地点与发病关系散点图 (2)作相关分析:选择“Analyze” “Correlate” “Bivariate”。进入的界面说明如下: 【主对话框】如图 7-27。 Variables 框:用于选择需要进行相关分析的变量,至少要选入

32、2 个。 Correlation Coefficients 复选框组:用于选择需要计算的相关分析指标。其中: Pearson:选择进行积距相关分析,即最常用的相关分析; Kendalls tau-b”: 计算 Kendalls 等级相关系数,它只能在两个变量均属于有序分类时使用;Spearman:计算 Spearman 相关系数,即常用的秩相关分析。 Test of Significance 单选框组:用于确定单侧检验或双侧检验,一般选择双侧检验。Flag significant correlations 是要求在结果中用星号标记有统计学意义的相关系数。 “*”表示 P0.05, “*” 表示

33、 P0.01。(3)在输出窗口获得输出结果:如表 7-11,可见变量 X 与 Y 的相关系数r=0.957,P=0.011。说明不同用膳地点与发病之间存在线性相关关系。7-11 CorrelationsX Y XPearson 1 .957 .CorrelationSig. (2-tailed) . .011 N 5 5 YPearson Correlation.957 1 Sig. (2-tailed) .011 . N 5 5 * Correlation is significant at the 0.05 level (2-tailed).以上是 SPSS 对例 7.1 资料的分析。在现

34、场调查资料分析中,还经常用到如下数据分析方法:4. t 检验例 7.2 某克山病区测得 11 例克山病患者与 13 例健康人的血磷值(mmol/L) ,问该地急性克山病患者与健康人的血磷值是否不同?患 者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87该例需用到成组设计两样本均数比较的 t 检验。SPSS 操作如下:(1)建立数据集定义变量:进入 SPSS 变量视图窗口。本例需要建立两个变量,一个是

35、表示健康人和患者的血磷值,取名为 X,另一个变量表示观察对象是健康人还是患者,取名为 GROUP。将 X和 GROUP 两个变量名分别输在变量视图窗口第一列“Name” 下的第一行和第二行,SPSS 会在其他列自动填入默认值,根据实际资料定义小数位数“Decimals”,本例 X 的小数位数为“2”,GROUP 的小数位数为“0” ,如图 7-28,变量定义后的数据视图窗口如图 7-29。输入数据:先输变量 X 的值,即按顺序输入患者的 11 个值,再输其相应变量 GROUP 的值,均取值为 1;同样输入健康人的 13 个 X 值,其相应变量 GROUP 均取值为 2。最终该数据集有 24 条

36、记录。保存数据:选择菜单“File” “Save as”,在保存路径框内键入文件存放处,然后在文件名框内键入“xuelin”并按“保存” ,则建立了文件名为“xuelin.sav”的数据集。.(2)统计分析 t 检验选择菜单“Analyze” “Compare Means” “Independent-Samples T Test”在“Independent-Sample T Test”主对话框键入相应变量(图 7-30) 点击“Define Groups”按钮 进入“Define Groups”子对话框并分别键入数字 1 和 2,如图 7-31,表明是变量 GROUP 取值为 1 和 2 的两

37、组比较 点击“Continue”及“OK”按钮。(3)结果输出及其解释。表 7-12 显示两组基本情况,如样本含量,均数,标准差,标准误。表 7-12 Group StatisticsGROUP N Mean Std. Deviation Std. Error Mean X1 11 1.5209 .42179 .12718 2 13 1.0846 .42215 .11708 表 7-13 显示 t 检验结果。该结果分为两大部分:第一部分为 Levenes 方差齐性检验,用于判断两总体方差是否齐,此例检验结果为 F=0.032,P=0.860,说明方差齐;第二部分分别给出两组所在总体方差齐和方差

38、不齐时的 t 检验结果,由于前面 Levenes 检验结果为方差齐,第二部分则选用方差齐时的 t 检验结果,即 t=2.542,P=0.019,统计推论:按照=0.05 水准,拒绝检验假设 H0,认为克山病患者与健康人的血磷值不同,根据两者均数大小可认为克山病患者的血磷值较高。表 7-13 Independent Samples TestLevenes Test for Equality ofVariancest-test for Equality of MeansF Sig. T df Sig. (2-tailed)Mean DifferenceStd. Error Difference95

39、% Confidence Interval of the Difference .Lower Upper Equal variances assumed.032 .860 2.524 22 .019 .4363 .17288 .07777 .79482 Equal variances not assumed2.524 21.353 .020 .4363 .17286 .07716 .79542 5. Logistic 回归分析例 7.3 调查了低出生体重婴儿与母亲怀孕前体重(Kg) 、高血压史、吸烟、子宫过敏之间的关系(表 7-14) 。后三个变量为 0、1 变量,0 表示无, 1 表示有。请

40、用 Logistic 回归分析方法进行因素分析。表 7-14 低出生体重研究数据病例 Y 体重 X1 高血压 X2 吸烟 X3 过敏 X411111111111111100000000000000000000595050465791594460484454596446516112247516445541048368865477724984504354001000100001011010000110000000011000000000011000000000010000000000001100001101000110000000000010011000100.000000000000000000

41、000 00007758528641506054701097673605476113686170695051985468001010010010110100000010100000000010000000000000000000000000000000000000000SPSS 操作如下:(1)建立名为 的“低体重.sav”数据文件,各变量如表 7-14。(2)选择“Analyze” “Regression” “Binary Logistic” 进入Logistic Regression 对话框,将因变量和自变量分别键入相应选择框,如图 7-32。(3)在 Logistic Regressio

42、n 对话框中点击“Options”按钮, 激活“Options”子对话框,如图 7-33。CI for exp(B): 给出 exp(B)的可信区间。At last step: 表示显示综合中间过程和最后结果 “Probability for Stepwise” 复选框:给出引入协变量水准(一般取 0.05)和剔除协变量水准(一般取 0.10) 。(4)输出结果:在输出窗口主要看表 7-15。它显示最终方程中所含的变量,在 =0.10水准下,第一步 X1 入选,第二步 X4 入选;表中各列依次为:回归系数(B) ,回归系数标准误(S.E.) ,检验回归系数统计量(Wald) ,自由度(df)

43、,P 值(Sig.) ,OR 值(Exp(B)) ,OR 值的 95%可信区间(95%C.I. for EXP(B)。最后得:B X1=-0.024,B X4=1.495;OR X1=0.976,OR X4=4.460,可见,变量 X1 是保护因素,变量 X4 为危险因素。表 7-15 Variables in the EquationB S.E. Wald df Sig. Exp(B) 95.0% C.I. for EXP(B) .Lower Upper Step 1aX1 -.019 .005 15.300 1 .000 .981 .972 .990 Step 2bX1 -.024 .00

44、6 16.572 1 .000 .976 .965 .988 X4 1.495 .740 4.086 1 .043 4.460 1.046 19.009 a Variable(s) entered on step 1: X1. b Variable(s) entered on step 2: X4.6. Cox 回归分析在流行病学定群研究和随访研究中,常用 Cox 模型作为统计分析手段,它在研究设计上比用 Logistic 模型作为统计分析手段要灵活。例 7.4 为进行某恶性肿瘤的预后影响因素的流行病学研究,调查并收集了 61 例患者资料如表 7-16,各变量含义及量化值见表 7-17。表 7

45、-16 63 例某恶性肿瘤患者的预后影响因素及生存时间编号 X1 X2 X3 X4 X5 X6 t Y123456789101112131415161718192021222324252627282930545758434840443639424242515549524854384038196737434950533246000100001001101111010010101110010111101110111110110000001111011011110110010000101100110001010011101110111110110000000111001022211102011121

46、0122002212015251351037605829706766878582767463101100669324939015387120120120001010010000000000010100110000.3132333435363738394041424344454647484950515253545556575859606162634344624050335748285435474943484460403244487242635539444274614538621101111101001010100010010001001000001011000100110101001001001

47、01010001011011011011101111110011011011000101100000011010100000100100010022102022012002222110200220210022120120120402612012012031207181201201541201624191202421201251201207401082416000110001111001101110110110011011表 7-17 某恶性肿瘤预后影响因素及量化值变 量 含 义 量 化 值X1X2X3X4X5X6tY患者年龄性别组织学类型治疗方式淋巴结转移否肿瘤浸润程度患者生存时间患者结局岁男

48、 1,女 0高分化 1,低分化 0新方式 1,传统 0 是 1,否 0突破浆膜层 1,未突破浆膜层 0,其他 2月死亡 1,截尾 0SPSS 操作如下:(1)建立名为 的“cancer.sav”数据文件,各变量如表 7-13。(2)选择“Analyze” “Survival” “Cox Regression”,激活 Cox .Regression 对话框,键因变量 t 入 Time 栏,状态变量 Y 入 Status 栏,协变量 X1X6 入Covariates 栏,如图 7-34。(3)点击“Define Event”按钮,激活 Define Event for Status Variables 对话框,并在“Singl

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报