收藏 分享(赏)

医学统计学 课后答案.doc

上传人:精品资料 文档编号:10804742 上传时间:2020-01-10 格式:DOC 页数:84 大小:4.45MB
下载 相关 举报
医学统计学 课后答案.doc_第1页
第1页 / 共84页
医学统计学 课后答案.doc_第2页
第2页 / 共84页
医学统计学 课后答案.doc_第3页
第3页 / 共84页
医学统计学 课后答案.doc_第4页
第4页 / 共84页
医学统计学 课后答案.doc_第5页
第5页 / 共84页
点击查看更多>>
资源描述

1、第四章 定量资料的统计描述4-11参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数2非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料参数检验 优点:资料信息利用充分;检验效能较高 缺点:对资料的要求高;适用范围有限2非参数检验 优点:适用范围广,可适用于任何类型的资料 缺点:检验效能低,易犯型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯型错误 第一

2、章 绪论1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于 2007 年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007 年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000 人,分别测的其红细胞数,组

3、成样本,其样本含量为 2000 人。2.简述误差的概念。误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计

4、。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。4.简述小概率事件原理。当某事件发生的概率小于或等于 0.05 时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章 调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:研究的对象及其相关因素(包括研究因素和非研究因素)是客第四章 定量资料的统计描述4-2观存在的,不能人为给予干预措施不能用随机化分组来平衡混杂因素对调查结果的影响。2.简述调查设计的基本内容。明确调查目的和指标确定调查对象和观察单位确

5、定调查方法确定调查方式确定调查项目和调查表制定资料整理分析计划制定调查的组织计划。3.试比较常用的四种概率抽样方法的优缺点。(1)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。(2)系统抽样 优点是:易于理解,简便易行容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另

6、外的系统误差实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。(3)分层抽样 优点是:减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。(4)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差, 。4.常用的非概率抽样方法有哪些?

7、有偶遇抽样、立意抽样、定额抽样、雪球抽样等。5.简述调查问题的顺序安排。调查问题顺序安排总原则:符合逻辑一般问题在前,特殊问题在后易答题在前,难答题在后如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。二、最佳选择题1. 实验性研究与观察性研究的根本区别在于A. 抽样方法不同B. 研究对象不同C. 是否设立对照组D. 假设检验方法不同E. 是否人为施加干预措施2. 以下抽样方法中不属于概率抽样的是A. 单纯随机抽样B. 系统抽样C. 整群抽样D. 分层抽样E. 雪球抽样3

8、. 条件相同时,下列抽样方法中抽样误差最大的是 A. 单纯随机抽样B. 系统抽样C. 分层抽样D. 整群抽样E. 无法直接比较第四章 定量资料的统计描述4-34. 下列关于调查设计的叙述,正确的是A. 明确调查目的是调查研究最核心的问题B. 采用抽样调查还是普查是由该地区的经济水平决定的C. 调查设计出现缺陷时,可以通过相应的统计分析方法弥补D. 一旦制定了调查研究计划,在实际操作过程中,就不可改变E. 调查的质量控制主要在调查问卷设计阶段5. 为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于A. 单纯随机抽样B. 分层抽样C.

9、 系统抽样D. 整群抽样E. 多阶段抽样6. 某县有 30 万人口,其中农村人口占 80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为A. 该县所有的已婚夫妻B. 该县所有的农村妇女C. 该县所有的育龄期妇女D. 该县所有的已婚妇女E. 该县所有已婚育龄期农村妇女7. 欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为A. 单纯随机抽样B. 整群抽样C. 分层抽样D. 典型调查E. 普查8. 普查是一种全面调查的方法,与抽样调查相比,叙述正确的是A确定普查观察单位非常简单B普查适于发病频率较低疾病的调查C普查不易获得反映平均水平的统计指标D因涉及面广普查可产生较大的抽样误差E

10、普查更易统一调查技术,提高调查质量9. 以下五个问题中,最符合调查问卷设计要求的是A你一个月工资多少?B你一个月吃多少克盐?C你是否有婚外恋:有 无D你和你的妈妈认为女孩几岁结婚比较好 ?E如果只生一个孩子,你希望孩子的性别是:女 男 男女均可1.E 2.E 3.D 4.A 5.B 6.E 7.D 8.A 9.E第三章 实验研究设计【思考与练习】一、思考题1. 实验设计根据对象的不同可分为哪几类?2. 实验研究中,随机化的目的是什么?3. 什么是配对设计?它有何优缺点?4. 什么是交叉设计?它有何优缺点?5. 临床试验中使用安慰剂的目的是什么?第四章 定量资料的统计描述4-4二、案例辨析题“三

11、联药物治疗士兵消化性溃疡”一文中,对 20002006 年在某卫生所采用三联药物治疗的 38 例消化性溃疡患者进行分析。内镜检测结果显示,痊愈 13 人,显效 14 人,进步 7 人,无效 4 人,有效率达 89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。 三、最佳选择题1. 实验设计的三个基本要素是A. 处理因素、实验效应、实验场所B. 处理因素、实验效应、受试对象C. 受试对象、研究人员、处理因素D. 受试对象、干扰因素、处理因素E. 处理因素、实验效应、研究人员2. 实验设计的三个基本原则是A. 随机化、对照、重复

12、B. 随机化、对照、盲法C. 随机化、重复、盲法 D. 均衡、对照、重复E. 盲法、对照、重复3. 实验组与对照组主要不同之处在于A. 处理因素B. 观察指标C. 抽样误差D. 观察时间E. 纳入、排除受试对象的标准4. 为了解某疗法对急性肝功能衰竭的疗效,用 12 头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7 天后观察两组幼猪的存活情况。该研究采用的是 A. 空白对照B. 安慰剂对照C. 实验对照D. 标准对照E. 自身对照第四章 定量资料的统计描述4-55. 观察指标应具有A. 灵敏性、特异性、准确度、精密度、客观性B. 灵

13、敏性、变异性、准确度、精密度、客观性C. 灵敏性、特异性、变异性、均衡性、稳定性D. 特异性、准确度、稳定性、均衡性、客观性E. 灵敏性、变异性、准确度、精密度、均衡性 6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A. 选择性偏倚B. 测量性偏倚C. 混杂性偏倚D. 信息偏倚E. 失访性偏倚7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验, 该实验设计方案是A. 随机区组设计B. 完全随机设计C. 析因设计D. 配对设计E. 交叉设计8. 在某临床试验中,将 180 例患者随机分为两组,实验组给予试验药对照药的模拟剂,对照给予对照药试验药的模拟剂

14、,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用的控制偏倚的方法有A. 单盲、多中心B. 随机化、多中心C. 随机化、单盲D. 随机化、双盲双模拟E. 双盲双模拟、多中心9. 临床试验的统计分析应主要包括A. 可比性分析、疗效评价、安全性评价B. 可比性分析、优效性分析、劣效性分析C. 可比性分析、安全性评价、可行性分析D. 优效性分析、等效性分析、安全性评价E. 疗效评价、安全性评价、可行性分析10. 药品上市后应用阶段进行的临床试验属于第四章 定量资料的统计描述4-6A. I 期临床试验B. II 期临床试验C. III 期临床试验 D. IV 临床试验E. 现场试验四、综

15、合分析题1. 欲将 16 只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了 8 只豚鼠作为实验组,剩下 8只作为对照组。该分组方法是否正确?若不正确,请说明理由。2. 某研究人员欲将 12 只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?3. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。(1) 你认为该研究最好采用何种实验设计方案?并说明理由。(2) 请帮该研究者实现 32 只大鼠的随机分组。【习题解析】一、思考题1. 根据受试对象不同,实验可以分为动物实验、临床试验和现场试

16、验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。2. 实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。3. 配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂因素

17、。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。4. 交叉设计是一种特殊的自身对照设计。其中 22 交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这第四章 定量资料的统计描述4-7样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具

18、有自愈倾向或病程较短的疾病研究。交叉设计的优点有:节约样本含量; 能够控制个体差异和时间对处理因素的影响;在临床试验中同等地考虑了每个患者的利益。其缺点有:处理时间不能太长;当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;受试对象一旦在某一阶段退出试验,就会造成数据缺失。5. 临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。二、案例辨析题该结论不正确。研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响

19、,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入 38 例消化性溃疡患者,并未设立相应的对照组。而且这 38 例患者接受治疗的时间为2000 年至 2006 年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。三、最佳选择题1.B 2.A 3A. 4.A 5.A 6.C 7.C 8.D 9.A 10.D四、综合分析题1. 解:该分组方法不正确。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃

20、的豚鼠进入实验组的机会增大,因此破坏了随机化原则。2. 解:先将 6 对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第 18 行最左端开始横向连续取 12 个两位数字。事先规定,每一对中,随机数较小者序号为 1,对应于 A组,随机数较大者序号为 2,对应于 B 组。分配结果见表 3-1。表 3-1 配对设计的 12 只小鼠随机分组的结果对子数 1 2 3 4 5 6动物编号 1.1 1.2 2.1 2.2 3.1 3.2 4.1 4.2 5.1 5.2 6.1 6.2随机数 12 96 88 17 31 65 19 69 02 83 60 75第四章 定量资料的统计描述4-8序号

21、1 2 2 1 1 2 1 2 1 2 1 2组别 A B B A A B A B A B A BSPSS 操作数据录入:打开 SPSS Data Editor 窗口,点击 Variable View 标签,定义要输入的变量 number 和pair,再点击 Data View 标签,录入数据(见图 3-1,图 3-2)。图 3-1 Variable View 窗口内定义要输入的变量 number 和 pair图 3-2 Data View 窗口内录入数据分析:TransformRandom Number Generators Active Generator InitializationSe

22、t Starting PointFixed ValueValue: 键入 20071222 设定随机种子为 20071222OKTransformCompute第四章 定量资料的统计描述4-9Target Valuable: 键入 randomNumeric Expression: RV.Uniform(0,1) 产生范围在 01 之间的伪随机数OKTransformRank CasesVariables(s): randomBy: pair 对每个对子中的两个伪随机数进行排序OK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为 SPSS 的 Syntax 窗口中用编程来完成本题

23、。FileNewSyntax,打开 Syntax 窗口,键入如下程序:input program. 开始数据录入程序段numeric k b n number pair (F8.0)/random(F8.6).string treat(A1).compute k=2. 处理组为2compute b=6. 对子数为6compute n=b*k.loop number=1 to pute pair=rnd(number-1)/k+0.5).end pute k=lag(k).end loop.end file.end input program. 结束数据录入程序段set seed 2007122

24、2. 设定随机种子为20071222compute random=uniform(1). 产生范围在01之间的伪随机数rank variables=random by pair. 对伪随机数排序formats rrandom(F3.0).compute treat=substr(“ABCDEFGHIJKLMN “,rrandom,1).根据伪随机数的序号进行分组list number pair treat. 结果中显示受试对象编号及被分到的处理组在 Syntax 窗口中选择 RunAll 提交运行。注:程序中的 b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序

25、来实现,仅需将 k 值设为处理组数,b 值设为相应的区组数。第四章 定量资料的统计描述4-10结果及解释Data View 窗口图 3-3 SPSS 编程实现受试对象随机分配结果Output 窗口Listnumber pair treat1 1 A2 1 B3 2 A4 2 B5 3 B6 3 A7 4 A8 4 B9 5 B10 5 A11 6 B12 6 A编程实现随机分配的结果见 data view 窗口( 图 3-3)或 output 窗口。可以看出 12 只小鼠被随机分配到 A 组和 B 组。在用此程序进行随机分组前,规定 A 组表示实验组,B 组表示对照第四章 定量资料的统计描述4

26、-11组。则 1,3,6,7,10,12 号小鼠被分到实验组,2,4,5,8,9,11 号小鼠被分到对照组。3. 解:(1) 该研究最好采用 22 析因设计的实验方案,如表 3-2 所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析 MEL 和 TXL 对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。表 3-2 MEL 和 TXL 对 32 只大鼠血管紧张素影响的析因设计TXLMEL (用)b1 (不用)b 2(用)a 1 a1b1 a1b2(不用)a 2 a2b1 a2b2(2) 先将 32 只大鼠按体重从小到大的

27、顺序编号。再从随机数字表中任一行,如第 2 列最上端开始纵向连续取 32 个两位数字。对随机数字排序,事先规定,序号为 18 的豚鼠分为 A组,序号为 916 的大鼠分为 B 组,序号为 1724 的大鼠分为 C 组,序号为 2532 的大鼠分为 D 组,分配结果见表 3-3。表 3-3 32 只大鼠随机分组的结果编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16随机数 17 36 77 43 28 22 76 68 39 71 35 50 96 93 87 56序号 1 8 25 11 5 4 22 19 9 20 7 14 30 28 27 15分组 A A

28、 D B A A C C B C A B D D D B编号 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32随机数 72 96 94 64 44 76 17 17 76 29 80 40 56 65 43 96序号 21 31 29 17 13 23 2 3 24 6 26 10 16 18 12 32分组 C D D C B C A A C A D B B C B DSPSS 操作数据录入:打开 SPSS Data Editor 窗口,点击 Variable View 标签,定义要输入的变量 number,见图3-4。再点击 Data View

29、 标签,录入变量 number 的值,即从 132。第四章 定量资料的统计描述4-12图 3-4 Variable View 窗口内定义要输入的变量 number分析:TransformRandom Number GeneratorsActive Generator InitializationSet Starting PointFixed ValueValue: 键入 20071222 设定随机种子为 20071212OKTransformComputeTarget Valuable: 键入 randomNumeric Expression: RV.Uniform(0,1) 产生范围在 01

30、 之间的伪随机数OKTransformRank CasesVariables(s): random 对伪随机数排序OKTransformRecodeInto Different VariablesInput Variable Output Variable: Rrandom 原变量名为伪随机数的序号RrandomOutput VariableName: 键入 treat 新变量名为 treat点击 Change点击 Old And New ValuesOld ValueRange: 键入 1 through 8 Output variables are stringsNew ValueValu

31、e: 键入 A Rrandom 值为 18 时,treat 值为 AOld New: 点击 AddOld Value第四章 定量资料的统计描述4-13Range: 键入 9 through 16 New ValueValue: 键入 B Rrandom 值为 916 时,treat 值为 BOld New: 点击 AddOld ValueRange: 键入 17 through 24New ValueValue: 键入 C Rrandom 值为 1724 时,treat 值为COld New: 点击 AddOld ValueRange: 键入 25 through 32New ValueVal

32、ue: 键入 D Rrandom 值为 2532 时,treat 值为DOld New: 点击 AddContinueOK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为 SPSS 的 Syntax 窗口中用编程来完成本题。FileNewSyntax,打开 Syntax 窗口,键入如下程序:input program. 开始数据录入程序段numeric n k number group (F8.0)/random(F8.6).string treat(A1).compute n=32. 受试对象总数为32compute k=4. 4个处理组loop number=1 to n.e

33、nd pute n=lag(n).compute k=lag(k).end loop.end file.end input program. 结束数据录入程序段compute random=uniform(1). 产生范围在01之间的伪随机数set seed 20071222. 设定随机种子为20071222第四章 定量资料的统计描述4-14rank variables=random . 对伪随机数排序compute group = trunc(rrandom-1)*k/n ).formats group(F3.0).compute treat=substr(“ABCDEFGHIJKLMN“,

34、group+1,1).根据伪随机数的序号进行分组list number treat. 结果中显示受试对象编号及被分到的处理组注:程序中的 n(受试对象总数 )、k(即处理组数) 可根据实际情况赋予不同的值。输出结果Data View 窗口 (由于篇幅限制,仅列出前 16 例受试对象的分组情况)图 3-5 SPSS 编程实现受试对象随机分配结果Output 窗口Listnumber treat number Treat1 D 17 C2 D 18 C3 B 19 B4 C 20 C第四章 定量资料的统计描述4-155 D 21 B6 D 22 A7 B 23 C8 C 24 D9 D 25 C1

35、0 A 26 A11 D 27 B12 B 28 A13 C 29 A14 B 30 A15 A 31 B16 A 32 D编程实现随机分配的结果见 data view 窗口(图 3-5)或 output 窗口。可以看出 32 只大鼠被随机分配到 A、B、C、D 组。在用此程序进行随机分组前,事先规定 A、B、C、D 分别对应于对照组、MEL 组、TXL 组和 MEL+TXL 组。从分配结果中可以看出:10,15,16,22,26,28,29,30 号大鼠被分到对照组;3,7,12,14,19,21,27,31 号大鼠被分到 MEL 组;4,8,13,17,18,20,23,25 号大鼠被分到

36、 TXL 组;1,2,5,6,9,11,24,32 号大鼠被分到 MEL+TXL 组。第四章 定量资料的统计描述 【习题解析】一、思考题1. 均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料; 中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。2. 同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变

37、异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。3. 极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点: 极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;标准差用于描述正态分布或近似正态分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。4. 正态分布的特征: 正态曲线在横轴上

38、方均数处最高; 正态分布以均数为中心,左第四章 定量资料的统计描述4-16右对称; 正态分布有两个参数,即位置参数 和形态参数 ;正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于 1。曲线下区间内的面积为 95.00%;区间 内的面积为(2.58,.)(2.58,.)99.00%。5通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题统计

39、描述时,常见错误是对定量资料的描述均采用均数、标准差, 。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清总胆固醇的频数分布图如下:频数图 4-1 血清甘油三酯(TG) 的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标 (mmol/L)15015022(.7/615)/2.7XM离散程度指标 四分位数间距= (mmol/L) 75.340.P三、最佳选择题1. B 2. E 3. B 4. C 5. D 6. E 7. A 8. D 9. D四、综合分析题1. 解:输出结果

40、第四章 定量资料的统计描述4-17频数图4-4 尿总砷的频数分布图由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。输出结果 图4-5 尿总砷对数的频数分布图由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。(2) 燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果Descriptive Statistics176 -1.99 -.24 -1.1831 .39685176lgxValid N (listwise)N Minimum Maximum Mean Std.Deviation结果中的Mean表示尿总砷对数值的

41、均数为 1.1831,求其反对数,得到几何均数。0.65(/L)G2. 解:(1) 已知健康人的血清 TC 服从正态分布,故采用正态分布法制定 95%的参考值范围。下限: (mmol/L)1.964.81960.2.XS上限: (mmol/L)7频数第四章 定量资料的统计描述4-18该市 4555 岁健康男性居民的血清总胆固醇的 95%参考值范围为 2.96 mmol/L6.72mmol/L。(2) 4555 岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。 13.2548

42、1.609XZ2.3查标准正态分布曲线下的面积表(附表 2)得:1().6)0.485Z2(31.60.4) 1796.%D该市 4555 岁健康男性居民中,血清总胆固醇在 3.25mmol/L5.25mmol/L 范围内的比例为 61.79%。(3) 作标准化变换 3.8041.0896XZ查标准正态分布曲线下的面积表(附表 2)得:()1.)%该市 4555 岁健康男性居民中,血清总胆固醇低于 3.80mmol/L 所占的比例为 14.01%。3. 解:输出结果跟骨硬度指数图4-8 跟骨硬度指数的频数分布图频数50 60 70 80 90 100 110 120 130 140 150 第

43、四章 定量资料的统计描述4-19由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。输出结果StatisticsSIN Valid 120Missing 0Percentiles 2.5 58.016797.5 143.6618即该地区 3035 岁健康女性的 SI 的 95%参考值范围为(58.02, 143.66)。第五章 定性资料的统计描述【习题解析】一、思考题1计算相对数应时有足够的观察单位数;分析时不能以构成比代替率;计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母

44、合计,再求出合计率或平均率;相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;样本率或样本构成比的比较应作假设检验。2. 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。3. 如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。

45、4. 常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。5. 标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。样本的标准化率是

46、样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明 98 例女性生殖器溃疡患者中,3 种病原体感染所占的比重,不能说明女性 3 种病原体感染发生的频率或强

47、度,该医生犯了以构成比代替率的错误。第四章 定量资料的统计描述4-20三、最佳选择题1. B 2. A 3. D 4. E 5. D 6. D 7. C 8. C 9. B四、综合分析题1. 解:表 5-3 经常吸烟与慢性阻塞性肺病(COPD)的关系经常吸烟分 组 调查人数是 否 经常吸烟率(%)COPD 患者 356 231 125 64.89非 COPD 患者 479 183 296 38.20COPD 患者的经常吸烟率:231/356100%=64.89%非 COPD 患者经常吸烟率:183/479100%=38.20%COPD 患者的经常吸烟率比非 COPD 患者高 26.69%231

48、96=.85OR比 值 比 ()还需进一步对 作假设检验(见第十一章) ,若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。 输出结果 * CrosstabulationCount296 183 479125 231 356421 414 835COPDCOPDTotal TotalRisk Estimate2.989 2.247 3.9761.760 1.503 2.061.589 .513 .675835Odds Ratio for (COPD / COPD)For cohort = -For cohort = -N of Valid CasesValue Lower Upper95% Confidence Interval2. 解:表 5-4 某地居民 19982004 年某病死亡率(1/10 万) 动态变化绝对增长量 发展速度 增长速度年份 符号 死亡率 累计 逐年 定基比 环比 定基比 环比1998 a0 160.5 1999 a1 144.2 -16.3 -16.3 0.90 0.90 -0.10 -0.102000 a2

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报