1、卫生统计学第 1 页 共 15 页卫生统计学课程复习资料一、名词解释1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量。4.总体:总体指特定研究对象中所有观察单位的测量值。5.样本:从总体中随机抽取部分观察单位
2、,其测量结果的集合称为样本(sample) 。6.变异:同质个体间研究因素的差异。7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数) 。8.算术均数:描述一组数据在数量上的平均水平。总体均数用 表示,样本均数用 表示。X9.中位数:将一组观察值由小到大排列,位次居中的那个数。10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。13.变异系数:用于观察
3、指标单位不同或均数相差较大时两组资料变异程度的比较。14.正态分布:若资料 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号X表示均数为 ,标准差为 的正态分布。),(2N15.标准正态分布:均数为 0、标准差为 1 的正态分布被称为标准正态分布,通常记为 。2(0,1)N16统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。18.标准误:通常将样本统计量的标准差称为标准误。19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。20.参数
4、估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。21.假设检验中 P 的含义:指从 H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。22.I 型和 II 型错误:I 型错误指拒绝了实际上成立的 H0,这类“弃真”的错误称为 I 型错误,其概率大小用 表示;II 型错误,指接受了实际上不成立的 H0,这类“存伪”的错误称为 II 型错误,其概率大小用 表示。 23.检验效能:1- 称为检验效能,它是指当两总体确有差别,按规定的检验水准 所能发现该差异的能力。 24.检验水准:是预先规定的,当假设检验结果拒绝 H0,接受 H1,下“有差别”
5、的结论时犯错误的概率称为检验水准,记为 。25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助 F 分布作出统计推断,判断各因素对观测指标有无影响。26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。27.相对数:是两个有联系的指标之比,是分
6、类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。28.标准化法:是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一卫生统计学第 2 页 共 15 页个统一“标准” (标准人口构成比或标准人口数) ,然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。29.构成比(proportion):表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。常以 100%为比例基数。计算公式为 10%某 一 组 成 部 分 的 观 察 单 位 数构 成 比 同 一 事 物
7、各 组 成 部 分 的 观 察 单 位 总 数30.Yates 校正:英国统计学家 Yates F 认为,由于 分布理论上是一连续性分布,而分类资料是间断性的,2由此计算出的 值不连续,尤其是自由度为 1 的四格表,求出的概率 P 值可能偏小,此时需对 值作连续性校2 2正(correction of continuity) ,这一校正即所谓的 Yates 校正(Yates correction) 。31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方
8、法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics) ,或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。33.相关系数:又称积差相关系数,以符号 r 表示样本相关系数, 表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方
9、向的指标。34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。35.回归系数 :是直线的斜率(slope) ,其统计意义是当 变化一个单位时 的平均改变的估计值。b XY时直线从左下方走向右上方, 随 的增大而增大; 时直线从左上方走向右下方, 随 的增大0bYX0bX而减小; 时直线与 轴平行, 与 无直线关系。 的计算公式为 2()(YXYlb二、单项选择题1.观察单位为研究中的( D )。A.样本 B.全部对象 C.影响因素 D.个体2.总体是由( C ) 。A.个体组成 B.研究对象组成 C.同质个体组成 D.研究
10、指标组成 3.抽样的目的是( B ) 。A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体统计量4.参数是指( B ) 。A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和5.关于随机抽样,下列那一项说法是正确的( A ) 。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( B ) 。A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变7.
11、比较身高和体重两组数据变异度大小宜采用( A ) 。A.变异系数 B.方差 C.极差 D.标准差8.以下指标中( )可用来描述计量资料的离散程度。( D )A.算术均数 B.几何均数 C.中位数 D.标准差卫生统计学第 3 页 共 15 页9.血清学滴度资料最常用来表示其平均水平的指标是( C ) 。A.算术平均数 B.中位数 C.几何均数 D.平均数10.两样本均数的比较,可用( C ) 。A.方差分析 B. t 检验 C.两者均可 D.方差齐性检验11.配伍组设计的方差分析中, 配伍 等于( D ) 。A. 总 - 误差 B. 总 - 处理 C. 总 - 处理 + 误差 D. 总- 处理-
12、 误差12.在均数为 , 标准差为 的正态总体中随机抽样, ( )的概率为 5%。( B )|XA. B. C. D.1.961.96X0.52,ts0.52,XtS13.完全随机设计方差分析的检验假设是( D ) 。A.各处理组样本均数相等 B.各处理组总体均数相等C.各处理组样本均数不相等 D.各处理组总体均数不全相等14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D ) 。A.分别进行比较 B.两个率比较的 2检验 C.不具备可比性,不能比较 D.对性别进行标准化后再比较15.率的标准误的计算公式是( D )
13、。A. B. C. D.)1(pnp)1(1npnp)1(16.非参数统计应用条件是( C ) 。A.总体是正态分布 B.若两组比较,要求两组的总体方差相等C.不依赖于总体分布 D.要求样本例数很大17.下述哪些不是非参数统计的特点( D ) 。A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握C.适用于等级资料 D.检验效能总是低于参数检验18.设配对设计资料的变量值为 X1和 X2,则配对资料的秩和检验( A ) 。A.把 X1 与 X2 的差数绝对值从小到大编秩 B.把 X1和 X2综合从小到大编秩C.把 X1和 X2综合按绝对值从小到大编秩 D.把 X1与 X2的差数从小到大
14、编秩19.秩和检验和 t 检验相比,其优点是( A ) 。A.计算简便,不受分布限制 B.公式更为合理 C.检验效能高 D.抽样误差小20.对两样本均数作比较时,已知 n1、 n2均小于 30,总体方差不齐且分布呈偏态,宜用( C ) 。A.t 检验 B. u 检验 C.秩和检验 D. F 检验21.等级资料的比较宜用( B ) 。A.t 检验 B.秩和检验 C. F 检验 D.四格表 X2检验22.两个小样本比较的假设检验,应首先考虑( D ) 。A.t 检验 B.秩和检验 C.任选一种检验方法 D.资料符合哪种检验的条件23.对于配对比较的秩和检验,其检验假设为( B ) 。A.样本的差数
15、应来自均数为 0 的正态总体 B.样本的差数应来自均数为 0 的非正态总体C.样本的差数来自中位数为 0 的总体 D.样本的差数来自方差齐性和正态分布的总体24.用最小二乘法确定直线回归方程的原则是各观察点( B )。A.距直线的纵向距离相等 B.距直线的纵向距离的平方和最小C.与直线的垂直距离相等 D.与直线的垂直距离的平方和最小25.实验设计的三个基本要素是( D ) 。A.受试对象、实验效应、观察指标 B.随机化、重复、设置对照C.齐同对比、均衡性、随机化 D.处理因素、受试对象、实验效应26.实验设计的基本原则( D ) 。A.随机化、盲法、设置对照 B.重复、随机化、配对 C.随机化
16、、盲法、配对 D.随机化、重复、设置对照27.实验设计和调查设计的根本区别是( D ) 。A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D.实验设计可人为设置处理因素卫生统计学第 4 页 共 15 页28.标准正态分布的均数与标准差分别为( A )。A.0 与 1 B.1 与 0 C.0 与 0 D.1 与 129.正态分布有两个参数 与 ,( )相应的正态曲线的形状越扁平。( C )A. 越大 B. 越小 C. 越大 D. 越小30.若 X 服从以 , 为均数和标准差的正态分布,则 X 的第 95 百分位数等于( B )。A. B. C. D.64.64.196.1
17、58.231.计算某地某年麻疹发病率,其分母为 ( E )A.该地体检人数 B.该地年平均就诊人数 C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群人数 32.两个独立小样本计量资料比较的假设检验,首先应考虑( E )A.用 检验 B.用 检验 C.用 Wilcoxon 秩和检验tuD.检验或 Wilcoxon 秩和检验均可 E.资料符合 检验还是 Wilcoxon 秩和检验条件t33.若决定系数为 0.04,则下列说法错误的是( A ) A.散点图中所有的实测点都排列在一条回归线上 B.决定系数即是 2rC.y 的总变异中有 4可以由 x 的变化来解释 D.相关系数 0.2 E.
18、回归贡献相对较小 r34.老年人口系数下降,可使 ( B )A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对 35.标准化以后的总死亡率( D )A.标化后的率比原来的率低 B.标化后的率比原来的率高C.反映了实际水平 D.反映了相对水平,仅作为比较的基础 E.不随标准选择的变化而变化36.配对样本差值的 Wilcoxon 符号秩检验,确定 值的方法为( D )PA. 越大, 越大 B. 越大, 越小TPTC. 值在界值范围内, 小于相应的 D. 值在界值范围内, 大于相应的PE. 值即 值,查 界值表u37.关于回归系数的描述,下列说法错误的是( A
19、 )A. ,表示回归直线与 y 轴交点在原点上方 B. ,回归直线与 x 轴平行 0b 0bC. 越大,则回归直线越陡 D. b 一般有单位 E. 表示回归直线从左上方走向右下方38.实验设计和调查设计的根本区别是( D )A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D.实验设计可人为设置处理因素 E.两者无区别39.少年儿童人口系数下降,可使( A )A.粗死亡率上升 B.粗死亡率下降 C.出生率上升 D.出生率下降 E.生育率下降40.以下对于标准化法的描述错误的是 ( C )A.标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影
20、响,从而达到可比性B.样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需做假设检验C.标准化率代表真实的死亡(或患病、发病)率水平D.一般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率E.当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法41.多样本计量资料的比较,当分布类型不清时选择( D )A. 检验 B. 检验 C. 检验 D. 检验 E. 检验t2uHF42.回归系数的假设检验,其无效假设 是( E )0HA. B. C. D. E.100043.估计样本含量时,所定第类误差愈小,则( A )A.所要的样本含量愈
21、大 B.所要的样本含量愈小C.不影响样本含量 D.所定的样本含量愈准确 E.所定的样本含量愈粗糙44.欲计算某年新生儿死亡率,则应选用作为分母的是( B )卫生统计学第 5 页 共 15 页A.某年新生儿总数 B.某年活产总数 C.当年怀孕的妇女数 D.妊娠 28 周以上的妇女数E.妊娠 28 周以上出生并存活的新生儿45.用以说明某现象发生的频率或强度的指标为 ( A )A.率 B.构成比 C.相对比 D.绝对数 E.均数46.当四个样本率比较,得到 0.05,3,则可以认为 ( D )2A.四个样本率都不相同 B.四个总体率都不相同C.四个样本率不同或不全相同 D.四个总体率不同或不全相同
22、 E.以上都不对47.成组设计两样本比较的秩和检验,其检验统计量 是( C )TA.以秩和较小者为 B.以秩和较大者为TC.以例数较小者秩和为 D.以例数较大者秩和为 E.当两样本例数不等时,可任取一样本的秩48.直线回归分析中,有直线回归方程 =0.004+0.0488X ,代入两点描出回归线。下面选项哪项正确( B )YA.所有实测点都应在回归线上 B.所绘回归直线必过点( , )YC.原点是回归直线与 Y 轴的交点 D.回归直线 X 的取值范围为(-1,1) E.实测值与估计值差的平方和必小于零49.研究 A 药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌 A
23、药;2 周后检测体内存活的肿瘤细胞数。这种对照在实验设计中称为 ( B )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照50.行列表中,对于理论频数太小的情形,最好采用( A )A.增大样本容量,以达到增大理论频数的目的 B.删去理论频数太小的格子所对应的行或列C.理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并 D.性质不同的行或列中的实际频数合并 E.使用连续性校正公式51.直线相关分析中,对相关系数作假设检验,其目的是 ( B )A.检验相关系数 r 是否等于 0 B.推断两变量间是否存在直线相关关系C.检验两总体相关系数是否相等 D.推断两变量间相关方
24、向 E.推断两变量间密切程度52.用最小二乘法确定直线回归方程的原则是( B )A.各观测点距直线的纵向距离相等 B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等 D.各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离最小53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择 40 例胃炎和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏冲剂” 。这种对照在实验设计中称为 ( D )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照54.某研究欲调查某市中学生对艾滋病的认识,从全市 40 所中学
25、随机抽取 4 所,对该 4 所学校的全部学生实施问卷调查。该种抽样方法属于( A )A.整群抽样 B.分层抽样 C.系统抽样 D.简单随机抽样 E.多阶段抽样三、简答题1.对于一组近似正态分布的资料,除样本含量 n 外,还可计算 和 ,问各说明什么?SX,S96.1答:三个指标分别说明:(1) 为算术均数,说明正态分布或近似正态分布资料的集中趋势;X(2) 为标准差,说明正态分布或近似正态分布资料的离散趋势;S(3) 可估计正态指标的 95%的医学参考值范围,即此范围在理论上应包含总体的 95%的个体值。X96.2.说明频数分布表的用途。答:频数分布表的用途是:(1)描述频数分布的类型;(2)
26、描述频数分布的特征;(3)便于发现一些特大或特小的可疑值;(4)便于进一步做统计分析和处理。3.试述正态分布的面积分布规律。卫生统计学第 6 页 共 15 页答:正态分布的面积分布规律是:(1) 轴与正态曲线所夹面积恒等于 或 ;X10%(2)区间 的面积为 ,区间 的面积为 ,区间 的面积为 。68.27%96.195. 58.29.04.均数的可信区间与参考值范围有何不同?答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。区别点 均数的可信区间 参考值范围意义按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体
27、均数,要么不包含。但可以说:该可信区间有多大(如当 =0.05 时为 95%)的可能性包含了总体均数。“正常人”的解剖、生理、生化某项指标的波动范围。计算公式未知: */2,SXtn已知: *u未知但 n60: */2正态分布: */2XuS偏态分布: PXP100X用途 估计总体均数 判断观察对象的某项指标正常与否* 也可用 (对应于单尾概率时)/2,t,t* 也可用 (对应于单尾概率时)u5.假设检验中和 P 的区别何在?答: 和 P 均为概率,其中 是指拒绝了实际上成立的 H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。 P 值是由实际样本获得的,在 H0成立的前提
28、条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将 P 与 对比来得到结论,若 P ,则拒绝 H0,接受 H1,有统计学意义,可以认为不同或不等;否则,若 P,则不拒绝 H0,无统计学意义,还不能认为不同或不等。6.假设检验时,当 ,则拒绝 ,理论依据是什么?0.50答: P 值是指从 H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如 t或 u)的概率。当 P0.05,按 =0.05 水准不拒绝 H0,差别无统计学意义,即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。2.某医院比较几种疗法对慢性胃炎病人的
29、疗效:单纯西药组治疗 79 例,有效 63 例;单纯中药组治疗 54 例,有效 47 例;中西医结合组治疗 68 例,有效 65 例。问:该资料属何种资料?实验设计属何种设计?欲比较3 种疗法的疗效的差别,宜选用何种假设检验方法?写出该种检验方法的 与 ;若求得的检验统计量0H1为 8.143,相应于 的检验统计量的临界值为 5.99,你如何做出结论?根据你的结论,你可能犯哪一0.5类统计错误?解:(1)该资料属计数资料?实验设计属完全随机设计;(2)宜选用 RC 表的 检验方法;2(3) :3 种疗法的总体有效率相等0H:3 种疗法的总体有效率不全相等1(4)在 的水准上,拒绝 ,接受 ,差
30、别有统计学意义,可认为 3 种疗法的总体有效率不全相.50H1等,即 3 种疗法对慢性胃炎病人的疗效有差别。可能犯 I 型错误。卫生统计学第 10 页 共 15 页3.某年某单位报告了果胶驱铅的疗效观察,30 名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L) ,血铅均数为 1.81(mg/L) 。服用果胶 20 天后再测,尿铅均数降为 0.087(mg/L) ,血铅均数降为0.73(mg/L) ,说明果胶驱铅的效果较好。请评述以上研究。解:人体有自行排铅的功能,应设对照组,并进行假设检验后才能下结论。4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作
31、为判断标准,选 20 名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为 40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?解:(1) 根据题意,该设计为配对设计,首先将 20 例病人按年龄、性别、病型和病情等条件进行配对后,将 10 对患者从 1 到 10 编号,再任意指定随机排列表中的任一行,比如第 8 行,舍去 1020,将随机数排列如下,规定逢单数者每对中的第 1 号试验对象进入胃舒氨组(A),第 2 号对象进入西米替丁组(B),逢双数者则相反。分组情况如下所示:病 人 号 1.1
32、2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.11.2 2.2 3.2 4.2 5.2 6.2 7.2 8.2 9.2 10.2随机数字 3 2 6 1 8 0 9 5 4 7入组情况 A B B A B B A A B AB A A B A A B B A B(2) 首先以溃疡面积减少百分率 40%为界限,将每位患者的治疗情况分为有效和无效两类,并整理成配对四格表的形式(见表 21) 。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别,故选用配对四格表的 McNemar 检验(McNemars test for correlated proportio
33、ns)进行统计分析。表 2 20 位患者治疗情况胃舒氨西米替丁有效 无效 合计有效 a b a+b无效 c d c+d合 计 a+c b+d N5.试就下表资料分析比较甲、乙两医院乳腺癌手术后的 5 年生存率。甲、乙两医院乳腺癌手术后的 5 年生存率(%)甲 医 院 乙 医 院腋 下 淋 巴结 转 移 病例数 生存数 生存率 病例数 生存数 生存率无 45 35 77.77 300 215 71.67有 710 450 68.38 83 42 50.60合计 755 485 64.24 383 257 67.10解:两医院乳腺癌患者的病情构成不同,比较两医院的标准化率,计算过程见表 3。表 3
34、 甲、乙两医院乳腺癌手术后的 5 年生存率的标化(以甲乙两医院合计为标准)甲 医 院 乙 医 院腋下淋巴结转移标准病例数Ni原生存率pi预期生存人数Nipi=原生存率Pi预期生存人数Nipi=无 345 77.77 268 71.67 247793 68.38 503 50.60 401有合计 1138( Ni)64.24 771( Nipi) 67.10 648( Nipi)甲医院乳腺癌手术后的 5 年生存率的标化生存率:卫生统计学第 11 页 共 15 页乙医院乳腺癌手术后的五年生存率标化生存率:因为甲、乙两医院有无腋下淋巴结转移的病情构成不同,故标化后,甲医院乳腺癌手术后的 5 年生存率
35、高于乙医院,校正了标化前甲医院低于乙医院的情况。6.假定正常成年女性红细胞数 近似服从均值为 4.18,标准差为 0.29 的正态分布。令 X 代表随机)/10(2L抽取的一名正常成年女性的红细胞数,求:(1)变量 X 落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数 95%参考值范围。解:(1)根据题意,变量 X 近似服从正态分布,求变量 X 落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量 进行标准化变换后,借助标准正态分布表求其面积,做法如下:4.0184.5018(4.0.5)( )2929PP).6.u60(1(27.3
36、5.096 变量 落在区间(4.00,4.50)内的概率为 0.5967。X(2)因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该资料过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:下限为: 1.964.8196(0.2)/10(.32L上限为: 75495%的正常成年女性红细胞数所在的范围是 。)/(.6127.为了解某中药治疗原发性高血压的疗效,将 44 名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如下表,问:该药治疗原发性高血压是否有效?两种疗法治疗原发性高血压的疗效分组 例数 有效 有效率/%实验组 2
37、3 21 91.30对照组 21 5 23.81解:本题为完全随机设计两样本率的比较。整理表格见下表。两种疗法治疗原发性高血压的疗效分 组 有效 无效 合计 有效率/%实验组 21 2 23 91.30对照组 5 16 21 23.81合计 26 18 44 59.09(1) 建立检验假设,确定检验水准21,即该药治疗原发性高血压无效 :0H,即该药治疗原发性高血压有效5.%75.610387%10 NPpi 94.64 i卫生统计学第 12 页 共 15 页(2) 计算检验统计量 59.8412minT2 22()(2165)40.69)()38adbcnd=(21)(21)=1(3) 确定
38、 值,作出统计推断 P查 界值表得 P0.005,按 05.水准拒绝 ,接受 ,差别有统计学意义,可以认为该药治疗原2 0H1发性高血压有效。8.某研究者采用配对设计进行实验,比较 2 种抗癌药物对小白鼠肉瘤抑瘤效果,先将 10 只染有肉瘤小白鼠按体重大小配成 5 个对子,每个对子内 2 只小白鼠随机接受两种抗癌药物,以肉瘤的重量为指标,实验结果见下表。问 2 种不同的药物的抑瘤效果有无差别?表 2 不同药物作用后小白鼠肉瘤重量(g)编号 A 药 B 药(1) (2) (3)1 0.82 0.652 0.73 0.543 0.43 0.344 0.41 0.215 0.68 0.43解:本例为
39、异源配对设计。计算 A 药、B 药肉瘤重量差值的结果见下表第(4)栏。用配对样本均数的 t 检验。(1)建立检验假设,确定检验水准(5 分)H0: ,即 2 种不同的药物的抑瘤效果相同。 dH1: ,即 2 种不同的药物的抑瘤效果不相同。.(2)计算检验统计量(5 分)本例 n=5, d=0.90, d2=0.18, /0.9/5.18dn。22()(.)0.185.dS0.186.93, 45t (3)确定 P 值,做出推断结论(5 分)查 t 界值表,得双尾概率 0.002P0.005,按 =0.05 水准,拒绝 H0,接受 H1,有统计学意义。可认为 2 种不同的药物的抑瘤效果不相同,B
40、 药的抑瘤效果较好。不同药物作用后小白鼠肉瘤重量(g)编号 A 药 B 药 差值(1) (2) (3) (4)=(2)-(3)1 0.82 0.65 0.172 0.73 0.54 0.193 0.43 0.34 0.09卫生统计学第 13 页 共 15 页4 0.41 0.21 0.205 0.68 0.43 0.259.某胸科医院,同时用甲、乙两法测定 202 份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率有无差别?甲、乙两法检测痰标本中的抗酸杆菌结果乙 法甲 法 合 计 49 25 74 21 107 128合 计 70 132 202解:本题是配对四格表资料(3 分) ,用配对
41、四格表资料的 检验(3 分) 。2甲、乙两法检测痰标本中的抗酸杆菌结果乙 法甲 法 合 计 49 25 74 21 107 128合 计 70 132 202: CB,即甲、乙两法的总体检出率相同0H1: ,即甲、乙两法的总体检出率不同(3 分)5.40621cb,用公式22()bc计算检验统计量值2(5).351查 界值表得 0.500 P 0.750, (3 分)按 水准,不拒绝 ,还不能认为两种方法的检出率05.0H不同。 (3 分)10某地方病研究所调查了 8 名正常儿童的尿肌酐含量(mmol/24h)如下表,估计尿肌酐含量( )对其Y年龄( )的回归方程。X8 名正常儿童的年龄 (岁
42、)与尿肌酐含量 (mmol/24h)XY编 号 1 2 3 4 5 6 7 8年龄 13 11 9 6 8 10 12 7尿肌酐含量 Y3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65表 1 中: 9.5X .983 Xl 1.02Yl .40XYl解:由原始数据及散点图(图 1)的观察,两变量间呈直线趋势,故作下列计算:(1)求直线回归方程计算 、 的均数 、 ,离均差平方和 、 与离均差积和YXlYXYl769.58Xn23.87.9Yn卫生统计学第 14 页 共 15 页222()(76)48XXln222()(3.).1.046YYl ()(7).8.65
43、.XYln求回归系数 和截距ba5.840/2.139=93()5.67a-=列出直线回归方程(回归直线绘制见图 1)1.670.2YX(2)回归方程的假设检验方差分析: ,即尿肌酐含量与年龄之间无直线关系0H: ,即尿肌酐含量与年龄之间有直线关系1=0.05按公式 225.84/0.134XYSl回按公式 6.28S总 回残列出方差分析表如表 1。表 1 方差分析表变异来源 自由度 SMFP总 变 异 7 1.0462回 归 1 0.8134 0.8134 20.97 0.1残 差 6 0.2328 0.0388、 ,查 界值表,得 。按 0.05 水准,拒绝 ,接受 ,可认为尿肌酐含量与年
44、龄126F0.P0H之间有直线关系。卫生统计学第 15 页 共 15 页或 检验t、 及 同上0H1本例 , 0.2328, 42, 0.13928nS残 Xlb按公式 1970.23.XY0.197.4bS.32.50t,查 界值表,得 。按 =0.05 水准,拒绝 ,接受 ,结论同上。6t0.2.05P0H111.某地随机抽样调查了部分健康成人的血红蛋白量,结果见下表。问:该地健康成年男、女血红蛋白含量有无差别?某年某地健康成年男、女血红蛋白含量(gL-1)性别 例数 均数 标准差男 360 134.5 7.1女 255 117.6 10.2解:两成组大样本均数的比较,用 u 检验。1) 建立检验假设,确定检验水准(5 分)H0: 12,即该地健康成年男、女血红蛋白含量均数无差别H1: ,即该地健康成年男、女血红蛋白含量均数有差别.52) 计算检验统计量(5 分)12234.517.6.8290XuSn3) 确定 P 值,作出统计推断(5 分)查 t 界值表( 时)得 P0.001,按 水准,拒绝 H0,接受 H1,差别有统计学意义,可以认为该地健0.5康成年男、女的血红蛋白含量均数不同,男性高于女性。