生物医学研究的统计学方法_课后习题答案 2014 主编方积乾.doc-道客多多

资源描述

1、思考与练习参考答案第 1 章绪论一、选择题1. 研究中的基本单位是指 ( D )。A样本 B. 全部对象 C影响因素D. 个体 E. 总体2. 从总体中抽取样本的目的是（ B ）。A研究样本统计量 B. 由样本统计量推断总体参数C研究典型案例 D. 研究总体统计量 . 计算统计指标3. 参数是指（ B ）。A参与个体数 B. 描述总体特征的统计指标C描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是（ E ）。A白细胞计数 B住院天数C门急诊就诊人数 D患者的病情分级 E. ABO 血型5关于随机误差下列不正确的是（ C ）。A受测量精密度限制

2、 B无方向性 C. 也称为偏倚不可避免 E. 增加样本含量可降低其大小二、名称解释（答案略）1. 变量与随机变量 2. 同质与变异 3. 总体与样本4. 参数与统计量 5. 误差 6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系？答：统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等，都是关于数据的学问，是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学，与医学统计学和卫生统计学很相似，其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法，而卫生统计学更侧重于介绍社会、人群健

3、康研究中的统计学原理与方法。2. 某年级甲班、乙班各有男生 50 人。从两个班各抽取 10 人测量身高，并求其平均身高。如果甲班的平均身高大于乙班，能否推论甲班所有同学的平均身高大于乙班？为什么？答：不能。因为，从甲、乙两班分别抽取的 10 人，测量其身高，得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样，由于存在抽样误差，样本均数与总体均数一般很难恰好相等。因此，不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断，而应通过统计分析，进行统计推断，才能作出判断。3. 某地区有 10 万个 7 岁发育正常的男孩，为了研究

4、这些 7 岁发育正常男孩的身高和体重，在该人群中随机抽取 200 个 7 岁发育正常的男孩，测量他们的身高和体重，请回答下列问题。(1) 该研究中的总体是什么？答：某地区 10 万个 7 岁发育正常的男孩。(2) 该研究中的身高总体均数的意义是什么？答：身高总体均数的意义是: 10 万个 7 岁发育正常的男孩的平均身高。(3) 该研究中的体重总体均数的意义是什么？答：体重总体均数的意义是: 10 万个 7 岁发育正常的男孩的平均体重(4) 该研究中的总体均数与总体是什么关系？答：总体均数是反映总体的统计学特征的指标。（5）该研究中的样本是什么？答：该研究中的样本是：随机抽取的 200 个 7

5、岁发育正常的男孩。（宇传华方积乾）第 2 章统计描述思考与练习参考答案一、最佳选择题1. 编制频数表时错误的作法是（ E ）。A. 用最大值减去最小值求全距 B. 组距常取等组距，一般分为1015组C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值E. 写组段，如“1.53，35， 56.5，”2. 描述一组负偏峰分布资料的平均水平时，适宜的统计量是（ A ）。A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度，宜采用（ A ）。A. 变异系数 B. 全距 C. 标准差D. 四分位数间距 E. 百分位数P

6、2.5与P 97.5的间距4. 均数和标准差S的关系是（ A ）。XA. S越小，对样本中其他个体的代表性越好 B. S越大，对样本中其他个体的代表性越好C. 越小，S越大D. 越大，S越小E. 必小于 X5. 计算乙肝疫苗接种后血清抗-HBs的阳转率，分母为（ B ）。A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数D. 乙肝病毒携带者数 E. 易感人数6. 某医院的院内感染率为5.2人/千人日，则这个相对数指标属于（ C ）。A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数7. 纵坐标可以不从0开始的图形为（ D ）。A. 直方图 B. 单式条图 C.

7、复式条图 D. 箱式图 E. 以上均不可二、简答题1. 对定量资料进行统计描述时，如何选择适宜的指标？答：详见教材表2-18。教材表2-18 定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值非对称分布；半定量资料；末端开口资料；分布不明众数频数最多的观察值不拘分布形式，概略分析平均水平调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布

8、资料四分位数间距居中半数观察值的全距非对称分布；半定量资料；末端开口资料；分布不明变异系数标准差与均数的相对比不同量纲的变量间比较；量纲相同但数量级相差悬殊的变量间比较2. 举例说明频率和频率分布的区别和联系。答：2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况，被调查者150人，分别有30人病情稳定，66人处于进展状态，54人死亡。当研究兴趣只是了解死亡发生的情况，则只需计算死亡率54/150=36%，属于频率指标。当研究者关心患者所有可能的结局时，则可以算出反映3种结局的频率分别为20%、44%、36%，它们共同构成所有可能结局的频率分布，是若干阳性率的组合。两者均为“

9、阳性率” ，都是基于样本信息对总体特征进行估计的指标。不同的是：频率只是一种结局发生的频率，计算公式的分子是某一具体结局的发生数；频率分布则由诸结局发生的频率组合而成，计算公式的分子分别是各种可能结局的发生数，而分母则与频率的计算公式中分母相同，是样本中被观察的单位数之和。3. 应用相对数时应注意哪些问题？答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有

10、时需分组讨论或计算标准化率。4. 常用统计图有哪些？分别适用于什么分析目的？答：详见教材表2-20。教材表2-20 常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势

11、，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数三、计算题1. 某内科医生调查得到100名4050岁健康男子总胆固醇（mg/dl），结果如下227 190 224 259 225 238 180 193 214 195 213 193 209 172 244199 155 208 203 199 253 181 196 224 210 220 255 257 216 249235 220 190 203 197 149 175 236 202 209 174 18

12、4 174 185 167235 167 210 171 248 201 266 189 222 199 197 214 199 198 230246 209 202 186 217 206 200 203 197 161 247 138 186 156 195163 273 178 190 207 259 186 194 246 172 234 232 189 172 235207 208 231 234 226 174 199 278 277 181（1）编制频数表，绘制直方图，讨论其分布特征。答：频数表见练习表2-1。根据直方图（练习图2-1），可认为资料为基本对称分布，其包络线见练习

13、图2-2。练习表2-1 某地100名4050岁健康男子总胆因醇/（mgdl -1）Frequency PercentValid PercentCumulative PercentValid 130145160175190205220235250265280Total1 3 11 12 25 15 13 11 5 4 100 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.04.015.027.052.067.080.091.096.0100.0280624020186

14、014区区2520151050Frequncy Mean =207.41Std.Dv98N 练习图2-1 直方图280624020186014区区2520151050Frequncy Mean =207.41Std.Dv98N 练习图2-2 包络线图（2）根据（1）的讨论结果，计算恰当的统计指标描述资料的平均水平和变异度。答：利用原始数据，求出算术均数 mg/dl 和标准差 mg/dl。4.07X8.29S（3）计算P 25,P75和P 95。答：利用原始数据，求出P 25=186.8 mg/dl，P 75=229.3 mg/dl，P 95=259.0 mg/dl。2. 某地对120名微丝蚴血

15、症患者治疗3个疗程后，用IFA间接荧光抗体试验测得抗体滴度如下，求抗体滴度的平均水平。抗体滴度 1:5 1:10 1:20 1:40 1:80 1:160 1:320例数 5 16 27 34 22 13 3利用上述频数表，得平均滴度为1:36.3 。3. 某地19751980年出血热发病和死亡资料如教材表2-21，设该地人口数在此6年间基本保持不变。教材表2-21 某地6年间出血热的发病与死亡情况年份发病数病死数1975 32 41976 56 51977 162 121978 241 131979 330 101980 274 5试分析：（1）粗略判断发病率的变化情况怎样。答：该地

16、人口数在此6年间基本保持不变，发病人数在1979年前逐年上升，1980年略有下降。可以认为发病率大致呈上升趋势，1980年略有下降。（2）病死率的变化情况怎样？答：病死率由各年度病死数除以发病数获得，病死率依次为12.5%、8.9% 、7.4% 、5.4%、3.0%和1.8%，呈逐年下降趋势。（3）上述分析内容可用什么统计图绘制出来？答：由于没有给出该地人口数，故不能计算发病率，可用普通线图表示发病数变化情况。病死率的下降情况可以用普通线图表示，下降速度则可以用半对数线图表示。（4）评述该地区出血热防治工作的效果。答：随着时间的推移，预防工作做得不好，治疗水平则逐年提高（体现在病死率下降）

17、。（张晋昕）第 3 章概率分布思考与练习参考答案一、最佳选择题1. 某资料的观察值呈正态分布，理论上有（ C ）的观察值落在范围内。SX96.1A. 68.27% B. 90% C. 95% D. 99% E. 45%2. 正态曲线下，从均数到的面积为（ A ）。641A. 45% B. 90% C. 95% D. 47.5% E. 99%3. 若正常人的血铅含量 X 近似服从对数正态分布，则制定 X 的 95%参考值范围，最

18、好采用（其中，为 Y 的标准差）（ C ）。YlgSA. B. C. 196X5.972P)64.1(lgYSD. E.).(lgYS4. 在样本例数不变的情况下，若（ D ），则二项分布越接近对称分布。A. 总体率越大 B. 样本率 p 越大 C. 总体率越小 D. 总体率越接近 0.5 E. 总体率接近 0.1 或 0.55. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从（ D ）。A. 二项分布 B. 正

19、态分布 C. 偏态分布 D. Poisson 分布 E. 对称分布6. Poisson 分布的均数与标准差的关系是（ E ）。A. B. C. D. E. 2二、思考题1. 服从二项分布及 Poisson 分布的条件分别是什么？简答：二项分布成立的条件：每次试验只能是互斥的两个结果之一；每次试验的条件不变；各次试验独立。Poisson 分布成立的条件：除二项分布成立的三个条件外，还要求试验次数很大，而所关心的事件发生的概率很小。n2. 二项分布、Poisson 分布分别在何种条件下近似正态分布？简答：二项分布的正态近似：当 n 较大

20、，不接近 0 也不接近 1 时，二项分布B（ , ）近似正态分布 N（ , ）。nn)1(Poisson 分布的正态近似：Poisson 分布，当相当大时（ 20），其分布近似于正态分布。三、计算题1. 已知某种非传染性疾病常规疗法的有效率为 80%，现对 10 名该疾病患者用常规疗法治疗，问至少有 9 人治愈的概率是多少？解：对 10 名该疾病患者用常规疗法治疗，各人间对药物的反应具有独立性，且每人服药后治愈的

21、概率均可视为 0.80，这相当于作 10 次独立重复试验，即 =0.80， n=10 的贝努利试验，因而治愈的人数 X 服从二项分布。至少有 9 人治愈的概率为：.8) (,B 80 101)8(C)19(1)9( k kkPXP37.58%02641区至少有 9 人治愈的概率是 37.58%。或者 )10()()( XPXP01910 )8(C8C 5372. 据以往的统计资料，某地新生儿染色体异常率为 1%，问 100 名新生儿中

22、染色体异常不少于 2 名的概率是多少？解： )2(12)( XPXP 1)()(XP= 26.4036790.e!011 3. 调查某市 2000 年 110 名 20 岁男性青年的身高（ cm）资料如下：173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5

23、178.9 171.5166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5181.2 177.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2

24、 168.0175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6175.8 164.8 175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2（ 1）试估计当年该市 20 岁男性青年中，身高在 175.0178.0（ cm）内的占多大比例？（ 2）估计当年该市 95%以及 99%的 20 岁男青年身高

25、范围。（ 3）若当年由该市随机抽查 1 名 20 岁男青年，试估计其身高超过 180 cm 的概率。解：用 SPSS 计算本题。数据文件：data3-n.sav。数据格式：数据库 2 列 110 行，变量 n 为男性青年序号， x 表示身高。操作步骤：操作说明AnalyzeDescriptive StatisticsDescriptivesOptions Mean Std. DeviationContinueVariables: x OK调用 Descriptives 过程计算得均数=174.766 ，标准差=4.150 9Tra

26、nsformCompute调用“变量计算(Compute Variable)”对话框Target Variable P 定义目标变量“P”Numeric Expression：CDF.NORMAL(178.0,174.766,4.1509)-CDF.NORMAL(175.0,174.766,4.1509) OK当年该市 20 岁男性青年中，身高在 175.0178.0 cm 内的比例Target Variable x1 Numeric Expression：174.766-1.96*4.1509OKTarget Variable x2 Numeric Expressi

27、on：174.766+1.96*4.1509OKTarget Variable x3 该市 95%以及 99%的 20 岁男青年身高范围间的比例Numeric Expression：174.766-2.58*4.1509OKTarget Variable x4 Numeric Expression：174.766+2.58*4.1509OKTarget Variable p1 Numeric Expression：1-CDF.NORMAL(180.0,174.766,4.1509)OK由该市随机抽查 1 名 20 岁男青年，其身高超过 180

28、 cm 的概率计算结果（练习图 3-1）：Descriptive StatisticsN Mean Std. Deviationx 110 174.766 4.1509Valid N (listwise) 110练习图 3-1 SPSS 输出结果以上是 SPSS 输出结果，得到均数（ Mean）为 174.766 cm，标准差（ Std. Deviation）为 4.150 9 cm。估计当年该市 20 岁男性青年中，身高在 175.0178.0 cm 内的比例为25.956%，身高在 175.01

29、78.0 cm 内的约有 29 人。估计当年该市 95%的 20 岁男青年身高范围为 166.63182.90 cm， 99% 的 20 岁男青年身高范围为 164.06185.48 cm。由该市随机抽查 1 名 20 岁男青年，估计其身高超过 180 cm 的概率约为 10%。（祁爱琴高永石德文）第 4 章参数估计思考与练习参考答案一、最佳选择题1.关于以 0 为中心的 t 分布，错误的是（）A. t 分布的概率密度图是一簇曲线 B. t 分布的概率密度图是单峰分布C. 当时，

30、 t 分布 Z 分布 D. t 分布的概率密度图以 0 为中心，左右对称E. 相同时，值越大， P 值越大2.某指标的均数为，标准差为 S，由公式计算出来的区间常称X1.96,.XS为（）。A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间D. 95%置信区间 E. 90%置信区间3.样本频率与总体概率均已知时，计算样本频率 p 的抽样误差的公式为（）。pA. B. C. 1n1n1nD. E. 124在已知均数为 , 标准差为的正态总体中随机抽样，（）的概X率为 5%。A. B. C. 1.961.96X0.5/2,tSD. E.0.5/2,Xt

31、S 0.5/2,t5. （）小，表示用样本均数估计总体均数的精确度高。A. CV B. S C. D. R E. 四分位数间距X6. 95%置信区间的含义为（）：A. 此区间包含总体参数的概率是 95% B. 此区间包含总体参数的可能性是 95%C. “此区间包含总体参数”这句话可信的程度是 95%D. 此区间包含样本统计量的概率是 95% E. 此区间包含样本统计量的可能性是 95%二、思考题1. 简述标准误与标准差的区别。答: 区别在于：（1）标准差反映个体值散布的程度，即反映个体值彼此之间的差异；标准误反映精确知道总体参数（如总体均数）的程度。（2）标准误小于标准差。（3）样本含量越

32、大，标准误越小，其样本均数更有可能接近于总体均数，但标准差不随样本含量的改变而有明显方向性改变，随着样本含量的增大，标准差有可能增大，也有可能减小。2. 什么叫抽样分布的中心极限定理？答: 样本含量 n 越大，样本均数所对应的标准差越小，其分布也逐渐逼近正态分布，这种现象统计学上称为中心极限定理（central limit theorem）。当有足够的样本含量（如）时，从任何总体中抽取随机样本的样本均数近似地30服从正态分布。样本含量越大，抽样分布越接近于正态分布。X正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布，那么对于所有值，抽样分布均为正态分布。如

33、果总体为非正态分布，仅在 n 值n X较大情况下近似服从正态分布。一般说，时的抽样分布近似为正态分布；但是，30nX如果总体分布极度非正态（如双峰分布、极度偏峰分布），即使有足够大的值，抽样分布也将为非正态。3. 简述置信区间与医学参考值范围的区别。答: 置信区问与医学参考值范围的区别见练习表 4-1。练习表 4-1 置信区间与医学参考值范围的区别区别置信区间参考值范围含义用途计算公式总体参数的波动范围，即按事先给定的概率 100(1)%所确定的包含未知总体参数的一个波动范围估计未知总体均数所在范围未知： /2,XtS已知或未知但 n30，有或/2XZ/Z个体值的波动范围，即

34、按事先给定的范围 100(1)%所确定的“正常人”的解剖、生理、生化指标的波动范围供判断观察个体某项指标是否“正常”时参考（辅助诊断）正态分布： /2ZS偏峰分布：P XP100X4. 何谓置信区间准确度与精确度？如何协调两者间的关系。答：置信区间有准确度（accuracy）与精密度（precision ）两个要素。准确度由置信度 (1 ) 的大小确定，即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看，置信度愈接近于 1 愈好，如置信度 99比 95好。精密度是置信区间宽度的一半（即、），意指置信区间的两端点值离样本统计量（

35、如、 p）的距离。2,XtS2,pZ X从精密度的角度看，置信区间宽度愈窄愈好。在抽样误差确定的情况下，两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度，可适当增加样本含量。三、计算题1.随机抽取了 100 名一年级大学生，测得空腹血糖均数为 4.5 mmol/L，标准差为 0.61 mmol/L。试估计一年级大学生空腹血糖总体均数及方差的 95置信区间。答：总体均数 95 置信区间为（ 4.379， 4.621），方差的 95 置信区间为（ 0.286 9， 0.502 1）。2.调查某地蛲虫感染情况，随机抽样调查了 260 人，

36、感染人数为 100。试估计该地蛲虫感染率的 95%置信区间。答：该地蛲虫感染率的 95%置信区间为（32.55，44.38）。（宇传华）第5 章假设检验思考与练习参考答案一、最佳选择题1. 样本均数比较作 t 检验时，分别取以下检验水准，以（ E ）所取类错误最小。A. B. C. D. E. 0.0.50.10.20.32. 在单组样本均数与一个已知的总体均数比较的假设检验中，结果 t=3.24，t 0.05,v =2.086， t0.01,v =2.845。正确的结论是（ E ）。A. 此样本均数与该已知总体均数不同B. 此样本均数与该已知总体均数差异很大C. 此样本均数所对应的总体

37、均数与该已知总体均数差异很大D. 此样本均数所对应的总体均数与该已知总体均数相同E. 此样本均数所对应的总体均数与该已知总体均数不同3. 假设检验的步骤是（ A ）。 A. 建立假设，选择和计算统计量，确定 P 值和判断结果B. 建立无效假设，建立备择假设，确定检验水准C. 确定单侧检验或双侧检验，选择 t 检验或 Z 检验，估计类错误和类错误D. 计算统计量，确定 P 值，作出推断结论E. 以上都不对4. 作单组样本均数与一个已知的总体均数比较的 t 检验时，正确的理解是（ C ）。A. 统计量 t 越大，说明两总体均数差别越大B. 统计量 t 越大，说明两总体均数差别越小C. 统计量

38、t 越大，越有理由认为两总体均数不相等D. P 值就是 E. P 值不是，且总是比小5. 下列（ E ）不是检验功效的影响因素的是：A. 总体标准差 B. 容许误差 C. 样本含量 nD. 类错误 E. 类错误二、思考题1试述假设检验中与 P 的联系与区别。答：值是决策者事先确定的一个小的概率值。P 值是在成立的条件下，出现当前检验统计量以及更极端状况的概率。0HP 时，拒绝假设。2. 试述假设检验与置信区间的联系与区别。答：区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小，即推断总体参数的置信范围；而假设检验用于推断质的不同，即判断

39、两总体参数是否不等。 3. 怎样正确运用单侧检验和双侧检验？答：选用双侧检验还是单侧检验需要根据数据的特征及专业知识进行确定。若比较甲、乙两种方法有无差异，研究者只要求区分两方法有无不同，无需区分何者为优，则应选用双侧检验。若甲法是从乙法基础上改进而得，已知如此改进可能有效，也可能无效，但不可能改进后反不如以前，则应选用单侧检验。在没有特殊专业知识说明的情况下，一般采用双侧检验即可。4. 试述两类错误的意义及其关系。答：类错误（typeerror ）：如果检验假设实际是正确的，由样本数据计算获得0H的检验统计量得出拒绝的结论，此时就犯了错误，统计学上将这种拒绝了正确的零假0H设（弃真）的

40、错误称为类错误。0H类错误(type error)：假设检验的另一类错误称为类错误(type error)，即检验假设原本不正确（正确），由样本数据计算获得的检验统计量得出不拒绝（纳伪）0H1 0H的结论，此时就犯了类错误。类错误的概率用表示。在假设检验时，应兼顾犯类错误的概率（）和犯类错误的概率（）。犯类错误的概率（）和犯类错误的概率（）成反比。如果把类错误的概率定得很小，势必增加犯类错误的概率，从而降低检验效能；反之，如果把类错误的概率定得很小，势必增加犯类错误的概率，从而降低了置信度。为了同时减小和，只有通过增加样本含量，减少抽样误差大小来实现。5试述检验功效的

41、概念和主要影响因素。答：拒绝不正确的的概率，在统计学中称为检验功效(power of test)，记为。0H1检验功效的意义是：当两个总体参数间存在差异时(如备择假设：成立时)，所使1H0用的统计检验能够发现这种差异(拒绝零假设： )的概率，一般情况下要求检验00功效应在 0.8 以上。影响检验功效的四要素为总体参数的差异、总体标准差、检验水准及犯类错误的概率。6简述假设检验的基本思想。答：假设检验是在 H0 成立的前提下，从样本数据中寻找证据来拒绝、接受的0H1一种“反证”方法。如果从样本数据中得到的证据不足，则只能不拒绝，暂且认为成立（因为拒绝的证据不足），即样本

42、与总体间的差异仅仅是由于抽样误差所引起。拒0H绝是根据某个界值，即根据小概率事件确定的。所谓小概率事件是指如果比检验统计量更极端（即绝对值更大）的概率较小，比如小于等于 0.05（各种科研杂志习惯上采用这一概率值），则认为零假设的事件在某一次抽样研究中不会发生，此时有充分理由拒绝，0H即有足够证据推断差异具有统计学意义。三、计算题1. 一般正常成年男子血红蛋白的平均值为 140 g/L，某研究者随机抽取 25 名高原地区成年男子进行检查，得到血红蛋白均数为 155 g/L，标准差 25 g/L。问：高原地区成年男子的血红蛋白是否比一般正常成年男子的高？解：：：（单侧）0H01H0.

43、5=3.00 nSXt/t=3，，可认为高原地区居民的血红蛋白比一般正常成年男子的高。01.5.0P2. 一般而言，对某疾病采用常规治疗，其治愈率约为 45%。现改用新的治疗方法，并随机抽取 180 名该疾病患者进行了新疗法的治疗，治愈 117 人。问新治疗方法与常规疗法的效果是否有差别？解：：，：，0H0 10.55.410()/pZnZ=5.41，，可认为新治疗方法与常规疗法的效果不同，新疗法优于常规1.P疗法。（林爱华宇传华）第6章两样本定量资料的比较思考与练习参考答案一、最佳选择题1. 正态性检验，按 =0.10 检验水准，认为其总体服从正态分布，此时若推断有错，其错

44、误的概率为（ D ）。A. 大于0.10 B. 等于0.10 C. 小于0.10 D. 等于,而未知 E. 等于1-，而未知2. 甲、乙两人分别从同一随机数字表抽取30个（各取两位数字）随机数字作为两个样本，求得、，则理论上（ C ）。21SX区2区A. 21XB. SC. 由甲、乙两样本均数之差求出的总体均数95%可信区间，很可能包括0D. 作两样本均数比较的t检验，必然得出无统计学意义的结论E. 作两样本方差比较的F检验，必然方差齐3. 两样本均数比较时，能用来说明两组总体均数间差别大小的是（ D ）。A. t值 B. P值C. F值 D. 两总体均数之差的95%置信区间E.

45、上述答案均不正确4. 两小样本均数比较，方差不齐时，下列说法不正确的是（ C ）。A. 采用秩和检验 B. 采用 t 检验 C. 仍用 t检验 D. 变量变换后再作决定E. 要结合正态性检验结果方能作出决定5. 两样本秩和检验的是（ B ）。0HA. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等6. 在统计检验中是否选用非参数统计方法（ A ）。A. 要根据研究目的和数据特征作决定B. 可在算出几个统计量和得出初步结论后进行选择C. 要看哪个统计结论符合专业理论D. 要看哪个值更小PE. 既然非参数统计对资料没有严格的要求，

46、在任何情况下均能直接使用7. 配对样本差值的Wilcoxon符号秩和检验，确定P值的方法是（ D ）。A. T越大， P值越小B. T越大， P值越大C. T值在界值范围内，P 值小于相应的D. T值界值，P 值大于相应的值E. T值在界值范围上，P 值大于相应的8. 成组设计两样本比较的秩和检验，其检验统计量T 是（ C ）。A. 为了查T 界值表方便，一般以秩和较小者为TB. 为了查T 界值表方便，一般以秩和较大者为TC. 为了查T 界值表方便，一般以例数较小者秩和为TD. 为了查T 界值表方便，一般以例数较大者秩和为TE. 当两样本例数不等时，任取一样本的秩和为T 都可以查T

47、界值表二、思考题1假设检验中，P值和的含义是什么？两者有什么关系？答： P 是指 H0 成立时出现目前样本情形的概率最多是多大, 是事先确定的检验水准。但 P 值的大小和没有必然关系。2. 既然假设检验的结论有可能有错，为什么还要进行假设检验？答：假设检验中，无论拒绝不拒绝 H0，都可能会犯错误，表现为拒绝 H0 时，会犯类错误，不拒绝 H0 时，会犯类错误，但这并不能否认假设检验的作用。只要涉及到抽样，就会有抽样误差的存在，因此就需要进行假设检验。只是要注意，假设检验的结论只是个概率性的结论，它的理论基础是“小概率事件不可能原理” 。3. 配对设计资料能否用完全随机设计资料的统计检验方法？为什么？答：不能。采用完全随机设计资料

展开阅读全文

生物医学研究的统计学方法_课后习题答案 2014 主编 方积乾.doc

生物医学研究的统计学方法_课后习题答案 2014 主编方积乾.doc