1、必答题1. 欲研究广东省 6 岁儿童的身高情况 , 在广东省随机抽取了 200 名 6 岁儿童进行调查,以此为例说 明同质、变异、总体与样本这几个概念。 答:同质体现在同为广东省、同为 6 岁儿童,变异体现在 200 名儿童的身高不同。 总体是指所有广东省 6 岁儿童,样本为 200 名 6 岁儿童。 2卫生统计工作中的统计资料主要的来源有哪些? 答:统计报表。经常性工作记录。专题调查或实验。 3简述统计工作全过程的四个步骤。 答:研究设计、收集资料、整理资料、统计分析。 4试举例说明常见的三种资料类型。 答:(1).计量或测量或数值资料,如身高、体重等。 (2).计数或分类资料,如性别、血型
2、等。 (3).等级资料,如尿蛋白含量、 。 5. 统计学上的变异、变量、变量值是指什么? 答:变异:每个观察个体之间的测量指标的差异称为变异。 变量: 表示个体某种变异特征的量为变量。 变量值:对变量的测得值为变量值。 6. 简述编制频数表的步骤与要点。 答:(1)找出最大和最小值,计算极差。 (2)确定组距和列出分组计划: 第一组应包括最小值;最末组应包括最大值,并闭口。 (3)将原始数据整理后,得到各组频数。 7描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况? 答:常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合:对称资料,最好是近似正态分布资料。 几何
3、均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。 中位数适合:数据非对称分布、分布不清楚或开口资料的情形。 8. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合:数据分布非对称的情形。 四分位数差距适合:数据分布非对称的情形。方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。 变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 9. 统计描述的基本方法有哪些,各自有何特点
4、? 答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。 表:详细、精确。图:直观。指标:综合性好。 10简述变异系数的适用条件。 答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 11. 怎样正确描述一组计量资料? 答:(1).根据分布类型选择指标。 (2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料 选用中位数与四分位数间距。 12. 正态分布的主要特征有哪些? 答:(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。 (3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数
5、) 。 (4)正态曲线下的面积分布有一定规律。 13. 参考值范围是指什么? 答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。 “正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。 14. 简述估计参考值范围的步骤与要点。 答:设计:样本: “正常人” ,大样本 n100。单侧或双侧。指标分布类型。 计算:若直方图看来像正态分布,用正态分布法。若直方图看来不像正态分布,用百分位数法。 15简述正态分布的用途。 答:(1)估计频数分布。 (2)制定参考值范围。 (3)质量控制。 (4)统计检验的理论基础。 16简述可信区间在假设检验问题中的作用。 答:可信区间不仅能回答差别有
6、无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率 P 值。故将二者结合起来,才是对假设检验问题的完整分析。 17. 假设检验时,当 P 0.05,则拒绝 H0,理论依据是什么? 答:P 值为 H0 成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当 P0.05 时,说明在 H0 成立的条件下,得到现有检验结果的概率小于 0.05,因为小概率事件几乎不可 能在一次试验中发生,所以拒绝 H0。下差别“有统计学 ”意义的结论的同时,我们能够知道可能犯 错误的概率不会大于 0.05,也就是说,有
7、了概率保证。 18. 假设检验中 与 P 的区别何在? 答:以 t 检验为例, 与 P 都可用 t 分布尾部面积大小表示,所不同的是: 值是指在统计推 断时预先设定的一个小概率值,就是说如果 H0 是真的,允许它错误的被拒绝的概率。P 值是由实际 样本获得的,是指在 H0 成立的前提下,出现大于或等于现有检验统计量的概率。 19. 什么叫两型错误?作统计学假设检验为什么要加以考虑? 答:如果 H0 正确,检验结果却拒绝 H0,而接受 H1,则犯 I 型错误,记为 ; 如果 H0 错误,检验结果却不拒绝 H0,未能接受 H1,则犯 II 型错误,记为 。 一般情况下, 越大, 越小; 越小, 越
8、大。如果要同时减少两类错误,则需最大样本 含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论 时,都要考虑到两型错误。 20. 配对比较是不是就比成组比较好?什么情况下用配对比较比较好? 答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不 是说凡是配对试验就一定比成组比较好。 实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的 个体间相似程度更高。 21. t 检验有几种?各适用于哪些情况? 答:t 检验以 t 分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种: 一是样
9、本均数与总体均数比较的 t 检验。即将一个样本均数 X 与一已知的总体均数作比较; 二是配对资料的 t 检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。 三是两个样本均数比较的 t 检验;两组的样本量可以不相同。 此外尚有相关系数、回归系数的 t 检验。 22. 什么叫假设检验?医学研究中常用的假设检验有哪些? 答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤 是:提出检验假设 0 H ,确定单双侧与检验水准 ;计算检验统计量;确定概率 P 值;判 断结果。在医学研究中常用的显著性检验有 u 检验、t 检验、F 检验、 2 检验及非参数秩和检验等多种
10、,不论那种检验均以假设成立时得到的统计量的概率来判断。 23.通过实例说明为什么假设检验的结论不能绝对化? 答:统计的结论为概率性的结论。拒绝 H0 时,可能犯型错误。不拒绝 H0 时,可能犯型错误。 24. 方差分析的检验假设(H0)是什么? 答:各总体均数相等 25. 方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解? 答:总的离均差平方和等于各部分离均差平方和之和. 总的自由度等于各部分自由度之和. 完全随机设计: SS 总SS 组内SS 组间 V 总V 组内V 组间 随机区组设计: SS 总SS 组内
11、SS 处理组间+SS 区组间 V 总V 组内V 处理组间+ V 区组间 26. 三组均数比较时,为什么不能直接作一般的两两均数比较的 t 检验? 答:增大犯第一类错误的可能性. 27. 两组均数差别的假设检验能否作方差分析,为什么? 答:可以.方差分析与 t 检验关系: k=2 时,F=t 2 , P 值相等,即两检验等价。 28方差分析的基本思想是什么? 答:方差分析的基本思想: 就是根据资料设计的类型及研究目的, 可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。 29为什么不能以构成比代率? 答:二者说明的问题不同。构成比只能说明
12、某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。 30简述相对数标准化的基本思想。 答:基本思想: 采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的 标准化死亡率具有可比性。 计算题1、2. 3. 4. 5、. 某院收治了 470 例颅脑损伤后综合症患者,疗效如下表,请对此资料作统计分析并写出统计报告。组 别 治疗数 有效数复方琥珀组 320 297安 定 组 100 45脑 复 康组 50 22答案:32 表 2 检验。 描述指标:有效率 复方琥珀组 92.8%,安定组 45.0%,脑复康组 44.0%;(5 分) 2 =135.553
13、, p=0.000;(10 分) 实际推论:三组有效率有显著差别。 (5 分)6、7. 8、对 10 例肺癌病人和 12 例矽肺病人用 X 线照片测量肺门横径右侧距 R1 值(cm) ,结果见下表:问:肺癌病人的 R1 值是否高于矽肺病人?肺癌病人和矽肺病人的 R1 值比较( cm)肺癌病人 2.78 3.23 4.20 4.84 5.12 3.21 7.18 8.05 8.56 9.60矽肺病人 3.23 3.50 4.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.95 5.10答案: 正态性检验: Normal 0.831889 PrF = 0.0000
14、即 |Z| = 0.3558Kruskal-Wallis Test (Chi-Square Approximation): CHISQ = 0.91465 DF = 1 Prob CHISQ = 0.3389P0.05,可以认为病人组的R 1值高于矽肺组。抢答题(单选题): 1. 对血清滴度资料表示平均水平的最常用统计量是:: A均数 B中位数 C几何均数 D全距 E标准差 答案(C )2描述一组偏态分布资料的变异程度时,适宜的统计量是: A 变异系数(CV) B 方差 C 极差(R) D 标准差(S) E 四份位数间距答案(E)3. 关于标准正态分布曲线下的面积,错误的是_A. -1.96
15、到 1.96 间曲线下面积是 95% B. 1.96 到 2.58 间曲线下面积是 2% C. 大于 1.645 的曲线下面积是 2.5% D. -1.96 到-1.645 间曲线下面积是 2.5% E. 大于 1.96 的曲线下面积为 2.5% 答案(C )4. 范围内占正态曲线下面积的_ 。 1.96A. 80% B. 99% C. 95% D. 5% E. 47.5% 答案(C )5 正态曲线下总面积为_ 。 A. 95% B. 99% C. 50% D. 1% E. 100% 答案(E)6. 抽样误差是由 A. 计算引起 B. 测量引起 C. 抽样引起 D. 采样结果不准引起 E. 试
16、剂、仪器未经校正引起 答案(C )7 在抽样研究中,均数的标准误。 A. 比标准差大 B. 比标准差小 C. 与标准差无关 D. 比均数大 E. 与标准差相等 答案(B )8. 配对设计 t 检验的统计假设为 A. 两样本来自同一总体 B. 差数的均数来自 的总体 0C. 差数的均数来自 的总体 D. 差数的均数来自 的总体 0E. 差数的均数来自 的总体 答案(B )9. 假设检验的步骤是 A 建立假设、选择和计算统计量、确定 P 值和判断结果 B 建立无效假设、建立备择假设、确定检验水准 C 确定单侧检验或双侧检验、选择 t 检验或 u 检验、估计 I 类错误和 II 类错误 D 计算统计
17、量、确定 P 值,做出推断结论 E 以上都不对 答案(A)10. 在比较两样本均数的假设检验中,结果 t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。正确的结论是A 两样本均数不同 B 两样本均数差异很大 C 两总体均数差异很大D 两样本均数来自同一总体 E 两样本均数来自不同总体 答案(E)11. 区间 的含义是 2.58XSA99% 的总体均数在此范围内 B样本均数的 99%可信区间 C99%的样本均数在此范围内 D总体均数的 99%可信区间 答案(D)12. 通常可采用以下那种方法来减小抽样误差。 A减小样本标准差 B减小样本含量 C增大样本含量 D以上都不对
18、答案(C )13. 关于假设检验,下列那一项说法是正确的。 A单侧检验优于双侧检验 B采用配对 t 检验还是成组 t 检验是由实验设计方法决定的 C检验结果若 P 值大于 0.05,则接受 H0 犯错误的可能性很小 D用 u 检验进行两样本总体均数比较时,要求方差齐性 答案(B )14. 两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小 A B C D0.50.10.10.2答案(D)15. 甲、 乙两人分别从随机数字表抽得 30 个 (各取两位数字) 随机数字作为两个样本,求得 ,则理论上221,XSA 22B作两样本 t 检验,必然得出无差别的结论 C作两方差齐性的 F 检验,
19、必然方差齐 D分别由甲、乙两样本求出的总体均数的 95%可信区间,很可能有重叠 答案(D)16. 作两样本均数比较的 t 检验时,正确的理解是: A. 统计量 t 越大,说明两总体均数差别越大。 B. 统计量 t 越大,说明两总体均数差别越小。 C. 统计量 t 越大,越有理由认为两总体均数不相等。 D. P 值就是 E. P 值不是 ,且总是比 小。 答案(C )17将 90 名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的 差值为疗效,欲比较三种方法的效果是否相同,正确的是_ 。 A. 作三个差值样本比较的 t 检验 B. 作三个差值样本比较的方差分析 C.
20、作配伍组设计资料的方差分析 D. 作两两比较的 t 检验 E. 以上都不对 答案(B )18当组数等于 2 时,对于同一资料,方差分析结果与 t 检验的结果:_. A 完全等价且 F=t. 方差分析结果更准确 t 检验结果更准确. 完全等价且 t F以上都不对 答案(D)19. 方差分析中 A. F 值可能是负数 B. F 值不可能是负数 C. 组间离均差不会等于组内离均差 D. 组间离均差不会小于组内离均差E. 组间离均差不会大于组内离均差 答案(B )20方差分析的目的: A、 比较均分 B、比较标准差 C、比较均方 D、比较离均差平方和 E、比较变异系数 答案(C )观众题1 下面的变量
21、中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 E.血压 答案(D)2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 E 疗效 答案(B )3.随机事件的概率 P 为 A.P=0 B. P=1 C. P=-0.5 D. 0.5P0.5 E. 0P1 答案(E)4.用样本作推断, 样本应是 A. 总体中典型的一部分 B. 总体中任一部分 C. 总体中随机抽取的一部分 D. 总体中按比例分配的一部分 E. 总体中信息明确的一部分 答案(C )5若以发汞含量大于 2.6ug/kg 为异常,调查某地 1000 人中多少人属于异常,这资料可看作 A计量资料 B. 计数资
22、料 C. 等级资料 D. 实验资料 E. 以上均不对 答案(B )6. 统计工作的步骤是: A. 作假设、计算统计量、查界值表和作结论 B. 整理资料、分析资料、假设检验 C. 统计设计、收集资料、整理和分析资料 D. 设立对照组、估计样本、重复试验 E. 统计描述、区间估计、假设检验 答案(C )7. 反映计量资料集中趋势的指标是_ 。 A. 标准差 B. 标准误 C. 率 D. 全距 E. 均数 答案(E)8. 编制频数表中错误的做法是_ 。 A. 找出最大值和最小值, 计算极差 B. 定组距 , 常用等组距, 一般分 815 组为宜 C. 写组段时组段可重叠,如“24, 46,” D.
23、用划记法计频数 E. 第一个组段应包括变量最小值,最后一个组段应包括变量最大值 答案(C )9. 在描述资料的变异程度时,最宽的范围是_。 A 均数 标准差 B 极差 C 四分位数间距 D 95%的参考值范围 E P5P95 间距 答案(B )10比较 20 头河马体重和 20 只小白鼠体重两组数据变异程度大小宜采用_ A 变异系数(CV) B方差 C 极差(R) D 标准差(S) E 四份位数间距 答案(A)挑战题第一组(每题 10 分)1. 欲研究广东省 6 岁儿童的身高情况 , 在广东省随机抽取了 200 名 6 岁儿童进行调查,以此为例说 明同质、变异、总体与样本这几个概念。 答:同质
24、体现在同为广东省、同为 6 岁儿童,变异体现在 200 名儿童的身高不同。 总体是指所有广东省 6 岁儿童,样本为 200 名 6 岁儿童。 2卫生统计工作中的统计资料主要的来源有哪些? 答:统计报表。经常性工作记录。专题调查或实验。 3简述统计工作全过程的四个步骤。 答:研究设计、收集资料、整理资料、统计分析。 4试举例说明常见的三种资料类型。 答:(1).计量或测量或数值资料,如身高、体重等。 (2).计数或分类资料,如性别、血型等。 (3).等级资料,如尿蛋白含量、 。 5. 统计学上的变异、变量、变量值是指什么? 答:变异:每个观察个体之间的测量指标的差异称为变异。 变量: 表示个体某
25、种变异特征的量为变量。 变量值:对变量的测得值为变量值。 6. 简述编制频数表的步骤与要点。 答:(1)找出最大和最小值,计算极差。 (2)确定组距和列出分组计划: 第一组应包括最小值;最末组应包括最大值,并闭口。 (3)将原始数据整理后,得到各组频数。 7描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况? 答:常用描述平均水平的平均数有算术均数、几何均数和中位数。 算术均数适合:对称资料,最好是近似正态分布资料。 几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。 中位数适合:数据非对称分布、分布不清楚或开口资料的情形。 8. 描述计量资料离散程度(
26、差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。 极差适合:数据分布非对称的情形。 四分位数差距适合:数据分布非对称的情形。方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。 变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较 无可比性,适用变异系数比较。 第二组(每题 20 分)1. 统计描述的基本方法有哪些,各自有何特点? 答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。 表:详细、精确。图:直观。指标:综合性好。 2简述变异系数的实
27、用时机。 答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。 3. 怎样正确描述一组计量资料? 答:(1).根据分布类型选择指标。 (2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般 偏态分布资料 选用中位数与四分位数间距。 4. 正态分布的主要特征有哪些? 答:(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。 (3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数) 。 (4)正态曲线下的面积分布有一定规律。 5. 参考值范围是指什么? 答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。 “
28、正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。 6. 简述估计参考值范围的步骤与要点。 答:设计:样本: “正常人” ,大样本 n100。单侧或双侧。指标分布类型。 计算:若直方图看来像正态分布,用正态分布法。若直方图看来不像正态分布,用百分位数法。 7简述正态分布的用途。 答:(1)估计频数分布。 (2)制定参考值范围。 (3)质量控制。 (4)统计检验的理论基础。 8简述可信区间在假设检验问题中的作用。 答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率 P 值。故
29、将二者结合起来,才是对假设检验问题的完整分析。 第三组(每题 30 分)1. 假设检验时,当 P 0.05,则拒绝 H0,理论依据是什么? 答:P 值为 H0 成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当 P0.05 时,说明在 H0 成立的条件下,得到现有检验结果的概率小于 0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝 H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于 0.05,也就是说,有了概率保证。 2. 假设检验中 与 P 的区别何在? 答:以 t 检验为例, 与 P 都可用 t 分布尾部面积大小表示,所不同的是:
30、 值是指在统计推断时预先设定的一个小概率值,就是说如果 H0 是真的,允许它错误的被拒绝的概率。P 值是由实际样本获得的,是指在 H0 成立的前提下,出现大于或等于现有检验统计量的概率。 3. 什么叫两型错误?作统计学假设检验为什么要加以考虑? 答:如果 H0 正确,检验结果却拒绝 H0,而接受 H1,则犯 I 型错误,记为 ; 如果 H0 错误,检验结果却不拒绝 H0,未能接受 H1,则犯 II 型错误,记为 。 一般情况下, 越大, 越小; 越小, 越大。如果要同时减少两类错误,则需最大样本 含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论 时,都要考
31、虑到两型错误。 4. 配对比较是不是就比成组比较好?什么情况下用配对比较比较好? 答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不是说凡是配对试验就一定比成组比较好。 实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的 个体间相似程度更高。 5. t 检验有几种?各适用于哪些情况? 答:t 检验以 t 分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种: 一是样本均数与总体均数比较的 t 检验。即将一个样本均数 X 与一已知的总体均数作比较; 二是配对资料的 t 检验。例如治疗前后的比较,或配成对子的实验
32、动物之间的比较。 三是两个样本均数比较的 t 检验;两组的样本量可以不相同。 此外尚有相关系数、回归系数的 t 检验。 6. 什么叫假设检验?医学研究中常用的假设检验有哪些? 答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤 是:提出检验假设 0 H ,确定单双侧与检验水准 ;计算检验统计量;确定概率 P 值;判断结果。在医学研究中常用的显著性检验有 u 检验、t 检验、F 检验、 2 检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。 7.通过实例说明为什么假设检验的结论不能绝对化? 答:统计的结论为概率性的结论。拒绝 H0 时
33、,可能犯型错误。不拒绝 H0 时,可能犯型错误。 8. 方差分析的检验假设(H0) 是什么? 答:各总体均数相等 第四组(每题 40 分)1. 方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解? 答:总的离均差平方和等于各部分离均差平方和之和. 总的自由度等于各部分自由度之和. 完全随机设计: SS 总SS 组内SS 组间 V 总V 组内V 组间 随机区组设计: SS 总SS 组内SS 处理组间+SS 区组间 V 总V 组内V 处理组间+ V 区组间 2. 三组均数比较时,为什么不能直接作一般的两两均数比较的
34、 t 检验? 答:增大犯第一类错误的可能性. 3. 两组均数差别的假设检验能否作方差分析,为什么? 答:可以.方差分析与 t 检验关系: k=2 时,F=t 2 , P 值相等,即两检验等价。 4. 方差分析中,组间变异是来源于那些方面的变异? 答:该变异除随机原因的影响外,有可能存在处理因素的作用。5. 对多组均数作方差分析的主要步骤和结果有那些? 答:(1)建立检验假设和检验水准 (2)计算统计量 F 值(列出方差分析表) (3)确定 P 值和作出推断结论 (4)作两两均数之间的比较(若 P0.05 则可省略此步骤) 6方差分析的基本思想是什么? 答:方差分析的基本思想: 就是根据资料设计
35、的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。 7为什么不能以构成比代率? 答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。 8简述相对数标准化的基本思想。 答:基本思想: 采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的 标准化死亡率具有可比性。 第五组(每题 50 分)1 解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法? 答: 率的直接标化法:已知各组的年龄别死亡率 pi。间接标化法:已知各组的死亡总数和
36、各年龄组人口数.2率的直接标化法,与间接标化法有何不同? 答: (1)适用条件不同( 见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成” 。 后者选定一套“标准年龄别死亡率” 。 3应用相对数时应注意哪些问题? 答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。 4常用相对数指标有哪些? 它们的意义上有何不同? 答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全
37、体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。 5统计学上资料是否“具有可比性”指的是什么? 你能举出一些不可比的例子吗? 答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。 6. 二项分布、Poisson 分布各有哪些特征? 答:二项分布和 Poisson 分布都是离散型分布。 二项分布的形状取决于 与 n 的大小: =0.5 时,不论 n 大小,分布对称。 0.5 时,图形呈偏态,随
38、n 的增大,逐渐对称。当 n 足够大, 或 1- 不太小,二项分布 B(n, )近似于正态分布 N( n , n(1- ) )。 Poisson 分布: 值愈小分布愈偏, 愈大分布趋于对称,当 足够大时,分布接近正态分布 N( , )。7. 简述二项分布、Poisson 分布、正态分布的关系。 答:当 n 足够大, 或 1- 不太小时,二项分布近似于正态分布。当 n 足够大, 或 1- 很小时, 二项分布近似于 Poisson 分布。 较大时,Poisson 分布近似于正态分布。 8. 二项分布的应用条件是什么? 答:每次试验有且仅有两个互相排斥的结果(A 或非 A) 。 每次试验中,发生 A 的概率相同,均为 。 各次试验独立,即 n 次观察结果相互独立。