1、第一套试卷及参考答案一、选择题 (40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图 B 百分条图或圆图 C 线图 D 直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式 负偏态分布 正偏态分布 正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A)A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数 B 方差 C 标准差 D 四分位间距5、产生均数有抽样误差的
2、根本原因是( A )A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同6.男性吸烟率是女性的10倍,该指标为(A )(A)相对比 (B) 构成比 (C)定基比 (D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设”C. A 和 B 均不是 D. A 和 B 均是8、两样本均数比较用 t 检验,其目的是检验( C)A 两样本均数是否不同 B 两总体均数是否不同C 两个总体均数是否相同 D 两个样本均数是否相同9、 有两个独立随机的样本,样本含量分别为 n1和 n2,在进行成组设计资料的 t 检验时,自由度是(D )(A) n 1+ n2
3、(B) n 1+ n21 (C) n 1+ n2 +1 (D) n 1+ n2 -2 10、标准误反映(A)A 抽样误差的大小 B 总体参数的波动大小C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)垂直距离的平方和最小 垂直距离最小纵向距离的平方和最小 纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的 t 值为 tr,对回归系数检验的 t 值为 tb,二者之间具有什么关系?(C)A trtb B tr 20.05, 可认为( A)A 各总体率不同或不全相同 B 各总体率均不相同C 各样本率均不相
4、同 D 各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A )A四格表检验 B.四格表校正检验 C t 检验 D U 检验16、为调查我国城市女婴出生体重:北方 n1=5385,均数为3.08kg,标准差为0.53kg;南方 n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.00345 (B)n40, T40, 10 , b0 , b0 (C) r0 (D) r=b二、填空题 12分1、 统计资料按其性质不同,通常将资料分为 (计量、计数、等级
5、) 三种类型。2、 统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为(统计描述 )与(统计推断)两个阶段。3、 计量资料,随着样本例数的增大,S 逐渐趋向于( ), 逐渐趋向于( 0 )。4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。5、(相关分析)侧重于考察变量之间相关关系密切程度,(回归分析 )则侧重于考察变量之间数量变化规律。6、对某地一年级12名女大学生体重(x :单位 kg)与肺活量(y:单位 L)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:=0.000419+0.058826X,这意味着体重每增
6、加1kg ,肺活量平均增加(0.058826L );且两者之间为(正)相关。三、名词解释13分1.参数和统计量2.概率3.计数资料4.回归系数答案见书本相应的位置四、简答题15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3.能否说假设检验的 p 值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为 P 值的大小与总体指标间差
7、异大小不完全等同。P 值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的 P 也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。 五、计算分析题1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。年份 病例数存活数住院期死亡总数急性期死亡数住院期总病死率(%)急性期病死率(%)1964 17 9 8 7 47.1 41.21965 13 8 5 4 38.5 30.81966 15 8 7 6 46.7 40.01967 15 9 6 6 40.0 40.01968 12 8 4 4 33.3 33.3合计 72 42 30 27 41
8、.7 37.5修改表:某年某地1964-1968年某病住院期与急性期病死率比较住 院 期 急 性 期年份 病例数 死亡总数总病死率(%)死亡数 病死率(%)1964 17 8 47.1 7 41.21965 13 5 38.5 4 30.81966 15 7 46.7 6 40.01967 15 6 40.0 6 40.01968 12 4 33.3 4 33.3合计 72 30 41.7 27 37.52、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可)表1某新药临床试验部分指标医院代码性别
9、 身高 体重疗效 组别1 1 175.00 63.00 3 01 2 157.00 54.00 2 01 1 178.00 67.00 2 11 2 165.00 50.00 3 0. 2 162.00 51.00 4 0. 2 156.00 48.00 2 1. 1 176.00 62.00 2 1. 1 184.00 72.00 2 05 1 168.00 65.00 2 05 2 166.00 46.00 2 1分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的 t 检验或 u 检验。两组疗效比较可用秩和检验。第三套试卷及参考答案一、
10、选择题 20分17人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为_C_A1:12.4 B1:8 C1:16 D1:81:162比较身高和体重两组数据变异度大小宜采用_A_A变异系数 B方差 C极差 D标准差3下列关于个体变异说法不正确的是_C_A个体变异是生物体固有的。 B个体变异是有规律的。C增加样本含量,可以减小个体变异。D指标的分布类型反映的是个体的分布规律。4实验设计的原则是_C_A对照、随机、均衡 B随机、重复、均衡C对照、重复、随机 D随机、重复、齐同5说明某现象发生强度的指标为_B_A平均数 B率 C构成比 D相对比6要研究四种不
11、同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2列的R*C 表后,其卡方值的自由度为_C_A8 B1 C3 D跟样本含量有关7假设检验中的第一类错误是指_A_所犯的错误。A拒绝了实际上成立的 H0 B不拒绝实际上成立的 H0C拒绝了实际上不成立的 H0 D不拒绝实际上不成立的 H08样本含量固定时,选择下列哪个检验水准得到的检验效能(1-)最高_D_A B C D 9两样本均数的 t 检验对资料的要求是_D_A正态性、独立性、方差齐性 B资料具有代表性C为定量资料 D以上均对10四个率的比较的卡方检验,P 值小于0.01,则结论为_D_A四个总体率均不相等; B四个样
12、本率均不相等;C四个总体率之间肯定不等或不全相等;D四个总体率之间不等或不全相等。二、名词解释 10分1相关系数;2抽样误差;3变异系数;4总体参数;5率;答案:见书上相应的地方三、填空题 10分1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样(系统抽样) ,分层抽样,整群抽样 2、统计推断的内容主要包括 参数估计 和 假设检验 。3、临床观察7名某病患者,其潜伏期(天)各为:3,7,9,5,6,9,16,则其全距为 13天。4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:有效无效有效(4)有效 无效,这种资料属于何种类型资料 计数资料。5、实验研究的基本要素是:处
13、理因素、受试对象、实验效应四、简答题 20分1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次” ,而在同一组的相同数据不必计算平均秩次?答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。2某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广” 。答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。3某地岁婴儿平均血红蛋白95可信区间为116.2130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95的参考值范围为111.2135.1(g/L),又说明了什么含义? 答:表示该地岁婴儿血红蛋白总体平均数
14、在116.2130.1(g/L),估计正确的概率为95%表示该地有951岁正常婴儿的血红蛋白值在111.2135.1(g/L)4对同一组资料,如果相关分析算出的 r 越大,则回归分析算出的 b 也越大。为什么?答:没有这个规律。相关分析 r 值大小仅说明变量间联系紧密,而回归分析 b 的大小说明两者数量关系。五、分析计算题40分1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅) 。男婴 x1 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5女婴 x2 7
15、.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3(1)该资料是数值变量资料还是分类资料?数值变量资料(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组 t 检验还是配对 t 检验?成组 t 检验(3) 经过计算 t 值为2.16,已知自由度22时,双侧面积0.05对应的 t 界值为2.07,自由度11时,双侧面积0.05对应的 t 界值为2.20。试写出假设检验的全过程并下结论。答:H0:白种人男婴与女婴的出生体重是相同的即 1=2H1:12 =0.05t=2.16 =22 tt 0.05/2,22=2.07 p0.05结论:在 =0.05
16、水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。3 比较缺氧条件下猫和兔的生存时间(时间:分)猫 兔生存时间 秩次 生存时间 秩次25 5.5 14 134 10 15 238 11 16 340 12 18 441 13 25 5.542 14 26 745 15 28 830 9(1)该资料属于什么试验设计方式?完全随机设计两样本资料的比较(2)对资料进行编秩;见表(3)该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组 39.5(4)写出对该资料进行假设检验的假设。H0:两组生存时间的总体分布是相同的。4.请完成以下空白并进行描述性分析。年龄(岁)人口数死亡总数恶性肿瘤死亡数恶性肿瘤死亡占总死亡的%恶性肿瘤死亡率(1/10万) 年龄别死亡率()0- 82920 ( ) 4 2.90 ( ) ( )20- ( ) 63 ( ) 19.05 25.73 ( )40- 28161 172 42 ( ) ( ) ( )60- ( ) ( ) 32 ( ) ( ) ( )合计 167090 715 90 12.59 ( ) ( )