1、样本含量的估计与检验效能,一、样本含量的估计,(一)样本含量(sample size)每个样本所包含的调查或受试对象数。样本含量估算是在保证研究结论具有一定可靠性的条件下,确定最小的实验或调查单位数。,(二)样本含量的确定因素 1. 检验水准 。 ,则n 2. 检验效能1-。(1-),则n ,(1-) 0.75,通常取0.8。 3. 容许误差或差值。所比较的两个总体参数间的差值。 ,则n , ,则n ,一般令允许误差小一些,对总体估计精确一些。 4.总体平均数(或总体率)、总体标准差 。,两总体均数间的差值=1-2,两总体率间的差值=1-2。计量资料两组均数的比较:=(1-2)/,或 = 配对
2、资料 =/,或 = 计数资料中两组率的比较:=1-2,或=P1-P2,,(三)确定样本含量的意义 1.获得有统计学意义的最低样本含量。2.估计检验效能 3. 估计总体参数的差异,Z:检验水准所对应的z值,单侧Z0.05=1.645,双侧Z0.05=1.96 Z:第二类错误概率所对应的Z值,Z0.1=1.282 :两总体均数间的差值 :总体标准差,(四)样本含量的估计 1.抽样调查(1)均数抽样,【例1】要调查某社区居民白细胞总量的平均值,已知该社区人口总数为2.5万人,以往测定结果,白细胞的标准差S=1000个/mm3,若取=0.05,允许误差=100个/mm3,问用单纯随机抽样方法需调查多少
3、人?,已知:N=25000,S=1000个/mm3,=100个/mm3,=0.05,Z0.05=1.96,即需要从该社区随机抽取385人。,(2)率的抽样,【例2】从参考文献得知高血压的患病率为8%,研究者拟研究某地高血压患病率,要求误差不超过2%,取=0.05,允许误差=0.02,问需调查多少人?,已知 =0.08,=0.05,Z0.05=1.96,=0.02,即需调查707人。,2. 样本均数与总体均数比较,【例3】 用某药治疗矽肺患者可增加尿矽的排出量,标准差为89.0mmol/L,取=0.05,=0.10,能辨别出尿矽排出量平均增加35.6mmol/L,需观察多少例矽肺患者?,已知:S
4、=89.0,=35.6,单侧=0.05,单侧Z0.05=1.645,=0.10,单侧Z 0.10=1.282,即需观察54例矽肺患者。,3.两样本均数比较,【例4】为研究某地正常成年男、女末稍血液的红细胞的差别,据文献报道,男性红细胞均数为465万/mm3 ,女性红细胞均数为422万/mm3,标准差为52万/mm3,取双侧=0.05,把握度(1-)=0.9,问要抽查多少人才能发现男女间红细胞的差别?,已知: 1=465, 2=422,=| 1- 2|=|465-422|=43,=52 双侧=0.05,Z0.05=1.96, =0.1,Z0.1=1.282,即成年男女性各需抽查31人才能发现其红
5、细胞间的差别。,已知: 1=465, 2=422,=| 1- 2|=|465-422|=43,=52 双侧=0.05,Z0.05=1.96, =0.1,Z0.1=1.282,4. 配对计量资料比较,d:每对观察对象差值的标准差n: 所求的观察对子数,【例5】研究碳酸铝对白细胞减少症的治疗效果。已知治疗后比治疗前平均增加1109/L,标准差为1.2109/L,取双侧=0.05,把握度(1-)=0.9,求样本含量。,已知:=1,d=1.2,Z0.05=1.96, Z0.1=1.282,即需15例患者参加试验。,5. 两样本率比较,1和2:分别表示两组的总体率 c :两组的合并率,【例6】用旧药治疗
6、慢性肾炎的近控率为30%,现试验新药疗效,新药的近控率必须达到50%才认为有推广价值,问每组各需要多少例患者?,已知:1=0.5,2=0.3,c=(0.5+0.3)/2=0.4单侧=0.05,Z0.05=1.645,=0.1,Z0.1=1.282,即试验组和对照组各应观察103人。,6. 配对计数资料比较配对资料分析形式,甲乙两法比较,+-=b/(a+b), -+=c/(a+c),c=(+-+-+) /2,【例7】某菌种接种于甲、乙两种培养基的结果如下: +-=0.04,-+=0.24,取双侧=0.05,=0.1, 现要研究一种与该菌种相似的新菌种,问需观察多 少对子数?,c=(0.04+0.
7、24) /2=0.14,即需观察57对样本。,7. 根据相对危险度进行估计 8. 相关分析,二、检验效能及其计算,(一)检验效能(Power)又称把握度 即两总体确实有差别,按水准能发现它们有差别的能力,用(1-)表示。(1-)=0.9 为第二类错误的概率。Z 查z值表 (1-),出现“阴性”结果有两种可能:(1)(1-)较大,被比较的指标间很可能无差别。 (2)(1-)较小,所比较的指标间很可能差别有显著性,但由于样本含量不足而未能发现。,p:在水平下,接受H0,即认为差别无显著性,又称作“阴性”结果。,(二)Z的计算 1.两样本均数比较:,(未知时),【例8】用阻滞剂降低心肌梗塞患者血压的
8、随机双盲对照试验,结果见下表。检验结果为t=1.54,P0.05,无统计学意义,认为该药无降压效果。问该结论是否可靠?要求:=0.67kPa,=0.05,Z0.05=1.96。,两组心肌梗塞患者治疗后的收缩压(kPa),已知:=0.67kPa,=0.05, Z0.05=1.96,S=1.6,n1=n2=15,查附表1 P(Z-0.81)=1- P(Z-0.81)=1-0.2090=0.7910 即=0.79,则 Power=1-=1-0.79=0.21说明检验效能太低,该结论假阴性的可能性大, 需增加样本含量进一步试验。,【例9】用同一种降压药分别治疗两组高血压患者,服用4周后比较两组患者收缩
9、压的下降值(mmHg),测得结果:n1=14, ,S1=6.32;n2=16, ,S2=2.16。检验结果:t=2.34, P0.05。问该研究的检验效能如何?,查表,P(Z0.28)= P(Z-0.28)=0.3936 则=0.39,Power=1-=1-0.39=0.61 即该研究得检验效能偏低,结论不可靠。,2. 配对计量资料比较,N为对子数,为差值均数,Sd为差值标准差。,【例10】经连续非卧床腹膜透析(cAPD)治疗晚期糖尿肾病6例,测得生化指标之一Na的结果(XS):治疗前138.332.28,治疗后139.671.41,差值1.332.76。检验结果:t=0.482,P0.05。该结论是否可靠?,已知N=6, =1.33,Sd=2.76,查表,P(Z-0.78)=1- P(Z-0.78)=1-0.2177=0.7823 即=0.78,Power=1-0.78=0.22 说明检验效能太低,结论不可靠。,3. 两样本率比较 4. 配对计数资料 5. 直线相关,Summary,一、样本含量的估计 (一)样本含量(sample size) (二)样本含量的确定因素:4个 (三)确定样本含量的意义 (四)样本含量的估计 二、检验效能及其计算 (一)检验效能(Power) (二)Z的计算,