1、总体均数的估计和t检验,何平平 北京大学医学部流行病与卫生统计学系 Tel:82801619,一、均数的抽样误差及总体均数置信区间的估计,(一)均数的抽样误差(一定是同一总体的样本) 1.定义在抽样研究中,由于抽样造成的样本均数与总体均数之间的差异或者样本均数之间的差异,称为均数的抽样误差(sampling error)。抽样误差是不可避免的,造成抽样误差的根本原因是个体变异的客观存在。,2. 计算,3.性质(1)抽样误差的大小(样本均数的标准差),即标准误,与标准差成正比,与样本含量的平方根成反比。(2)在实际工作中,减小抽样误差的有效方法是增大样本含量。,(二)t分布,1.定义若从正态分布
2、N(, 2)总体中随机抽取若干个样本含量为n的样本,样本均数也服从正态分布N(, )。则服从标准正态分布N(0, 1)。在实际工作中,当 未知时,常用 来代替,则 服从自由度 = n 1的t分布,2.性质一组与自由度有关的曲线,随着自由度的增大接近标准正态分布。,N50,(三)总体均数95置信区间的估计,1.定义 根据样本均数计算出有(1-)的把握包含总体均数的一个数值范围,这个数值范围称为总体均数的置信区间,该(1-)称为置信度。一般取0.05或0.01,则置信度为95%或99%,即一般估计总体均数的95%或99%置信区间。 置信区间的估计是有概率性的:总体均数的95%置信区间即有95%的概
3、率(可能性)认为计算出来的置信区间包含了总体均数;这意味着不能认为总体均数肯定落在此可信区间内,即总体均数仍有5%的可能性不在此置信区间内。 2. 计算 总体均数的95%置信区间为 t0.05/2,二、假设检验 (t 检验),假设检验的基本思想,假设检验的目的: = 0?,0 ,考虑差异来源有两种可能性:(1) = 0 (同一总体), 0仅由抽样误差造成。(2) 0 (不同总体), 0主要由两总体之间的不同造成。,小概率原理,小概率原理,接受,检验水准:亦称为显著性水准(significance level),符号为。 是预先规定的概率值,它是“是否拒绝H0的界限”。研究者可以根据研究目的规定
4、的大小,通常取0.05。,检验假设: H0:无效假设 H1:备择假设,(一)样本均数与总体均数的比较的t检验 又称为单样本t检验。已知的“总体均数”一般为理论值、标准值或经过大量观察所得到的稳定值等。令已知总体均数为0,样本均数所代表的未知总体均数为 ,假设检验的目的:推断样本均数所代表的未知总体均数 与已知总体均数0是否相等(双侧检验)。, = n 1,假设检验的目的推断两个总体均数是否相等(双侧检验:1 = 2?,单侧检验: 1 2? 或者1 2? ),例: 通过大量调查,已知某地正常男婴出生体重为3.26kg。某医生随机抽取20名难产男婴,出生体重如下(见数据文件p192.sav) 。问
5、该地难产男婴出生体重均数是否与正常男婴不同?,难产婴儿: 3.5 3.5 3.2 3.5 3.3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4.0 4.0,SPSS操作步骤:,Sig:significance,结论:经t检验,得到t1.330,P0.05,尚不能认为该地难产男婴出生体重均数与正常男婴不同。,(二)两个独立样本均数比较的t检验 又称为完全随机设计的t检验或成组t检验。是指分别从两个研究总体中随机抽取样本,目的是推断这两个独立样本所代表的未知总体均数1与2是否相等。,例:某医师测得12名正常人和13名病毒性肝炎患者血清转
6、铁蛋白含量(g/L),结果如下(见数据文件p193.sav)。问病毒性肝炎患者和正常人血清转铁蛋白含量有无差异?,病毒性肝炎患者: 2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42 正常人:2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.71 2.64,变量说明:group:分组,1患者;2正常人。X:血清转铁蛋白。,SPSS操作步骤:,结论:经Levene方差齐性检验,P0.10,认为两组方差齐,因此采用t检验,得到t8.812,P0.05,认为病毒性肝炎患
7、者和正常人血清转铁蛋白含量有差别。,(三)配对t检验 可分为自身配对比较和实验配对比较,目的是推断某种处理有无作用或两种处理结果有无差别。 由于配对设计资料可以有效地控制个体差异对结果的影响,故配对t检验的检验效率比成组t检验要高。,, = n 1,H0:UD=0,例: 为比较某新药与常规药降血脂的效果,将性别相同、血清总胆固醇水平相近的高血脂患者配成对子。每对中随机抽取一人服用新药,另一人服用常规药。服用一段时间后,测得血清总胆固醇含量(mmol/L)如下(见数据文件p196.sav)。问新药与常规药降血清总胆固醇效果是否相同?,常规药:6.57 6.46 6.27 6.89 6.21 7.
8、61 7.60 7.04 6.68 7.42新药: 6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.22,变量说明:X1:常规药的血清总胆固醇, X2:新药的血清总胆固醇。,SPSS操作步骤:,结论:因为t=1.517,P=0.1640.05,所有尚不能认为新药和常规药降低血清总胆固醇的效果不同。,假设检验的P值不能反映总体均数差别的大小。P值越小,越有理由(越有把握)认为两总体均数不相等。 假设检验的结论具有概率性。(两类错误常考)H0原本正确, 但P0.05,拒绝H0 :第一类错误()H0原本不正确,但P0.05,不拒绝H0 :第二类错误() 为事先指定的检验水平(一般取0.05),未知;越小,越大;越大,越小;增大样本量n,可以同时减小和 。,假设检验的注意事项,注:在临床或者基础科研中,可能会由于样本量不足,从而增大了第二类错误的概率,导致“差别无统计学意义”的错误结论。,