1、1,均数的抽样误差和t检验,第二节:,一、抽样误差与标准误,(一)抽样误差的概念,由于抽样的原因所造成的样本指标与总体指标之间的差异就叫抽样误差。,例:某地成年男子血红蛋白的总体均数()为138.2g/L,随机抽取了400名男子算得平均血红蛋白含量为 =134.8g/L,如果用这个样本均数作为该地区“成年男子血红蛋白的总体均数()的估计值,它的抽样误差是多少?,样本的统计指标(统计量)与总体的统计指标(统计量)的差别称抽样误差。,1)样本统计量与总体参数之间的差异(如样本均数与总体均数差异); 2)样本统计量之间的差异(如两次抽样得到的两个样本均数也不会相等)。,抽样误差产生的两个基本条件:,
2、抽样误差有两种表现形式:,1)个体变异 2)样本含量,这均是由于总体中每个个体存在变异引起的!,标准误是反映抽样误差大小的指标,标准误越大则说明样本均数的代表性越差!,(二)标准误及其计算,举例说明:,例如:某大学有20000名同质学生,空腹血糖值(mmol/L)均值为4.655(4.655)。,如果我们对这些学生作132次抽样调查,每次抽100个学生,平均空腹血糖值X1、X2、。,=132,=?,n= ?,n= 100,5,这些均数不相等,但其分布有一定规律:大多数集中在总体均数(4.655)附近,离总体均数越远,样本均数的个数越少。,n=100,4.623 n=100,4.412 n=10
3、0,4.661 n=100,5.022 n=100,4.682 n=100,4.089 n=100,4.193 nN=100, N4.754,4.655,单位:(mmol/L),样本均数也呈正态分布!,6,如果把132(N)个样本均数看着132(N)个“变量值”,也可求其标准差,即样本均数的标准差,它说明样本均数间的变异程度,即样本均数的抽样误差。,样本均数的标准差称为标准误(standard error),用X表示。标准误越大,样本均数的抽样误差越大。标准误计算公式如下:,计算总体均数标准误公式,标准误计算公式:,计算样本均数标准误公式,由于总体标准差()往往不可知,所以一般用样本标准差(s
4、)代替,得总体标准误的估计值样本标准误 。,计算上述资料的标准误:如果计算的标准差为0.401,如何计算标准误?,8,标准差描述样本中个体值间的变异;标准误描述样本均数的抽样误差。 当样本量足够大时,标准差趋向稳定;而标准误则随样本量的增大而减小,甚至趋于零。 标准差可用于制定参考正常值的范围;标准误用于估计总体均数范围和不同组之间的参数比较。,思考标准误和标准差的区别?,1.96S(标准差) 估计95的正常值范围;,1.96 (标准误) 估计总体均数95的可信区间。,分布,前面介绍:从总体中进行抽样,如果样本含量较大时,其均数的抽样分布将趋于正态分布z(u)分布,进行u变换公式为:U= (
5、X- ) /s,求得u的估计值后再查表可求面积。但当样本含量较少时,对正态变量 采取的就不是z(u)变换,而是t变换,进行t变换公式为:,分布是英国统计学家W.S.Gosset 于1909年以“Student”为笔名在其发表的论文中首次提出来的,故分布又称 Student t分布(英国生物统计杂志发表)。,(三),图2-2 不同自由度下t分布图,分布图形的特征:,11,标准正态分布曲线下面积为95的双侧界值是?,如果双侧界值是1:面积为68.27%;如果为2.58?,表中左侧标目为自由度,右侧标目为概率P,表中数字为不同和P值下相应的界值,记做t, 。,为了方便使用,统计学家根据自由度(v)大
6、小与t分布曲线下面积的关系,推算出t界值表。因t分布是以0为中心的对称分布,故只列正值,如算得t值为负值,可取其绝对值查表。,(四)总体均数的区间估计,医学研究的一个目的就是对未知的总体参数进行估计。由样本信息估计总体参数称为参数估计。,点估计是直接用样本统计量作为对应的总体参数的估计值。,1.点估计,例如,某市1982年所有7岁男童身高是一个总体,但总体参数(平均身高)未知,为此,随机抽取该市1982年110名7岁男童,测量他们的平均身高为123.62(cm);标准差为4.74(cm),这两个均为样本的统计量。,如果你用这个样本平均数和标准差作为总体均数和标准差的估计,就可以认为该市所有7岁
7、男孩的平均身高为123.62(cm);标准差为4.74(cm),这就是点估计。,指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率(1- )称为可信度,通常取1-=0.95。可信度又称置信度、置信率。区间估计既是按一定的概率或可信度(1- )用一个区间估计总体参数所在范围,这个范围称可信度1-的可信区间,又称置信区间,它的理论基础是抽样分布规律。,2.区间估计,16,总体均数95可信区间:总体均数99可信区间,当样本含量较大时,例如n100,t分布近似正态分布,此时可用标准正态分布(u分布)代替t分布作为可信区间的近似计算。,1)大样本可信区间估计-正态近似法:,1
8、7,随机抽查120名21岁女大学生体重,得X48.83kg,Sx0.32kg,估计21岁女大学生体重均数的95可信区间。,例题:,X1.96Sx48.831.960.3248.2049.46(kg),21岁女大学生体重平均值的95%可信区间为:(48.20-49.46)kg,2)小样本可信区间估计-t分布法:,总体均数95可信区间估计计算公式:,总体均数99可信区间估计计算公式:,随机抽取某地25名正常成年男子,测得该样本的脉搏数为73.6次/分,标准差为6.5次/分,求该地正常男子脉搏总体均数95%的可信区间。,本例自由度:-1=25-1=24; t0.05,24,经查表得t0.05,24
9、= 2.064 则,- t0.05,24 = 73.6 - 2.0646.5/ = 70.9次/分,+ t0.05,24 =73.6 + 2.0646.5/ = 76.3次/分,即该地区正常男子脉搏总体均数的95%可信区间为: 70.976.3(次/分),例题:,=n1=251=24, 取双尾0.05,查附表2,t值表得:结论:婴儿血红蛋白平均值95%的可信区间为(118.79-128.61)g/L。,(g/L),课堂练习:现测得某地25名1岁婴儿血红蛋白的平均值为123.7(g/L), S=11.9g/L求其95%可信区间。,本例n=25, S=11.9g/L, 按公式算得其标准误为:,21
10、,可信区间意义:用样本均数估计总体均数,总体均数在该范围的可能性(概率)是95或99。,可信区间通常有两个可信限构成,小的称“下可信限”(或称下限),记为CL;大的称“上可信限”(或称上限),记为CU。严格地讲,可信区间并不包括上下限的值,即可信区间(CL,CU)是一个“开区间”。,3)关于区间估计的几点说明:,可信度为1- 的可信区间涵义是:如果重复若干次样本含量的相同抽样,每个样本均按同一方法构建100(1- )%可信区间,则在这些可信区间中,理论上有100(1- )个包含了总体参数,还有100 个未估计到总体均数。,如果,如果 = 0.05,从同一已知的总体中重复抽取100个样本含量为1
11、0的样本,每个样本均按 建立可信区间,则在100个可信区间中,理论上有95个包含总体均数,有5个不包括总体均数。,(1)可信区间的含义,(2)可信区间的两个要素:,第一个要素是“准确性”,又称可靠性,反映为可信度1- 的大小,显然可信度越接近1越好。准确性常根据研究目的和实际问题的背景由研究者自行决定,常用的有95%和99%。,第二个要素是“精确性”,常用可信区间的长度(CL,CU)来表示,当然长度越小越好。精确性与变量的变异度大小、样本例数和1- 的取值有关。当1- 的取值确定后,可信区间的长度受限于个体变异和样本含量,个体变异越大区间越宽,样本越小区间越宽,反之区间越窄。,24,例:某年级
12、学生总人数800人,通过计算其中50人的医学统计学考试成绩来估计其总体均数。,75.00 可能性,70.0080.00 可能性,65.0085.00 可能性,抽样n50,,X 75.00。估计 ?。,统计分析,包括“总体参数估计”和“假设检验”两个内容。,是用统计指标、统计表和统计图描述资料的分析规律及其数量特征。,统计描述,统计推断,二、t 检验,假设检验(hypothesis test)也称显著性检验(significance test)。由于存在抽样误差,从总体中随机抽样所得的样本均数与总体均数之间存在误差,从同一总体中抽取的样本均数之间也有误差。,的原因?,完全由抽样误差引起,比较的均
13、数来源于同一总体; 来自于不同的总体,均数之间存在本质差别。,(一)假设检验的概念与意义,27,28,例题:大规模调查表明健康成年男子血清总胆固醇的均数为4.6mmol/L,今随机调查某单位食堂成年男性炊事员25名,测得血清总胆固醇均数为5.1mmol/L,标准差为0.88mmol/L,试问该单位食堂炊事员血清总胆固醇的均数与健康男子血清总胆固醇均数有无差别?,两均数不相等的原因有两种可能: 由于抽样误差所致; 样本来自另一总体(由于环境条件的影响,炊事人员血清总胆固醇确实高于一般)。 这就需要通过建立“假设检验”来进行判断!,条件:本例中已有一个总体均值( = 4.6mmol/L),样本均值
14、和标准差分别为5.1mmol/L和0.88mmol/L,现在样本均数与总体均值不同。,0,假设检验的目的:,假设检验的目的就是分辨两个样本是否属于两个不同的总体,并根据检验假设成立的概率对总体作出适当的结论。与此类似,假设检验也包括分辨一个样本是否属于某一特定总体、三个及三个以上的样本是否属于相同的总体等。,1)建立假设和确定检验水准,统计学中的假设有两方面的内容:,一是无效假设(零假设),符号记为 H0:=0 即误差是因抽样引起 二是备择假设(对立假设),符号记为 H1: 0 即两者确有差别 后者的意义在于备选!在这里备选其实包含了: 0 或 0,建立假设:,操作程序步骤:,确定检验水准(水
15、平),检验水准常用表示,习惯上确定为 = 0.05。,确定检验水准:,0.05是指发生第一类错误的概率,即H0实际成立,但拒绝H0的概率为0.05。,第一类错误出现的概率与样本含量大小与试验所定的检验水准有关,即假设检验中假阳性的概率,其相当于显著性检验中的值。 显著性水准一般取0.05或0.01,表示假阳性出现的可能性在5%或1%的水平。愈小则所需样本愈大。,33,H1 : 0 01 2 1 2,建立假设时还需要根据研究目的和专业知识确定是单测检验还是双侧检验。,2)选定检验方法并计算检验统计量,根据研究设计的类型、资料的类型及分析目的选用适当的检验方法并计算适合的检验统计量。不同的检验方法
16、要用不同的公式计算统计量(t值计算;u值计算)。,检验统计量是衡量样本与总体间的差别或偏离程度的一个统计指标。,计算公式类型:样本均数与总体均数比较计算公式;配对设计资料比较计算公式;成组设计资料计算公式等。,统计量t表示:在标准误的尺度下,样本均数与总体均数的偏离,这种偏离称为标准t离差(大小取决于两均数之差)。,根据抽样误差理论,在H0成立的前提下,统计量t服从t分布,即t值在0附近的可能性较大,远离0的可能性较小,离0越远,可能性越小。,样本均数与总体均数比较计算公式;,3)确定p值,做出统计推断,用计算得到的统计量和相应界值表(u值表;t值表)的界值进行比较,确定p值。P值是指在H0所
17、规定的总体中做随机抽样,获得等于及大于或等于及小于现有统计量的概率。如果P(=0.05),则按设定的水准拒绝H0,可作出有统计学意义的结论。如果P(=0.05),则接受H0,并作出没有统计学意义的结论。,37,表2-5 判断t值差别的意义,假设检验作出的结论不是绝对正确,而是具有概率性。拒绝H0可能犯第一类错误,不拒绝H0又可能犯第二类错误。,对结论的理解:,t 检验:1.单因素设计的小样本(n60)计量资料;2.样本来自正态分布总体;3.两样本相应的总体方差相等。,(二) t 检验和z(u)检验,应用条件:,独立性、正态性、方差齐性,u 检验:1.大样本(主要);2.样本小,但总体标准差已知
18、(少用)。,t 检验形式:,t检验主要有以下三种形式: 单个样本的 t 检验 配对样本均数 t 检验(非独立两样本均数t检验) 两个独立样本均数 t 检验,1.样本均数与总体均数比较的t检验,又称单样本均数t 检验(one sample t test),适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。,已知总体均数0 一般为标准值、理论值或经大量观察得到的较稳定的指标值。,2)假设检验有三个基本步骤: 建立假设和确定检验水准 (通常选?) 选择检验方法和计算检验统计量 确定P 值和做出统计推断结论,所有的假设检验都按照这三个步骤进行,各
19、种检验方法的差别在于第步计算的检验统计量不同。,配对设计资料比较的t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。,2.配对设计资料比较的t检验,应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。,同源配对(自身配对、自身对比):同一对象处理前后的数据或同一样品用两种方法测定的结果(同一标准的两部分随机分配接收两种不同的处理)。 异源配对:将受试对象按某些重要特征相近的原则配成对子,对每一对子中的两个实验对象给予两种不同的处理,以推断两种处理的效果有
20、无差别。,配对资料类型:,44,某药治疗前后的血沉(mm/h),病人号 治疗前 治疗后,1 10 6 2 13 9 3 7 4 : : : n 8 5,45,46,配对设计下的数据具有一一对应的特征,研究者关心的变量常常是对子的效应差值而不是各自的效应值。在进行配对设计资料的t检验时,首先应求出各对数据间的差值d,将d值作为变量值计算均数。若两处理因素的效应无差别,理论上差值d的总体均数(0 )应为0,故可将该检验理解为样本均数与总体均数的比较。,配对设计资料比较的思想:,48,0为差数的总体均数 d 为成对数据之差(差数)的均数 Sd 为差数均数的标准误 Sd 为差数均数的标准差,计算公式:
21、,例2.4 应用某药治疗9例高胆固醇血脂患者,治疗前后血浆胆固醇如下表。问该药是否对患者治疗前后血浆胆固醇变化有影响?,50,建立假设:H0 :d 0 H1 :d 0 0.05(单侧检验),计算均值和标准误,51,确定P值自由度vn1918查t值表单侧t0.01,8 2.896tt0.01,8 P 0.01,计算t值,52,统计推断结论P0.01 ,在0.05水准上拒绝H0,接受H1 ,差异有高度统计学意义。,结论:,可认为该药有降低血浆胆固醇作用!,3.小样本中两个均数比较的t检验,-两样本均数的差异比较,适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。 完
22、全随机设计是将受试对象随机地分配到两组中,每组对象分别接受不同的处理,然后分析比较处理的效应(先算出两组数据的均数,然后比较两个均数的差异是否具有显著性)。,简称“成组 t 检验”、又称“两独立样本t 检验”。,54,v=n1+n22,计算公式:,55,带入后的t值计算通用公式为:,v=n1+n22,56,例 从4059岁有、无肾囊肿的女性中分别随机抽取10与12人,测定她们的尿素氮水平(mmol/L)见下表。问两组女性尿素氮水平有无差别?,57,假设:H0 :12 H1 :12 0.05 单侧检验,58,59,确定P值自由度vn1n221210220查单侧t值表t0.05,20 1.725,
23、统计推断结论P0.05 ,在0.05水准上不拒绝H0,差异无统计学意义。故尚不能认为有、无肾囊肿的女性尿素氮水平有不同。,本例t值t1.46,tt0.05,20 P0.05,当样本含量较大(自由度100)时,假设检验对资料的正态性和方差齐性要求不高,且t分布和标准正态u分布接近,此时可用u检验代替t检验。,计算公式:,公式中( )为两均数之差的标准误。,4.大样本(成组)设计资料的z(u)检验,检验步骤与t检验相同!,某地随机抽取正常男性264名,测得空腹血中胆固醇(mmol/L)的均数为4.404,标准差为1.169;随机抽取正常女性160名,测得空腹血中胆固醇的均数为4.288,标准差为1
24、.106。问男、女胆固醇浓度有无差别?,例 题:,假设:H0 :12 H1 :12 0.05,计算u值,63,*为双侧,单侧u界值为1.645、2.326。,64,确定P值 本例 u = 1.02u1.96 P0.05,统计推断结论P0.05 ,在0.05水准上不拒绝H0,差异无统计学意义。,结论:尚不能认为男、女胆固醇浓度不相同。,(三)假设检验中两类错误,假设检验是针对H0,利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是接收H0,都可能会犯错误。,-型(类)与型(类)错误,当H0为真时,检验结论拒绝H0接受H1,这类错误称为第一类错误或型错误(type error),亦称假阳性错误。,设置的检验水准(),就是预先规定的允许犯型错误概率的最大值!,当真实情况为H0不成立而H1成立时,检验结论不拒绝H0反而拒绝H1,这类错误称为第二类错误或型错误(type error),亦称假阴性错误 。,(四)假设检验时应注意的几个问题,(一)有专业实际意义; (二)要有严密的研究设计; (三)选择的假设检验方法应符合应有条件; (四)正确理解检验水准和概率的意义; (五)合理选择单侧检验和双侧检验; (六)下结论不要绝对化,注意实际差别大小与统计学意义的区别。,