1、假设检验基础,总 体,样 本,统计描述,统计推断,随机 抽样,假设检验的概念与原理 t检验 Poisson分布资料的z检验 假设检验与区间估计的关系 假设检验的功效,第一节 假设检验的概念与原理,例1 根据大量调查,已知健康成年男子的脉搏均数是72次/min,某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/ min,标准差为6.5次/ min 。可否据此认为山区成年男子的脉搏均数与一般健康男性脉搏均数相同?目的:推断山区的健康成年男子脉搏均数(未知总体均数)与一般健康成年男子脉搏均数(已知总体均数0)间有无差别 =0 ?,显然样本均数与总体均数不等有两种可能: 1 由于抽样
2、误差所致; 2 由于环境因素的影响所致。如图所示:,已知总体均数0,未知总体均数,是由抽样误差所致,不仅仅是由抽样误差,两总体存在本质差异,假设检验,如何判断,假设检验的概念 (Hypothesis)先对未知总体进行两种对立的假设,然后依据有限的样本信息对未知总体的两种对立假设进行抉择的过程。,假设检验的基本思想 小概率事件实际推断原理小概率事件在一次随机试验中不大可能发生,如果一次抽样发生了小概率事件,就有理由怀疑前提假设的成立。 反证法提出一个假设,确定当此假设成立时获得现在样本的 概率大小,如果是小概率事件,则推断假设是假的,拒绝它;如果不是,则认为假设是真的,不能拒绝它,事件,A,B,
3、肯定A,否定B,(一) 建立假设,确定单双侧检验,建立假设: 零假设或原假设(null hypothesis)、无效假设通常为两总体参数相等或服从某分布样本均数与总体均数不同是由于抽样误差所致: 备择假设(alternative hypothesis)、对立假设通常为两总体参数不相等或不服从某分布样本均数与总体均数不同是由于存在本质差别 确定单双侧检验 由研究目的及专业知识所决定 从备择假设看:,(二)确定检验水准,检验水准 :为预先规定的小概率事件的标准 通常取值0.05或0.01 可根据研究目的进行调整,(三)选择检验方法,计算检验统计量,应根据研究目的、资料类型、设计类型及样本含量大小等
4、因素选择合适的假设检验方法; 在 成立的前提下,由样本已知信息构造检验统计量; 通常根据构造的检验统计量来命名假设检验方法。 不同的统计量涉及的统计分布不同,(四)确定 P 值,值的含义:由H0所规定的总体作随机抽样,获得现有样本统计量值及更极端值的概率怎样确定值:构造的检验统计量服从相应的分布,查相应分布界值表确定值。一般双侧检验查双侧界值表,单侧检验查单侧界值表。,(五)作出推断结论,与检验水准相比作出推断结论 ,拒绝H0,接受H1 差别有统计学意义 (在H0成立的前提下,一次随机抽样发生了小概率事件) ,不能拒绝H0 差别无统计学意义 (在H0成立的前提下,一次随机抽样没有发生了小概率事
5、件,没有充足的理由拒绝H0 )推断结论应包括统计结论和专业结论,还必须结合专 业得出最终结论,1、H0:72,山区成年男子的脉搏均数与一般健康男性脉搏均数相同;H1:72,山区成年男子的脉搏均数与一般健康男性脉搏均数不相同。 2、检验水准0.05 3、计算检验统计量 4、按 =25-1=24查附表2 t界值表P=P(|t|1.69) ?,例题的假设检验基本步骤,t0.05,24=2.064 P =P ( |t| 2.064 )=0.05,0.025,-2.064,2.064,0.025, =24,0,P=P(|t|1.69)0.05,5、本例P0.05,按 =0.05的水准,不拒绝H0,差别没
6、有统计学意义,还不能认为山区成年男子的脉搏均数与一般健康男性脉搏均数不相同。,第二节 t检验,单样本设计的检验 配对设计的检验 完全随机设计(成组设计)的检验,计量资料分析的 t 检验,英国统计学W.S.Gosset (1909)导出了样本均数的确切分布,即 t分布。 t分布的发现使小样本的统计推断成为可能,因而它被认为是统计学发展史上的里程碑之一。 以t分布为基础的检验称为t检验。,t 检验,t检验亦称student t检验。 t检验的用途: 样本均数与总体均数的比较; 两样本均数的比较。 t检验的应用条件: 当样本例数较小时,要求样本取自正态总体; 做两样本均数比较时,还要求两样本的总体方
7、差相等。 但在实际应用中,与上述条件略有偏离,对结果亦影响不大。,单样本t检验,设计类型:例2 大量研究表明汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm,某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.95、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区汉族足月正常产男性新生儿临产前双顶径(BPD)是否大于一般新生儿?,例3 已知北方农村儿童前囱门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得前囱门闭合月龄均值为14. 3月,标准差为5.08月。问该县
8、儿童前囟门闭合月龄的均数是否大于一般儿童?,单样本t检验,目的: 推断该样本是否来自某已知总体;样本均数代表的总体均数与0是否相等。总体均数0一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。,单样本设计检验可解决问题,假设检验思路 先假设 等于0,再判断样本提供的信息是否支持这种假设,若不支持,则可推断该样本并非来自已知均数的总体。,单样本设计t检验的步骤,例4 测得25例女性患者的血红蛋白(Hb),其均数为150 (g/L), 标准差为16.5 (g/L)。而当地正常成年女性的Hb均数为132 (g/L),问该病女性患者的Hb含量是否与正常女性Hb含量不同? 1、H0:13
9、2,病人与正常人的平均血红蛋白含量相等;H1: 132,病人与正常人的平均血红蛋白含量不等。 2、检验水准0.05 3、计算检验统计量 4、按 =25-1=24查附表2t界值表P=P(|t|5.4545) ?5、本例P0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义,认为该病女性患者的Hb含量高于正常女性的Hb含量。,单样本设计检验的适用条件,独立性independence正态性 normality当资料不满足正态性选用单样本设计秩和检验如何判断资料是否服从正态分布 从经验或专业知识判断 需作正态性检验,配对设计 t检验,配对设计是研究者为了控制可能存在的主要非处理因素而采
10、用的一种试验设计方法。减少了个体差异,配对设计的抽样误差减小,提高了统计效率。,配对设计的形式,配对设计有同体配对和异体配对两种形式 同体配对*自身前后配对对同一受试对象处理前后结果进行比较*自身左右配对同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;*自身取样配对比如血样、尿样、唾液等,异体配对将受试对象(按主要非处理因素)配成特征相近的对子,同对的两个受试对象随机接受两种不同的处理。 实验动物按同种属,性别相同,年龄、体重相近的两个动物配成对子。人群试验中,将性别相同,年龄、生活、劳动条件相近的两个人配成对子或同一批病人治疗前后的某项生理、生化指标进行测量观察
11、。,例1 某医生研究脑缺氧对脑组织中生化指标的影响,将白兔按出生体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两组动物脑组织钙泵的含量有无差别?,例2 为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收集了15对孪生兄弟的出生顺序和出生体重,数据如下:,例3 现用两种测量肺活量的仪器对12名妇女测得最大呼气率(PEER)(L/min),资料如下表,问两种方法的检测结果有无差别?,配对t检验,配对t 检验实质同单样本t 检验。 对每对数据的差值进行检验,若两处理效应相同,即1=2,则d 12=0 差值的样本均数 与已知总体均数d =0的比较,配对设计检验可解决的问题,?,配对设计检验的
12、假设检验步骤,1、H0:d=0 H1: d02、0.053、4、查=n-1的界值表,确定值5、P拒绝H0,接受H1P不能拒绝H0,例4 20只按体重、月龄及性别配对的大白鼠随机分入甲、乙两组,甲组饲喂正常饲料,乙组的饲料缺乏维生素E。10天后测定各鼠肝脏的维生素A含量,结果如下。问两组大白鼠肝脏维生素A含量是否有差别?,例 5 现用两种测量肺活量的仪器对12名妇女测得最大呼气率(PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?,H0:d0,两仪器检验结果相同; H1:d0,两仪器检验结果不同。 双侧 =0.05按 = n-1=12-1=11查t值表,得t0.20,11=
13、1.363,t0.10,11=1.796,t0.10,11tt0.20,11,则0.20P0.10, 差别无统计学意义,尚不能认为两种仪器检查的结果不同。,*独立性 *正态性当资料不满足正态性选用配对设计秩和检验,配对设计检验的适用条件,两独立样本t检验,又称为成组t检验或完全随机设计两样本t检验,是指分别从两个研究总体中随机抽取样本,目的是推断这两个独立样本所代表的未知总体均数1和2是否相等,两独立样本t检验,有些研究设计既不能作自身对比,也不便于配对。如 实验中只有把受试动物杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定; 再如比较两种治疗方法对同一疾病的疗效,每个患者一般
14、只能接受一种方法的治疗,把受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比较。在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,两组样本量可以相等,也可以不等,但只有在两组例数相等时检验效率才最高。,完全随机设计类型(两种形式),1.从同一个总体中随机抽取两个样本,分别采用两种不同的处理,比较不同处理结果是否有差异。2.从两个总体中随机抽取两个样本,两样本信息不同,推断两总体信息是否不同。,例 某医院用某新药与常规药治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)如下,问新药与常规药的疗效有无差别?,例 某市于197
15、3年和1993年抽查部分12岁男童对其生长发育情况进行评估,其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无差别。1973年:120 均数139.9 cm 标准差7.5 cm1993年:153 均数143.7 cm 标准差6.3 cm,完全随机设计检验可解决的问题,?,完全随机设计检验的适用条件,独立性 正态性 方差齐性(equal variances) : 两样本来自的两总体方差相等 方差齐性判断:经验判断作方差齐性检验,完全随机设计两组比较假设检验分析思路,先作方差齐性检验,检验,方差齐,方差不齐,变量变换,秩和检验,两样本方差的齐性检验,适用条件:两样本来自正态分布总体 推
16、断目的:推断两总体方差 和 有无差别,?,方差齐性检验步骤,1、H0: , H1: ,=0.052、 式中 和 分别为较大和较小的方差, 和 分别为方差较大和较小样本的样本含量。3 、根据计算得的统计量,查界值表(方差齐性检验用),作出推断 。,完全随机设计检验的假设检验步骤,H0:1=2, H1:12 0.05 计算检验统计量t值 两总体方差相等,可将两样本方差合并,求两者的共同方差 合并方差 。,完全随机设计检验的假设检验步骤,确定P值,作出统计推断例 为研究国产四类新药阿卡波糖胶囊降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖
17、胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后空腹血糖,算得空腹血糖下降值见下表,能否认为国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,(1)建立检验假设,确定检验水准 H0:1=2 H1:1 2 =0.05 (2)计算检验统计量=n1+n22=2(n1)=2(201)=38 (3)确定P值,作出推断结论按=0.05 水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。,t检验,总体方差不相等 数据变换后进行t 检验 秩转换的非参数检验 近似t检验 t检验(separate variance estimationt-test
18、)见书107页例题,两独立样本几何均数比较的t检验,变量变换 检验目的:两样本代表的两总体几何均数有无差别,例:为研究甲乙两种麻疹疫苗预防接种效果,随机分为两组的对象分别用甲乙两种麻疹疫苗作预防接种,接种后在两组随机抽查,得到儿童注射疫苗后血凝抑制抗体效价(倒数)资料如下,问甲乙两组疫苗预防接种效果(平均效价)是否相同?,大样本Z检验,适用条件:大样本资料(n100)的假设检验 单样本Z检验 完全随机设计两样本均数比较的Z检验,单样本Z检验,推断目的:样本所代表的总体均数与已知总体均数有无差别 步骤同单样本t检验如总体标准差已知,则,例 为了解老年人的心理健康问题,随机抽取了某市65岁以上的常
19、住老人304人,用SCL90量表进行测定,算得十项因子总分的均分为124.6,标准差为19.53,全国因子总分的均分为130.0,问该市老年人的总分是否与全国水平相同.,两样本均数比较的Z检验,适用条件:例数较多 推断目的:两样本所代表的两总体均数有无差别 步骤同两样本均数比较的t检验,例 某市于1973年和1993抽查部分12岁男童对其发育情况进 行评估,其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无差别。,1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。H0:12,即该市两个年度12岁男童平均
20、身高相等;H1:12,即该市两个年度12岁男童平均身高不等。双侧 =0.05。P0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。,t检验与Z检验 公式 查表 与n关系 计算精度t 较复杂 需 n较小 精确Z简单 是 n较大 近似,第三节 Poisson分布的Z检验,第七节 假设检验的两类错误和注意事项,假设检验的两类错误假设检验的注意事项,一、假设检验的两类错误,假设检验是根据有限的样本信息对总体作推断,由于存在抽样误差,不论做出那种推断结论,都有可能发生错误。,一、假设检验的两类错误,第类错误与第类错误的概念 将假设检验的结果与实际情况相比: 第类错误(ty
21、peerror):H0为真时,拒绝H0(弃真) 第类错误(type error) : H0不真时,不拒绝H0 (存伪),一、假设检验的两类错误,两者的关系第一类错误的概率用表示,假设检验时,根据研究者的要求来确定,一般取0.05或0.01;第二类错误的概率用表示,它只有与特定的 H1结合起来才有意义,但值的大小很难确切估计,仅知样本含量确定时,愈小,愈大。 实际中可以通过调整来控制,与关系示意图,与间关系:大,小;大,小。增加n可同时,缩小。,与间关系:大,小;大,小。增加n可同时,缩小。,假设检验的功效,检验效能:又称把握度,用1-表示。1-是指两总体确有差别,按水准能发现差别的能力。比如:
22、 1-0.90,意味着如果两总体确有差别,则理论上100次检验中,有90次能够得出差异有统计学意义的结论,减少I型错误的主要方法:假设检验时设定 值。,减少II型错误的主要方法:提高检验效能。,提高检验效能的最有效方法:增加样本量。,如何选择合适的样本量:实验设计。,二、假设检验的注意事项,要有严密的抽样研究设计样本的代表性与组间均衡性(可比性) 所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征; 所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确
23、应用的前提 。,二、假设检验的注意事项,根据研究目的、资料类型、设计类型及样本含量大小选择适当的假设检验方法 有统计学意义不等于有实际意义如两组降压药的疗效 结论不能绝对化假设检验结论具有概率性,对于有统计学意义的结论,要考虑型错误,对于无统计学意义的结论,要考虑型错误。报告结论时,应列出现有统计量,注明单、双侧检验及检验水准,并写出P值的确切范围。,假设检验与可信区间的区别与联系,可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同 可信区间具有假设检验的主要功能;可信区间可以提供假设检验没有的信息(可信区间在回答差别有无统计学意义的同时,还可以提示差别有无实际意义);,可信
24、区间可以提供的信息,假设检验与可信区间的区别与联系,假设检验可提供可信区间不提供的信息 当统计结论为拒绝H0时,假设检验可以报告确切的P值,说明检验结论的概率保证; 当统计结论为不拒绝H0时,假设检验可以对检验功效做出估计。可信区间只能在预先规定的概率前提下进行计算,而假设检验能够获得确切的概率P值。,假设检验与可信区间的区别与联系,总之,置信区间与相应的假设检验既能提供等价信息,又各自有不同的功能,两者结合起来,可以提供更全面更完整的信息,练习 10例男性矽肺患者的血红蛋白(g/dl)的均数为12.59(g/dl),标准差为1.63(g/dl),已知男性健康成人的血红蛋白正常值为14.02(
25、g/dl),问矽肺患者的血红蛋白是否与健康人不同(分别用可信区间估计和假设检验说明)。,本例自由度=10-1=9,经查表得t0.05,9=2.262,则矽肺患者的血红蛋白总体均数的95%CI:(11.424,13.756)g/dl,不包括男性健康成人的血红蛋白的总体均数14.02(mg/dl),所以说矽肺患者的血红蛋白与健康人不同。,H0:14.02,矽肺患者的血红蛋白与健康人相同; H1:14.02,矽肺患者的血红蛋白与健康人不同。 =0.05tt0.05,9=2.262 P 0.05按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为矽肺患者的血红蛋白与健康人不同。,小结,t分布、总体均数的估计 假设检验的基本步骤 检验 Z检验 应用假设检验应注意的问题 第类错误与第类错误,