1、第五章 假设检验,医学统计学余松林主编,本章内容,假设检验的基本思想 假设检验的基本步骤 未知总体与已知总体均数的比较 配对设计资料均数的比较 两组完全随机设计资料的方差齐性检验 完全随机设计两总体均数的比较 正态性检验 假设检验中的两类错误与检验效能,第一节 假设检验的基本思想,例 根据大量调查,已知健康成年男子脉搏的均数为72次/分,某医生在一山区随机调查了25名健康成年男子,求得脉搏均数为74.2次/分, 标准差为6.0次/分,能否据此认为该山区成年男子的脉搏均数高于一般人?,假设检验的原因,由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同。,单、双侧检
2、验,备择假设中 双侧检验: 0(即 0 ,或 0) 单侧检验:(1)0 (根据专业角度不可能小于 0 )(2) 0 (根据专业角度不可能大于 0 )注:以后未作说明都采用双侧检验。,例如:,要比较经常参加体育锻炼的中学男生心率是否低于一般中学男生的心率。,因为根据医学知识知道经常参加体育锻炼的中学男生心率是不会高于一般中学男生的,因此属于单侧检验。,H0: =0,即经常参加体育锻炼的中学男生心率与一般中学男生的心率相同。 H1: 0,即经常参加体育锻炼的中学男生心率低于一般中学男生的心率。,小概率原理,假设有一前提条件H0: = 0成立,P 0.05,对立条件 H1: 0,小概率原理,假设有一
3、前提条件H0: = 0成立,P 0.05,对立条件 H1: 0,第二节 假设检验的基本步骤,一、建立检验假设和确定检验水准,(1)无效假设和备择假设,(2) ,二、选择检验方法和计算统计量,三、确定概率P和作出统计推断,(1)统计结论: 若P ,则拒绝H0,接受H1;差异有统计学意义。 若P ,则不拒绝H0;差异无统计学意义。 (2)专业结论,第三节 未知总体与已知总体均数的比较,该检验对样本有如下的要求: 1.假定样本来自同分布的总体,即同质性。 2.每个个体的测量值要相互独立。 3.研究的变量应服从正态分布(或近似服从正态分布)。,计算步骤,一、建立假设,确定检验水准: H0:未知总体与已
4、知总体的均数相同(=0) H1:未知总体与已知总体的均数不同(0) 检验水准为,二、计算统计量,三、确定P值,得出结论,查标准正态分布曲线下的面积表(附表1),或t界值表(附表2),得到u/2或t/2 ()。(单侧检验时用u或t () )。 当u u/2 或t t/2 () 时,即P时,拒绝H0,接受H1。 当u u/2 或t t/2 () 时,即P 时,不拒绝H0。,公式:,总体方差已知:在H0成立时,统计量u服从标准正态分布N(0,1)。 总体方差未知:在H0成立时,统计量t服从自由度为=n-1的t分布。,例5-1:,已知一般中学男生的心率平均值为74次/分钟,标准差6次/分钟,为了研究经
5、常参加体育锻炼的中学生心脏功能是否增强,在某地区中学中随机抽取常年参加体育锻炼的男生100名,得到心率平均值65次/分钟。,解:,一、建立假设,确定检验水准: H0:常年参加体育锻炼的中学男生的心率与一般的中学男生相等(=0) H1:常年参加体育锻炼的中学男生的心率与一般的中学男生不同(0)(此时以双侧为例) 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,u=|-16.67| u0.05=1.96 ,P 0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,常年参加体育锻炼的中学男生的心率与一般的中学男生不同。,例5-2:,已
6、知中学一般男生的心率平均值为74次/分钟。为了研究经常参加体育锻炼的男生16名,测量了他们的心率,结果如下。16名常年参加体育锻炼的男生的心率(次/分钟) 55 72 58 57 70 75 72 69 61 67 69 73 59 71 53 69,解:(此时以双侧为例),一、建立假设,确定检验水准: H0:常年参加体育锻炼的中学男生的心率与一般的中学男生相等(=0) H1:常年参加体育锻炼的中学男生的心率与一般的中学男生不同(0) 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,t=|-4.65| t0.05/2(15)=2.131 ,P 0.05,统计:按照=0.0
7、5的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,常年参加体育锻炼的中学男生的心率与一般的中学男生不同。,查t界值表,t0.05/2(15)=2.131,=n-1=15,解:(此时以单侧为例),一、建立假设,确定检验水准: H0:常年参加体育锻炼的中学男生的心率与一般的中学男生相等(=0) H1:常年参加体育锻炼的中学男生的心率比一般的中学男生慢(0) 检验水准=0.05。,二、计算检验统计量:,三、确定P值,得出结论:,t=|-4.65| t0.05(15)=1.753 ,P 0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例
8、,常年参加体育锻炼的中学男生的心率比一般的中学男生慢。,查t界值表,t0.05 (15)=1.753,=n-1=15,第四节 配对设计资料均数的比较,配对设计:是将可能影响效应指标的某些特征相同或相近似的两个个体配成一对,然后按随机化方法将每个对子内的两个个体安排两种处理,观察结果。 使用条件: 假定样本来自同分布的总体,即同质性。 不同对子间的测量值要相互独立。 研究变量的差值应服从正态分布(或近似服从正态分布)。,公式:,=n-1,例5-3:,为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收集了15对孪生兄弟的出生顺序和出生体重(见表5-1)。,表5-1 15对孪生兄弟的出生体重(kg
9、),解:(双侧检验),一、建立假设,确定检验水准: H0:在孪生兄弟中先出生者与后出生者的出生体重相同,即d=0 H1:在孪生兄弟中先出生者与后出生者的出生体重不同,即d 0 检验水准=0.05,二、计算检验统计量:,三、确定P值,得出结论:,t=2.33 t0.05/2(14)=2.145,P 0.05,统计:按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。,专业:结合本例,在孪生兄弟中先出生者的出生体重重于后出生者的体重。,查t界值表,t0.05/2 (14)=2.145,=n-1=14,第五节 两组完全随机设计资料的方差齐性检验,完全随机设计:将受试对象随机分配到各个处理
10、组或对照组中,或分别从不同总体中随机抽样进行研究。它可以是两样本比较,也可以是多样本比较;各样本含量可以相等,也可以不等,但也不宜差别太大。 两组完全随机设计资料比较的两个条件: 服从正态分布或近似服从正态分布 方差齐性,公式:,查方差齐性检验用F分布表,例5-4:,用同一种降压药,分别治疗两组高血压病人,服用4周后比较两组病人收缩压的下降值,问此降压药对两组病人的降压效果是否相同。,两组病人服用降压药后的降压效果比较 (收缩压的下降值mmHg),解:(方差齐性检验),一、建立假设,确定检验水准:,二、计算检验统计量:,三、确定P值,得出结论:,F=8.561 F0.05/2(12,13)=2
11、.96,P 0.05,按照=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义,即认为两个总体的方差不等。,查方差齐性检验用F界值表,因表中无F0.05/2 (13,15),用 F0.05/2 (12,13)=2.96,1=n1-1=13 2=n2-1=15,第六节 完全随机设计两总体均数的比较,有两种类型资料: 选择一定数量的研究对象,将他们随机分成两组,分别施以不同的处理。(随机分配) 从两组具有不同特征的人群中,分别随机抽取一定数量的样本,比较某一指标在不同特征人群中是否相等。(随机抽样),一、完全随机设计两总体均数比较的t检验(总体方差未知),方差齐:方差不齐:(方法很多,只介绍
12、一种),=n1+n2-2,例5-4:经方差齐性检验可以看出两组的方差不等,因此需作t检验。,一、建立假设,确定检验水准:,二、计算检验统计量:,1=n1-1=13 2=n2-1=15,例5-4:,三、确定P值,得出结论:,统计:按照=0.05的检验水准,不拒绝H0,差异无统计学意义。,查t分布界值表,得到t0.05/2 (13)=2.160,用 t0.05/2 (15)=2.131,专业:结合本例,可以认为两种降压药的疗效相等。,例5-5:,一项随机双盲临床试验,用国产药和进口药治疗绝经后妇女骨质疏松症,目前比较两种药的疗效是否相等。受试对象为国产药组20例,进口药组19例,评价指标为第2-4
13、腰椎(L2-4)骨密度的改善值(试验后与试验前的差值),试验数据见表5-2。 表5-2 两药物治疗绝经后妇女 骨质疏松症L2-4骨密度改善值(mg/cm2),解:(一)方差齐性检验,一、建立假设,确定检验水准:,二、计算检验统计量:,三、确定P值,得出结论:,F=1.344 F0.05/2(15,18)=2.67,P 0.05,按照=0.05的检验水准,不拒绝H0,差异无统计学意义,即认为两个总体的方差相等。,查方差齐性检验用F界值表,因表中无F0.05/2 (19,18),用 F0.05/2 (15,18)=2.67,1=n1-1=19 2=n2-1=18,解: (二)比较两总体均数,一、建
14、立假设,确定检验水准: H0:1= 2两总体的均数相同 H1: 1 2两总体的均数不同 检验水准=0.05,二、计算检验统计量:,三、确定P值,得出结论:,t=1.230 t0.05/2(37)=2.026,P 0 .05,统计:按照=0.05的检验水准,不拒绝H0,差异无统计学意义。,专业:结合本例,认为两种药的疗效相同,所以该医生的结论是可以用国产药替代进口药。,查t界值表,t0.05/2 (37)=2.026,=20+19-2=37,二、完全随机设计两总体均数比较的u检验(总体方差已知),公式:,第七节 正态性检验,图示法 方格坐标纸图 正态概率纸图 P-P图 统计检验方法 W检验法 D
15、检验法,第八节 假设检验中的两类错误与检验效能,假设检验的结论是根据概率推断的,所以不是绝对正确的。,检验水准:亦称为显著性水准(significance level),符号为。 是预先规定的概率值,它是“是否拒绝H0的界限”。研究者可以根据研究目的规定的大小,通常取0.05。,型错误和型错误,(1b)即把握度(power of a test):两总体确有差别,被检出有差别的能力 (1a)即可信度(confidence level):重复抽样时,样本区间包含总体参数(m)的百分数,通常情况下型错误未知,对于一般的假设检验, a定为0.05(或0.01),b的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确, b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯型错误的概率b有多大,假设检验注意事项,(1)可比性 (2)正确选用假设检验方法 (3)差别的实际意义 (4)判断结论时不能绝对化 (5)单侧检验与双侧检验 (6)报告结果应写出统计量值、P值(单侧时应注明),