1、假设检验,授课教师:殷菲,统计分析,统计描述,统计推断,参数估计,假设检验,假设检验是统计推断的另一个重要方面,什么是假设检验?,1、概念 事先对总体参数(总体分布)作出某种假设 然后利用样本信息来判断原假设是否成立 2、特点 采用逻辑上的反证法 依据统计上的小概率事件原理,什么是反证法?,例如:根据经验我们可以说成都的6月天不会下雪,假如有一年的6月份下了一场雪,则原来的结论就被推翻。这样的推理方法就是反证法。 再如:天下乌鸦一般黑。如果能够找到另外一种颜色的乌鸦,则原来的假设就被推翻。,假设检验中的小概率原理,什么是小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率。 2.
2、在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。 3. 小概率由研究者事先确定。,例7.3 一般正常成年男子血红蛋白的平均值为140g/L,某研究者随机抽取60名高原地区健康成年男性进行检查,测得血红蛋白均数为155g/L,标准差为24g/L。可否认为高原地区成年男性居民的血红蛋白平均水平不同于一般正常成年男子?,从统计学角度考虑,高原成年男子与一般人群有差别有两种可能: 1)差别是由于抽样误差引起的,即二者来自同一总体。统计学上称为差异无统计学意义。 2)差异是本质上的差异,即二者来自不同总体。统计学上称为差异有统计学意义。,造成两者不等的原因: 同一总体,即 但有抽样误差存在;,非
3、同一总体,即 ,二者存在本质上的差别。,假设检验的基本步骤,建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断,建立检验假设,确定检验水准,假设有两种: 一是无效假设(null hypothesis) 二是备择假设(alternative hypothesis), 什么是无效假设?,1. 待检验的假设 2. 表示为 H0 H0: 某一数值 例如, H0: = 0 (次/分),什么是备择假设?,1. 与无效假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: (或, )某一数值 本例, H1: 0,H0:一般设为某两个或多个总体参数相等,即认为他
4、们之间的差别是由于抽样误差引起的。 H1:和H0的假设相互对立,即认为他们之间存在着本质的差异。 H1的内容反映出检验的单双侧。,无效假设和备择假设,样本均数(其总体均数为)与已知总体均数0的比较目的 H0 H1 双侧检验 是否0 =0 0 单侧检验 是否0 =0 0或是否0 =0 0,总 结,H0和H1是相互联系,对立的假设,结论是据H0或H1提出来的。 H0是某两个或多个总体参数相等;某两个总体参数等于0;某个资料服从某个特定分布。 H1直接反映单双侧。,Attention !,H0和H1都是根据统计推断的目的提出的对总体特征的假设。,检验水准,检验水准(significance leve
5、l),符号为,常取0.05 。 它将小概率事件具体化,即规定概率不超过 就是小概率事件。,假设检验的基本步骤,建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断,选定检验方法,计算检验统计量,根据样本数据计算相应的统计量。,计算统计量,例7.3应计算t检验的检验统计量t:=n-1=60-1=59,假设检验的基本步骤,建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断,什么是P值?,P值是指在H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。,什么是P值?,如果总体状况跟H0一致,统计量获得现有数值以及更不
6、利于H0的数值的可能性(概率)有多大。,example,某商家宣称他的一大批鸡蛋都是新鲜鸡蛋H0为了对鸡蛋质量做出判断,顾客与商家约定,从中随机抽取5个做检验,结果有4个好的,一个坏的。那么更不利于广告词(H0)的可能是5个鸡蛋样品中出现2个、3个甚至4个坏鸡蛋。于是P值就是坏鸡蛋数目1的概率。,什么是P值?,例7.3 H0: 0 140 t 4.841,样本均值,= 140,基本思想 Basic Idea,抽样分布,总体均值,t 4.841,155,H0,样本均值,= 140,基本思想 Basic Idea,抽样分布,总体均值,t 6.455,160,H0,t分布,0,P (t4.841),
7、t4.841,若只考虑单侧,P值就是统计量t4.841的概率,QUESTION,如果考虑双侧,即回答例7.3的问题,P是什么?,结论 若P,表示在H0成立的条件下,出现等于及大于(或等于及小于)现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。 因此,当P时,按所取检验水准,拒绝H0,接受H1。,若P时,表示在H0成立的条件下,出现等于及大于(或等于及小于)现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。,结论 若P,拒绝H0,可以认为差异有统计学意义。 若P时,不拒绝H0,尚不能认为差异有统计学意义。,t分布,0,P (t4.841),t4.841,拒
8、绝H0,可认为,0.05,1.样本均数与总体均数比较 (例8.1),例8.1 已知某地新生儿出生体重均数为3.36 kg。从该地农村随机抽取40名新生儿,测得其平均体重为3.27 kg,标准差为0.44 kg,问该地农村新生儿出生体重是否与该地新生儿平均出生体重不同?,其分析目的是推断样本所代表的未知总体均数与已知总体均数0有无差别。,(1) 建立检验假设,确定检验水准H0:=0该地农村新生儿体重与该地新生儿平均出生体重相同 H1:0该地农村新生儿体重与该地新生儿平均出生体重不同 =0.05 (2) 计算统计量 (3) 确定P值,作出统计推断 查附表3,t界值表,t0.20,39=1.304,
9、t0.40,39=0.851,得0.40P0.20,按=0.05水准不拒绝H0,尚不能认为该地农村新生儿体重与该地新生儿平均出生体重不同。 。,2.配对设计的均数比较,配对设计,同源配对:来源相同,予不同处理如同一窝别同性别的小鼠来自同一家庭的姐妹、双胞胎同性别,同病情和年龄相近的病人配成一对,符合实验要求 的大白鼠,按 雌 雄 、 体 重 配 对,对子 1,对子 2,对子 3,随机,随机,随机,T,C,T,T,C,C,配对设计,自身配对 同一对象给予两种不同处理 同一对象处理前后,P92 例8.2,(1) 建立假设检验,确定检验水准 H0:儿童皮肤对不同结核菌素的反应性无差别,即d=0 H1
10、:儿童皮肤对不同结核菌素的反应性有差别,即d0 =0.05 (2) 计算统计量=n-1=12-1=11 (3) 确定P值,作出统计推断查附表3,t界值表,得P0.001,按=0.05水准拒绝H0 ,可认为两种不同结核菌素对儿童皮肤反应性有差别。,成组设计的两样本均数的比较,什么是成组设计?,将受试对象随机分配成两个处理组,每一组接受一种处理。 从两个群体中分别随机抽取一定数量的观察对象,测量某项指标进行比较。,某医生研究野木瓜用于手术后的镇痛疗效,以派替啶作为对照,观察两药的镇痛时间(h),问野木瓜与派替啶的术后平均镇痛时间是否不同?,58名病人,随机分组,野木瓜组 30人,派替啶组 28人,
11、什么是成组设计?,将受试对象随机分配成两个处理组,每一组接受一种处理。 从两个群体中分别随机抽取一定数量的观察对象,测量某项指标进行比较。,P93例8.3,某医生研究血清白介素-6(IL-6)与银屑病的关系,收集了12例处于进行期的银屑病患者及12例正常人的血清标本进行IL-6检测,得到表8.2结果,问银屑病患者与正常人的血清IL-6均数是否不同?,未知总体 (银屑病患者),样本2,未知总体 (正常人),?,样本1,统计量t,均数之差的标准误,合并 方差,(1) 建立假设检验,确定检验水准 H0:1=2 , 即两总体均数相等 H1:12 , 即两总体均数不相等 双侧=0.05,两样本均数的比较
12、,(2) 计算统计量,(3) 确定P值,作出统计推断查附表3 , t界值表, 0.002P0.005,按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为,方差齐性检验,总体方差不等时处理方式,近似t检验(separate variance estimation t-test) t检验 秩和检验(第十二章),t检验的应用条件:,未知且n较小时,要求样本来自正态分布总体; 两样本均数比较时,还要求两样本所属总体的方差相等。,Z 检 验,Z检验,两大样本均数比较,可用Z检验,z检验为t检验在样本含量较大时的近似计算法,I 型错误与II 型错误(p85),拒绝了实际上成立的H0,这类“弃真”
13、的错误为I 型错误(type I error); 不拒绝实际上不成立的H0,这类“存伪”的错误为II 型错误(type II error)。,X,=0,X,0,检验效能,II 型错误概率大小用 表示,但值的大小很难确切估计,只有在已知样本含量n、两总体参数差值以及所规定的检验水准的条件下,才能估算出大小。,检验效能,1-称为检验效能或把握度(power of a test) 统计学意义是:若两总体确有差别,按水准能检出其差别的能力。,客观实际 拒绝H0 不拒绝H0 H0成立 I 型错误() 推断正确(1-) H0不成立 推断正确(1-) II 型错误(),, 的关系,通常当n固定时,愈小,愈大;反之,愈大,愈小。 增大n,可同时减小,。,作 业(P403),四. 综合分析题12(检验甲药是否有效)3,