收藏 分享(赏)

假设检验 假设检验的基本思想.ppt

上传人:霞霞 文档编号:1295845 上传时间:2018-06-22 格式:PPT 页数:78 大小:887KB
下载 相关 举报
假设检验 假设检验的基本思想.ppt_第1页
第1页 / 共78页
假设检验 假设检验的基本思想.ppt_第2页
第2页 / 共78页
假设检验 假设检验的基本思想.ppt_第3页
第3页 / 共78页
假设检验 假设检验的基本思想.ppt_第4页
第4页 / 共78页
假设检验 假设检验的基本思想.ppt_第5页
第5页 / 共78页
点击查看更多>>
资源描述

1、假设检验张菊英 教授,主要内容,假设检验的基本思想假设检验的基本步骤 t 检验型错误与型错误假设检验与区间估计的联系假设检验需要注意的问题,某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,假设检验,假设检验(hypothesis test) 亦称显著性检验(significance test),是统计推断的另一个重要方面 。,例7.1 将病情相似的某病患者随机分配到两组,分别接受A和B两种不同的治疗方法,观察两组疗效的差异,结果见表7.1。,未知总体A,未知总体B

2、,样本A,样本B,A组与B组有效率之差为12.7%,其产生的原因可能有两种 :1. 仅由抽样误差造成 2. 总体率之差造成 ,即体现了两种疗法效果的本质差异,?,已知总体3min,样本,未知总体,?,例7.2,样本均数不等于已知的总体均数,原因可能有两种 1. min,只是由于抽样误差造成样本均数不等 于总体均数 2. 样本对应的总体均数本来就不等于3 min,即,假设检验的目的,推断样本统计量之差是由于总体参数存在差异造成的,或仅由于抽样误差造成的。,一、假设检验的基本思想,小概率反证法在总体参数相等这一假设成立的前提下,计算出现等于及大于(或等于及小于)现有样本统计量的可能性( P 值)。

3、如果 P 值很小,小于等于事先规定的一个界值(例如5%),结论就是拒绝假设“总体参数相等”,认为总体参数之间存在差异。如果 P 值大于事先规定的界值,就不能拒绝这个假设,尚不能认为总体参数之间存在差异。,两种假设,零假设(null hypothesis),也称无效假设或无差异假设,记为 ,表示目前的差异是由抽样误差引起的。备择假设(alternative hypothesis)或对立假设,记为 ,表示两者存在本质不同 。,二、假设检验的基本步骤,建立检验假设,确定检验水准 选定检验方法,计算检验统计量 确定P值,作出统计推断,例7.3 一般正常成年男子血红蛋白的平均值为140g/L,某研究者随

4、机抽取60名高原地区健康成年男性进行检查,测得血红蛋白均数为155g/L,标准差为24g/L。可否认为高原地区成年男性居民的血红蛋白平均水平不同于一般正常成年男子?,建立检验假设,确定检验水准,零假设H0: 即高原地区成年男性居民血蛋 白的总体均数等于140g/L 备择假设H1 : 即高原地区成年男性居民血 红蛋白的总体均数不等于140g/L,检验水准,检验水准(level of significance or level of a test) ,符号为,习惯上通常取0.05或0.01 。检验水准应在设计时根据专业知识和研究目的确定。,单侧检验与双侧检验,双侧检验 (two-sided tes

5、t) 单侧检验 (one-sided test)选用双侧检验还是单侧检验需要根据分析目的及专业知识进行确定 在没有充分理由进行单侧检验时,为了稳妥起见,建议采用双侧检验应该在假设检验的第一步建立检验假设时确定,不应该在算得检验统计量后主观确定,否则可能得到相反的结论,选定检验方法,计算检验统计量,已知观察变量血红蛋白值服从正态分布 ,其中总体标准差 未知,确定P值,作出统计推断,P值是指在H0成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。,t0.001,59=3.460,结论,拒绝 ,接受 ,可以认为高原地区成年男性的血红蛋白平均水平不等于140g/L 。,若P,表示在H0成立的

6、条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P时,按所取检验水准,拒绝H0,接受H1。,抉择标准,若P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。,三、t 检验,单样本t检验 例7.3和例 7.4配对设计均数的比较 例8.2两样本均数的比较 例8.3,t检验的应用条件,在单样本t检验中,总体标准差 未知且样本含量较小( )时,要求样本来自正态分布总体 两小样本均数比较时,要求两样本均来自正态分布总体,且两样本总体方差相等 对两大样本( 均大于50)的均数比较,可用Z检验,配

7、对设计均数的比较,亦称为配对检验(paired samples t test) 配对设计资料主要有以下三种情况 配对的两个受试对象分别接受两种不同处理之后的数据 同一样品用两种方法(或仪器)检验出的结果 同一受试对象两个部位的测定数据,配对设计均数比较的原理,设两种处理的效应相同,即差值的样本均数所代表的未知总体均数与已知总体均数的比较,:每对数据的差值,:差值的样本均数,:差值的标准差,:差值的标准误,:对子数,例8.2,(2)计算检验统计量,(3) 确定P 值,作出统计推断,两种t 检验的区别与联系,样本均数与已知均数的t检验配对设计的t 检验,两样本均数的比较,两样本均数的检验又称两独立

8、样本的检验(independent samples t test)或成组检验。,两样本均数比较的t检验,假定两样本所代表的总体分别服从正态分布 、,若两总体方差相等(=),可估计出两者的合并方差,分别表示两样本均数,为合并方差,例8.3,两样本几何均数比较的t检验,对数正态分布 以 为基础计算 统计量,例8.4,表8.3 两种疫苗狂犬病毒抗体滴度的比较,(1) 建立检验假设,确定检验水准 H0:两种疫苗的总体几何均数对数值相等 H1:两种疫苗的总体几何均数对数值不等 =0.05,(2) 计算检验统计量 将两组数据分别取对数,用变换后的数据计算 、 、 、 。,(3) 确定P值,作出统计推断,查

9、t界值表,得0.01P0.02,按 =0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为两种疫苗的平均抗体滴度不同,精制苗高于PVRV。,案例 某研究者选取体重接近的雌体中年大鼠20只,然后随机分为甲、乙两组,每组10只。乙组中的每只大鼠接受3mg/kg的内毒素,甲组作为对照组,分别测得两组大鼠的肌酐(mg/L)见下表。为检验两总体均值之间有无差别,该研究者先计算两组的差值并进行正态检验,服从条件后采用配对设计 检验: , 。该统计分析方法是否正确?,表* 治疗前后血清Sil-2R(U/ml)数据,正态性检验,正态性检验(test of normality) 即判定资料是否服从正态分布

10、 检验方法图示法 P-P图法或Q-Q图法 统计检验法 W检验和矩法检验,横坐标为观察累计概率(observed cumulative proportion) 纵坐标为期望值累计概率 (expected cumulative prop-ortion),P-P图(Proportion - proportion plots),W检验,在样本量 时使用首先将来自同一总体的 个数据按从小到大的顺序排列统计量W的计算公式为,矩法检验,偏度检验 峰度检验,偏度检验,H0:系数 ,即总体分布对称 H1:系数 ,即总体分布不对称 =0.05检验统计量为,峰度检验,=0.05检验统计量为,两总体的方差齐性检验,查

11、F界值表(附表4),如果,拒绝H0,接受H1 ,认为两个总体的方差不等。否则不拒绝H0,认为两个总体的方差相等。,检验( Satterthwaite近似法),在进行两小样本均数比较时,若两总体方差 与 不相等,可使用 检验,例 为了比较特殊饮食与药物治疗改善血清胆固醇的效果,将24名志愿者随机分成两组,每组12人,甲组为特殊饮食组,乙组为药物治疗组。受试者试验前后各测量一次血清胆固醇,差值的结果见表6-4,请比较两种降血清胆固醇措施的效果是否相同?,四、型错误与型错误,由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。,拒绝了实际上成立的H0,这类“弃真”

12、的错误为型错误(type I error);不拒绝实际上不成立的H0,这类“存伪”的错误为型错误(type II error)。,客观实际 拒绝H0 不拒绝H0 H0成立 I 型错误() 推断正确(1-)H0不成立 推断正确(1-) II 型错误(),, 的关系,当样本量确定时,愈小,愈大;反之,愈大,愈小。增大样本量,可同时减小,。,t (界值),图7.1 两型错误示意图(以单侧t检验为例),检验效能 显微镜,样本含量 放大倍数 样本含量的大小是决定检验效能的关键。,检验效能,1-称为或把握度(power of a test),其统计学意义是若两总体确有差别,按水准能检出其差别的能力。 值的

13、大小很难确切估计,只有在已知样本含量n、两总体参数差值 以及所规定的检验水准 的条件下, 才能估算出 大小。或通过非中心的t界值表得到。,案例某研究者在鼻咽癌放射治疗研究中,比较加速分割与常规分割两法治疗后患者鼻咽癌直径减小大小是否有差异,两种方法治疗后直径减少大小成正态分布且方差齐,选用两样本均数t 检验,设定检验水准=0.05 。如果假设检验结果为P0.05,则结论为“可以认为两种方法疗效不同”。但有一医生以检验效能不够为由,怀疑其结论。你怎么认为呢?,五、假设检验与区间估计的关系,置信区间估计和假设检验都属于统计推断的方法 置信区间用于估计总体参数的可能范围,假设检验用于推断总体参数是否

14、不相等 两者既有区别,又有联系,1. 置信区间具有假设检验的主要功能,例7.5 结合例7.3的资料,计算高原地区成年男性的血红蛋白的总体均数的95%置信区间,(g/L),: 不在此区间之内。这与按照检验水准拒绝的推断结论是等价的 。,2. 置信区间可提供假设检验没有提供的信息,图7.2 置信区间提供的信息,3. 假设检验比置信区间多提供的信息,假设检验可以报告确切的 值,置信区间只能在预先确定的置信度 水平上进行推断。在不拒绝的场合,假设检验可以对检验的功效做出估计,从而可以评价是否在识别差异能力较强的情形下不拒绝 的,而置信区间并不提供这方面的信息。,六、假设检验中的注意事项,数据应该来自设

15、计科学严密的实验或调查 数据应该满足假设检验方法的前提条件 例如,一般t 检验要求样本取自正态分布总体,而且各总体方差齐;完全随机设计下两总体均值比较的资料如果方差不齐,则宜用 检验。另外,属于配对设计的资料不宜应用两独立样本的 检验。,案例,某研究者检测了8例肺结核及8例结核性胸膜炎的血沉(1小时)值,以下表给出资料。采用两独立样本比较的 检验,结果为 , , ,拒绝 ,差异有统计学意义,你认为正确吗?,表* 肺结核及结核性胸膜炎血沉(1小时)值数据,正确理解假设检验中概率 值的含义,在报告检验结论时,如果 ,宜说差异“有统计学意义”(statistically significance),同时写明 的数值或相应的不等式。将 说成“差异显著”,将 说成“差异非常显著”都是不对的。,4. 结论不能绝对化,5. 统计学意义与实际意义 的结合,假设检验常见结果,(1) 专业有意义,统计学检验无意义 例如 某临床试验,比较A、B两种药品降血压作用,3个月后A、B两组舒张压下降值的均数相差20mmHg,但是经t检验得 ,差异无统计学意义。,(2) 专业无意义,统计学检验有意义 例如,通过合理膳食降血压是一种有益的方法,临床试验比较合理膳食组与未合理膳食组人群血压,结果两组舒张压平均改变值相差4mmHg,经t检验有统计学意义。,(3) 专业有意义,统计学检验有意义,问题?,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报