收藏 分享(赏)

第三章假设检验PPT课件.ppt

上传人:微传9988 文档编号:3476735 上传时间:2018-11-03 格式:PPT 页数:94 大小:1.27MB
下载 相关 举报
第三章假设检验PPT课件.ppt_第1页
第1页 / 共94页
第三章假设检验PPT课件.ppt_第2页
第2页 / 共94页
第三章假设检验PPT课件.ppt_第3页
第3页 / 共94页
第三章假设检验PPT课件.ppt_第4页
第4页 / 共94页
第三章假设检验PPT课件.ppt_第5页
第5页 / 共94页
点击查看更多>>
资源描述

1、2018/11/3,广西医科大学卫统黄高明编,医学统计学,医学统计学,第三章 总体均数的估计和假设检验,统计分析:统计描述、统计推断,统计推断:参数估计、假设检验,2018/11/3,广西医科大学卫统黄高明编,第一节 抽样误差与总体均数的估计,总体,样本,统计推断,抽样,抽样误差,一、抽样误差的概念,2018/11/3,广西医科大学卫统黄高明编,误差:观察值与真值之差,产生误差的原因: 1、人为误差:人员没有经过培训、标准掌握不统一 2、系统误差:仪器、设备未经校正 3、随机误差:偶然因素 4、抽样误差:抽样造成,2018/11/3,广西医科大学卫统黄高明编,由于总体中存在个体变异,(所以)由

2、抽样得到的样本指标与总体指标之间存在差异,这种由抽样造成的差异称抽样误差。,在抽样研究中,抽样误差是不可避免的,但其大小可以控制和估计的。,2018/11/3,广西医科大学卫统黄高明编,总体均数=,标准差=,样本均数=,标准差=,2018/11/3,广西医科大学卫统黄高明编,中心极限定理,1、在正态总体中,随机抽取例数为n的样本,样本均数服从正态分布;2、在偏态总体中随机抽样,当n足够大时(n30),也近似正态分布;3、从均数为,标准差为的正态或偏态总体中,抽取例数为n的样本,样本均数的均数仍为,标准差为 。,2018/11/3,广西医科大学卫统黄高明编,标准误意义及其计算方法,1、标准误意义

3、:说明抽样误差大小的指标。均数抽样误差用表示;率的抽样误差用p 表示。,2018/11/3,广西医科大学卫统黄高明编,2、计算公式:,(理论值),(估计值),2018/11/3,广西医科大学卫统黄高明编,随着 n S 稳定 Sx 0,均数的标准误与标准差成正比,与样本例数n的平方根成反比。,因此,减少抽样误差最有效的办法:,增加样本例数,2018/11/3,广西医科大学卫统黄高明编,例3.1 已知n=200, S =4.8cm, x=124.0cm,求其标准误。,cm,2018/11/3,广西医科大学卫统黄高明编,例4.1 已知n=144, =5.381012 /L, S=0.441012 /

4、L 。求其标准误。,(1012 /L),2018/11/3,广西医科大学卫统黄高明编,3、标准误的应用,(1)反映抽样误差大小:标准误越大,抽样误差越大; (2)反映均数的可靠性:越大,样本均数的抽样误差越大,(用样本均数推算总体均数的)可靠性差;反之,越小,均数抽样误差越小,(用样本均数推算总体均数的)可靠性好。 (3)用于进行假设检验(见下节),2018/11/3,广西医科大学卫统黄高明编,标准差,标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。 区别:概念不同: 标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好; 标准误是描述样本均数的抽

5、样误差,Sx越小,均数的可靠性越高;,2018/11/3,广西医科大学卫统黄高明编,与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。 联系: 标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。,用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。,2018/11/3,广西医科大学卫统黄高明编,二、 t 分 布,t 分布的概念,t值分布称t分布。,u变换:,u值的分布称u分布(标准正态分布),2018/11/3,广西医科大学卫统黄高明编,t分布特征1、以0为

6、中心,左右对称的单峰分布;2、t分布的形态与自由度有关,越小,t分布曲线越低平,尾部的面积较大;逐渐增大,t分布逼近标准正态分布;,t分布标准正态分布。,2018/11/3,广西医科大学卫统黄高明编,2018/11/3,广西医科大学卫统黄高明编,注:所有的t分布的曲线均比正态曲线低。说明在同样的曲线下面积,t值u值。例如,中间95%面积,在横轴上的区间:|u|=1.96; 而 |t|1.96,t值的表示方法:t,为界值以外的面积;自由度,2018/11/3,广西医科大学卫统黄高明编,t界值表(附表2)对应每一自由度取值,就有一条t分布曲线,每条曲线都有自身曲线下t值的分布规律,因此,计算t值较

7、为繁杂。为此,统计学家已制成t值表,通过查表即获得相应的t值。,2018/11/3,广西医科大学卫统黄高明编,查表须注意:(1)t值有正负值,由于t分布是以0为中心的对称分布,故表中只列正值,查表时,不管t值正负只用绝对值;(2)t值表中插图阴影部分,表示t,以外尾部面积占总面积的百分比, 即概率;,2018/11/3,广西医科大学卫统黄高明编,(3)当一定时,越小,t值越大; (4)当一定时,越大,t值越小;(5) 当时,tu;,单侧:t0.025,10=2.228 双侧:t0.05/2,10=2.228,二者相等,另外:,表示双侧,不是除2,2018/11/3,广西医科大学卫统黄高明编,/

8、2,/2,2(/2),双侧,单侧,95%,95%,1.96,1.645,2018/11/3,广西医科大学卫统黄高明编,三、总体均数的可信区间估计,可信区间的概念,统计推断,参数估计,假设检验,点估计,区间估计,用样本指标来估计总体指标,2018/11/3,广西医科大学卫统黄高明编,参数估计的估计方法: 1、点值估计:用样本均数来估计总体均数缺点:没有考虑抽样误差(可靠性) 2、区间估计:按一定的概率估计总体均数所在范围。1称可信度。 习惯上,常取1=0.95,即95%可信区间或取1=0.99,即99%可信区间,若无特别说明,一般取双侧95%可信区间,2018/11/3,广西医科大学卫统黄高明编

9、,总体均数的可信区间估计方法,(1)当未知,且n较小(n30)时:,例 3.2 已知:n=30, X=187.11, S=42.32,查t界值表,v=n-1=29, 得t 0.05,29=2.045,2018/11/3,广西医科大学卫统黄高明编,(2)当未知但样本例数足够大(n30或n50)时,按正态分布原理处理:,例 3.3 已知:n=200, X=124.0, S=4.6,(3)当已知,2018/11/3,广西医科大学卫统黄高明编,可信区间的两个要素: 准确度:反映在可信度(1)的大小。1越接近1,就越准确。如可信度99%比95%准确。 精确度:反映在区间的长度。长度越小越好。在例数n确定

10、的情况下,二者呈反比关系:准确度, 精确度(范围变宽)。要兼顾准确度和精确度,一般取95%可信区间。,2018/11/3,广西医科大学卫统黄高明编,可信区间与参考值范围区别,(1)意义不同 正常值范围是指绝大多数观察值在某个范围; 可信区间是指按一定的可信度估计总体均数(参数)的所在范围;,(2)计算公式不同,可信区间,正常值范围,2018/11/3,广西医科大学卫统黄高明编,(3)应用不同,可信区间:估计总体均数,参考值范围: 判断某项指标是否正常,2018/11/3,广西医科大学卫统黄高明编,第二节 假设检验的基本原理和步骤,假设检验原理,例 3.4,0=72次/分,已知总体,X=74.2

11、 S=6.0,未知总体,2018/11/3,广西医科大学卫统黄高明编,假设检验思想根据研究目的,对样本所属总体特征提出一个假设,根据样本提供的信息,然后用适当方法,了解在假设条件下差异由抽样误差引起的可能性大小。推断此假设应当拒绝或不拒绝(P0.05,不拒绝;P0.05,拒绝)。,2018/11/3,广西医科大学卫统黄高明编,假设检验的一般步骤,1、建立假设和确定检验水准,2、选定检验方法和计算检验统计量,3、确定P值和作出推断结论,2018/11/3,广西医科大学卫统黄高明编,1、建立假设和确定检验水准,基本步骤,(1)两个假设 无效假设: H0备择假设: H1,(2)确定单侧或双侧检验,根

12、据专业知识和研究目的而定,2018/11/3,广西医科大学卫统黄高明编,单侧检验:在比较两种药物的疗效时,根据专业知识可认为新药不会比旧药差,只关心新药是否比旧药好(至多相同,绝对排除出现相反的可能性),可用单侧检验。,A组:磺胺 B组:磺胺+增效剂,B组疗效是否高于A组?,2018/11/3,广西医科大学卫统黄高明编,双侧检验:在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。,2018/11/3,广西医科大学卫统黄高明编,(3)确定检验水准 一般取0.05,双侧检验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定有差别。,20

13、18/11/3,广西医科大学卫统黄高明编,2、选定检验方法和计算检验统计量,不同设计、不同的资料类型和不同的推断目的,选用不同的检验方法;,(对症下药),2018/11/3,广西医科大学卫统黄高明编,3、确定P值P值是指由所规定的总体作随机抽样, 获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。,手工计算:一般是通过查界值表获得。,统计软件:直接给出精确的P值,2018/11/3,广西医科大学卫统黄高明编,4、作出推断结论(含统计结论和专业结论),统计结论:拒绝H0,接受H1,差异有统计学意义),专业结论:可认为 不同或不等。,当 P时,,将获得的事后概率P与事先规定的概率进行

14、比较。,要正确表达!,2018/11/3,广西医科大学卫统黄高明编,当P时, 统计结论:不拒绝H0,差异无统计学意义,专业结论:还不能认为 不同或不等。,2018/11/3,广西医科大学卫统黄高明编,假设检验的特点: 1、统计检验的假设是关于总体特征的假设; 2、用于检验的方法是以检验统计量的抽样分布为理论根据的; 3、作出的结论是概率性的,不是绝对的肯定或绝对的否定。,2018/11/3,广西医科大学卫统黄高明编,假设检验中值与P值的区别: 1、假设检验中值是检验水准,是拒绝或不拒绝H0的概率标准。的大小是人为选定的,一般取0.05。 2、P值是指有H0所规定的总体中作随机抽样,获得等于或大

15、于(等于或小于)现有样本统计量的概率。通过P值与值的比较来确定拒绝或不拒绝H0。,2018/11/3,广西医科大学卫统黄高明编,第三节 t检验和u检验,t检验和u检验类型1、样本均数与总体均数比较2、配对设计的均数比较3、成组设计的两样本均数的比较4、成组设计的两样本几何均数的比较5、两大样本均数比较u检验,2018/11/3,广西医科大学卫统黄高明编,应用条件1、t检验应用条件:(1)样本来自正态总体(2)两样本均数比较,还要求样本的总体方差相等,2、u检验应用条件: 样本例数n较大,或n虽小而总体标准差已知。,2018/11/3,广西医科大学卫统黄高明编,一、样本均数与总体均数比较,样本均

16、数代表的未知总体均数和已知总体均数0的比较,0,理论值、标准值、稳定值,X,2018/11/3,广西医科大学卫统黄高明编,公式 :,=n-1,2018/11/3,广西医科大学卫统黄高明编,例3.5 (对例3.4进行t检验),例 3.5,0=72次/分,已知总体,X=74.2 S=6.5,未知总体,2018/11/3,广西医科大学卫统黄高明编,检验步骤:,例3.5,建立假设和确定检验水准H0:=72次/分H1:72次/分单侧=0.05 今n=25, =74.2次/分,s=6.5次/分,0=72次/分,2018/11/3,广西医科大学卫统黄高明编,例3.5,选定检验方法和计算检验统计量 按式(3.

17、3),v=n-1=25-1=24,2018/11/3,广西医科大学卫统黄高明编,例3.5,确定P值以v=24查附表2,t界值表,得:t0.05,24=1.771, t0.025,24=2.064t0.1,24=1.318P0.05,(v一定时,t值越大,P值越小),2018/11/3,广西医科大学卫统黄高明编,查t值表时,先查P=0.05时的界值。当P0.05时,需继续往P更大的一侧查,直到最大的P值为止。 ?,如使用统计软件,会给出确切的概率值。,注意,为什么?,2018/11/3,广西医科大学卫统黄高明编,例3.5,作出推断结论(两个结论:统计结论和专业结论)今0.05P0.10,按=0.

18、05水准,不拒绝H0 (统计结论),尚不能认为该山区健康成年男子脉搏均数高于一般健康成年男子脉搏均数(专业结论)。,2018/11/3,广西医科大学卫统黄高明编,二、 配对设计的均数比较(paired t-test),(1)同对的两个受试对象分别给予两种处理(见后) (2)同一受试对象分别给予两种处理(同一标本用两种方法检测)(例3.6) (3)同一受试对象处理前后比较(见后),2018/11/3,广西医科大学卫统黄高明编,例 随机选择9窝中年大鼠,每窝中取两只雌性大鼠随机地分入甲、乙两组,甲组大鼠不接受任何处理(即空白对照),乙组中的每只大鼠接受3mg/Kg的内毒素。分别测得两组大鼠的肌酐(

19、mg/L)测定结果如下。,窝别编号: 1 2 3 4 5 6 7 8 9 甲(对照)组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙(处理)组:7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2,(模拟双胞胎,目的:减少组间差异,提高可比性),2018/11/3,广西医科大学卫统黄高明编,例 检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。问:检验甲乙两法检出血磷是否相同,用何统计方法?,样本号 1 2 3 4 5 6 7乙 法 2.74 0.54 1.20 5.00 3.85 1

20、.82 6.51甲 法 4.49 1.21 2.13 7.52 5.81 3.35 9.61,(双胞胎?),2018/11/3,广西医科大学卫统黄高明编,某脑电图室观察家兔注射AT3前后脑电图波形的变化,观测结果如下。试分析注射AT3前后脑电图波形是否发生了显著性变化。,注射AT3前后脑电图波形的变化率(%),家兔编号 注射前 注射后1 29 372 28 443 38 524 29 355 34 416 41 43,2018/11/3,广西医科大学卫统黄高明编,检验公式:,2018/11/3,广西医科大学卫统黄高明编,例3.6,2018/11/3,广西医科大学卫统黄高明编,检验步骤,1、建立

21、检验假设,确定检验水准H0: d0 H1:d 0 0.05,2、本例为配对计量资料,用配对t检验,=1.7728,n-1=12-1=11,2018/11/3,广西医科大学卫统黄高明编,3、确定P值,以t=1.7728, =12,查附表2,得0.10P0.20,4、作出推断结论,按0.05水准,不拒绝H0,差异无统计学意义。还不能认为两种方法检查的结果有影响。,2018/11/3,广西医科大学卫统黄高明编,确切的P值,查表结果:0.10P0.20,2018/11/3,广西医科大学卫统黄高明编,三、成组设计的两样本均数比较,应用条件:(1)两样本均来自正态总体(2)两样本的方差齐 在正式的统计分析

22、中,先要看方差是否齐,如果不齐,要选方差不齐的结果!,在一般的统计软件中,都会同时给出方差齐性检验的结果,2018/11/3,广西医科大学卫统黄高明编,SPSS统计结果:,方差齐,方差不齐,方差齐性检验结果:P0.05,齐;P0.05,不齐,(P值),2018/11/3,广西医科大学卫统黄高明编,计算公式,2018/11/3,广西医科大学卫统黄高明编,例 3.7 (略),组 别 例数 均数 标准差野木瓜 30 6.2 1.4哌替啶 28 3.5 1.2,2018/11/3,广西医科大学卫统黄高明编,四、两个样本几何均数比较,1、应用条件:a.两样本的对数值均来自正态总体b.两样本的对数值的方差

23、齐,2、检验公式 与两样本均数的t检验和u检验公式相同, 只是原始数据要作对数变换,用对数值的均数和标准差代公式。,2018/11/3,广西医科大学卫统黄高明编,3、检验步骤 与两样本均数的t检验,在使用统计软件进行分析时,先将原始数据取对数,然后用对数值作一般的t检验。,注意啦!,2018/11/3,广西医科大学卫统黄高明编,五、u检验,1、应用条件:例数较大(n50),2、方法:,样本均数与总体均数比较,两样本均数比较:,2018/11/3,广西医科大学卫统黄高明编,例3.8,2018/11/3,广西医科大学卫统黄高明编,检验步骤,1、建立检验假设,确定检验水准H0: 1 2 H1:d 0

24、 0.05,2、本例为两样本均数比较且例数较大,用两均数比较u检验,2018/11/3,广西医科大学卫统黄高明编,已知: X1=73.07, S1=10.75, n1=100,X2=80.30, S2=11.83, n1=105,2018/11/3,广西医科大学卫统黄高明编,(3)确定P 值,作推断结论,查附表2,v=时,u 0.001=3.2905,今 u=4.58 u 0.001=3.2905, P0.001,按0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为农村高碘区与非高碘区儿童智力均数不等,高碘区较低。,2018/11/3,广西医科大学卫统黄高明编,任何两样本均数比较,如果

25、方差齐,都可以用t检验!,正确!,2018/11/3,广西医科大学卫统黄高明编,n1 n2 较大时也可以吗?,of course!,2018/11/3,广西医科大学卫统黄高明编,两小样本均数比较,t检验,t检验,方差不齐,方差齐,变量变换,秩和检验,第四节 方差不齐时两小样本均数比较,2018/11/3,广西医科大学卫统黄高明编,在一般的统计软件中,都会同时给出方差齐性检验的结果。,(略),一、两样本方差的齐性检验,二、t检验 (略),在一般的统计软件中,也会同时给出方差不齐的检验( t检验 )结果。,2018/11/3,广西医科大学卫统黄高明编,第五节 正态性检验 (不要求),一、图示法:P

26、-P图(SPSS有该绘图功能),二、统计检验方法:,2018/11/3,广西医科大学卫统黄高明编,第六节 两类错误和检验效能,型错误:拒绝实际上是成立的H0, 这类“弃真”的错误称型错误或第一类错误。其概率大小用表示。,型错误:不拒绝(接受)实际上是不成立的H0, 这类“存伪”的错误称型错误或第二类错误。其概率大小用表示,但一般不知道,即拒绝H0,犯型错误;不拒绝H0 ,犯型错误。,2018/11/3,广西医科大学卫统黄高明编,两类错误的关系,型错误的概率为, 型错误的概率为,一般的大小是不知道的。,越大,越小 ;越小,越大。,呈反比关系,2018/11/3,广西医科大学卫统黄高明编,1:称为

27、检验效能(又称把握度),即两总体确有差别, 则按水准能发现它们有差别的能力。,2018/11/3,广西医科大学卫统黄高明编,如何确定和的取值?1、若重点减少(例如,为避免把疗效与常规药本无差别的新药当做有差别,致使无故废弃常规药,即严格要求),则取0.01,2018/11/3,广西医科大学卫统黄高明编,2、若重点减少(例如,当欲用新方法取代旧方法时,为了慎重起见,宁可把无差别当成有差别),则取0.1或0.2。,方法1 (公认的方法),方法2 (某人发明的方法),取代,或改用第八节两样本均数的等效检验,2018/11/3,广西医科大学卫统黄高明编,3、若需兼顾和,则取0.05较为恰当。4、若要同

28、时减少和,只能增加样本的含量。,2018/11/3,广西医科大学卫统黄高明编,第七节 假设检验的注意事项,1、要有严密的抽样研究设计,应考虑到被比较的样本的可比性,这是假设检验的前提。,2、选用的假设检验方法应符合其应用条件。,2018/11/3,广西医科大学卫统黄高明编,3、正确理解差别有无显著性的统计意义。,是否拒绝H0,取决于:1、被研究的事物有无本质的差异2、抽样误差大小:(1)个体差异大小 (2)样本例数多少3、检验水准的高低,2018/11/3,广西医科大学卫统黄高明编,甲组(n=18) 乙组(n=12) P值XS XS 甲指标 3.481.65 4.762.52 0.10乙指标

29、5.231.12 6.381.21 0.01,两均数相差1.28,两均数相差1.15,2018/11/3,广西医科大学卫统黄高明编,解释,差值大小,抽样误差大小,变异度,例数多少,2018/11/3,广西医科大学卫统黄高明编,4、结论不能绝对化。,即 拒绝H0, 犯型错误;不拒绝H0 ,犯型错误。,无论是否拒绝H0,都可能犯错误!,2018/11/3,广西医科大学卫统黄高明编,5、统计意义和实际意义,有统计学意义,不一定有实际意义!,2018/11/3,广西医科大学卫统黄高明编,第八节 两样本均数的等效检验,前面所介绍的假设检验方法都是推断某种处理有无作用,或两种处理效果有无差别。(研究的主观愿望是得到有差别的结论!),有时我们需要推断两种处理的效果是否相近或相等的问题。(研究的主观愿望是得到无差别的结论! ),2018/11/3,广西医科大学卫统黄高明编,再见,2018/11/3,广西医科大学卫统黄高明编,A人群的月收入:300,350,320,400,350,360,200,10000X=1535(元) S=3420.9(元),B人群的月收入:300,350,320,400,350,360,200,500X=347.5(元) S=85.3(元),2018/11/3,广西医科大学卫统黄高明编,差不多,Sx=0 Sx0,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 教育范文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报