1、1,第三章 t 检验,2,1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。 2、两个样本均数 与 比较的t检验 目的:推断两个未知总体均数 与 是否有 差别,用成组设计。 3、配对设计资料均数比较的t检验 目的:推断两个未知总体均数 与 是否有差别用配对设计。,t 检验,亦称student t 检验,有下述情况:,3,已知正常成年男子脉搏均数为72次/分钟,现随机检查了20名慢性胃炎所致的脾虚的男病人,其脉搏均数为74.3次/分钟,标准差为6.4次/分钟。问此类的脾虚男病人的平均脉搏是否与正常成年男子不同?,4,72次/分钟
2、 74.3次/分钟 原因: 1.可能是总体均数不同 2.是抽样造成的,5,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,假设检验基本思想及步骤,6,7, H1的内容直接反映了检验单双侧。若H1中只是 0 或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。 单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。,8,(3) 检验水准
3、,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取 = 0.05。可根据不同研究目的给予不同设置。,9,10,11,图3-5 例3-5中P值示意图,12,13,若 ,是否也能下“无差别”或“相等”的结论?,14,一、单样本 t 检验 (one sample / group t-test),即样本均数 (代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,15,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红
4、蛋白是否不同于正常成年男性平均值140g/L?(1)建立检验假设,确定检验水准 H0: =0 =140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等 H1: 0=140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等 =0.05,16,(2)计算检验统计量,17,(3)确定P值,作出推断结论,18,配对t 检验适用于配对设计的计量资料。 配对设计类型:两同质受试对象分别接受两种不同的处理;同一受试对象分别接受两种不同处理;同一受试对象(一种)处理前后。,二、配对t 检验 (paired / matched t-test),19,20,例3-6 为比较两种方法对
5、乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?,21,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),22,(1)建立检验假设,确定检验水准 H0:d0,即两种方法的测定结果相同 H1:d0,即两种方法的测定结果不同 =0.05(2)计算检验统计量 本例n=10,d=2.724,d2=0.8483,,23,按公式(3-16)(3)确定P值,作出推断结论查附表2的t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果
6、不同,哥特里罗紫法测定结果较高。,24,三、两样本t检验(two-sample / group t-test),又称成组 t 检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。,25,26,27,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空
7、腹血糖的降糖效果不同?,28,29,(2)计算检验统计量,30,(3)确定P值,作出推断结论,31,若变量变换后总体方差齐性 可采用t 检验(如两样本几何均数的t 检验,就是将原始数据取对数后进行t 检验);若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验。,若两总体方差不等( ),?,32,2. Cochran & Cox近似t 检验(t 检验) 调整 t 界值,33,34,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两
8、种不同药物的病人其HbA1c下降值是否不同?,35,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似 t 检验。,36,(1)建立检验假设,确定检验水准(略),(2)计算检验统计量,37,(3)确定P值,作出推断结论。 查t界值表t0.05/2,19=2.093。,由t=0.9650.05。按=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。,38,第五节 假设检验注意事项,39,一、I型错误和II型错误,假设检验是利用小概率反证法思想,根据P值判断结果,此推断结
9、论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。见表3-8。,40,表3-8 可能发生的两类错误,41,I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知) 。 但 n 一定时, 增大, 则减少 。 1- :检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。,42,图3-6 I型错误与II型错误示意图(以单侧u检验为例),43,减少I型错误的主要方法:假设检验时设定 值。,减少II型错误的主要方法:提高检验效能。,提高检
10、验效能的最有效方法:增加样本量。,如何选择合适的样本量:实验设计。,44,二、假设检验应注意的问题 1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。,45,2.不同的资料应选用不同检验方法 应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。而完全随机设计的两样本计量资料,若为小样本(即任一ni 60)且方差齐
11、,则选用两样本t检验;若方差不齐,则选用近似t检验(Cochran & Cox法或Satterthwaite法)。若为大样本(所有ni60),则可选用大样本u检验。,46,3.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。,47,4.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。,48,5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。,49,3.假设检验的步骤及有关概念,(1)基本思想:“小概率事件在一次抽样试验中几乎是不可能发生”的原理。 (2)步骤:三部曲 (3)类错误、类错误 (4)检验效能(1-),