1、,检验,主要内容,检验的基本思想 独立样本列联表资料的 检验 配对设计资料的 检验 拟合优度的 检验 线性趋势 检验 四格表的Fisher确切概率法,分布,分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符问题若有 个相互独立的标准正态分布随机变量 ,则 的分布称为服从自由度为 的 分布,记为 ,即:,分布,分布,推断两个或两个以上总体率(或构成比)之间有无差别 拟合优度检验 推断两分类变量间有无相关关系,用途,检验基本思想,基本思想:实际频数和理论频数吻合的程度 检验的计算公式A 为实际频数 (actual frequency) T 为理论频数(theoreti
2、cal frequency),问题: 1.是否可用前面所学的方法进行统计推断? 2.是否还有其它方法进行统计推断?,表11.1甲、乙两药治疗小儿上消化道出血的效果,例11.1 某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有差别?,90名患儿,随机分组,甲药组 45人,乙药组 45人,Table. 病例分配随机表,Table. 结果记录表,例11.1的问题,甲、乙两药治疗小儿上消化道出血的效果,研究目的:比较两药有效率有无差别?能否根据 88.89%60
3、.00%,认为乙药的有效率大于甲药?,四格表基本格式,检验的基本思想,假设:两种药物的有效率相同 则可以算得理论上的两种药物的有效率均为67/9074.44。,说明:理论上甲药与乙药有效率均为74.44%,表11.1 两种药物有效率的比较,表11.1 理论频数计算(what is “理论频数”?),*,计算理论频数,按两组合计的有效率74.44,推算理论频数: 甲药组有效人数为 甲药组无效人数为 乙药组有效人数为 乙药组无效人数为,为相应行的合计为相应列的合计n 为总例数。,计算理论频数公式,如果假设成立,则实际频数和理论频数吻合,即:对每一个格子有:而本例实际上:2733.5-6.5 181
4、1.56.54033.5 6.5 511.5-6.5,为消除符号的影响,用:考虑绝对数不能完全体现其对 值的贡献:考虑 值受格子数多少的影响,引入,确定P值,如果检验成立,则实际数与理论数之差一般不会很大,2值应该很小. 实际频数与理论频数相差较大,即A与T相差很大,此时2值越大,相应的概率P越小。当P0.05时,有理由怀疑无效假设成立,拒绝H0。 2与P值的对应关系可查2界值表(附表9)。2值愈大,P值愈小。,对于例11.1:,根据附表9,确定P值下结论。,例11.1具体步骤,1. 建立检验假设,确定检验水准 H0 : ,即两种药物治疗小儿上消化道出血的有效率相同 H1: ,即两种药物治疗小
5、儿上消化道出血的有效率不同,将A与T的值代入公式,得,2. 计算 值和自由度,3. 确定P值,作出统计推断查附表9,得 ,按 水准,拒绝H0,接受H1,差异有统计学意义,可以认为两种药物治疗小儿上消化道出血的有效率不同,乙药的有效率高于甲药。,四格表专用公式,将例11.1数据代入专用公式,可见,与前面的基本公式计算结果相同。,四格表 值的校正,注:(1)连续性校正(correction for continuity )或Yates校正; (2)如检验所得P值近于检验水准时, 最好改用四格表 确切概率法。,四格表 值的校正,T 5且n 40时, 不须校正; 1 T5, 而n 40时, 需计算校正
6、值, 或改用四格表确切概率计算法; T1或n40时, 需用确切概率计算法。,例11.2,见教材137-138页,校正与未校正结果的比较,RC列联表资料的2检验,RC列联表 :R行、C列 包括22表(四格表)、R2表(多个样本率的比较)、2C 或RC表(两个或多个构成比的比较)。 基本原理和检验步骤与四格表2检验相似。 公式,例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗效,将年龄在5070岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?,表11.4 三种方案治疗轻、中度
7、高血压的效果,多个样本率的比较,1. 建立检验假设,确定检验水准 H0: ,即三种方案治疗轻、中度高血压的有效率相同 H1:三种方案治疗轻、中度高血压的有效率不全相同,将表11.4的数据代入公式,得:,2.计算 值和自由度,3. 确定P值,作出统计推断查附表9,得 ,按0.05水准,拒绝H0 ,接受H1,差异有统计学意义,可以认为三种方案治疗轻、中度高血压的有效率不全相同。,两个或多个构成比的比较,教材139页例11.4 计算方法和检验步骤一样(略),RC列联表检验时的注意事项,1.计算 值时,必须用绝对数,而不能用相对数,因为 值的大小与频数大小有关。,RC列联表检验时的注意事项,2. 2检
8、验要求理论频数不宜太小,一般认为表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。理论频数是否太小可以通过计算最小理论频数(即最小行、列合计所对应格子的理论频数)来判断。,理论频数太小有四种处理办法,增加样本例数以增大理论频数; 删去理论频数太小的行或列; 将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并, 使重新计算的理论频数增大;(专业角度判断) 用确切概率法。,RC列联表检验时的注意事项,当效应按强弱(或优劣)分为若干个级别, 比如分为-、+、+、+、 +等6个等级, 在比较各处理组的效应有无差别时, 宜用秩和检验。 如作2检验只说明各处理组效应的构成比有无差
9、异。,3.单向有序RC列联表的统计处理,RC列联表检验时的注意事项,4.当多个样本率(或构成比)比较的检验, 结论为拒绝检验假设, 只能认为各总体率(或总体构成比)之间总的说来有差别, 但不能说明它们彼此间都有差别, 或某两者间有差别。若想进一步了解哪两者的差异有统计学意义,需要进行多个样本率(或构成比)的两两比较。见例11.5,配对设计资料的 2 检验,甲的阳性率=乙的阳性率=甲、乙的阳性率之差=即a、d 不起作用,只需比较b与c之间的差异,配对设计四格表的 检验公式,校正公式,当 时,需作连续性校正,公式如下:,例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法
10、对79名临床确诊的低钾血症患者进行检查,结果见表11.9。问两种方法的检测结果是否不同?,表11.9 两种方法诊断低血钾的结果,配对设计,同源配对:来源相同,予不同处理如同一窝别同性别的小鼠来自同一家庭的姐妹、双胞胎同性别,同病情和年龄相近的病人配成一对,符合实验要求 的大白鼠,按 雌 雄 、 体 重 配 对,对子 1,对子 2,对子 3,随机,随机,随机,T,C,T,T,C,C,配对设计,自身配对 同一对象给予两种不同处理 同一对象处理前后,例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表11.9。问两种方法的检测
11、结果是否不同?,例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表11.9。问两种方法的检测结果是否不同?,表11.9 两种方法诊断低血钾的结果,1. 建立检验假设,确定检验水准 H0 : ,即两种方法的检测结果相同 H1: ,即两种方法的检测结果不同,2. 计算 值和自由度 本例 ,故用式校正公式计算:,3. 确定P值,作出统计推断查附表9,得 ,按0.05水准,拒绝H0 ,接受H1,差异有统计学意义,可以认为两种方法的检测结果不同。,注意事项,比较两种诊断试验法诊断效能有无差异时, 要求所投入试验的检品是用标准法检
12、出的阳性检品。,拟合优度的 检验,基本思想:实际频数与理论频数的吻合程度。 用途:检验样本所代表的总体的频数分布是否符合某一理论分布(正态、二项、Poisson)。 注意事项:样本含量要充分大,每个组段的理论频数不能太小(小于5)。 实例:教材145页例11.8,线性趋势 检验,例11.9,学过的2检验,独立样本列联表资料的 检验 配对设计资料的 检验 拟合优度的 检验 线性趋势 检验,2检验的基本步骤,建立检验假设,确定检验水准 计算检验统计量(首先考察最小理论频数)确定P值,作出统计推断,四格表资料的Fisher确切概率法,适用条件 四格表若有理论频数小于1, 或n40时 用其它检验方法所
13、得概率接近检验水准时,确切概率法基本思想,在四格表的周边合计不变的条件下, 用下式直接计算表内四个数据的各种组合之概率。 式中a、b、c、d为四格表的实际频数,例11.10 某研究者欲了解某新药联合某常规药物治疗急性重症胰腺炎的效果,将28例患者随机分为两组,试验组采用新药+常规药物联合治疗,对照组仅采用常规药物治疗,治疗10天后,疗效见表11.15。试问两种治疗方案的有效率有无差别?,表11.15 两种治疗方案治疗急性重症胰腺炎的疗效,1. 建立检验假设,确定检验水准 H0: 即两种治疗方案的有效率相等 H1: 即两种治疗方案的有效率不等 =0.05,直接计算概率,在四格表的周边合计不变的条件下, 用公式直接计算表内四个数据的各种组合之概率。,表11.16 Fisher确切概率法计算用表,将小于等于原四格表概率(0.02418)的所有四格表对应的概率相加,得到双侧概率为,按0.05水准,不拒绝,差异无统计学意义,尚不能认为两种治疗方案治疗急性重症胰腺炎的疗效有差别。,