收藏 分享(赏)

小样本资料的差异显著性检验.ppt

上传人:精品资料 文档编号:10208127 上传时间:2019-10-19 格式:PPT 页数:63 大小:687KB
下载 相关 举报
小样本资料的差异显著性检验.ppt_第1页
第1页 / 共63页
小样本资料的差异显著性检验.ppt_第2页
第2页 / 共63页
小样本资料的差异显著性检验.ppt_第3页
第3页 / 共63页
小样本资料的差异显著性检验.ppt_第4页
第4页 / 共63页
小样本资料的差异显著性检验.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

1、第六章,小样本资料的 差异显著性检验,本章主要介绍 小样本时单个均数、两个均数的假设检验 单个率、两个率间的假设检验 应重点掌握各种情况下的t检验方法 正确区分成组资料和配对资料,在上一章中,我们系统介绍了抽样分布和统计推断的基本原理和基本方法,即通过随机抽样的方法获得某一特定总体的随机样本,用这一样本进行试验,并对试验后所得资料进行分析,通过统计推断来定性或定量地分析研究总体的特征 本章主要介绍总体方差未知、且样本较小时不同资料类型的统计推断差异显著性检验(假设检验)的具体方法,第一节 单个平均数的假设检验,单个平均数的假设检验是检验一个样本所属的总体平均数 与一个特定(已知)总体平均数 间

2、是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定(已知)总体的统计分析方法 根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(即表面效应)由抽样误差造成的概率 测验的统计量分布服从 u- 分布或 t- 分布,所以单个平均数的假设检验可分为 u-test 和 t-test 两种,一、总体方差已知时单个平均数的假设检验,当总体方差 已知,不管样本多大,均可用 u- 分布计算实得差异由抽样误差造成的概率,所以称 u-test u- 检验(u-test)的方法和步骤见前一章内容 (请逐一回忆一下检验公式和检验步骤),二、总体方差未知时单个样本平均数的假

3、设检验,(一)当总体方差未知、而样本较大时,可以使用u- 分布计算实得差异由抽样误差造成的概率 因此,其检验还是 u-test (请回忆一下以上两种 u-test 的共同点和不同点;公式的不同:哪里不同),(二)总体方差未知,且样本较小时的单个样本平均数的假设检验 实际上,在很多情况下,总体方差往往是未知的,而由于各种条件的限制,试验的样本又不可能很大,即只能用小样本来作试验,或调查时抽取的样本较小 因此,总体方差未知、样本较小是试验中最常见的一种情况,在第四章讨论 t- 分布时,我们已经知道,总体方差未知、且样本较小时,可以用 代替 ,其统计量 就不再服从标准正态分布,而是服从 t- 分布:

4、,(请回忆一下 t- 分布曲线及其特点) t- 分布曲线受自由度制约,不同自由度下的 t- 分布曲线其形状是不同的,因此不同自由度下算得的 t- 值落在某一范围内的概率值也随自由度的不同而不同,下面我们用例子来说明这一类型的 t-test 例:猪的正常肛温为 39,今有一个猪场报告,怀疑其猪群可能是发病了,某兽医在该场内随机抽测了 24 头猪的体温,得到这 24 头猪的平均肛温为 = 40.2 ,标准差为 = 1.25 ,试问该猪场的猪犯病了吗? 该例仅有总体平均值 = 39 ,而无总体方差,且样本量不大(n = 24 30),因此符合总体方差未知、且是小样本的情况,应使用 t-test 来进

5、行检验,已知: = 39 ,样本 = 40.2 , = 1.25 检验步骤如下: 设 计算 和 t 值:查附表4:t 分布表,得知:自由度为 df = 24 - 1 = 23 时的,本例中所得 所得 t 值的概率 因此,应否定无效假设,接受备择假设 即:该猪群肛温与正常猪肛温差异显著,我们有95% 以上的把握认为该猪群犯病了 由于所得 t 值远大于 因此还应当作进一步的检验: 所得 t 值出现的概率 ,因此更应该否定无效假设而接受备择假设 即:该猪群肛温与正常猪肛温差异极显著,我们有99% 以上的把握认为该猪群犯病了,再举一例: 药典规定,某药物每 100ml 中应含有 60mg 的总黄酮,现

6、对某药厂生产的某一批次的这种药进行检测,得如下数据,试问该批次药物的总黄酮含量合格吗? 58.3 59.2 58.6 60.6 60.3 59.5 59.1 58.0 61.0 58.9 n = 10 下面我们作统计分析 由于是小样本,且总体方差为未知 因此应使用 t-test 进行分析 (请同学们先自行立题、计算),首先计算平均数和标准差,得:第一步,设立无效假设 设:查 t 值表,得:即 接受无效假设,即该批次药物的总黄酮含量符合药典规定 (试想一下,该题可以用一尾检验吗?),我们有三个公式用于单个样本的统计假设检验:能说出这三个公式各自的使用场合和它们之间的区别吗?,第二节 两个样本平均

7、值相比较的 统计假设检验,很多情况下,我们不只是将样本平均数与总体平均数相比较 而是做一个试验,这个试验中设置两个组,一个组作试验,施加某种试验条件(即处理 ),另一个组作对照,试验完了将这两个组的试验数据进行比较 这种试验可以采用两种方法进行: 第一种方法是两个组的数据是相互独立的:一组是处理,另一组是对照 第二种方法是两个组的数据是配对的,下面我们先讨论两个组是相互独立的情况 这种统计假设检验的方法称为成组数据的比较 一、成组数据的平均值比较 方法介绍: 在一个总体中,随机地抽取两个样本,在这两个样本中,被抽取的个体是相互独立的,且基本条件(如品种、日龄、性别、体况等)都应一致、均匀,必要

8、时须作适当的调整,尽可能使两个组在样本量上一致,各组的基本情况一致 随机地指定一组作处理,另一组作对照,一定要注意其中的任意一组作处理,一组作对照,而不能事先规定哪一组做处理,哪一组作对照 试验过程中注意记录资料,结束以后整理资料并进行统计分析 这样得到的资料称为成组数据 这样的数据在组间、组内都是独立的 成组数据的 t-test 其公式是:其中:,或:t 公式中分母两样本差的标准误也可以这样写:其中:当两样本量相等时: 则:,在小样本时,两样本平均数差的标准化是服从 t 分布的 因此:由于我们在之前的无效假设是: (备择假设是: ) 因此这一式子可以简化为:,得到成组数据所进行的试验称为完全

9、随机设计法(仅两个组) 两个组的样本量可以相等,也可以不等,但应尽量接近 这种两个组是完全独立的试验,如: 一组用药,一组不用药 一组用试验药物,一组用常规药物 一组用试验剂量,一组用常规剂量 一组是引进品种(品系),一组是本地品种,等等 就称为完全随机设计试验 这里,前面的一组称为处理,后一组称为对照,下面我们以实例来说明成组数据的比较 A、B 两厂生产某同类药物,现作 24 小时血液内残留量检测,得如下数据,试分析哪一厂家的该类药物的残留量大 A厂:49.3 48.1 49.8 51.2 50.0 50.7 49.9 48.5 50.4 51.6 B厂:48.3 49.7 48.2 48.

10、8 47.3 47.7 50.4 49.2 显然,这两个厂家的药物是相互独立的,试验所用动物也是独立的;样本较小 因此应使用成组数据的 t-test 进行分析 (同学们先行分析),先做预备计算,将两个样本的平均值、方差等计算出来:设立无效假设: 计算 t 值,并作比较:所得 t 值出现的概率 因此,否定无效假设,接受备择假设 即:A、B 两厂生产的该类药物的 24h 血液残留量差异显著(下面应针对这一现象作出专业解释),在这种检验中,我们求 t 值时用的是合并均方,合并均方只有在两总体方差(我们一般用样本均方估计总体方差)相同,即两方差差异不显著的情况下才能得到 这里我们总假定两个均方差异不显

11、著,但如果两方差差异显著,就不能合并,两均方是否相等,必须用下一章的 F-test 进行检验才能知道,当两均方不等(称为方差不齐)时,用以下方法计算 和 t 值:当 用 的 作判断的临界值 当 时须用 Cochran-cox 法: 首先计算在水平上显著的临界值式中: ,,若 就否定 ,否则,就接受 由于 处于 之间,因此,只有在实际计算得到的 在 之间时,才需要计算附: 两均方是否齐性的判别方法: 如果 表示两均方齐性,否则就是不齐 (例题见P 52 该例实际是不需要计算 的,为什么? ),二、配对数据的平均值比较 方法介绍: 配对数据来自于配对试验,配对试验根据具体试验情况可以有好多种方法:

12、 1、将两个品种、性别、日龄、体况等一致的动物(最好是有血缘关系的同胞或半同胞)配成一对,任意一只进入试验组,另一只进入对照组,配成若干对,试验中做好记录,这种记录到的数据就是配对数据 注意:对子内的两个个体应尽可能一样,但对子之间应有较大的差异,2、选取若干个动物,每一个动物在试验前测定一次,试验后测定一次,这样的两次记录就是配对数据,如同一个人吃早饭前后各测一次血糖值,这同一个人的两次血糖值就是一对数据,若干个人就有若干个数据对 3、同一个体的不同部位可以配成一对,如一个兔子的左右体侧,就可以配成一对,若干个兔子的不同体表就是若干对 4、同一个动物的不同试验时期所施加的不同处理形成一个对子

13、,如一只猪在第一试验期施加 A 处理,在第二试验期施加 B 处理;或第一试验期施加处理,第二试验期作对照,凡此种种,都是配对试验,因此配对试验既有空间上的配对,亦有时间上的配对,配对试验所得到的数据,就称为配对数据 配对数据的比较方法不同于成组数据的比较方法 其 t-test 的公式为: 其中: 而,而 n 是对子数,这里的样本量不是 2n,而是 n,因此自由度不是 2(n-1),而是 n-1 在对配对资料进行统计分析时,首先要计算每一对对子内两数据之差,即 d 值,然后对 d 值进行分析 下面我们以实际例子来说明配对数据的差异性检验,研究 和 的关系,挑选体况基本相似的一对全同胞小鼠,其中任

14、意一只放入组,另一只放入组,共挑选了8 对,分成了两组。一组饲喂正常饲料,另一组饲喂缺乏 的饲料。试验结束后检测小鼠肝脏中 的含量,得如下数据: 对子号 1 2 3 4 5 6 7 8 正常 3550 2000 3000 3950 3800 3750 3450 3050 缺 2450 2400 1800 3200 3250 2700 2500 1750差 1100 -400 1200 750 550 1050 950 1300,第一步,设立无效假设,即饲料中缺乏 不影响肝脏中 的储存量,对:饲料中缺乏 会严重影响肝脏中 的储存量 简写为:设 第二步,计算:首先计算各组数据的差 然后计算,得 得

15、: 即 t 值出现的概率 否定无效假设,接受备择假设,即饲料中缺乏 会严重影响小鼠肝脏对 的储存量;或正常饲料与缺乏 的饲料两者对肝脏 的储存量差异极显著,随机抽取 10 名健康青年男子,测量一日中不同时间的血压(舒张压)变化,得如下数据,试分析不同时间血压的差异性 序号 1 2 3 4 5 6 7 8 9 10 6时 80 83 75 78 71 89 77 81 72 75 9时 85 93 89 83 80 86 85 79 78 81 差: 5 10 14 5 9 -3 8 -2 6 6 上一例是两个试验动物配成一对,这一例是同一个试验材料不同的时间内测定的数据配成一对,这是在兽医类试

16、验中经常使用的对比方法 下面是统计分析结果(同学们可先行分析),设立无效假设: 计算 t 值:先计算每一个人的差值,写于表格的最下面一行 再计算差的平均值和标准误: 计算 t 值: 即出现t值的概率 因此,否定无效假设,接受备择假设:上午 9 时血压舒张压极显著高于上午 6 时,或:上午 6 时和9 时的血压舒张压有极显著的差异 差异不显著、显著、极显著也可以这样表示: 不显著:n.s. 显著:* 极显著:* 如:,成组数据差异显著性检验和配对数据差异显著性检验的区别在于: 1、在作试验设计和实施试验时,两者的差别就已经确定了,试验设计是配对的,就不能用成组比较法来分析所得资料;反之,试验设计

17、是成组的,就不能用配对比较法来分析所得资料 2、如果是分析别人的资料(如我们在统计学习中碰到的例题等),一定要根据例题(或习题)的内容来加以判断:独立抽取两个样本、将所抽得的样本随机分为两组;抽取一对相似的试验动物、一个个体在某一时间段作什么,另一时间段作什么、某一试验前测定一次,试验后测定一次;等,两者的区别千万不能搞错: 配对试验如使用成组比较法,易发生型错误,即不能鉴别应属显著的差异,这是人为地扩大了标准误(存伪) 成组试验的资料如果乱配成对子后用配对比较法,易使不显著的差异检验成显著的差异(弃真) 成组试验应采用供试单位基本一致的材料,彼此独立,随机抽样、随机分组、随机供试,两组样本尽

18、可能一致 配对试验对子内应尽可能一致,对子间应适当扩大距离,以使试验有更大的适应性,第三节 百分资料的 u-test,在动物科学研究中,特别是兽医学科研究中,有很多资料是属于二项分布的 这样的资料一般可用率来表示,如受精率、出苗率、孵化率、死亡率、存活率、治愈率、淘汰率,等 计算这一类率时所用的样本一般很大,样本量较小时,所得到的率其实用意义不大 当 p 或 1-p 不太小、而 np 或 n(1-p) 不小于 5 时,率的分布也服从正态分布,因此,率的检验可采用 u-test 率的检验有单个样本率和两个率的比较两种,一、单个样本率的假设检验 这是检验某一个率所属总体与理论率或期望率是否一致的假

19、设检验,即某一个样本率 是否符合一预设的总体率其中: 由于一般计算率的样本都比较大,因此可使用 u-test 进行检验,与之相比较的两个临界值 就是 时取 1.96 , 时取 2.58,即当 时, 差异不显著当 时, 差异显著当 时, 差异极显著,例:某兽药厂称该厂生产的治疗猪丹毒病的某种新药其疗效达 85%,今有一养猪场购买了这种药,500头病猪经治疗后成活了 415头,该厂关于这一新药的宣传是否属实? 设立无效假设:接受无效假设,即该厂生产的这种新药其疗效在95% 的水平上可以得到承认,又例:孟德尔的豌豆花试验中,孟德尔曾假设其红花和白花的比例是3:1,今一个试验中,得红花447朵,白花

20、165朵,问:这次试验的结果符合这一假设吗? 作无效假设:这一次试验在95%的水平上可被接受,即本次试验的结果是符合孟德尔假设的,二、两个样本率差异的显著性检验 这一类型的假设检验往往是检验两个样本率 和 所属总体率 和 是否一致,或者说两个样本率是否来自一个总体 设两个样本容量分别是 和 ,两样本中发生某一阳性事件的次数分别是 和 ,则两样本率分别是 和 这两个样本率所属总体的率分别是 和 我们通过两样本率的差 来推断 和 是否相等,这一类型的无效假设是 其备择假设是,用以检验的公式为: 其中:由于一般样本很大,因此可用 u-test 得到的 u 值与 1.96 和 2.58 相比时, ,差

21、异不显著时, ,差异显著时, ,差异极显著,例:试验某种新药对杀灭猪体外寄生虫的效果,用常规药物作对比试验,常规药物施与 860 头虫体,死亡 585 头,该新药施与 920 虫体,死亡672 头,新药的疗效如何? 新药的杀灭率和常规药物的杀灭率分别为设立无效假设:设,否定无效假设,即新药的除虫效果显著好于常规药物,又例:试验用 EM 制剂处理饲料可否提高苗猪的成活率:处理组(施用 EM)382 头苗猪成活 364头,对照组(未施用任何药剂)278 头成活 244头,EM 有效果吗? 处理组成活率: 对照组成活率: 设,否定无效假设,接受备择假设,即 EM 可以极显著提高苗猪的成活率,三、小样

22、本率假设检验的校正 质量性状的率的计算,一般应使用大样本,但有些特殊情况下,样本不够大,只能得到一个小样本的率,如 n 25、且 np 5 时,资料服从二项分布,不能再使用常规的 u-test,这时应进行校正,近似地进行 u-test,(a)单个小样本率的校正性检验 其公式是:(b)两个小样本率的校正性比较 其公式是:其中, 是较大的样本率, 是较小的样本率,第四节 总体平均值的(小样本资料)区 间估计,复习:标准误的作用 复习:置信区间、置信度、置信半径、置信上限、置信下限 当总体方差为已知时:或写成:,当总体方差未知,但样本较大时:或写成:,当总体方差未知,且样本较小时,总体平均值的置信区

23、间估计应当用以下公式进行:或写成:,例:在某地随机抽查 25 头南阳黄牛,测得其血红蛋白含量为: 则该地南阳黄牛血红蛋白的总体平均值其 95% 置信区间为:(下限:63 - 2.0643.67 = 55.43) (上限:63 + 2.0643.67 = 70. 58) 即:55.43,70.580.95 其 99% 的置信区间为:52.74,73.270.99,第五节 百分率的置信区间估计,一般情况下,率的估计都是大样本,因此,不管总体方差是否已知,我们都可以用下式来估计总体率的置信区间:或写成:我们再次强调:小样本的率其统计学意义不大 因此,当我们必须计算小样本的率时,一定要慎重,例:一养猪场某年发生仔猪白痢,1027 头仔猪由于白痢而死亡了 128 头,死亡率为 12.46% 则仔猪白痢的总体死亡率其 95% 置信区间为: 12.46-0.02,12.46+0.020.95 = 12.44,12.480.95 其 99% 置信区间为: 12.43,12.490.99,从以上置信区间的设置,我们可以看出,置信区间的宽窄与置信度、样本容量、标准误等有关,因此,为了得到一个较好的置信区间用以估计总体平均值或总体率: 应当选择一个合理的置信度 应当扩大样本容量 应当提高试验的技术和精确度以降低试验误差(*),END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报