1、第四章 均数差异显著性检验 t检验,河南农业职业学院 孙攀峰,目 的 要 求,显著性检验的目的、方法以及步骤 Excel进行t检验的步骤、方法,第一节 概率及分布概述,一、事件,定义:在一定条件下,某种事物出现与否就称为是事件。 自然界和社会生活上发生的现象是各种各样的,常见的有两类。,在一定条件下必然出现某种结果或必然不出现某种结果。,确定性事件,必然事件(U) (certain event),不可能事件(V) (impossible event),一、概率基本概念,在一定条件下可能发生也可能不发生。,随机事件(random event) 不确定事件(indefinite event),为了
2、研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。,二、频率(frequency),若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率(frequency),记为W(A)=m/n。,0W(A) 1,抛掷一枚硬币发生正面朝上的试验记录,从表中可以看出,试验随着n值的不同,正面朝上出现的频率也不相同,当n越大时,频率越接近0.50。,一、概率基本概念,频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。,概 率,定义:设在相同的条件下
3、,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。,P(A) = p,统计概率,抛掷一枚硬币发生正面朝上的试验记录 实验者 投掷次数 发生正面朝上的次数 频率(m/n)蒲丰 4040 2048 0.5069 K 皮尔逊 12000 6019 0.5016 K 皮尔逊 24000 12012 0.5005,随着实验次数的增多,正面朝上这个事件发生的频率稳定接近0.5,我们称0.5作为这个事件的概率。,三、概率(probability,P),P(A) = p=lim ,在一般情况下,随机事件的概率P是不可能准确得到的。通常以试验次数n充分大,随机事件A的频
4、率作为该随机事件概率的近似值。,m n,m n,1,2,3,4,5,6,7,8,9,10,随机抽取一个球,求下列事件的概率; (1)事件A抽得一个编号 4 (2)事件B =抽得一个编号是2的倍数,该试验样本空间由10个等可能的基本事件构成,即n=10,而事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一个,事件A便发生。,P(A)=3/10=0.3,P(B)=5/10=0.5,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A“一次取一个球,取得红球的概率”,10个球中取一个球,其可能结果有10个基本事件(即每个球被取到的可能性是相等的),即n=10,事件A:取得红球,
5、则A事件包含3个基本事件,即m=3,P(A)=3/10=0.3,四、小概率事件原理,概念: 如果某事件发生的概率很小,在大量重复试验中事件发生的频率也很小,在1次试验中该事件被看做是不会发生的。应用:是假设检验时进行统计推断的理论依据。通常将5%,1%认为是小概率的标准,又称显著水平。,第二节 均数差异显著性检验,一、复习回顾,生物统计的本质:研究如何从样本推断总体,样本抽取的原则:随机抽样,试验误差的概念:由样本推断总体时,由各种无法控制的随机因素引起的误差。,现在,我们假设有这样一个情况:从一批同质(相同品种、相同日龄、相同饲料、相同饲养管理等)的20000只肉鸡中随机抽取各含100只肉鸡
6、的两个样本,分别称量其42天出栏重,结果发现:样本1平均出栏重为:2.24kg/只样本2平均出栏重为:2.31kg/只,?,两样本来自同一总体,但二者 的样本平均数却存在一定差异,这种差异来源于随机抽样 造成的随机误差!,现在,我们再来看另一种情况:在相同日龄、相同饲料、相同饲养管理等条件下,随机从两个品种(AA肉鸡、艾维因肉鸡)的各10000只肉鸡中分别抽取100只肉鸡做为样本,称量其42天出栏重,结果发现:AA 肉鸡平均出栏重为:2.31kg/只艾维因肉鸡平均出栏重为:2.24kg/只,?,在试验进行过程中,尽管尽量排除随机误差的影响,以突出试验的处理效应,但由于生物个体间无法避免的差异,
7、以及诸多无法控制的随机因素,使得试验结果最后表现的观察值除了处理效应以外,还包括试验误差的效应。,处理 效应,误差 效应,表 面 效 应,二、显著性检验的目的,对两个样本进行比较时,必须判断样本间差异主要是随机误差造成的,还是本质不 同或处理效应引起的?,处理 效应,误差 效应,表 面 效 应,处理 效应,误差 效应,显著性检验,显著性检验,分析误差产生的原因,确定差异的性质,排除误差干扰,对总体特征做出正确判断,三、显著性检验的任务,四、显著性检验的原理,小概率原理: 统计假设:对总体的某些未知或不完全知道的性质提出待考查的命题,通常包括无效假设和备择假设。根据样本资料对假设的成立与否进行推
8、断就是假设检验,也称显著性检验。,五、显著性检验的分类,t 检验主要用于检验两个处理平均数差异是否显著;方差分析主要用于检验多个处理平均数间差异是否显著; 检验 主要用于由质量性状得来的次数资料的显著性检验等。,六、显著性检验的步骤,1、提出假设 2、确定显著水平 3、选定检验方法,计算检验统计量,确定概率值作出推断 4、结论:是否接受假设,例1:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数,得到如下数据资料:试比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。,下面以两均数差异显著性检验为例具体说明操作步骤。,1 、提出假设,对立,无效假设 /零假设 /检验假设,备择假设 /对应假设
9、,1 2,1 2,误差 效应,处理 效应,H0,HA,提出假设:(1)无效假设H0: 1 2 即假设两品种经产母猪产仔数的总体平均数相等,试验的处理效应(品种间差异)为0。(2)备择假设HA : 1 2 即假设两品种经产母猪产仔数的总体平均数1 和2 不相等,亦即存在处理效应,其意义是指两品种经产母猪产仔数存在本质上的差异。,例:比较内江猪与荣昌猪两品种经产母猪产仔数 是否存在显著差异。,2 、 确定显著水平,0.05,显著水平*,极显著水平*,能否定H0的人为规定的概率标准称为显著水平,记作。,统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检
10、验也常取=0.05和=0.01两个显著水平 。,P ,0.01,0.05,3 、选定检验方法,计算检验统计量,确定概率值,根据研究设计的类型和统计推断的目的选择使用不同的检验方法。,例:,这里是对两品种经产母猪产仔数的总体平均数进行比较,因此为均数差异显著性检验-t检验。,在无效假设H0成立的前提下计算t值,注:由于计算过程复杂,这里不再重复书上内容,在下面将具体讲解如何用Excel来进行统计分析。,Excel进行t检验分类,Excel可提供的t检验工具: t-检验:双样本等方差假设 此 t-检验先假设两个数据集取自具有相同方差的分布,可确定两个样本是否来自具有相同总体平均值的分布。 t-检验
11、:双样本异方差假设 此 t-检验先假设两个数据集取自具有不同方差的分布,可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。 t-检验:平均值的成对二样本分析 当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进行了两次检验),可以使用此成对检验,以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。,Excel进行t检验步骤(一),输入数据,Excel进行t检验步骤(二),“工具” “数据分析” “t检验”,这里假设无效假设Ho成立,即两品种无差异,二者来自同一总体,则为“双样本等方差假设”。,Excel进行t检验步骤(三),拉取两
12、品种数据,假设Ho成立,则平均差为0.,“内江猪”“荣昌猪”做为标志拉取在上面的变量区域中,显著水平,结果输出区域,可选任一空白单元格,Excel进行t检验步骤(四),双尾概率P,计算所得t值,4、作出推断结论:是否接受假设,P,P ,小 概 率 原 理,接受H0 否定HA,否定H0 接受HA,假设H0成立 可能正确,假设H0成立 可能错误,例:上例中P0.0530.05 所以接受H0,从而得出结论:内江猪与荣昌猪经产母猪产仔数未发现有显著差异,其表面差异应有大于5%的概率归于随机误差所致。,分 析 题 意,提 出 假 设,确 定 显 著 水 平,计 算 检 验 统 计 量,作 出 推 断,假
13、设检验的步骤:,第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误,七、显著性检验两种类型错误,、 两类错误既有联系又有区别,错误只在否定H0时发生 错误只在接受H0时发生,错误增加 错误减小错误增加 错误减小,2、 还依赖于 - 0 的距离,3、n , 2 可使两类错误的概率都减小.,八、样本均数与总体均数差异显著性检验,无效假设为Ho:o 备择假设为HA:o 计算公式如下:,根据以上公式可导出以下结论:,由此可知,当总体平均数落在已知的样本均数置信概率为(1-)的置信区间以外时,就表明在显著水平时差异显著。,
14、样本均数与总体均数差异显著性检验t检验,例5.2:母猪的怀孕期为114d,现抽测12头大白猪母猪的怀孕期分别为115,113,114,112,116,115,114,118,113、115、114、113,试检验所得样本的平均数与总体平均数114d有无显著差异?,第一步, 输入数据,第二步,工具-数据分析-描述统计,第三步,输入参数,第四步,计算结果,95%置信区间 下限:114.3333-1.025696=113.3 上限:114.3333+1.025696=115.4 总体平均数: 114d分析:总体平均数落在样本均数置信概率为95%的置信区间内(113.3115.4),说明样本均数与总体
15、均数差异不显著。,九、两个样本平均数的差异显著性检验,成组数据平均数的比较,成对数据平均数的比较,试 验 设 计,非配对试验设计,配对试验设计,非配对试验成组数据平均数的比较,试验单位完全随机地分两组,各实施一试验处理,两个样本之间的变量没有任何关联,不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准,来检验其差异的显著性。如:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数:内江猪:14,15,12,11,13,17,14,14,13荣昌猪:12,14,13,13,12,14,10,10,20分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组成一组数据
16、,相互比较时以组平均数做为比较标准,在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。,配对试验成对数据平均数的比较,试验单位两两配对,随机分配到两个处理,配对的试验单位要求存在相似性,而每个处理内的各试验单位不一定相似,可以变异较大,但配对内试验单位要求相似,因此,两样本容量相同,所得数据为成对数据,两组数据以相配对的试验单位之间的差异作为相互比较的标准,来检验其差异的显著性。在Excel里进行t 检验时应采用“t检验-平均值的成对二样本分析”模块进行分析。,配对试验成对数据平均数的比较,如:从8窝仔猪中每窝选出性别相同、体重相近的两头随机分
17、配到两个饲料组中进行对比试验:,窝号,饲料,分析:每窝中选出的性别相同,体重相近的两头仔猪做为一个配对被随机分到甲、乙两组饲喂两种饲料,但甲组中来自8窝的仔猪之间可以性别不同,体重不相近,因此最后的数据是原来属于同一窝的两仔猪的成对数据,比较的是配对仔猪之间的差异,而非两组平均数的差异。,实例:某研究所对三黄肉鸡进行饲养对比试验,试验时间为60d,增重结果如下表,问甲乙两种饲料对三黄鸡的增重效果有无显著影响?,非配对试验成组数据平均数的比较,()假设,(2)水平,(3)检验,H0: 12,即认为两种饲料增重效果相同。 HA: 1 2,即认为两种饲料增重效果不同。,选取显著水平0.05,第一步,
18、在Excel中输入数据,第二步,工具数据分析t检验-双样本等方差假设,(4)推断,P=0.210.05,故接受H0,否定HA;,认为两种饲料饲喂三黄鸡的增重效果差异不显著。,第三步,得出检验结果,配对试验成对数据平均数的比较,实例1:现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间为30d,结果见下表,问两种品牌饲料饲喂仔猪增重有无显著差异?,窝号,饲料,()假设,(2)水平,(3)检验,H0: 12,即认为两种饲料增重效果相同。 HA: 1 2,即认为两种饲料增重效果不同。,选取显著水平0.05,第一步,在Excel中输入数据,第
19、二步,工具数据分析t检验-平均值的成对二样本分析,(4)推断,P=0.00190.05,故否定H0,接受HA;,认为两种饲料饲喂仔猪的增重效果差异显著。,第三步,得出检验结果,实例2: 现用国产与进口的背膘厚测定仪,对14头肥猪进行了测定(单位:mm) ,数据如下:,试检验两种仪器测定的结果有无显著差异?分析:这里是用国产和进口两种仪器测得同一头猪的背膘厚数据分到两组,是同一样本前后两次试验的结果,属配对试验设计。,()假设,(2)水平,(3)检验,H0: 12,即认为两种仪器结果相同。 HA: 1 2,即认为两种仪器结果不同。,选取显著水平0.05,第一步,在Excel中输入数据,第二步,工
20、具数据分析t检验-平均值的成对二样本分析,(4)推断,P=0.920.05,故接受H0,否定HA;,认为两种仪器测定背膘厚的结果差异不显著。,第三步,得出检验结果,十、百分数资料的差异显著性检验,样本百分数与总体百分数差异显著性检验,两个样本百分数差异显著性检验,基本步骤:1. 提出无效假设与备择假设无效假设H0:p=p0备择假设HA:pp02.计算t值3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断若 1.96,则p0.05,表明p与p0差异不显著; 若1.96 2.58 ,则0.01p0.05,表明p与p0差异显著; 若 2.58,则 p0.01,表明p与p0差异极显著;,
21、(一)样本百分数与总体百分数差异显著性检验,实例:据往年调查,某地区的雏鸡白痢病的发病率一般为 30%,现对某鸡场500只雏鸡进行检测,结果有175只凝集反应呈阳性,问该鸡场的白痢病是否比往年严重?,分析:此例总体百分数p0=30%样本百分数p=175/500=35%,1. 提出无效假设与备择假设无效假设H0:p=p0备择假设HA:pp02.计算t值= =0.0205于是 =(0.35-0.30)/0.0205=2.4393.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断因为1.962.44 2.58 ,则0.01p0.05,表明p=35%与p0=30%差异显著,故该鸡场的雏鸡白
22、痢病比往年严重。,(二)两个样本百分数差异显著性检验,基本步骤:1. 提出无效假设与备择假设无效假设H0:p1=p2备择假设HA:p1p22.计算t值3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断若 1.96,则p0.05,表明p1与p2差异不显著; 若1.96 2.58 ,则0.01p0.05,表明p1与p2差异显著; 若 2.58,则 p0.01,表明p1与p2差异极显著;,实例:某猪场第一年饲养PIC品种商品仔猪10000头,死亡980头;第二年饲养该品种仔猪10000头,死亡950头,试检验第一年与第二年仔猪死亡率是否有显著差异?,分析:此例第一年死亡率p1=980/10000=9.8%第一年死亡率p2=950/10000=9.5%,1. 提出无效假设与备择假设无效假设H0:p1=p2备择假设HA:p1p22.计算t值= (980+950) /(10000+10000) =9.65% =0.00418,=(9.8%-9.5%)/0.00418=0.71773. 将计算所得的t 的绝对值与1.96,2.58比较,作出统计推断因为0.7177 1.96,则p0.05,p1与p2差异不显著,表明第一年仔猪死亡率与第二年仔猪死亡率差异不显著。,