1、第三章 统计推断,第一节 参数估计 第二节 统计假设测验的原理 第三节 样本平均数的显著性测验 第四节 统计假设测验的两类错误,第一节 参数估计,统计推断的内容 总体的参数估计 总体的假设检验 参数估计:总体参数未知时,需要从总体抽出一个样本对未知参数进行估计。分为点估计和区间估计。 点估计是对参数真值的估计 区间估计是对参数真值取值范围的估计,一、参数的点估计,(1)点估计的定义 假设总体x 的分布函数的形式已知,但含有未知参数。x1、x2、xn为总体的一个样本,构造一个的统计量 (如平均数),将所测得的样本值代入统计量,就会得到 ,那么就称 为未知参数的估计值。,(2) 评价估计量优劣的标
2、准 无偏性:如果 的数学期望值存在,且等于待估参数, 就是的无偏估计。 有效性:如果 和 都是的无偏估计,但 的方差小于 的方差,我们就说 比 有效。 一致性:对任意小的正数, 成立,则称 是参数的一致估计量。,二、参数的区间估计,(1)点估计的缺点 只给出了总体参数的估计值,没有考虑试验误差的影响,从总体中抽取不同的样本,可能得到不同的结果。 没有指出估计的可靠程度。,(2)区间估计相关概念 区间估计:在一定概率保证下给出总体参数的可能范围 置信区间:所给出的可能范围 置信限:置信区间的上、下限,用L1和L2表示 置信距:置信区间的长度 置信度:所给出的概率保证,也称置信概率,用P=(1)表
3、示,(3)区间估计的原理 置信度1反映了区间估计的可信度,常取0.90、0.95和0.99。 置信距反映了区间估计的精确度。 在保证置信度1的前提下,置信区间越短越好。,(4)进行区间估计的一般步骤: 首先,构造一个与待估计参数有关的统计量 ; 其次,找出统计量 的分布,在一定的置信度下,给出临界值; 最后,计算总体参数的置信区间。,三、正态总体平均数的置信区间,(1)总体方差2已知时,的置信区间为其中,u为正态分布下置信度为1时u的临界值。,应用举例,某棉花株行圃36个单行的皮棉平均产量为 4.1kg,已知0.3kg,求99%置信度下该株行皮棉产量的置信区间。,置信度P=(1)0.99,0.
4、01,则u0.012.58 由于 置信区间为(4.12.580.05)(4.12.58 0.05),即3.9714.229 推断:该株行圃皮棉平均产量在3.9714.229kg之间,此估计值的可靠度有99%。 0.05时,平均产量在4.0024.198kg之间,(2)总体方差2未知但为大样本时, 用样本方差s2 代替2 ,的置信区间为(3)总体方差2未知且为小样本时, 用样本方差s2 估计2 ,的置信区间为其中,t为t分布下置信度为1时t的临界值。,t 分布,由样本平均数抽样分布的性质知道:若xN (,2),则 N (,2/n)。将随机变量标准化: ,则uN (0,1)。 当总体标准差未知时,
5、如果为大样本,可以用样本标准差s直接代替使用。 如果为小样本,那么用s代替所得到的统计数记为t,即 。 由于用s代替,t变量不再服从标准正态分布,而是服从自由度dfn1的t分布,t的取值范围是(,)。 附表5中数字为两尾临界t值。,应用举例,某春小麦良种在8个小区的平均千粒重 ,。试估计在置信度为95%时该品种的千粒重范围。 由附表4,t 0.05(7)2.365,95%置信区间为(35.22.3650.58)(35.22.3650.58),即33.836.6 推断:该品种的千粒重范围在33.836.6g之间,此估计值的可靠度有95%。也可以写作35.22.3560.5835.21.4g,即3
6、3.836.6g。,四、两总体平均数差数(12)的 置信区间,(1)两总体方差已知时,12在1置信度下的置信区间为(2)两总体方差未知但为大样本时,用s1、s2分别代替1、2,12在1置信度下的置信区间为,应用举例,测两个甘薯品种单株平均产量,其中第一个品种测了332株, =1550g,s1=5.350g;第二个品种测了282株, =1250g,s2=3.750g。试估计这两个品种单株平均产量的相差在95%置信度下的置信区间。,由附表3查得置信度为95%时,u0.05=1.96,并且95%置信度下的置信区间为 (1512)1.960.3612(1512)1.960.36,即2.2912 3.7
7、1。因此,第一个品种比第二个品种的单株平均产量多2.29 50g3.7150g,这个估计有95%的把握。,(2)两总体方差未知且为小样本时 如果两总体方差相等,即1222 2 。12在1置信度下的置信区间为:其中,df=n1+n2-2,应用举例,比较两种密度水稻的平均亩产量,每种密度各调查5个小区,结果 =428kg, =440kg, =11.136kg。试估计这两种密度水稻的平均亩产量差数在99%置信度下的置信区间。,由附表5查得df8时置信度为99%时,t0.013.355 99%置信度下的置信区间为(428440)3.355 11.13612(428440)3.35511.136,即49
8、.41225.4。 结果说明:第一种密度的平均亩产量可以比第二种密度少收49.4kg到多收25.4kg,波动很大。 因此,这个例子说明12的。,当 12时,意味着两总体平均数相等,因此,可用两样本平均数的加权平均数 作为对的估计:, 如果两总体方差不相等,即1222 。12在1置信度下的置信区间为: 其中取其整数部分,第二节 统计假设测验的原理,一、统计假设测验的概念 二、统计假设测验的原理 三、统计假设测验的步骤 四、两尾测验和一尾测验,一、统计假设测验的概念,(1)为什么要进行统计假设测验 一个试验相当于一个样本,由一个样本统计数可以对总体参数作出估计,但总体参数是固定的,而样本统计数会因
9、样本不同而不同,即样本统计数存在误差。,如:某地区主栽水稻品种的亩产量为550kg(总体),一新品种的多点试验结果为600kg的亩产量,试问这一新品种的亩产量是否真正高于主栽品种?(其它举例见教材P75) 该新品种的亩产量比主栽品种高600550=50kg,这是试验的表面效应,造成这种差异的可能原因有两个: 一是新品种确实优于主栽品种 二是试验误差,(2)如何进行假设测验 那么如何判断是哪一种原因?方法是将表面效应与误差作比较。 如果表面效应并不大于误差,则无充分证据说明新品种确实优于主栽品种,表面效应是由试验误差造成的。 如果表面效应大于误差,表面效应不完全是由试验误差造成的,说明新品种确实
10、优于主栽品种。,表面效应是否大于试验误差这个度怎么把握? 我们可以根据抽样误差出现的概率而利用抽样分布来计算。 只要设定一定的概率标准,如5%或1%,如果表面效应属于误差的概率不超过这个标准,我们就可以认为表面效应不完全是由试验误差造成的。,(3)相关概念 统计推断:把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率而作出推论的方法。 统计假设测验:计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成的(如假定新品种并不优于主栽品种)。有了这个事先的假设,才能计算概率。这种先作处理无效的假设(无效假设)再依据该假设概率大小来判断接受或否定该假设的过程称为统计假设测验。,二、
11、统计假设测验的原理,(1)两个总体间的差异如何比较? 一种方法是检验整个总体材料,获得全部结果,这种方法很准确,但实际上不可能进行。 另一种方法是通过研究样本来研究其所代表的总体。 如将新旧品种共同种植12年,取得其平均产量,然后由此推断“新旧品种无差异”的假设是否正确。如果发现假设和试验结果相符的可能性大,接受该假设;反之,否定该假设。,(2)相关概念 统计假设:要进行统计假设测验,首先需要提出一个有关某一总体参数的假设,这种假设称为统计假设。 无效假设:统计假设一般假设没有效应差异,即表面效应是由误差造成的,这种假设称为无效假设,记作H0 。 备择假设:和无效假设相对应的是备择假设,记作H
12、A 。 如果否定了无效假设,就必须接受备择假设;如果接受了无效假设,也就否定了备择假设。,(3)常见的统计假设类型 单个平均数的假设:样本是从具有平均数0的总体中随机抽出的,记作H0:0。 如黄瓜新品种的亩产量和主栽品种相同,这是指新品种的产量是主栽品种产量的一个随机样本,其平均产量等于主栽品种产量0,故记为H0:0。 两个平均数相比较的假设:两个样本是从两个具有相等平均数的总体中随机抽出的,记为H0:12或120。 如两个番茄品种亩产量相同或两种杀虫剂对于某种害虫的药效相等。,三、统计假设测验的步骤,(1)对所研究的总体及所抽取的样本首先提出一个无效假设和备择假设 (2)在承认上述无效假设的
13、前提下,获得平均数的抽样分布,计算该假设正确的概率 (3)根据“小概率事件实际上不可能发生”原理接受或否定假设,应用实例,某地小麦主栽品种亩产300kg,即当地品种这个总体的平均数0=300kg,并从多年种植结果获得其标准差= 75kg,而现有某新品种通过25个小区的试验,计得其样本平均亩产量为330kg, 即 =330,那么新品种样本所属总体与0=300kg的主栽品种这个总体是否有显著差异呢?,(1)对所研究的总体首先提出一个无效假设 通常无效假设常为所比较的两个总体间无差异。 测验单个平均数,则假设该样本是从一已知总体中随机抽出的,即H0:0,备择假设为HA:0 。 假定新品种的总体平均数
14、等于原品种的总体平均数0=300kg ,而样本平均数和之间的差数:330300=30kg属随机误差; 如果测验两个平均数,则假设两个样本的总体平均数相等,即H0:12 ,也就是假设两个样本平均数的差数 属随机误差,并非真实差异;其备择假设为HA: 1 2。,(2)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为n=25的样本,根据中心极限定理,该样本平均数的抽样分布服从正态分布,平均数 =300kg,标准误 =15(kg) 。, 计算概率 在假设H0为正确的条件下,根据的抽样分布算出获得=330kg的概率。 将 标准化:新品种产量
15、有可能高于或低于主栽品种,用两尾概率。 查附表2,当u2时,P=0.0455,这说明 030kg属于随机误差的概率小于5%,即新品种总体与主栽品种总体没有差异的概率小于5%。,这样有两种推论可以选择: A. 新品种与主栽品种无明显差异,其概率小于5%。 B. 新品种与主栽品种有明显差异,其概率大于95%。 那么我们是选择哪一种推论呢?, 计算接受区和否定区 在假设H0为正确的条件下,根据 的抽样分布划出一个区间,如 在这一区间内则接受H0,如 在这一区间外则否定H0 。 意思就是,如果 在这个区间内,该差数就解释为随机误差;如果 落在这个区间外,该差数就应该就解释为真实差异。 如何确定这一区间
16、呢?,我们在讲正态分布的时候,知道:在 的抽样分布中,落在( , )区间内的有95%,落在这一区间外(即 和 )的概率只有5%。 如果以5%概率作为接受或否定H0的界限,那么前者称为接受假设的区域,简称接受区;后者为否定假设的区域,简称否定区。1%概率的接受区和否定区各是多少?,在上面的例子中,95%的接受区域为(3001.96 15,3001.9615),即(270.6,329.4)。,(3) 根据“小概率事件实际上不可能发生”原理接受或否定无效假设 根据“小概率事件实际上不可能发生”原理,当无效假设成立的概率小于5%或1%时,我们就认为无效假设不可能成立,从而否定无效假设,接受备择假设。,
17、上例中, 30kg是由随机误差造成的概率小于5%,因此可以否定H0,称这个差数是显著的,接受HA。 如果差数由随机误差造成的概率小于1%,就称这个差数是极显著的,接受HA。 用来测验假设的概率标准5%或1%等,称为显著水平,一般用表示,如0.05或0.01。 上例中算得u值的概率小于5%,说明差数30kg已经达到0.05显著水平。,统计假设测验的步骤可总结如下: (1)对样本所属的总体提出统计假设,包括无效假设和备择假设。 (2)规定测验的显著水平值。 (3)在无效假设为正确的假定下,根据统计数的抽样分布,如为正态分布的计算正态离差u值,或根据显著水平划出否定区域。 (4)将显著水平和u值比较
18、,或将试验结果和否定区域比较,作出接受或否定无效假设的推断。,四、两尾测验和一尾测验,我们在提出统计假设时,必有一个相对应的备择假设。备择假设是否定无效假设时必然要接受的假设。 如果H0:0,备择假设为HA:0。 后者包括两种可能性,即0和0 。因而在假设测验时所考虑的概率为正态曲线左边一尾概率和右边一尾的总和,这类测验称为两尾测验,它具有两个否定区域。,如果H0:0,备择假设为HA:0。 某种杀虫剂防虫效果达到90%才符合标准,那么其无效假设为H0:90%,备择假设为HA:90%。 对应的备择假设只有一种可能,无效假设只有一个否定区域,即正态曲线的右边一尾。这类测验称一尾测验。 一尾测验还有
19、一种情况,即H0:0, HA :0,这时,否定区域在正态曲线的左边一尾。 使用某种杀菌剂后的发病率为10%,不使用时为50%,试测验该杀菌剂是否降低了发病率。那么H0:50%,HA:50%。,作一尾测验时,需将附表3列出的两尾概率乘以1/2,再查出其u值。如作0.05时的一尾测验,查附表的P0.10一栏,u1.64,其否定区域为 或 。 当0.05时,两尾测验的|u| 1.96,而一尾测验的u1.64或u1.64。 所以,一尾测验容易否定假设。在试验之前应慎重考虑采用一尾测验还是两尾测验。,第三节 样本平均数的显著性测验,一、样本平均数显著性测验的类型 二、单个样本平均数的假设测验 三、两个样
20、本平均数相比较的假设测验 四、二项资料百分数(成数)的假设测验,一、样本平均数显著性测验的类型,根据总体方差2是否已知和样本大小可分为以下几种测验。 u测验 :适用于总体方差已知或总体方差虽未知但为大样本的情况 t测验 :适用于总体方差未知且为小样本的情况,(1)u 测验,根据中心极限定理,从一个平均数为、方差为2的正态总体中抽样,或者在一个非正态总体里抽样,只要样本容量足够大,所得一系列样本平均数 的分布必然趋向正态分布,即 。经 标准化后,服从标准正态分布N(0,1)。 由试验结果计算出u值后,便可从附表3查出其相应的概率,测验H0:0。 这类测验称为u测验。,应用举例,如:苹果某品种的果
21、实硬度015kg/cm2,进行喷Ca2+处理后,取100个果实, 15.6kg/cm2,s0.5kg/cm2。问Ca2+处理能否提高苹果果实硬度?,提出假设:H0:0,HA:0。 规定显著水平:0.05,u0.05=1.64。 统计量计算:作出推断:uu0.05,P0.05,否定H0,接受HA。 解释试验结果:Ca2+处理能显著提高苹果果实硬度。,(2)t 测验,当总体标准差未知且为小样本时,以样本标准差s代替所得到的统计数记为t, 。 t变量不再服从标准正态分布,而是服从自由度dfn1的t分布。 按t分布进行的假设测验称为t测验。 t测验的原理、步骤均同u测验。,应用举例,如:池塘水含氧量的
22、标准是0 4.5 mL/L,现对某一池塘水进行含氧量检测,取10个点,含氧量分别为4.33、4.52、4.25、4.44、4.56、4.54、4.42、4.26、4.24和4.50 mL/L 。问该池塘的水含氧量是否达到标准?,提出假设:H0:0,HA: 0 。 规定显著水平:0.05,t0.05(9)=2.262。 统计量计算:=4.406,s0.126作出推断:|t| t0.05(9) ,P0.05,否定H0,接受HA。 解释试验结果:此池塘的水含氧量没有达到标准。,二、单个样本平均数的假设测验,这是测验某一样本平均数所属总体是否和某一指定总体的平均数相同。上面的举例都属于单个样本平均数的
23、假设测验。 如:某春小麦良种的千粒重034g,现自外地引入一高产品种,在8个小区种植,得其千粒重为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6g,问新引入品种的千粒重与当地良种有无显著差异?,提出假设:H0:0,HA: 0 。 规定显著水平:0.05,t0.05(7)=2.365。 统计量计算:=35.2g,s1.64g作出推断:t t0.05(9) ,P 0.05,接受H0,否定HA。 推断:新引入品种千粒重与当地良种千粒重指定值没有显著差异。,三、两个样本平均数相比较的假设测验,这是由两个样本平均数的相差,测验这两个样本所属的总体平均数有无明显差异。 两
24、个黄瓜品种的产量是否相同。 两种杀虫药剂对于辣椒疫病的防治效果是否相等。 测验方法因试验设计的不同以下两种: (1)成组数据的平均数比较 (2)成对数据的平均数比较,(1)成组数据的平均数比较,成组数据:如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据都称为成组数据。以组(处理)平均数作为相互比较的标准。 根据两个样本所属总体的方差(12和22)是否已知、是否相等而采用不同的测验方法。, 两个样本的总体方差12和22 已知,由抽样分布的公式知,两样本平均数 和 的差数标准误 ,在12和22是已知时为:并有:在假设H0: 1 2 下,故可对两样本平均数的差
25、异作出假设测验。,应用举例,某小麦品种产量的20.4(kg/m2)2。在该品种的一块地上用A、B两种方法取样。A法取12个点,产量为 1.2(kg/m2)2;B法8个点,产量为 1.4 (kg/m2)2。问A、B两种取样方法的产量有无明显差异?,H0:12,HA:12。 显著水平取0.05,u0.05=1.96。 计算u值12=2220.4,n1=12,n2=8,作出推断:|u|u0.05,P0.05,接受H0,否定HA。 说明:这两种取样方法的产量无明显差异。, 两个样本的总体方差12和22 未知,但可假定12=222,且两个样本为小样本时,采用t测验,根据样本方差计算平均数差数的合并方差s
26、e2,作为对2的估计。由于假定12=222 , se2应为两个样本方差的加权平均值。并有:在假设H0: 1 2 下,故可对两样本平均数的差异作出假设测验,其df=df1+df2= n1+n2-2。,应用举例,调查某农场30万苗/亩和35万苗/亩的亩产量(kg),各调查5个田块(右表)。 问两种栽培密度的亩产量有无明显差异。,因为是小样本,所以用t测验。又由于不知道两种密度的亩产量谁高谁低,所以用两尾测验。 H0:12,HA:12。 显著水平取0.05,t0.05(8)=2.306。,=430+(-10/5)=428, =440 SS1=1950-(-10)2/5=1930, SS1=550-0
27、2/5=550由于|t|t0.05(8),P0.05,所以接受H0:12,两种密度的亩产量无显著差异。, 两个样本的总体方差12和22 未知,但12 22时,采用近似t测验,由于12 22 ,在计算差数标准误时需要用两个样本的方差s12和s22分别估计12和22。 在计算t值时,不再是准确的t分布,只能进行近似的t测验。首先计算有效自由度df,然后计算t 。t 近似于t分布,具有有效自由度df ,可根据df 查t值表计算概率。取其整数部分,应用举例,测定小麦的蛋白质含量(%),品种A测了10次,=14.3,s12=1.621;品种B测了5次, =11.7,s22= 0.135。问两个小麦品种的
28、蛋白质含量有无明显差异。 如果我们经过分析,得知两个小麦品种蛋白质含量的方差是显著不同的,因此采用近似t测验。,H0:12,HA:12。 显著水平取0.05,由于查附表5,t 0.05(11)=2.201由于tt0.05(11),P 0.05,所以,否定H0,肯定HA,说明两个小麦品种的蛋白质含量存在显著差异。,(2)成对数据的平均数比较,成对数据:若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。 在条件最为相似的两个小区或花盆、营养钵中进行两种不同的处理,在同一植株(或同一组织器官)的对称部位进行两种不
29、同的处理,或在同一供试单位上进行处理前和处理后的对比等,都将获得成对比较的数据。 半叶法测定光合速率,成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。 在分析试验结果时,只要假设两样本的总体差数的平均数d120 ,而不必假定两样本的总体方差12和22相同。,设两个样本的观察值分别为x1和 x2 ,共配成n对,各个对的差数为 d = x1x2 ,差数平均数为 , 则差数平均数的标准误 为:因而: 其df=n-1若假设H0:d0,则上式改为: 即可测验H0:d0。,应用举例,选生长期、发育进度、植
30、株大小和其他方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的饨化病毒效果,试测验两种处理方法的差异显著性。,H0:d0,两种方法对钝化病毒效果相同,HA:d0。 显著水平0.05,t(0.05,6)=2.447。,|t|t 0.05(6),P0.01,所以,否定H0,接受HA,两种钝化病毒方法有极显著差异。,作一尾测验的实例,研究新肥料能否比原肥料皮棉亩产量增产5kg。选土壤和其它条件最相近的相邻小区组成一对,其中一区施新肥料,另一区施原肥料,共9对。试测验新肥料能否比原肥料每亩增产5kg以上皮棉?,H0:d5,新肥料比原肥料亩产
31、量增产不超过5kg;HA:d5kg 显著水平取0.05,t0.05(8)(一尾)t0.10(8)(两尾)1.86 。,tt0.05,P0.05,所以,接受H0,否定HA,新肥料比原肥料皮棉亩产量增产不超过5kg。,(3)成对数据和成组数据平均数比较的不同,成对数据是假定各个配对的差数来自差数分布为正态的总体,具有N(0, ),并且每一配对的两个供试单位是彼此相关的。 成组数据是假定两个样本都来自具有共同(或不同)方差的正态总体,并且两个样本的各个供试单位都是彼此独立的。 如果将成对数据按成组数据的方法进行比较,有时不能鉴别应属差异的错误。所以在应用时要严格区别。,四、二项资料百分数(成数)的假
32、设测验,许多生物试验的结果是用成数或百分数表示的 如结实率、发芽率、杀虫率以及杂种后代分离比例等。 这些百分数由计数某一属性的个体数目计算,属间断性的计数资料,与前面连续性的测量资料不同。 理论上,这类百分数的假设测验应按二项分布进行,但如果样本容量n足够大,并且np和nq都大于5时,二项分布趋近于正态分布,当np和nq都大于30时,可直接按正态分布处理,否则需要进行连续性矫正,再按正态分布处理。,(1)单个样本百分数(成数)的假设测验,这是测验某一样本百分数所属总体百分数 与某一理论值或期望值p0的差异显著性。 样本百分数的标准误 为:根据可测验H0:pp0。,应用举例,用紫花和白花的大豆品
33、种杂交,F2代共有289株,其中紫花208株,白花81株。问该试验结果是否符合一对等位基因的遗传规律? 如果花色由一对等位基因控制,则根据遗传学原理,F2代紫花株与白花株的分离比例应为3:1,即紫花株的理论百分数为p0.75,白花株的理论百分数为q0.25。,H0:p0.75,大豆花色遗传符合一对等位基因的分离规律;HA:p0.75。 显著水平取0.05,作两尾测验,u0.051.96。|u|u0.05,所以P0.05,接受H0:p0.75 同样可对白花株的百分数H0:p0.25进行测验,结果完全一样。,上面的资料也可直接用次数进行假设测验。当二项资料用次数表示时,np, 。np2890.75
34、216.75结果和上面一样,(2)两个样本百分数相比较的假设测验,这是测验两个样本百分数 和 所属总体百分数p1和p2的差异显著性。 一般假定两个样本的总体方差相等,即 。 设两个样本某种个体的观察百分数分别为 和 ,而两个样本所属总体该种个体百分数分别为p1和p2,则两个样本百分数的差数标准误为其中,q1=1p1,q2=1p2。 这是两总体百分数为已知时的差数标准误公式。,如果两总体百分数相同,即 p1= p2 = p , q1 = q2 = q在两总体百分数p1和p2未知时,则在 的假定下,可用两个样本百分数的加权平均值 作为p1和p2的估计。 两样本百分数的差数标准误为:由 可对H0 :
35、 p1 = p2 作出假设测验,应用举例,调查西瓜品种A 378株(n1),其中枯萎病株355株(x1),发病率93.92%( );调查西瓜品种B 396株(n1),其中枯萎病株346株(x1),发病率87.37%( )。问两个西瓜品种枯萎病的发病率有无明显差异。,H0 : p1 = p2 ,两个西瓜品种枯萎病的发病率无明显差异,HA : p1 p2 。 显著水平取0.05 ,作两尾测验,u0.05=1.96。uu0.05,所以P0.05,接受HA : p1 p2 两个西瓜品种枯萎病的发病率有明显差异,应用举例,杀虫剂A在1000头虫子中杀死657头,杀虫剂B在1000头虫子中杀死728头,问
36、杀虫剂B的杀虫效率是否高于杀虫剂A。 H0:p2p1,杀虫剂B的杀虫效率不高于杀虫剂A,HA:p2p1。显著水平取0.01,作一尾测验,u0.01(一尾) u0.02(两尾)= 2.326。,|u|u0.01,所以P0.01,否定H0:p2p1,接受HA:p2p1。杀虫剂B的杀虫效率极显著高于杀虫剂A。,(3)二项样本假设测验时的连续性矫正,二项总体的百分数是由某一属性的个体数计算出来的,在性质上属于间断性资料,其分布是间断性的二项分布。 如果把它当作连续性的正态分布或t分布处理,结果会有些出人,一般容易将无差异检测为有差异。 补救的办法是在假设测验时进行连续性矫正,这种矫正在 30时是必需的
37、。 经过连续性矫正的u值或t值,分别以uC 或 tC表示。,单个样本百分数的连续性矫正公式为两个样本百分数相比较的连续性矫正公式为如果为小样本时,可用连续性矫正后的t分布进行测验,单个样本百分数的dfn1,两个样本百分数相比较的dfn1n22。,应用举例,一批果树种子的平均发芽率为0.75(p0),现随机取100粒(n),用福尔马林浸种,共发芽86粒。问用福尔马林浸种对种子发芽有无效果(0.05)。 H0:pp0,福尔马林浸种无效果,HA:pp0 显著水平0.05,作一尾测验,u0.051.64。 p00.75,q010.750.25,np01000.7575,nq01000.2525 由于n
38、q02530,所以需要进行矫正。,uCu0.05,所以P0.05,否定H0:pp0 ,接受HA:pp0 。福尔马林浸种对促进种子发芽有明显效果。,应用举例,用新配方农药处理25头棉铃虫,结果死亡15头,存活10头;用乐果处理24头,结果死亡9头,存活15头。问两种处理的杀虫效果是否有显著差异? H0 : p1 = p2,假设两种处理的杀虫效果没有差异,对HA : p1 p2。 n1、n2均小于30,需作t分布的连续性矫正。 显著水平0.05,作两尾测验, df25242= 47,t0.05(47) t0.05(45) 2.014。,tC 0.05,接受H0 : p1 = p2 ,否定HA :
39、p1 p2 ,即两种杀虫剂的杀虫效果没有显著差异。,第四节 统计假设测验的两类错误,一、统计假设测验的两类错误 第一类错误: H0正确,而测验结果否定了H0 ,称为弃真,即处理间无差异,而测验结果表明处理间有差异。 第二类错误: H0错误,而测验结果接受了H0 ,称为纳伪,即处理间有差异,而测验结果表明处理间无差异。,第一类错误发生的概率为显著水平值。 假如显著水平取0.05,在无效假设正确的前提下,在 的分布中,会有5%的落在 之外,因而对一个正确的假设作出错误的否定的概率就是显著水平0.05。 我们规定0.05为否定假设的概率标准,就是说明假设测验结论仅有95%的把握,同时有5%的风险把随
40、机误差当作真实差异。 如果采用更高的显著水平,如0.01或0.001,犯第一类错误的概率就会减小。,第二类错误的概率为值。 值的计算方法就是计算抽样平均数落在已知总体的接受区的概率(下图)。,已知总体的接受区域在c1和c2之间。从被抽样总体中抽得的 可能落在c1和c2间的概率为被抽样总体的抽样分布曲线与直线c1和c2以及横轴围成的面积,这个面积正是 落在总体接受区的可能性。 由于两个总体的平均数不同,这种可能性正是第二类错误的概率值。,举例,已知总体的均值0 =300,其平均数抽样标准误为15,被抽样总体的平均数= 315、标准误也为15,第二类错误概率值的一般计算方法为:,二、控制两类错误的途径 (1)采用一个较低的显著水平,如=0.05 如果为了减小犯第一类错误的概率而采用更高的显著水平,那么c1和c2就会分别向外移动,从而增大值,也就是增大了犯第二类错误的概率。,(2)降低标准误 标准误 决定分布曲线的宽窄, 越小,曲线越窄,两个总体分布曲线的重叠程度减小,犯两类错误的概率也就会减小。主要措施: 采用合理的试验设计,严格的试验管理,降低。 增加重复数,增大样本容量。,