收藏 分享(赏)

生物统计学 第五章 t分布.pdf

上传人:精品资料 文档编号:9985207 上传时间:2019-09-24 格式:PDF 页数:87 大小:1.44MB
下载 相关 举报
生物统计学 第五章  t分布.pdf_第1页
第1页 / 共87页
生物统计学 第五章  t分布.pdf_第2页
第2页 / 共87页
生物统计学 第五章  t分布.pdf_第3页
第3页 / 共87页
生物统计学 第五章  t分布.pdf_第4页
第4页 / 共87页
生物统计学 第五章  t分布.pdf_第5页
第5页 / 共87页
点击查看更多>>
资源描述

1、第 五 章 t分布与 t检验 第一节 样本平均数的抽样分布和 t分布 1. 抽样分布 1.1总体 和样本的关系 总体 样本(一般 特殊 ) 主要研究所抽取样本的 分布 ,亦即 变异特点(抽样分布) 样本 总体 ( 特 殊 一般 ) 主要从样本的结果去推断原来总体的结果 (统计推断 ) t分布 , 2必然形成一种 分布 (亦即 一个新的 总体 ),这种 分布称为该统计量的随机抽样分布或 抽样 分布 。 t分布 &t检验 实例 在一个 N=4的有限总体中,存在变数 2,3,3,4。根据 =x N和 2=(x-)2 N求得该总体的 、 2、 为: =3, 2=1 2, = =0.707 从 有限总体

2、作返置随机抽样 , 如果从中抽取 n=2的样本,共可得 41 41=16个样本;如果样本含量 n为 4,则一共可抽得 41 41 41 41=256个样本 。 当 n=2时的组合有: 2-3,2-3,2-4,3-3,3-4,3-4,4-3,4-3,4-2,3-3,3-2,3-2,2-2,3-3,3-3,4-4等共 16种组合。 分别 求这些样本的平均数 ,其次数 分布 下 表: 21t分布 &t检验 t分布 &t检验 在 n=2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为: =4/16=1/4=(1/2)/2= n=4时 : 316/0.48/ fxfx 1616/48148/)(

3、)( 22222 fNxfxffxf nxxnxx 2/214/12n/2 3256/768xnx /4/)2/1(8/1256/32 22 nx 42181t分布 &t检验 图 4-12 平均数的抽样分布 t分布 &t检验 1.4 样本平均数的抽样分布 特点 ( 1)正态总体抽样的样本平均数 定理 若随机变量 X服从正态分布 X (, 2), 1, 2, , 是 X的随机变量,则:样本平均数 =( ) 服从平均数为 ,方差为 2/n的正态分布,即: ( , 2/2) 。 t分布 &t检验 ( 2)样本平均数差异的分布 假设 : 1(1,12) 随机抽样 1 2(2,22) 随机抽样 2 则

4、: 从两个独立正态总体中抽出的独立样本平均数差数 (1 2)的分布也是正态分布, 即: (1 2)N(1-2, 12 1 + 22 2 ) 注意:两个独立样本平均数进行比较时 ,要根据总体的方差已知还是未知,以及两个总体的方差是否相等,选用不同的检验统计量 。 t分布 &t检验 ( 3) 任意 样本平均数的极限分布 中心极限定理 : 如果被抽样本总体不是正态分布,但具有一定的平均数 和方差 2,则随样本容量 n的不断增大,样本平均数 的分布越来越趋近于正态分布,且具有平均数 和方差 2/n,这就是中心极限定理 。 中心极限定理应用 :该定理对于连续性变量或非连续性变量都适用。不论总体为何种分布

5、 , 一般只要样本容量 n 30,属于大样本 , 就 可以用中心极限定理 , 认为样本平均数 的分布是正态分布。 t分布 &t检验 2 样本 标准误 = 的大小反映样本平均数 的抽样误差的 大小 , 即 精确性的高低。值越小越精确。可用样本标准差 S估计 ,即有 : 标准差 S和 样本 标准误 区别 样本标准差反映观察值 x1 x2 xn 等变异程度, 与 代表性强弱有关。 大样本资料用 表示 。 样本 标准误 是 抽样误差的估计值,反映了样本间变异程度的大小及 精确 性 。 小样本用 表示 。 )1(/)()1()( 222 nnnxxnnxxnSSxt分布 &t检验 3 t分布 ( 1)定

6、义 1, 2, , (n 2)相互 独立,且都服从 (, 2), 则 变量 = ( ) = ( ) (t值 )服从自由度 df=n-1的 t分布,记作 T t(n-1)。 t分布的密度函数 平均数和标准差 t 0 (df1), (df2) 图 4-13 不同自由度的 t分布密度曲线 212)1()2/( 2/)1(1)( dfdftdfdfdftf )2/( dfdftt分布 &t检验 ( 2) t分布的性质 t分布曲线是左右对称的单峰曲线,以平均数 = 0向两侧递降。 t分布受自由度 df=n-1的制约,每个自由度都有一条 t分布曲线。 t分布比正态分布离散度大,顶部偏低,尾部偏高,尤其是自

7、由度小的 t分布更为明显。 当自由度 df30时, t分布比较接近正态分布曲线;当df +时,则和正态分布曲线吻合。 t分布 &t检验 ( 3) t检验的适用条件 已知 一个总体均数; 可 得到一个 样本均数 及该样本 标准差 ; 样本 来自正态或近似正态总体。 ( 4) t分布两尾概率表(附表 3) 当 n=20,两尾概率 a=0.05时,查临界 t值: 0.05 20 =? t分布 &t检验 第二节 显著性检验的 基本原理 假设检验又叫显著性检验,包括 t检验、 F检验和 2 检验。 1.显著性检验的意义 饲喂相同饲料, 随机 抽测 10尾甲品种鱼 和 10尾乙品种鱼增重情况( g/mon

8、th) , 资料如下: 甲型鱼 : 11, 11, 9, 12, 10, 13, 13, 8, 10, 13 乙型鱼 : 8, 11, 12, 10, 9, 8, 8, 9, 10, 7 甲型鱼 平均 增重 =11, 标准差 S1=1.76; 甲型鱼 平均 增重=9.2, 标准差 S2=1.549。 能否仅凭这两个平均数的差值 11-9.2=1.8,立即得出 两品种鱼增重 不同的结论呢? 观测值 包含 两部分,即 = + 。 总体平均数 反映了总体特征, 表示 误差 。 t分布 &t检验 ix ix i it分布 &t检验 意义:由 一个样本平均数可以对总体平均数作出估计,但样本平均数包含有抽

9、样误差,用包含有抽样误差的样本平均数来推断总体,其 结论不可靠。而显著性检验可从试验的表面效应( - )与试验误差( )间接推断处理效应是否存在。 1x 2x2.统计推断 定义 : 根据 带有随机性的观测数据(样本)以及问题的条件和假定模型,而对未知事物 作出以 概率形式表述的推断。 主要内容: 假设检验(即“显著性检验”);参数估计 。 t检验、F检验、2检验 样本 1 样本 2(总体) 差异:本质差异(处理效应) or 试验误差? t分布 &t检验 3.统计假设 无效假设 ( ): 是直接检验的假设,是对总体提出的一个假想目标,又称为“零假设”。“无效”意指处理效应与总体参数之间没有真实的

10、差异,试验结果中的差异乃误差所致。 无效假设 的两原则: 无效假设是有意义;据之可算出因抽样误差而获得样本结果的概率 。 备择假设 ( ): 是和无效假设相反的一种假设,即认为试验结果中差异是由于总体参数不同所引起的 。 t分布 &t检验 统计假设 的一般形式 对一个样本平均数的假设 , 假设一个样本平均数 来自平均数为 的总体 , 可提出:无效假设 0 : = 0,备择假设 HA: 0 。 对两个样本平均数相比较的假设,假设两个样本平均数 1和 2分别来自平均数为 1 , 2的总体,则提出:无效假设 0: 1=2, 备择假设 : 12。 t分布 &t检验 4.假设检验 (显著性检验方法) 定

11、义 : 根据 总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后 对 样本 的实际 结果 进行 计算 ,作出在一定概率意义上应该接受的那种假设的 推断 。 如果 抽样结果使小概率发生,则 拒绝 无效 假设; 如果 抽样结果没有使小概率发生,则 接受 备择 假设。 假设检验 标准 : 一般 取 a=0.05和 a=0.01两个显著性水平。当零假设 0正确时,它被拒绝的概率不会超过 a。 方法 : t检验、 F检验和 2检验。 t分布 &t检验 未知 不完全知道 总体 理论分布 小概率原理 假设检验 无效假设 备择假设 a=0.05, or 0.01显著水平 发生:拒

12、绝无效假设 没发生:接受 是否发生小概率事件? 假设检验作用 : 通过假设检验,可以正确分析处理效应( 1-2)和随机误差( 1-2),间接推断处理效应是否存在,作出可靠的结论。 假设检验流程 t分布 &t检验 5、 假设检验的基本方法和步骤 以 一个总体的样本平均数为例,说明假设检验的方法和步骤。 例题 根据 以往的研究资料, 2龄鳜( gu)鱼的体长( cm) X N(30,100)。现从某湖泊获得一个容量为10尾的 2龄鳜鱼的样本,平均体长为 34.5cm。试问该湖泊中鳜鱼体长 =30是否 可信? 第一步 提出测验的假设和标准 本题中的无效假设( 0)是该湖泊现在平均体长( )等于原来的

13、平均体长( 0 ),即 = 0 =30。备择假设( )是 0 。 显著检验水平 a=0.05 或 0.01。 t分布 &t检验 第二 步 确定并计算 统计量 检验统计量 是 在 无效 假设 0正确的前提下,根据样本平均数的抽样分布构成并计算出的一个样本统计量。 本题 u = x 00n 总体标准误 x = 0n u = 34.5301010= 1.4230251.42 t分布 &t检验 第三步 根据数据分布性质,计算差异显著性时的临界值 本题 应用总体标准差 0 = 10,所以由正态分布转化为标准正态分布,应查正态分布的临界 u值 ; 0.05=1.96, 0.01=2.58 当 使用的是样本

14、标准误 时 , 则 分布转化为 t分布,应 根据自由度 df 和显著水平 a, 查 t分布的临界 t值。 t分布 &t检验 第四步 确定概率 P值范围,作出统计推断 当 P0.05或 0.01时,接受无效假设,否定备择假设,即样本和总体无差异;当 P0.05,认为鳜鱼体长 =30可信 。 t分布 &t检验 6.显著水平和两种类型的错误 6.1显著水平 用来确定是否接受无效假设的概率标准叫做“显著水平” 记作 a。 a 0.05和 a 0.01分别 称为 ”差异显著 ”和 “差异极显著” , 在 t值 (或 u值 )右上方 分别标 以 “ *”和“ *” , 否定无效假设, 表明试验 效应 由处

15、理 效应 引起 。 a 0.05称为 ”差异不显著” , 在 t值(或 u值)右上方以“ ns”或不标记 。 接受无效假设 , 表明试验效应 由试验误差 引起 。 t分布 &t检验 6.2 假设检验 中的两类错误 ( 1) 定义 在检验一个假设 0的时候,可能犯两类错误 :第一类错误 如果 0是真实,但假设检验却否定了它,就犯了“以真为假”的错误, 也 叫 型错误。犯 型错误的概率为 a。 把不显著判定为显著 。 第二类错误 如果 0不是真实,但假设检验却接受了它,就犯了“以假为真”的错误 ,也叫 型错误。犯 型错误的概率为 。 把显著判定为不 显著 。 图 5-2 两类错误示意图 t分布 &

16、t检验 显著性判定及其结果 总体特征 所作判定 判定正确 概率值 假设 H0 假设 HA H0 HA 真实 虚假 接受 拒绝 正确 大 真实 虚假 拒绝 接受 型错误 小( a) 虚假 真实 接受 拒绝 型错误 小( ) 虚假 真实 拒绝 接受 正确 大 t分布 &t检验 ( 2) a与 的关系及其 控制 a与 的关系 在样本容量给定的情况下, a越小, 就会愈大;反之, a越大, 就会愈小。 控制 方法 在 a=0.05(或 0.01)就满意的前提下, 越小越好; 值的大小主要取决于样本容量的大小。增加样本容量 n,以减少标准误 , 是减少两类错误的关键 。 t分布 &t检验 ( 3)显著性检验的应用 a值控制 严格 : 若 一个试验耗费大,可靠性要求高,不允许有反复,那么 a应该取小些;若一个试验的使用事关重大,容易产生不良后果, a应该取小 些 。 a值控制 宽松 : 一 个条件不易控制、容易受随机误差影响的试验, a应该取大些,可放宽至 0.1,甚至到 0.25。 比如 为了防止某新制的疫苗疗效错判为有效,应当让 a取小些;在珍惜水产动物中华鲟做试验,数量有限,可以让 a取大 些 。 t分布 &t检验 t检验作业

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报