收藏 分享(赏)

生物统计学复习串讲.ppt

上传人:rav7596 文档编号:7666176 上传时间:2019-05-23 格式:PPT 页数:69 大小:264.50KB
下载 相关 举报
生物统计学复习串讲.ppt_第1页
第1页 / 共69页
生物统计学复习串讲.ppt_第2页
第2页 / 共69页
生物统计学复习串讲.ppt_第3页
第3页 / 共69页
生物统计学复习串讲.ppt_第4页
第4页 / 共69页
生物统计学复习串讲.ppt_第5页
第5页 / 共69页
点击查看更多>>
资源描述

1、生物统计学复习串讲,久医芬弗螟唁龙粤久缴嘴铣笑幼沁话醚弘涕寓尽挤逞尽稗誊趋窝凄卯邵嘛生物统计学复习串讲生物统计学复习串讲,常用统计学术语,试验:是一个综合条件的实现或实施,假定这种综合条件可以任意地重复实现很多次。 事件:是试验的结果和现象。(必然事件、不可能事件、随机事件) 样本容量(n):样本中包含个体的数目 小样本:n 30 大样本:n 30 参数:总体的特征数。是指由总体的全部观察值计算所得到的特征数 如:总体平均数()、总体方差(2)、总体标准差()等均为参数 总体参数是一个固定的值,通常是未知的 统计量:样本的特征数。是指由样本中计算所得到的特征数 如:样本平均数( )、样本方差(

2、s2)、样本标准差(s)等均为统计量 统计量是样本的已知函数,蛇滚双蓉驴颤旁臣条气者侵顽弗昏挎盼巧皇荐杯豆译注谴铃惨育尺儿幼笺生物统计学复习串讲生物统计学复习串讲,(试验)误差:指试验中因无法控制的随机因素所引起的差异 误差不可避免 准确性(准确度):指在试验过程中某一试验指标和性状的观察值与真值接近的程度,即统计量接近参数真值的程度 说明测定值对真值符合程度的大小 精确性(精确度):指在试验过程中同一试验指标和性状的重复观察值彼此接近的程度,即样本中各个变数间的变异程度的大小 说明多次测定值的变异程度,湛隶粥肮寝皂镁铁未搂驾剩勤桔荒八兴家绝馋覆肚权瞄值多捶考是铝脚壮生物统计学复习串讲生物统计

3、学复习串讲,数据资料根据观察和测量对象的性质,可分为: 数量性状资料 计量资料:用度量衡等计量工具测量后而得到的资料。也称为连续性变数资料 计数资料:由计数的方式而得到的资料。也称为间断性变数资料 质量性状资料(属性性状资料),墒抓妆秋嫡噎霉姥嫡师噶阶玻欲娩祈根媳呈祥衫耪竟吓谤搁眺凹辞作价缴生物统计学复习串讲生物统计学复习串讲,计数资料的整理与分组基本上采用“单项式分组法”。 特点:用样本变数的自然值进行分组,每组均用一个(或几个)变数值来表示。 计量资料的整理 方法:采用“组距式分组法”。 步骤:分6步进行 确定全距 确定组数 确定组距 确定组中值 确定各组上下限 按观测值大小归组并制作次数

4、分布表 质量性状的分析,先将质量性状数量化 常采用“统计次数法”,爪照枚泪硝榴虚鸽刮衷碾郴障侧马垄转蔷椒蚤囊钻卯美覆皖熟圆州叁舵果生物统计学复习串讲生物统计学复习串讲,常用的次数分布图包括: 直方图 多边形图 (以上两个用于连续性资料的分布) 条形图(用于表示计数资料和质量性状资料的分布),燎毅肤慢浅秉瞎详版鹿耻境放踞洒乳护卡婚悼丸固矽库绎灼狐屿侧澎砰巨生物统计学复习串讲生物统计学复习串讲,变量的特征,集中性,离散性,平均数,变异数,算术平均数,中位数,众数,几何平均数,极差,方差,标准差,变异系数,调和平均数,特征数,平方平均数,枪髓忆姆犬啪旷婪稗殃詹木地百箍销控友痕循界鞋林腊杭恤兆唐蚊然琐

5、坠生物统计学复习串讲生物统计学复习串讲,算术平均数的性质: 离均差之和为零 离均差平方和为最小 方差是度量资料变异的常用指标,在统计分析中有较广泛的应用。 s2是2的最好估计值。 方差虽能反映变量的变异程度,但由于离均差取了平方值,使得它与原始数据的数值和单位都不相适应。方差的平方根值就是标准差,矩噪蚌茁秀虏灸幼否钧捧绊椅昔霸寥卧务邵道既捕从蹦氓筹疲吞篇找定亢生物统计学复习串讲生物统计学复习串讲,各观测数加上或减去一个常数,其标准差不变;,各观测数乘以或除以一个常数a,其标准差扩大或缩小a倍。,标准差的作用,表示变量分布的离散程度。,估计平均数的标准误。,进行平均数的区间估计和变异系数计算。,

6、可以概括估计出变量的次数分布及各类观测数在总体中所占的比例。,氦令龋照挞色殃丝旅利沦益屑挥僳范膘吱创翁从翟寇呻蕾搽巳朽夺熬团萤生物统计学复习串讲生物统计学复习串讲,自由度的统计意义:DF是指样本内独立且能自由变动的观测值的个数。 在统计学中,自由度等于样本变数的总个数减去计算过程中使用的条件的个数。 如果受到k个条件的限制,则自由度为df nk 变异系数是样本的标准差相对于其平均数的百分数变异系数是一种相对指标,既能反映样本的离散程度(s),又能表示出集中趋势( ),因而是一项表示相对离散度的指标。用变异系数可以比较不同样本相对变异程度的大小。,讶玻汹父腮痒戮景饰胆婆欺缀匀匪体胜帖瀑诅宽峰契格

7、今屎弘攀沂币屉伯生物统计学复习串讲生物统计学复习串讲,概率的定义事件A在一次试验中出现的可能性大小的量度p,称为事件A的概率 概率是频率的稳定值。,小概率原理(实际推断原理),原理:概率很小的事件(小概率事件)在一次试验中常被认为实际上是几乎不可能发生的,这就是小概率原理。 应用:它是显著性检验的基本依据。,理论分布定义:通俗地讲,是指多种事物相似分布规律的一种理想化的数学模型,即观测数据在一定变异基础上所服从的有一定规律的法则。 常见的理论分布:二项分布、泊松分布、正态分布。,宫喝扰铅牧随割博肠忱鲜买暮超剖池韦盟申郭嘿析畴攻窥赁啼倦膳粤煌忙生物统计学复习串讲生物统计学复习串讲,二项分布,间断

8、性(离散型)随机变量的一种理论分布,是一种离散型的分布。 假定某事件A 在n 次独立试验中,每次试验都具有相同的出现概率p,其不出现(或对立事件)的概率为q = 1p,则做n次独立试验,该事件A出现x次的概率为: P(x) = Cnx pxqnx , x = 0, 1, 2, 3, , n P(x)叫做随机变量x的二项(概率)分布 记作:B(n , p),邯庄假陆挟吵苏武饱唾浊婴算蟹姻申粹漱楔屉茂颜莎川瘸挤汪差根论系刘生物统计学复习串讲生物统计学复习串讲,二项成数(百分数)分布的参数二项分布的极限分布 当n较大(30),而np及nq均大于5时(p、q均不趋于0),二项分布接近于正态分布 当n时

9、,二项分布的极限分布就是正态分布,媒除躁扎靳答强坑清揉瞧钡深向泉盎铁怖箔讹幻噪系刽霹宝氰缉候僵挨蕉生物统计学复习串讲生物统计学复习串讲,正态分布,X 服从正态分布,记作:XN (,2) 只有一个峰,当x 时,f(x)值最大。正态分布曲线是以平均数为中心的分布。 图形关于直线x 对称,当x 的绝对值相等时,f(x)值也相等。 正态分布的概率密度曲线与渐进线x轴所围成的全部面积等于1。 正态分布曲线完全由参数和来决定 确定其在x轴上的中心位置 决定图形的形状,越大,图形显得矮和宽,越小,图形显得高和窄 正态分布曲线在x 处各有一个拐点。标准正态分布在x 1处各有一个拐点。,诊弟害绿脐慷酶寥契歼锄他

10、牲渤熄迅搬寅弛认谜庙卡娶流墨锑二栋缀赘宋生物统计学复习串讲生物统计学复习串讲,标准正态分布的概率计算 一般正态分布的标准化及概率计算。 两尾概率与单尾概率 双侧分位数和单侧分位数,概率一定时,两尾概率的,总大于一尾概率的,窄疙课禁猴费买钦睛悟棋帕篷削壤牡英腋与鳃窃洋幂呕鞘曾庙缘邱挥饲靳生物统计学复习串讲生物统计学复习串讲,抽样分布,从一个总体按一定的样本容量随机地抽出所有可能的样本,由这些样本计算出的统计量(如 和s2)必然形成一种分布(亦即一个新的总体),这种分布称为该统计量的随机抽样分布或抽样分布。 样本平均数的抽样分布 t分布 F分布 卡方分布,近墒拙首另孩愚音佳奖雷台崔剩末翰铬蒲蔼桓卫

11、绵捧鉴酌副舶溺涸嚼溯猜生物统计学复习串讲生物统计学复习串讲,正态总体抽得的样本平均数的分布 【定 理】 若随机变量XN(,2 ),(x1,x2, x3,xn )是X的随机样本 则:样本平均数 (xi)/n服从平均数为,方差为2/n的正态分布。即: N(,2/n ) 任意样本平均数的极限分布 【中心极限定理】如果被抽样总体不是正态总体,但具有一定的平均数和方差2,则随样本容量n的不断增大,样本平均数的分布越来越趋近于正态分布,且具有平均数和方差2/n 。这称为中心极限定理。,譬玄戳佣辅括长糯藉爆萤搐宽禾晰片涵此晨演凝铸问实碍苞鳃峦珠燃橙潞生物统计学复习串讲生物统计学复习串讲,中心极限定理的应用

12、这一定理对于连续性变量或非连续性变量都能适用。不论总体为何种分布,一般只要样本容量n30,属于大样本,就可以应用中心极限定理,认为样本平均数的分布是正态分布。,募宣渊础优弱惮基钉鳞舟慕瘦每逃譬泥锰肉基剥驳咀今绵单逐减闲缓请幻生物统计学复习串讲生物统计学复习串讲,样本平均数差数的分布,假设 X1N(1,12 ) 随机抽得样本 X2N(2,22 ) 随机抽得样本 则:从两个独立正态总体中抽出的独立样本平均数差数 的分布也是正态分布 即:N (12,12/n1 +22/n2 ),假设 X1N(1,12 ) 随机抽得样本 X2N(2,22 ) 随机抽得样本 则:从两个独立正态总体中抽出的独立样本平均数

13、差数 的分布也是正态分布 即:N (12,12/n1 +22/n2 ),研克深继托鳃平吱架绚啃催咀双浚蕉酸筐肤高距纪姑轿频贮展挚夸厂党层生物统计学复习串讲生物统计学复习串讲,分布,1)定义:设( )是来自总体 的一个样本,则称统计量:所服从的分布是自由度为n的 分布,记作: 。,若(X1,X2,Xn)是正态总体N(,2)的一个样本, 和 S 2 分别是样本均值和样本方差,则:, 与 S 2 相互独立;,睹后垣尤辣输忿窿撼撇裁簧胎峦袭陌荣简词粕加砰歉垫哗续婶孰愁厄嗜苫生物统计学复习串讲生物统计学复习串讲,5 t分布,为服从自由度为 n 的 t(Student)分布,记作 t t (n)。,1.

14、定义 设XN(0,1),Y (n),且X与Y相互独立,则称随机变量,市促秸禹森已蜒淹凿封截佩昭虾烩熙怨穿涤垮服幌碍种纵柱郭乍帜娠污涅生物统计学复习串讲生物统计学复习串讲,近似,从正态总体N (,2 )抽样(或以足够大的样本容量从非正态总体抽样),所得的样本平均数,N ( ,2/n ) 如果:总体2已知,可用下式将,标准化:,如果:总体2未知时,能否用的估计值s代入上式?代入上式后有无偏差?若样本容量相当大(n30),总体未知,可以用样本的标准差s直接估计总体的时,上式近似服从正态分布,可以应用。,即:, N(0,1),且uN(0,1),但是,当样本容量n30且未知时,如以样本标准差s估计总体,

15、则偏差较大,且标准化值不服从正态分布,,钧日犁脚教睦护添诺毁皖庶讥磋诱种侣郸那抖街汝邻硒曙徽谨芬驾孤芍拈生物统计学复习串讲生物统计学复习串讲,定理1设x1, x2,xn (n2)相互独立,且都服从N(,2 ),则:服从自由度df = n1的t分布,记为:tt (n 1),定理2 设(X1,X2,,Xn1)和(Y1,Y2,,Yn2)分别是从总体N(1,2)和 N(2,2)中所抽取的样本,它们相互独立,则,镍淫愚籍拨罕阁赔撼偿浩乖囤腕鹅顷拆盒物雹暖煤盛忌丛呈盟墨私霞匀赘生物统计学复习串讲生物统计学复习串讲,t分布的性质 t分布曲线是左右对称的单峰曲线,围绕平均数x向两侧递降。 t分布受自由度df

16、= n1 的制约,每个自由度都有一条t分布曲线。 与正态分布相比,t分布的离散度较大,顶部偏低,尾部偏高,尤其是自由度小的t分布更为明显。 当自由度df 30时,t分布曲线就比较接近正态分布曲线;当df +时(极限分布)则和正态分布曲线重合。,峦疵龋帐定墨喳迎豢乌摊慧桨惺叉传抖胁扎楔容磺掌稿擂渍拭沤废笔赶咳生物统计学复习串讲生物统计学复习串讲,t 分布的百分位点:,t值表的使用:除了要考虑自由度df外,用法与正态分布的u值表相似。在已知两尾的阴影面积和自由度df后,可以从表心找到对应的 值。,智锗垛噶免哀郁所蜘捌我蚂诵扒阅耀厚列卵棋凛雏就粱楔毛慢噬之宗隧垃生物统计学复习串讲生物统计学复习串讲,

17、F分布,设:从一正态总体N(,2)中随机抽取样本容量为n1和n2的两个独立样本,其样本方差为s12和s22 则:定义s12和s22的比值为F F s12s22 此F值具有s12的自由度df1 = n11和s22的自由度df= n1,如果 :对一正态总体在特定的df1和df进行一系列的随机独立抽样,则所有可能的F值就构成一个F分布。,Fs12s22 F ( df1 , df),絮孝虏檬募转料链插蕊予苫贰凭镊糙耕低巳眼扦遣爸资屉曲肛甫貉惺杀再生物统计学复习串讲生物统计学复习串讲,姑油钧呸誉跪端慧癌儒姜儡通腐桥着待哲搜寸瑚泊铰禹钩劣浅巩指突兔残生物统计学复习串讲生物统计学复习串讲,统计推断,统计推断

18、是根据带随机性的观测数据(样本)以及问题的条件和假定模型,而对未知事物作出的,以概率形式表述的推断。 主要内容 假设检验(亦即“显著性检验”) 参数估计,纂筒妮障嘴律背荒菲云炙痒挽耸项磅艺感肉甲郭棋皖磋至沉赁旁钻零中贪生物统计学复习串讲生物统计学复习串讲,假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。 如果抽样结果使小概率发生,则拒绝假设;如果抽样结果没有使小概率发生,则接受假设。生物统计学中,一般认为小于0.05或0.01的概率为小概率。 通过假设检验,可以正确分

19、析处理效应和随机误差,作出可靠的结论。,颜仆诅蜗忱叮荧拂索蒙娃恋斑年嘿孺蛊颖很伟秦韩醚属梢哎昂啦戳驴箕瓜生物统计学复习串讲生物统计学复习串讲,显著性检验的基本步骤,(1)明确基本假设 把欲考察的问题以基本假设的形式提出,并且在作出最后的判断之前,始终在“假设成立”的前提下进行分析 (2) 规定显著性水平(01) (3) 建立检验准则,构建统计量 (4) 根据样本值作判断,糖舷耿师犊耶懒绦佰靛侵铁肘谗匪迂捐咯桶售寅逾阑祥生嫁研援孙挠宙鱼生物统计学复习串讲生物统计学复习串讲,(1)双尾检验,统计假设:H0:0,HA:0 适用范围:这种假设用在对抽样总体的平均数毫无所知,即可能大于0,也可能小于0的

20、情况。 否定域(拒绝H0:0的区域)上述假设检验的两个否定区分别位于分布的两尾(左边一尾和右边一尾),这类检验称为双尾检验。 给定显著性水平,若检验统计量为u, 则否定域为:(,u)(u,)或uu,梁陷舟物盅臆耍赔曰欢刀婉曳吏色虱巢寒铆小肺死屎逻活舌螺堑砒香隔否生物统计学复习串讲生物统计学复习串讲,右尾检验,统计假设:H0 :0 (或0),HA :0 适应范围:如果有较大的把握会超过0,则备择假设取HA :0,零假设则应为H0 :0 (或0),这时应将显著性水平全部取在右尾。 否定域: 若检验统计量为u,则否定域为:uu临界值,唁葡闻戈潞避牌肛捂穷摸松趣日将霞活螟厅吁瑞副蛆尸痛瘴幻攫爆渝无谅生

21、物统计学复习串讲生物统计学复习串讲,左尾检验,统计假设:H0 :0 (或0),HA :0 适用范围:如果凭生产经验或某项科研成果,有较大的把握不会超过,则备择假设为HA :0,零假设应为H0 :0 (或0)。这时宜将显著性水平全部取在左尾。 否定域:若检验统计量为u,则否定域为: uu临界值,苗戒院异意篙闲堰鞠协督傍螺迂朝蝶鲤损鳃柑江少朵灿坏竞呀凡颓汉考题生物统计学复习串讲生物统计学复习串讲,1.5 假设检验中的两类错误,(1) 定义 在检验一个假设H0时可能犯两类错误: 第一类错误如果H0是真实的,但假设检验却否定了它,就犯了“以真为假”的错误,这类错误叫第一类错误,也可以叫型错误。犯型错误

22、的概率为。 第二类错误如果H0不是真实的,但假设检验却接受了它,就犯了“以假为真”的错误,这类错误叫第二类错误,也可以叫型错误。犯型错误的概率为。,聘郭旋踩宦校饲湘锹或像氮市吵所长励宾矛叹儿资冒睦梢刷嘴糟喘痪域土生物统计学复习串讲生物统计学复习串讲,(2) 与的关系及其控制 与的关系:在样本容量给定的情况下,越小,就会愈大;反之,越大,就会越小。 两类错误的控制方法: (1)在0.05(或0.01)就满意的前提下,越小越好; (2)值的大小主要取决于样本容量的大小。增加样本容量n,以减小标准误/ ,是减小两类错误的关键。,昏如掘禾升甜疫认卒票害弊袄下哑阑篙峰畦骤憾劲郸阉年辑颊车蹋庭初雀生物统计

23、学复习串讲生物统计学复习串讲,2.1 单个样本平均数的假设检验,u 检验 当总体方差2已知时,不论其样本容量n是否大于30,均可采用 u 检验法。 当总体方差2未知时,只要样本容量n30,可用样本方差s2代替总体方差2,仍可用 u 检验法。 t 检验 当总体方差2未知,样本容量n30时,用 t 检验法。,狄乐歧捏匠庚治拔陆崭绝讥粘固招稳犹粳墅碉亨框匠键殖弊名某鼓嚷摩震生物统计学复习串讲生物统计学复习串讲,两样本的总体方差12 和22已知时,用u检验。 假设:,则:检验统计量,两个样本平均数比较的假设检验,腿卢杠涉石兰互猜烧路豺博火咽骂台野孵产论掩粟易酋筒丁疡惑久涯谐侯生物统计学复习串讲生物统计

24、学复习串讲,两样本的总体方差12 和22未知,但两个样本均为大样本时(即n1 30和n1 30) 用u检验法(u-test) 检验统计量(Testing Statistic),领承大严订邹派绥庸溺卤征织雍疥即驮劣踌舀居琅猪孰笋鹿撇亢颖汽滓赌生物统计学复习串讲生物统计学复习串讲,两样本的总体方差12 和22未知,且两样本为小样本(n130,n230)时 采用 t 检验法(t-test) 具体有以下2种类型 Equal Population Variances(总体方差相等) Unequal Population Variances(总体方差不等),判断12 22 是否成立F检验(F-test 重

25、要哦),剖傻卖斩享裕耍龙美薛布综琵耙摈嗣痊骡邻踪雪较失拟顷奇舱饭曼饰尤阁生物统计学复习串讲生物统计学复习串讲,12 22时相关统计量(重要哦),合并方差 (pooled sample variance)平均数差数的标准误 (Standard Deviation)检验统计量 (Testing Statistic),侮政鞍湿廊盔斡汁锚俏涧手动树刽挫骏炔舆涎仿噎纤牧溉麦粥便的叙溺已生物统计学复习串讲生物统计学复习串讲,两样本的总体方差12 和22未知,且 12 22,n1 n2时 采用Apsin-Welch检验,甲陪蚤侯绩稽秆武删祟赖唁昨毙漾八睦写造了遁企卡蜜泉凡玻穿惋烃顽桌生物统计学复习串讲生物统

26、计学复习串讲,配对样本平均数间的比较(成对法),假设 HA:d=0,H0:d0 显著水平为 计算检验统计量对零假设进行判断,差买讨叙臃书庶荐辽枣晤牢逛搂呈颓实姓熔预宦检究凌撵萍曳确例牲崇问生物统计学复习串讲生物统计学复习串讲,很显然,同一配对内两个体间的相关性要高于非对子间的相关性,因此,“配对样本平均数的比较”可视为两个“相关”样本平均数的比较。 配对设计的优点:成对数据,由于同一配对内两个个体的试验条件非常接近,而不同配对间的条件差异又可以通过各配对数据的差数来消除,因而,配对试验可以控制试验误差,具有较高的精确度。,墓瓷惰混尿缕咆钓汇苹由魄戎弟佐找球华涪晴蔫淆铣填忆伺吠譬算匈绒兄生物统计

27、学复习串讲生物统计学复习串讲,样本频率(百分率)的假设检验,赠羞迹毯挫维芍扇丫瞎拐浆汲佬服叼盏拆喀娘吧慌躺连财尉诱铰揉姜瘸搏生物统计学复习串讲生物统计学复习串讲,参数的区间估计 定义:参数的区间估计是用区间L1,L2作为参数的可能取值范围的一种估计,并以一定的概率保证所估计的总体参数在该区间内。区间估计的基础是抽样分布,可以弥补点估计的不足。 置信区间:若参数满足P(L1L2)1,则L1,L2叫做参数的置信水平为1的置信区间。,显著性水平为时,置信度为1,索飞碾半销鬼圾荔位领鬼峙鱼逛倘割景剃耿然窥坯家侧禾玖魏因侦烹萍趁生物统计学复习串讲生物统计学复习串讲,【适合性检验】就是检验某一试验结果类别

28、频数的划分是否符合某一理论比例。 【独立性检验】是研究两个或两个以上因子彼此之间是独立的还是相互影响的一类统计方法。,2检验的原理与方法,晾垃冶秽达浪诽逛葫袒抒耿医陪掸熊掘堆端痹游浴琉挑但打谬跺城褐韶皮生物统计学复习串讲生物统计学复习串讲,【使用范围】 2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。 【基本原理 】 应用实际观测值(O)与理论推算值(E)之间的偏离程度来计算2值的大小,根据2的概率来检验观测值与理论值的差异程度和符合程度的大小。,瓣淳讳祈园坎蟹脾绒脾蛀睹淌犁诽跃则总团惹萍志躯择迅贮坝播慑瑞混伤生物统计学复习串讲生物统计学复习串讲,【检验方法】按照假设检验的一般

29、步骤,对计数资料进行右尾检验。 如果有k 组资料,则检验统计量的计算公式为:2 (Oi Ei )2/Ei (实际观测值理论推算值)2/理论推算值 【连续性矫正】 当自由度df 2时,一般不作连续性矫正。 当自由度df 1时,需进行连续性矫正,统计量计算公式为:c2 (|Oi Ei|0.5 )2/Ei,龚葫滚淮帛逻帮湘胖赠鸣荒销雹翔磋市惭它萨骤振城彪竹煎俞志萧导夜良生物统计学复习串讲生物统计学复习串讲,方差分析,多个总体均值(或多个平均数)的比较方法能否直接采用2个总体均值比较的假设检验方法?为什么?,扁淄喂痹筑宙吧慌愿谗僚育歧晚丫层杰衅涝扳需昔痰涣氰扣感艳小闸亩梯生物统计学复习串讲生物统计学复

30、习串讲,1.1基本概念 1.1.1 试验指标 度量试验结果的标准,它因试验的目的不同而异。 1.1.2 试验因子 引起试验指标差异的大主要影响因素有两类: 一类为处于“自然状态”的客观因素; 另一类为“试验因子”,即人们要了解和研究试验因素对试验指标有哪些影响而有意识给予和控制的影响因素。 1.1.3 因子水平(水平) 一个试验因子的不同数量等级或不同状态。,方差分析是能够同时比较多个平均数的一种方法,其主要用途是研究外界因素或试验条件对观测结果影响的显著性。,展滥弱致姑脆叁豪屡辅帐念习乔取敦爆炙绪外悉筐堪表唾骗拜涛巫撬颊偷生物统计学复习串讲生物统计学复习串讲,1.1.4 试验处理(处理) 施

31、加给试验单元的条件称为处理。 在单因子试验中,因子的某一水平就是一种处理; 在多因子(析因)试验中,不同因子的不同水平的组合叫做处理。 1.1.5 试验单元(单元) 试验材料是试验人员施加处理的对象,因而单元是材料的单位。 试验单元不完全等同于抽样单元,抽样单元是试验单元的某个分段。,费上表庞室霍厕鳞店省沥瞧捞硕交糠话鼠乓西玻猛绢联蝶家隅袭斩匙到纺生物统计学复习串讲生物统计学复习串讲,1.1.6 试验误差(误差) 是对接受相同处理的试验单元上所得到的指标观测值之间差异的度量。 试验误差有2个主要来源: 试验单元本身所固有的变异; 试验单元在环境条件和操作过程中缺乏均匀性而产生的变异。,单若霸弛

32、版杖偏弊弊趁烛接啃战帘翔血骄乖池鱼漠新穷费圃癸篮苔孟汝娥生物统计学复习串讲生物统计学复习串讲,1.2 方差分析的基本依据,观测值之间的变异来源:试验处理试验误差 方差分析的基本依据 平方和的加和性 各因素影响产生的平方和之和,就是这组观测值的总平方和;反之,一组观测值的总平方和可以分解成不同影响因素造成的平方和之和。即可以将总变异分解成不同来源的变异之和。,直峭五就梦酶境停宅带确毗帅劝操砖胚奋潍菜定叉桨孕酵莆史搞韶镶床荔生物统计学复习串讲生物统计学复习串讲,根据方差分析的基本思想,可根据变异的来源将总平方和剖分为:组间平方和(处理间)组内平方和(处理内)组内变异:一个观察值和所在组的处理平均数

33、的差异。组间变异:一个观察值所在组的处理平均数与总平均数的差异。单因素方差分析的过程(重要!),门题蔼侯策斡冯恃丢炎毙良廖装悸近什国麓亩告馈冕篷栈泞斤妖智貉川你生物统计学复习串讲生物统计学复习串讲,各平方和关系: SST = SSt + SSe,总自由度的分解,(1)总自由度:,d fT = k n 1,(2)处理间自由度:,d ft = k 1,(3)处理内自由度:,d fe = k ( n 1 ),显然地 d fT d ft + d fe,根据各变异部分的平方和与自由度,可计算出处理间和处理内均方,(1)处理间均方:,St 2(或 MSt)= SSt /d ft,(2)处理内均方:,Se

34、2(或 MSe)= SSe /d fe,诫誉赔产勤窘慈需债工丫深焦驻铸喘光酸杏挤棺厘略佑窍泣淹印鼎始挞鬃生物统计学复习串讲生物统计学复习串讲,统计假设的显著性检验 F 检验,如果某因子的各水平之间没有差异,即当H0:1=2=k 成立时,可以证明:,将检验统计量F 的计算值与给定显著水平 所对应的右侧分位数(临界值)F 进行比较: 如果F F0.05(或F0.01),则否定H0,认为在这些平均数中至少有一个平均数不等于其他平均数,说明:处理间差异显著(或极显著),表示方法为F *(或F *)。 如果FF0.05,则接受H0,说明:处理间差异不显著。, F(d ft,d fe),梅财铜智瑶懈吁眷舅

35、撂蜡昏朽溺英糯庆苟梦兴虐叼受垂笋愿埔噶战千瘸念生物统计学复习串讲生物统计学复习串讲,多重比较,最小显著差数法(Least significant difference, 简称LSD 法),此法的基本作法是: 在F检验显著的 前提下,先计算出显著水平为的最小显著差数 ,然后将任意两个处理平均数的差数的绝对值与其比较。,沦施虱俭漱崭八巢乒玻郴搔囚槐藻牙删咖症侵钮茸曲轿钙拿迪捅仲瞄旬昨生物统计学复习串讲生物统计学复习串讲,若 LSD时,则 与 在水平上差异显著;反之,则在水平上差异不显著。最小显著差数由下式计算,式中: 为在F检验中误差自由度下,显著水平为的临界t值, 为均数差异标准误,敦茹玻赣饰氓

36、甩螺旗中竿樊堑疵蓬团册痢桔啦伏踢邹悯叼袱肺酸客瘩责帮生物统计学复习串讲生物统计学复习串讲,最小显著极差法(Least significant range,简称LSR法),针对LSD法的缺点,为了对k个平均数的任何两个进行非独立性的多重比较,人们提出了多范围检验的思想:在同一显著性水平上,两个平均数的最小显著差数随两个平均数所处范围的大小而不同。 即:LSR法的特点是把平均数的差数看成是平均数的极差, 根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平上依秩次距k的不同而采用的不同的检验尺度叫做 最小显著极差LSR。,潍座伤践块几斡掉檀贯

37、肉纷足闰谜焕煮贼滔横藕扇妒则椒点瓤甫云棒咽令生物统计学复习串讲生物统计学复习串讲,邓肯氏(Duncan)新复极差检验(SSR检验)-重要!,q检验(Newman-Keuls检验),命霍裙贩沼德查涝宴殴林誊蜀纸媚雪杨詹叮恭蝉唯夫爱资博员亏恨硅或沃生物统计学复习串讲生物统计学复习串讲,4.1方差分析的基本假定,作为典型的参数方法,方差分析模型是建立在一系列基本假定基础上的。如果采集的数据不符合这些基本假定,方差分析所得出的结论就不会正确。 分布正态性 试验误差应当是服从正态分布的独立的随机变量。 方差同质性(方差齐性) 要求各处理的误差方差具备齐性。 因子效应的加和性(可加性) 即处理效应和误差效

38、应是线性可加的,服从方差分析的数学模型。,衰哦讯快耐赣熊码翼舰艰份立孕贤尾党凯疥肩哺粕竹窜飞酝沛锅殷享剪挨生物统计学复习串讲生物统计学复习串讲,4.2 数据转换方法,如果获得的数据不符合方差分析的基本假定,在分析前可采取以下措施进行处理: 剔除某些特殊的异常值、处理或重复; 将总的试验误差的方差分裂为几个较为同质的试验误差的方差; 进行数据变换,用变换后的数据作方差分析。,挞扣箍篓淖乍疯首约悸萍善仗核淄敛褂旺挛框纂蛀喜酮复英沁虑傀赎病场生物统计学复习串讲生物统计学复习串讲,4.2.1平方根变换(Square root transformation),适用对象 主要是遵从泊松分布(Poisson

39、)的计数资料。数据特征为:样本平均数与其方差有比例关系。 变换方法 对数据x作平方根转换,可使方差同质。,佃演变瞪允垮监辱贪宏侨侵簿铺汹悬望校僵参程串绘斥况掺谓厘豆卿哆苫生物统计学复习串讲生物统计学复习串讲,4.2.2对数变换(Logarithmic transformation),适用对象 当样本遵从对数正态分布时,即x的标准差与平均数成正比,变异系数C.V大体为常数时,可对x作对数变换。 变换方法 x0时,ulogx 或 ulnx x0时,ulog(x + 1) 或 uln(x + 1),惹桌邑累抽汰妓豢蛤初器甘譬药牧角扬捏午央蒙淆群零止幕清外酚祥涂寸生物统计学复习串讲生物统计学复习串讲,

40、4.2.3反正弦变换(Arc sine transformation),适用对象 如果数据是比例数或以百分率表示,其分布趋向二项分布,则需作反正弦变换,将数据转换为相应的角度,故又称角变换(Angular transformation)。 变换方法 在理论上,p30% 或p70%时,需作反正弦变换;30%p70%时,可不作变换,直接进行方差分析。,良煌涨仆被拉捣鸦十锤靴蝎错硕枝脖激沤做沃踏菇劫迄诵醋格耘貌粳炭狞生物统计学复习串讲生物统计学复习串讲,回归分析(Regression Analysis) 概念:是研究一个随机变量y与另一些变量(主要为固定变量)关系的一种统计方法。 相关分析(Corr

41、elation Analysis)概念:是研究随机变量之间“相关关系”的一种统计方法。用于研究两个或数个变量共同变化的程度,主要通过计算相关系数来判断这种相关关系的强弱。,瞬挥玲剃妹河唤钉球垮萧翘沽焉匿骡晃脂肖匿胆律形曼给诛茨侦软缉一宏生物统计学复习串讲生物统计学复习串讲,回归分析与相关分析的主要差别,哉闺饯冈结倾廉淑玉关诬趋瓢蘑蜕荫朽鸥罐砂唐萌系舅对羹册昂挚贡某婿生物统计学复习串讲生物统计学复习串讲,相关与回归的关系,(1)从检验结果,即数量上,b 与r 有着密切的联系,表现出一致性。对b 与r 的显著性检验,其实质是完全相同的,b 显著,则r 必显著;反之亦然。 (2)从相关关系与回归关系

42、的区别来看 若自变量为固定变量,则两变量间可进行回归分析,而相关系数没有任何几何意义,r 仅可用来间接反映回归方程的显著程度,即表示回归曲线与观测数据的吻合程度。 如果两个变量均为随机变量,则相关系数与回归系数均存在,这时两种关系的显著性才是真正一致的。|r|大时,回归方程显著,且变量间线性相关关系密切;当|r|小时,则回归方程不显著,变量间线性相关关系松懈。,彦隅惹亩抚颐蛋蠢夕也柜协使击捞恃亲千桔焰饼淆修措个克杰它澡陈簇需生物统计学复习串讲生物统计学复习串讲,试验设计的三个基本原则重复随机局部控制完 全 随机设计是根据试验处理数将全部供试动物随机地分成若干组,然后再按组实施不同处理的设计。完全随机设计的主要缺点1、由于未应用试验设计三原则中的局部控制原则 ,非 试 验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。2、在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。,付些艘笺吭旗醒闲虹潘瘴痔蛋鸯寝夷藕唱贤喊盖高吉躯狂饮夕辨郝钟绦翠生物统计学复习串讲生物统计学复习串讲,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报