1、1. 什么是生物统计学?生物统计学的主要内容和作用是什么? 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下 4 个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。 4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别? 随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通
2、过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别? 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。 准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性? 平均数的用处:平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量
3、水平;作 为样本或资 料的代表数据与其他资料 进行比较。 平均数的特征:离均差之和为零;离均差平方和 为最小。 标准差的用处:标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;在计算标准差是如果对观察值加上一个或减去一个 a,标准差不变;如果给各观测值乘以或除以一个常数 a,所得的标准差就扩大或缩小 a 倍;在正态分布中,X+-S 内的观测值个数占总个数的68.26%,X-+2s 内的观测值个数占总个数的 95.49%,x-+3s 内的观测值个数占总个数的 99.73%。 标准差的特征:表示变量分布的离散程度; 标准差的大小可以估计出变量的次数分布及各类
4、观测值在总体中所占的比例;估计平均数的标准差;进行平均数区 间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点? 和 对正态分布曲线有何影响? 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧, 变量数减小,即中间多,两头少,两侧对称。 U=0,=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:、正 态分布曲线是以平均数 为峰值的曲线,当 x=时,f(x)取最大值 ;、正态分布是以 为中心向左右两侧对称的分布、 的绝对值 越大,f(x) 值就越小,但 f(x) 永远不会等于
5、 0,所以正态分布以 x 轴为渐近线, x 的取值区间为(- ,+);、正态分布曲线完全由参数 和 来决定、正态分布曲线在 x=处各有一个拐点;、正态分布曲线与 x 轴所围成的面积必定等于 1。 正态分布具有两个参数 和 ,决定正态分布曲线在 x 轴上的中心位置, 减小曲线左移,增大则曲线右移; 决定正态分布曲线的展开程度, 越小曲线展开程度越小,曲线越陡, 越大曲线展开程度越大,曲线越矮宽。 6. 什么是统计推断?统计推断有哪两种?其含义是什么? 统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。统计推断主要包括参数统计和假设检验两个方面。假设检验是根据总体的理论分
6、布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一定概率水平(或 显著水平)上应该接受或否定的那种假设的推断。参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计和区间估计 7. 什么是小概率原理?他在假设检验中有何作用? 小概率原理是指概率很小的事件再一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于 0.05 或 0.01 的时间作为小概率事件。他是假设检验的依据,如果在无效假设 H0 成立的条件,某事件的概率大于 0.05 或 0.01,说明无效假设成立,则接受 H0,否定 HA;,
7、如果某时间的概率小于 0.05 或 0.01,说明无效假设不成立,则否定 H0,接受 HA 8. 假设检验中的两类错误是什么?如何才能少犯两类错误? 在假设检验中如果 H。是真实的, 检验后却否定了它,就犯了第一类错误,即 错误或弃真错误;如果 H。不是真 实的, 检验后却接受了它,就犯了第二类错误,即 错误或纳伪错误 。为了减少犯两类错误的概率,要做到以下两点:一是显著水平 的取值不可太高也不可太低,一般取 0.05 作 为小概率比较合适,这样可使得犯两类错误的概率都比较小;二是尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减少标准误,减少两 类错误。 假设检验中的两类错误是取证
8、错误和取伪错误。为了减少犯两类错误的概率要做到:显著水平 a 的取值 不可以太高也不可太低,一般去 0.05 作为小概率比较合适,这样可以使犯两类错误的概率都比较小; 尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。 9. 什么叫区间估计?什么叫点估计?置信度与区间估计什么联系? 区间估计指根据一个样本的观测值给出总体参数的估计范围给出总体参数落在这一区间的概率。点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。 10. 2 检验
9、主要有几种用途?各自用于什么情况下的假设检验? x2 检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。 11. 2 检验的主要步骤有哪些?什么情况下需进行连续性矫正? x2 检验的步骤为: (1)提出无效假设 H0:观测值与理论值的差异由抽样误差引起即观测值=理论值备择假设 HA:观测值与理论值的差值不等于 0,即观测值理论值 (2)确定显著水平 a.一般可确定 为 0.05 或
10、0.01 (3)计算样本的 x2,求得各个理论次数 Ei,并根据各实际次数 Oi,代入公式, 计算出样本的 x2。 (4)进行统计推断 12. 什么是方差分析?方差分析的基本思想是什么?进行方差分析一般有哪些步骤? (1)方差分析是对两个或多个样本平均数差异显著性检验的方法。 (2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而 检验处理效应是否显著。 (3)方差分析的基本步骤如下: a.将样本数据的 总平方和与自由度分解 为各变异因素的平方和与自由度。 b.列方差分析表进行 F 检验,分析各变异因素在总变异中的重要程度
11、。 c.若 F 检验显著,对个处理平均数进行多重比较。 13. 什么是多重比较?多重比较有哪些方法?多重比较的结果如何表示? 1)多个平均数两两间的相互比较称为多重比较。 (2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和 q 检验法。 (3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母 a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母 a,直至某个与之相差 显著的则标以字母 b。再以该标有 b 的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母 a 的右 边
12、加标字母 b。然后再以 标 b 的最大平均数 为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母 b,直至差异显著的平均数标以字母 c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。 这样各平均数间,凡有一个相同 标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写字母标记。 梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数LSD(LSR)0.05 说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数LSD(LSR)0.01 说明处理平均数间的差异达到极显著水
13、平,在差数的右上角标上“*”号。差数 LSD(LSR)0.05, 说明差异不 显著。 14. 方差分析有哪些基本假定?(进行方差分析的条件)方差分析的数学模型(类型)与基本原理。 方差分析有 3 个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在 3 个基本假定的基础上的 15. 为什么有些数据需经过转换后才能进行方差分析?数据转换的方式有哪些?方差分析有 3 个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在 3 个基本假定的基础上的。 在研究中会出现一些样本,其所来自的总体和方差分析的基本假设相抵触,这些数据在进行方差分析之前必须经过适当的处理即数据转换来测量标
14、尺。 16. 什么叫回归分析?回归截距和回归系数的统计意义是什么? 回归分析是用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量,表示结果的变量为因变量。回归截距是当自变量为零时,因变量的取值,即回归线在 y 轴上的截距;回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量 y 平均增加或减少的单位数。 17. 什么叫相关分析?相关系数和决定系数各具有什么意义? 相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。相关系数表示变量 x 与变量 y 相关的程度和性质,决定系数是相关系数的平方,表示变量x 引起 y 变异的回归平方和和占 y 变异总平方和
15、的比率,它只能表示相关的程度而不能表示相关的性质。 18. 简述回归和相关的异同。 1.线性相关分析涉及到变量之间的呈线性关系的密切程度,线性回归分析是在变量存在线性相关关系的基础上建立变量之间的线性模型; 2.线性回归分析可以通过回归方程进行控制和预测,而线性相关分析则无法完成; 3.线性相关分析中的变量地位平等,都是随机变量, 线性回归分析中的变量有自变量和因变量之分,而自变量一般属确定性变量,因变量是随机变量。 19. 什么叫抽样调查?常用的抽样调查有哪些基本方法?是比较其特点及适用对象? 抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并对全部调查研究对象作
16、出估计和推断的一种调查方法。 常用的抽样调查方法有随机抽样,顺序抽样和典型抽样。 随机抽样是指在抽样过程中, 总体内所有个体都具有相同的被抽取的概率。由于抽样的随机性,可以正确的估计试验误差,从而推出科学合理的结论。随机抽 样可分为以下几种方法:简单随机抽样,分层随机抽样,整体抽样和双重抽样。 简单随机抽样的结果可用统计方进行分析,从而对总体作出推断,并对推断的可靠性作出度量。适用于个体间差异较小,所需抽取的样本单位数较小的情况。对于那些具有某种趋向或差异明显和点片式差异的总体不宜使用。 分层随机抽样是一种混合抽样。其特点是将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区
17、层按一定的抽样分数抽选抽样单位。分层随机抽样具有以下优点: 若总体内各抽样单位间的差异比较明显,可以把总体分为几个比较同质的区层,从而提高抽样的准确度;分层随机抽 样类似于随机区 组设计,既运用了随机原来,也运用了局部控制原理,这样不仅可以降低抽样误差,也可以运用 统计方法来估算抽样误差。 整体抽样是把总体分成若干群,以群为单位, 进行随机抽样, 对抽到的样本作全面调查,因此也称为整群抽样。整体抽 样具有以下优点: 一个群只要一个编号,因而减少了抽样单位编号数,且因 调查单位数减少,工作方便;与简单随机抽样相比较,它常常提供较为准确的总体估计值,特别是害虫危害作物这类不均匀的研究对象,采用整体
18、抽样更为有利;只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。 双重抽样是在抽样调查时要求随机抽出两个样本,涉及两个变量。双重抽样具有以下两个优点:对于复 杂性状的调查研究可以通 过仅测量少量抽样单位而获得相应于大量抽样单位的精确度;当复杂性状必 须通过破坏性测定才能调查时,则仅有这种双重抽样方法可用。 顺序抽样是按某种既定顺序从总体中抽取一定数量的个体构成样本。抽样顺序的优点表现在:可避免抽 样时受人们主观偏见的影响,而简便易行;容易得到一个按比例分配的样本;如果样本的观察单位在 总体分布均匀,其取 样个体在总体内分布较均匀,这时采用顺序抽样的抽样误差较小。其缺点表现在: 如果总
19、体内存在周期性变异或单调增减 趋势时,则很可能会得到一个偏差很大的样本,产生明显的系统误差;顺序抽样得到的样本并不是彼此独立的,因此,对抽样误差的估计只是近似的。通过顺序抽样的方法,不能计算抽样误差,估 计总体平均数的置信区间。 典型抽样是根据初步资料或经验判断,有意识,有目的的选取一个典型群体作为样本进行调查记载,以估计整个总体。 这种抽样方法完全依赖于调查工作者的经验和技能,结果不稳定,且没有运用随机原理,因而无法估计抽样误差。典型抽样多用于大规模社会经济调查,而在总体相对较小或要求估算抽样误差时,一般不采用这种方法 20. 何为实验设计?生物学实验设计的基本要求是什么? 试验设计包括广义
20、的试验设计和狭义的试验设计。广义的试验设计是指整个研究课题的设计,包括试验方案的拟订,试验单位的选择,分 组的排列, 试验过 程中试验指标的观察记载,试验资料的整理,分析等内容;而狭义的试验设计则仅是指试验单位的选择,分组与排列方法。生物统计学中的试验设计主要指狭义的试验设计。 生物学试验的基本要求是:试验目的要明确;试验条件要有代表性;试验结果要可靠;试验结果要重演 试解释什么是处理、处理效应、主效 应、互作? 实验误 差的来源有哪些?如何进行控制? 处理是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素。处理因素是指处理因素作用于受试对象的反应,是研究 结果
21、的最终体现。主效应是指由于因素水平的改变而造成因素效应的改变。互作是指两个或两个以上处理因素间的相互作用产生的效应。 试验误差的来源主要有:试验材料固有的差异;试验条件不一致;操作技术不一致;偶然性因素的影响。针对试验误差来源,控制试验误差的途径主要有:选择纯 合一一致的 试验材料; 改进操作管理制度,使之标准化;精心选择试验单位;采用合适的 试验设计。 21. 实验设计的基本要素?基本原则?实验设计的作用是什么? 试验设计有 3 项基本原则:重复,随机和局部控制。重复原则的主要作用是估计试验误差,降低试验误差;随机原则的主要作用是提供无偏的试验误差估计。局部控制原则的主要作用是降低试验误差。总之,只有遵循重复,随机,局部控制3 项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的,最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。