1、统计中常用的希腊字母,统计假设检验与参数估计,统计推断是根据样本分布规律和概率理论,由样本结果去推断总体特征。它主要包括假设检验 和参数估计两部分内容。,假 设 检 验 又叫 显著性 检验 (test of significance)。显著性检验的方法很多 ,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计有点估计(point estimation)和区 间 估计(interval estimation)。,例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为09.75,其标准差为5.
2、30。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为 11.99。试问,能否由这30个醋样的平均数 判断新曲种好于原曲种?,1 统计假设检验概述,1.1 统计假设检验的意义和基本原理,1.1.1 统计假设检验的意义,食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?,例2:A,B两种肥料,在相同条件下各施用于5个小区的水稻上,水稻产量平均分别为,二者相差20kg,那么20kg差异究竟是由于两种肥料的不同而造成的还是由试验的随机误差造成的?,例3:小麦良种的千粒重xN(33.5,1.62),现由外地引进一高产品种,在8个小区种植,得千粒重(g):35.6,37.6,33.4
3、,35.1,32.7,36.8,35.9,34.6,平均数为 ,试问新引进的品种千粒重与当地品种有无显著差异?如果有显著差异,是否显著高于当地品种?,以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是由于随机误差引起的。,样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差的存在),样本平均数与总体平均数之间往往有偏差。因此,仅由表面效应 是不能判断它们之间是否有显著差异。其根本原因在于 试 验 误差(或抽样误差)的不可避免性。,通过试验测定得到的每个观测值 ,既由被测个体所属总体的特征决定,又受其它诸多无
4、法控制的随机因素的影响。所以观测值 由两部分组成,即= +总体平均数 反映了总体特征, 表示试验误差。若 样本含量 为n ,则 可 得 到 n 个 观 测值: , , , 。于是样本平均数,可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。,试验表面效应为,上式表明,试验的表面效应由两部分构成:一部分是试验的处理效应(即两总体平均数的差异);另一部分是试验误差 。因此,仅凭表面效应来判断两总体平均数是否相同是不可靠的。,如果处理效应不存在即 ,则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应
5、是否存在是假设检验的关健。,同理,对于接受不同处理的两个样本来说,则有:= + , = + 这说明两个样本平均数之差( - )也包括了两部分:一部分是两个总体平均数的差( - ),叫 做 试 验 的 处 理 效 应 (treatment effect);另一部分是试验误差( - )。,也就是说样本平均数之差( - )包含有试验误差,它只是试验的表面效应。因此,仅凭( - )就对总体平均数 、 是否相同下结论是不可靠的。只有 通过 显著性检验 才能从( - )中提取结论。 对( - )进行显著性检验就是要分析:试验的表面效应( - )主要由处理效应( - )引起的 ,还是主要由试验误差所造成。,
6、处理效应( - )未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。,小概率事件实际不可能性原理,1.1.2 统计假设检验的基本思想,小概率事件在一次试验中被认为是不可能发生的。,小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大 ,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,0.05 0.0
7、1 0.001称 之 为 小 概 率 事件。,举一例子,箱子中有黑球和白球,总数100个,但不知黑球白球各多少个。现提出假设H0:“箱子中有99个白球”,暂时设H0正确,那么从箱子中任取一球,得黑球的概率为0.01,是一小概率事件。今取球一次,如果居然取到了黑球,那么,自然会使人对H0的正确性产生怀疑,从而否定H0。也就是说箱中不止1个黑球。,1.1.3 统计假设检验的基本原理,1. 根据研究目的,对研究总体提出假设,原假设、无效假设、零假设(null hypothesis),是被检验的假设,通过检验可能被接受,也可能被否定。,与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理
8、由是不能轻率接受的。,备择假设(alternative hypothesis),如前例,原假设H0: ,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。,对应的备择假设为 ,即表明采用新曲种酿造食醋能够改变醋酸含量,试验的处理效应存在。,对于来自两个总体的两个样本,原假设H0: ,即两个总体的平均数相等,处理效应为零,试验表面效应仅由误差引起,处理效应不存在。,对应的备择假设是 : ,即假设两个总体的平均数 不相等,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效
9、应在内。,2. 在无效假设成立的前提下,构造合适的统计量,并由该统计量的抽样分布计算样本统计量的概率。,当无效假设H0成立时,表明试验表面效应纯属试验误差引起,处理效应不存在。此时,可根据题意构造适当统计量,计算样本统计量值。,对前例分析,无效假设H0: 成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的 看成是从 总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,, N(0,2n)。,构造统计量:, N(0,1),由样本值计算统计量u值,,由正态分布双侧分位数(u)可知,本例计算出的统计量u2.315, 1.96 2.58,所以可推知其概率,0.01 0.05,本试验
10、的表面效应 0.0224完全由试验误差造成的概率在0.01-0.05之间。,在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时 ,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时, 则说明无效假设成立的可能性大 ,不能被否定,因而也就不能接受备择假设。,3. 根据“小概率事件实际不可能性原理”否定或接受无效假设,叫做均数差异标准误;n1、n2为两样本的含
11、量。,对于来自两个总体的样本,研究在无效假设 : = 成立的前提下,统计量( - )的抽样分布。经统计学研究,得到一个统计量t:,其中,所得的统计量 t服从自由度df =(n1-1)+(n2-1)的t分布。, t(df),两温度对产率的影响进行比较有无系统误差 24.3, 20.3, 23., 21.3, 17.4 18.2, 16.9, 20.2, 16.7a=0.05,根据两个样本的数据,计算得: - =21.5-18.0=3.5;,进一步估计|t|2.245的两尾概率,即 估计P(|t|2.245)是多少?查附表,在df =(n1-1)+ (n2-1) =7时,两尾概率为0.05的临界值
12、:两尾概率为0.01的临界t值:两尾概率为0. 1的临界t值:,=2.365,,=3.499,,即:P(|t|2.365)= P(t2.365)+ P(t 1.895)= P(t1.895)+ P(t-1.895)=0. 1,=1.895,,由两样本数据计算所得的t值为2.245,介于两个临界t值之间,即:t0.12.245t0.05所以,| t |=2.245的概率P介于0. 1和0.05之间,即:0.05 P 0. 1。 如图所示,| t |=2.245的两尾概率,说明无效假设成立的可能性, 即试验的表面效应为试验误差引起的可能性在0.05 0.1之间。,按所建立的 : = ,试验的表面效应是试验误差的概率在 0.05 0. 1 之间,大于0.05,故有理由否定 : ,从而接受 : = 。可以认为两个总体平均数 和 相同。 综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。,148 2,9,10,