1、从本章开始,介绍一些常用的假设检验方法。 第5章:对单个和两个平均数的假设检验 第6、7章:方差分析,假设检验的基本步骤:1、提出假设 H0:原假设或零假设,被直接检验的假设,否定 或接受 HA:备择假设,一旦否定原假设就接受备择假设2、计算统计量 利用原假设所提供的信息,而且其抽样分布已知,3、确定否定域 根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接收域。,4、对假设进行统计推断 显著水平:0.01;0.05 (1)差异不显著:接受原假设(2)差异显著:在 0.05 水平下,否定原假设, 接受备择假设(3)差异极显著:在 0.01 水平下,否定原假 设,接受备择假
2、设,5 对单个和两个总体平均数的假设检验,需要解决的问题:,5.1 对单个总体平均数的检验,样本平均数,总体均数,推断,?,已知,样本,随机抽样,总体,5.1.1 Z检验总体的方差2 已知,利用 Z 统计量进行检验,Z统计量服从标准正态分布,因而称为Z检验。检验步骤如下:,1、提出假设:针对不同的具体情况,有3中假设。 (1) H0:0;HA:0 双侧检验 (2) H0:0;HA: 0 单侧检验,2、计算统计量Z,5.1.1 Z检验总体的方差2 已知,5.1.1 Z检验总体的方差2 已知,3、确定否定域并做统计推断 对于给定的显著性水平,针对3种不同的假设,原假设的否定域分别为:,a 和2a:
3、分别为标准正态分布 两尾概率为 a和2a时 的分位点。见附表2。a0.05时, a1.96 2a1.64 a0.01时,a2.58 2a2.33,5.1.2 t 检验总体的方差2未知,在实际情况下,总体方差 2 一般是未知的,因此无法计算Z 统计量,不能采用Z 检验。这时,用样本方差 S2 代替总体方差。,t 检验:将利用服从t 分布的检验统计量来进行的 假设称为t 检验。t 检验 的否定域与Z 检验的否定域相似,不同之处仅仅在于其临界值要由t 分布的分位数表查得。见附表4。对于给定的显著性水平,针对3种不同的假设,原假设的否定域分别为:,5.1.2 t 检验总体的方差2未知,5.1.2 t
4、检验总体的方差2未知,/2,/2,-t,t,5.1.2 t 检验总体的方差2未知,例:母猪怀孕期应该是114天,今调查了某种猪场8头母猪,各头母猪的怀孕期为:113,115,115,114,116,117,115,113天。试检验8头母猪的怀孕期与114天是否有显著差异。假设 H0: 0114 HA: 0114计算检验统计量,5.1.2 t 检验总体的方差2未知,5.1.2 t 检验总体的方差2未知,3、确定否定域并做统计推断,不能否定原假设,接受H0,认为该样本是取自怀孕期为114天的总体。,例:随即抽测8头大白猪和8头哈白猪经产母猪的产仔数,如下: 大白,8 16 12 17 6 14 6
5、 5 哈白,14 11 9 12 10 14 13 8,结论?,5. 2 两个总体平均数的比较,结论:哈白猪一定比大白猪的产仔数高0.9头吗? 样本=总体?回答:不一定!原因:1.这个资料仅仅是一个样本,如果我们再随机抽测 8头哈白猪和8头大白猪,二者的平均数差异就不 是0.9了。因为有抽样误差的存在以及样本含量 的不同。 2.我们研究的目的不在于了解样本的情况,而是由 样本推断总体,给总体做出全面的结论。,5. 2 两个总体平均数的比较,5. 2 两个总体平均数的比较,为了比较两个总体均数的差异,不可能对两个总体的所有个体进行测定,只能通过样本来推断总体。分别从两个总体随机抽取一定数量的个体
6、,从而获得两个独立的样本,然后通过对样本数据的分析来对两个总体平均数有无差异进行检验。,5. 2 两个总体平均数的比较,5. 2 两个总体平均数的比较,针对不同的具体问题,有3种形式的假设,双侧检验,单侧检验,单侧检验,设有一个样本,含有n次重复观察值,其数据为x1、x2xn,假定总体均数(实验处理的理论值)为 ,第i个观察值的实验误差为i, 则 xi= + i(i=1、2n),5. 2 两个总体平均数的比较,目的就是分析表面效应主要是由处理效应引起,还是由实验误差引起。从而分析处理效应是否存在。表面效应可以计算,实验误差可以估计,根据这些推断处理效应是否显著。,5. 2.1 统计量 的抽样分
7、布,5. 2.1 统计量 的抽样分布,5. 2.1 统计量 的抽样分布,如果两个总体都是正态总体,则:,因此,可以计算检验统计量Z 对总体均数进行假设检验,分三种情况分别介绍。,第二节 显著性检验的步骤一、抽样分布 两个样本平均数的比较 1.X1服从N(1,12),从中抽得含量为n1的样本1,其平均数为 2. X2服从N(2,22),从中抽得含量为n2的样本1,其平均数为 那么,统计量 的抽样分布的期望和方差为:,二、显著性检验的步骤 1.零假设:H0: 1=2 备择假设:H1: 1 2 2.确定显著平准:0.05、0.01 3.计算Z值或者t值 4.查Z值表或者t值表,确定临界值 4.接受或
8、者拒绝零假设,第三节 Z检验如果两总体的方差相等,且方差已知时,用Z统计量进行假设检验。12=22=2,2已知 例1.教材第69页,第四节 t检验,一、未知12,22,但是知道12=22已知两总体方差相等,但是不知道它的具体值是多少,总体方差可以用两个样本的均方的加权平均来估计,所以:均数差异标准误为,均数差异标准误,当n1=n2=n时,上面公式演变为:,t值为,自由度为:df=(n1-1)+(n2-1)= n1+n2-2例:70-71页,二、未知12,22,且1222(一) 2的齐性检验 设有两个正态总体,X1服从N(1, 12), X2服从N(2, 22)。如果有理由怀疑1222,就首先进
9、行检验。 1.零假设:H0: 12=22 备择假设:H1: 1222 2.确定显著平准:0.05、0.01,3.计算统计量,查F表,确定临界值,接受或者拒绝H0,如果检验结果不显著,接受零假设12=22,那么还按照前一种t检验进行检验。如果检验结果显著,接受备择假设12 22,那么按照下面的t检验方法进行检验。,但要根据方差不齐的严重程度调整自由度,见教材p72,三、配对样品平均数间的比较,为了排除实验单位不一致对实验结果的影响,准确地估计实验处理效应,降低实验误差,提高实验的准确性和精确性,如果可能,应采用配对实验设计,可将其看作两个相关样本平均数的比较。,配对的目的是使为了把同一重复内二个
10、实验单位的初始条件的差异减少到最低限度,使实验处理效应不被实验单位的差异而夸大或缩小,提高实验精确度。,1.配对实验设计: 指先将实验单位按配对的要求两两配对,然后将每一个对子内的两个实验单位独立随机地分配到两个处理组中。 配对的要求是,配成对子的两个实验单位的初始条件应尽量一致,不同实验对子之间,实验单位的初始条件可以有差异。 每一个对子就是实验的一次重复。 我们将实验单位分为两组的方式称为配对实验设计。,(1)自身配对: 同一实验单位的接受实验处理的前后的两次观察值作为配对。如小白鼠照射X射线前后的体重。(2)亲缘配对: 同窝、同性别、同体重或者同卵双生的两头动物配成对子。其中一个个体接受
11、接受这个处理,另一个个体接受另一个处理。如如同一窝的仔猪增重或者双胞胎的子畜。(2)条件配对: 将具有相近条件的个体配成对子。,配对实验时,两组的实验单位数即两个样本的观察值数目相等,n1=n2。但是反过来,两个样本观察值相等的实验则不一定是配对实验。判断配对实验的根据不是两个样本的观察值是否相等,而是分组的方式。在配对实验设计中,由于实验单位是两两配对的,因此观察值也是两两配对的。,2.实验结果表示为:,我们的目的是: 通过 推断 ,即1与2是否相同。,d=1-2,3. 配对实验的检验步骤: (1)无效假设H0 :d=1-2 =0 备择假设HA :d0,即1-2 0 1为第一个样本所在总体的
12、平均数 2为第二个样本所在总体的平均数 d为第一个样本所在总体与第二个样本所在总体配对变数的差数d=x1-x2,所构成的差数总体的平均数,且d=1-2,(2)t值的计算公式,1.d为第一、第二两个样本各对数据之差。为第一、第二两个样本各对数据之差的平均数。3.Sd为第一、第二两个样本各对数据之差的标准差。4.n为配对的对子数,即实验的重复数。,例:在比较国产与进口的膘厚测定仪时,对14头活体肥猪进行测定结果如下:试检验两种仪器测定的结果有无显著差异?,同一头猪的两种方法测定可以看作是配对设计。1. 无效假设H0 :d=1-2 =0 备择假设HA :d0,即1-2 02.确定显著平准:0.05、0.01,3.计算差异标准误,4.计算t值,5. df =n-1=14-1=13 查t值表得:t 0.05(13)=2.0160 t =0.10260.05, 则认为d属于误差的概率大于0.05,因此接受无效假设。认为这两种仪器测定的结果是一样的。,本章小结:,显著性检验,t检验,Z检验,配对实验,非配对实验,标准误,自由度,t值和临界值,!,!,