1、1,假设检验,2,引 言,统计假设通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。,假设检验根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。,基本原则小概率事件在一次试验中是不可能发生的。,3,基本概念,引例:已知某班应用数学的期末考试成绩服从正态分布。根据平时的学习情况及试卷的难易程度,估计平均成绩为75分,考试后随机抽样5位同学的试卷,得平均成绩为72分,试问所估计的75分是否正确?,“全班平均成绩是75分”,这就是一个假设,根据样本均值为72分,和已有的定理结论,对EX=75是否正确作出判断,这就
2、是检验,对总体均值的检验。,判断结果:接受原假设,或拒绝原假设。,表达:原假设:H0:EX=75;备择假设: H1:EX75,4,基本思想,参数的假设检验:已知总体的分布类型,对分布函数或密度函数中的某些参数提出假设,并检验。,基本原则小概率事件在一次试验中是不可能发生的。,思想:如果原假设成立,那么某个分布已知的统计量在某个区域内取值的概率应该较小,如果样本的观测数值落在这个小概率区域内,则原假设不正确,所以,拒绝原假设;否则,接受原假设。,拒绝域,检验水平,5,引例问题,原假设 H0:EX=75;H1:EX75,假定原假设正确,则XN(75,2),于是T统计量,可得,如果样本的观测值,则拒
3、绝H0,检验水平,临界值,拒绝域,6,基本步骤,1、提出原假设,确定备择假设;,2、构造分布已知的合适的统计量;,3、由给定的检验水平,求出在H0成立的条件下的 临界值(上侧分位数,或双侧分位数);,4、计算统计量的样本观测值,如果落在拒绝域内, 则拒绝原假设,否则,接受原假设。,7,两 种 错 误,第一类错误(弃真错误)原假设H0为真,而检验结果为拒绝H0;记其概率为,即 P拒绝H0|H0为真= ,第二类错误(受伪错误)原假设H0不符合实际,而检验结果为接受H0;记其概率为,即 P接受H0|H0为假= ,希望:犯两类错误的概率越小越好,但样本容量一定 的前提下,不可能同时降低和。,原则:保护
4、原假设,即限制的前提下,使尽可能的小。,注意:“接受H0”,并不意味着H0一定为真;“拒绝H0” 也不意味着H0一定不真。,8,单个正态总体方差已知的均值检验,问题:总体XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,9,例1 由经验知某零件的重量XN(,2),=15,=0.05;技术革新后,抽出6个零件,测得重量为(单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已知方差不变,试统计推断,平均重量是否仍为15克?(=0.05),解 由题意可知:零件重量X
5、N(,2),且技术 革新前后的方差不变2=0.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05双侧分位数为,10,例1 由经验知某零件的重量XN(,2),=15,=0.05;技术革新后,抽出6个零件,测得重量为(单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已知方差不变,试统计推断,平均重量是否仍为15克?(=0.05),解,因为4.91.96 ,即观测值落在拒绝域内,所以拒绝原假设。,而样本均值为,故U统计量的观测值为,11,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic St
6、atistics1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中选择not equal,点击每个对话框 中的OK即可。,显示结果中的“P”称为尾概率,表示,12,显示结果,(1)因为,所以拒绝原假设,(2)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,13,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,14,例2 由经验知某零件的重量XN(,2),=15,=0.0
7、5;技术革新后,抽出6个零件,测得重量为(单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已知方差不变,试统计推断,技术革新后,零件的平均重量是否降低?(=0.05),解 由题意可知:零件重量XN(,2),且技术 革新前后的方差不变2=0.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05上侧分位数为,单侧检验,15,因为 ,即观测值落在拒绝域内,所以拒绝原假设,即可认为平均重量是降低了。,而样本均值为,故U统计量的观测值为,例2 由经验知某零件的重量XN(,2),=15,=0.05;技术革新后,抽出6个零件,测
8、得重量为(单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已知方差不变,试统计推断,技术革新后,零件的平均重量是否降低?(=0.05),解,16,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic Statistics1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中选择less than,点击每个对话框 中的OK即可。,17,显示结果,(1)因为,所以拒绝原假设,(2
9、)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,18,单个正态总体方差未知的均值检验,问题:总体XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,19,例3 化工厂用自动包装机包装化肥,每包重量服从正态分布,额定重量为100公斤。某日开工后,为了确定包装机这天的工作是否正常,随机抽取9袋化肥,称得平均重量为99.978,均方差为1.212,能否认为这天的包装机工作正常?(=0.1),解 由题意可知:化肥重量XN(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。,假设
10、H0:=100; H1: 100,构造T统计量,得T的0.1双侧分位数为,20,解,因为0.0545 InvCDF 0.95 k2;SUBC T 8.,MTB let k1=(99.978-100)*sqrt(9)/1.212,MTBPrint k1 k2,,则接受原假设;,否则,拒绝原假设。,22,P142例5的计算机实现步骤,1、输入样本数据,存入C2列,2、选择菜单StatBasic Statistics1-Sample T,3、在Variables栏中,键入C2,在Test Mean栏中键入750,打开Options选项,在Confidence level栏中键入95,在Alterna
11、tive中选择not equal,点击每个对话框中的OK即可。,23,显示结果,(1)因为,所以接受原假设,(2)因为,所以接受原假设,(3)因为,所以接受原假设,结果分析,24,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,25,假设检验,26,单个正态总体方差已知的均值检验,问题:总体XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,27,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,28,单个正态总体方差
12、未知的均值检验,问题:总体XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,29,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,30,单个正态总体均值已知的方差检验,问题:总体XN(,2),已知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,拒绝域,31,一个正态总体均值未知的方差检验,问题:设总体XN(,2),未知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,
13、双边检验,32,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态分布,现对工艺进行了某些改进,从中抽取5炉铁水测得含碳量如下:4.421,4.052,4.357,4.287,4.683,据此是否可判断新工艺炼出的铁水含碳量的方差仍为0.1082(=0.05)?,解 这是一个均值未知,正态总体的方差检验, 用2检验法,由=0.05,得临界值,假设,33,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态分布,现对工艺进行了某些改进,从中抽取5炉铁水测得含碳量如下:4.421,4.052,4.357,4.287,4.683,据此是否可判断新工艺炼出的铁水含碳量的方差仍为0.1082(=0.05)?,
14、解,2统计量的观测值为17.8543,因为,所以拒绝原假设,即可判断新工艺炼出的铁水含碳量的方差不是0.1082,34,例4的计算机实现步骤,1、输入样本数据,存入C1列,3、计算2统计量的观测值,存入k2,2、计算样本的均方差,存入k1,MTBstdev c1 k1,MTB let k2=4*k1*2/0.108*2,4、确定临界值,MTB invcdf 0.025 c4;SUBC chisquare 4.MTB invcdf 0.975 c5;SUBC chisquare 4.,0.975,0.025,?,35,36,37,38,39,40,41,42,43,临界值,17.8543,观测值,拒绝原假设,44,作业 P160-P161 3、4、5、7、13预习试验二,