收藏 分享(赏)

第六章 抽样分布及总体平均数的推断.ppt

上传人:精品资料 文档编号:9624864 上传时间:2019-08-18 格式:PPT 页数:104 大小:1.77MB
下载 相关 举报
第六章 抽样分布及总体平均数的推断.ppt_第1页
第1页 / 共104页
第六章 抽样分布及总体平均数的推断.ppt_第2页
第2页 / 共104页
第六章 抽样分布及总体平均数的推断.ppt_第3页
第3页 / 共104页
第六章 抽样分布及总体平均数的推断.ppt_第4页
第4页 / 共104页
第六章 抽样分布及总体平均数的推断.ppt_第5页
第5页 / 共104页
点击查看更多>>
资源描述

1、职教学院 刘春雷 E-mail:,教育统计学,1,2,第六章 抽样分布及总体平均数的推断,第一节 抽样分布 第二节 总体平均数的估计 第三节 假设检验的基本原理 第四节 总体平均数的显著性检验,3,第一节 抽样分布,一、抽样分布的概念三种不同性质的分布:总体分布:总体内个体数值的频数分布。样本分布:样本内个体数值的频数分布。抽样分布:某一种统计量的概率分布。,4,第一节 抽样分布,一、抽样分布的概念例如: 总体某市600名学生数学竞赛的分数; 总体分布600个考分的频数分布;样本随机抽取40个考分; 样本分布40个考分的频数分布;,5,第一节 抽样分布,一、抽样分布的概念 抽样分布 对所抽到的

2、40个考分,计算其平均数、标准差; 然后,还回总体中; 再随机抽取40个考分,计算其平均数、标准差; 这样反复抽下去,就获得n=40的一切可能个样本的平均数、标准差; 若将这一切可能个样本的平均数、标准差分别进行频数分布,就形成一个实验性的平均数抽样分布、标准差抽样分布。抽样分布是一个理论的概率分布,它是统计推断的理论依据。,6,第一节 抽样分布,二、平均数抽样分布的几个定理(1)从总体中随机抽出容量为n的一切可能样本的平均数的平均数等于总体的平均数。E 平均的符号;样本的平均数; 总体的平均数。,7,第一节 抽样分布,二、平均数抽样分布的几个定理(2)容量为n的平均数在抽样分布上的标准差,等

3、于总体标准差除以n的平方根。平均数抽样分布的标准差(平均数标准误) 总体标准差n 样本的容量,8,第一节 抽样分布,二、平均数抽样分布的几个定理(3)从服从正态分布的总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。(4)虽然总体不呈正态分布,如果样本容量较大,反映总体和的样本平均数的抽样分布,也接近于正态分布。,9,第一节 抽样分布,二、平均数抽样分布的几个定理总结:上述定理反映了 1、平均数抽样分布的形态; 2、一切可能样本平均数与总体平均数之间的关系; 3、平均数抽样分布的标准差与总体标准差的关系 当总体标准差确定,样本容量n越大,平均数抽样分布的标准差越小(当n等于总体

4、时,离差为0); 当样本容量n确定,平均数抽样分布的标准差与总体标准差成正比。,10,第一节 抽样分布,二、平均数抽样分布的几个定理抽样分布是统计推断的理论依据。 实际上,不是抽取一切可能个样本来求总体参数,而是抽取一个随机样本,根据一定的概率来推断总体的参数。即使抽取一切可能个样本,计算出的某种统计量的值与总体参数的真值,大多也是不相同的,这是由于抽样误差的缘故。,11,第一节 抽样分布,二、平均数抽样分布的几个定理抽样误差用抽样分布上的标准差来表示。标准误某种统计量在抽样分布上的标准差称为该种统计量的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越具有代表性,推断的可靠

5、性越大,所以,标准误是统计推断可靠性的指标。,12,第一节 抽样分布,三、样本平均数与总体平均数离差统计量的形态从正态总体中随机抽取的容量为n的一切可能样本平均数以总体平均数为中心呈正态分布。1、当总体标准差已知时, 一切可能样本平均数与总体平均数的离差统计量Z呈标准正态分布。,Z样本平均数的标准记分; 样本的平均数;是式中唯一的变量,其它都是已知的常数 总体平均数; 样本平均数标准误。,13,第一节 抽样分布,三、样本平均数与总体平均数离差统计量的形态注:总体标准差的估计量S 总体标准差一般是未知的,它需用样本标准差来估计。 的无偏估计量S等于样本统计量乘以贝塞耳氏校正数,即:,S总体标准差

6、的估计量; n样本的容量; 样本的标准差;X原始数据,X原始数据,14,第一节 抽样分布,三、样本平均数与总体平均数离差统计量的形态2、当总体标准差未知时, 需用估计量S来代替,一切可能样本平均数与总体平均数的离差统计量t呈t分布。,X原始数据,样本的平均数; 总体平均数。 式中 不是常数,因此样本平均数与总体平均数离差统计量t中有两个变量,t不仅随 变化,还随S变化,因为抽取一个样本,就有一个和S。,15,第一节 抽样分布,注:t分布t分布与正态分布相似点:在t分布基线上的t值从-+; 从平均数等于0处,左侧t值为负,右侧t值为正,左右对称; 曲线以平均数处为最高,向两侧逐渐下降,尾部无限伸

7、延,永不与基线相接,呈单峰对称。,图4-5,n=正态分布 n=10 n=1,t分布图,(4) t分布(Students 分布),17,第一节 抽样分布,注:t分布t分布与正态分布区别t分布的形态随自由度(df=n-1)的变化呈一簇分布形态; t分布的峰狭窄尖峭,尾长翘得高,在基线上分布的范围广。 自由度越小,分布范围越广。自由度逐渐增大时,t分布逐渐接近正态分布;自由度趋于无限大时,t分布与正态分布重合。,18,第一节 抽样分布,注:t分布中央面积为0.95不同自由度t的临界值,19,第一节 抽样分布,注:自由度df式中的n-1,统计学上称为自由度,用df表示。 自由度是指总体参数估计量中变量

8、值独立自由变化的个数。 自由度产生于利用样本统计量估计总体参数之时。 自由度的个数等于样本容量n减去限制因子的个数。,20,第一节 抽样分布,注:自由度df当利用样本 估计总体时,受到一个限制因子的限制, 故自由度等于样本容量n减去1,即df=n-1。例如,已知样本容量n=5,平均数=80,那么这组数据中随机变量X的取值只有4个是可以任意取的,假定为82,83,85,77。前四个数据确定了之后,第5个数据就不能任意取了,它一定是唯一确定的值。在这个例子中,第5个数据就是73。,21,第一节 抽样分布,注:自由度df计算自由度的另一种方法是看总体参数估计量中运用了几个样本统计量,其自由度就等于样

9、本容量减去几。例如,在总体参数的估计量S中, 运用了一个样本统计量样本平均数 , 故自由度等于样本容量n减去1。,22,第二节 总体平均数的估计,根据样本对总体参数的推断有两种不同形式: 总体参数估计和假设检验。一、总体参数估计的基本原理 根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。1、点估计用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。,23,第二节 总体平均数的估计,例如,有人通过抽样,对大学生做了一个调查。当研究者问“你认为谁对你影响最大?”,经统计,这个样本中有36.6%的认为父亲对自己的影响最大。 若用这个样本数据代表大学生

10、的一般情况,这种做法就是点估计。又如,研究者可以从高中三年级学生中随机抽取一个样本,给他们进行一次外语考试。假定经过统计,计算得平均数为85分,研究者用这个数据来说明高三学生外语的一般水平,这种做法也属于点估计。,24,第二节 总体平均数的估计,点估计量的评价标准:(1)无偏性如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。例如:样本平均数就是总体平均数的无偏估计量。,25,第二节 总体平均数的估计,点估计量的评价标准:(1)无偏性如果一切可能个样本统计量的值与总体参数值偏差的平均值大于或小于0,这种统计量就是总体参数的有偏估计量。例如:样本的标准

11、差就是总体标准差的有偏估计量。但校正后,所得的S就是总体标准差的无偏估计量。,26,第二节 总体平均数的估计,点估计量的评价标准:(2)有效性当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差(离散程度)小的,则其有效性就高。例如:算术平均数的一切可能样本值的方差最小,故其是总体平均数最有效的估计量。,27,第二节 总体平均数的估计,点估计量的评价标准:(3)一致性 随着样本容量的增大,估计量的值越来越接近它所估计的总体参数值,这种估计量就是这个总体参数的一致性估计量。例如:样本平均数 就是总体平均数的一致性估计量。样本标准差 或S也都是总体标准差的一致性估计量。,28,第二

12、节 总体平均数的估计,点估计量的评价标准: (1)无偏性 (2)有效性 (3)一致性,即使具备上述条件的点估计, 也是以误差存在为前提, 而且它不能指出正确估计的概率有多大。,29,第二节 总体平均数的估计,2、区间估计以样本统计量的抽样分布(概率分布)为理论依据, 按一定概率要求, 由样本统计量的值估计总体参数的所在范围,称为总体参数的区间估计。,30,第二节 总体平均数的估计,2、区间估计以总体平均数区间估计为例,说明总体参数估计的基本原理当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量Z(即一切可能样本平均数的标准记分)呈标准正态分布。,31,第二节 总体平均数的估计,若以

13、样本平均数对总体平均数的估计要求达到95%的可靠度,则令 在-1.96至1.96之间变动,其间的面积(累积概率)为0.95,即,32,第二节 总体平均数的估计,经移项,上式变为,也就是说,有95%的样本平均数在 的范围内。或者说,在总体平均数加减1.96倍标准误的范围内,包括有95%的样本平均数。,33,第二节 总体平均数的估计,但,在实际科研工作中,只抽取一个样本平均数,并在一定可靠度上推论总体平均数落在样本平均数周围多大的范围内,于是可将上式经移项变成:,这就意味着总体平均数在 区间出现的概率为0.95 就是说,总体平均数有95%的可能在 的范围内。 或者说,总体平均数在这个范围内的可能性

14、有95%。,34,第二节 总体平均数的估计,区间称为平均数相应于0.95概率的置信区间。为置信下限,为置信上限。,35,第二节 总体平均数的估计,要对总体参数值进行区间估计,即要在一定可靠度上求出总体参数的置信区间的上下限,需要以下条件:其一,要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;,36,第二节 总体平均数的估计,其二,要求出该种统计量的标准误(要想估计的可靠度大些,置信区间的距离就要长些;但在一定可靠度的前提下,可通过减小标准误来缩短置信区间的距离);,37,第二节 总体平均数的估计,其三,要确定在多大的可靠度上对总体参数作估计,再通过查某种理论概率分布表,

15、找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间上下限。,38,第二节 总体平均数的估计,二、已知条件下总体平均数的区间估计当总体已知,总体呈正态分布,样本容量无论大小,即大样本(n30)或小样本(n30)时;当总体已知,总体不呈正态分布,但样本容量较大,即大样本(n30)时,样本平均数与总体平均数的离差统计量均呈正态分布。总体平均数的置信区间可按Z分布,用已知计算。,39,第二节 总体平均数的估计,二、已知条件下总体平均数的区间估计,置信区间与可靠度有关 可靠度要求越高,置信区间就越大,反过来,置信区间越大,则可靠度就越高,正确估计的把握就越大。,40,第二节

16、总体平均数的估计,例如: 已知某年某地区高考数学成绩的标准差为10,从该地区随机抽得20名考生的数学成绩为:65、68、38、56、72、75、47、58、70、63、67、64、60、69、61、66、55、76、68、62,试求该地区这一年高考数学平均分95%和99%的置信区间。答:样本平均分为63,总体标准差为10,标准误是2.236 该地区这一年高考数学平均分95%和99%的置信区间分别为58.62至67.38分之间和57.23至68.77分之间。,41,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计1、未知条件下总体平均数区间估计的基本原理当总体未知,总体呈正态分布,样

17、本容量无论大小,即大样本或小样本时; 当总体未知,总体虽不呈正态分布,但样本容量较大,即大样本(n30)时,样本平均数与总体平均数离差统计量( )均呈t分布。 总体平均数的置信区间可按t分布,用的估计值计算。,42,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计若在95%可靠度上对总体平均数作估计,就是使t分布上t=0两侧的面积(累积概率)和为0.95。令 在左右两侧相应的临界值至 之间变动,于是,43,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计经移项,总体平均数95%置信区间为同理,总体平均数99%置信区间为95%的置信下限为 ,置信上限为99%的置信下限为

18、,置信上限为,44,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计 注:及 是某种自由度及显著性水平t的临界值。所谓显著性水平就是对总体参数作估计时,可能犯错误的概率(用表示)。假如在95%可靠度上对总体参数作估计,则犯错误的可能=1-0.95=0.05 假如在99%可靠度上对总体参数作估计,则犯错误的可能=1-0.99=0.01,45,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计注: 各种自由度t的临界值可查t表值(附表2)。t值表左侧纵列指的是自由度 上端横行P值为显著性水平; P(2)表示将值分置于双侧;P(1)单侧。例如:df=6,P(2)=0.05,这表

19、示:自由度为6,显著性水平为0.05,t的双侧临界值为2.447,46,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计 注: 式中 是平均数标准误的估计量。可表示为以下三种形式:(1)S总体标准差的估计量; n样本容量。,47,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计 注: 式中 是平均数标准误的估计量。可表示为以下三种形式:(2)样本标准差,48,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计 注: 式中 是平均数标准误的估计量。可表示为以下三种形式:(3),49,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计,95%置信限有三种

20、形式,置信下限,置信上限,50,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计,99%置信限有三种形式,置信下限,置信上限,51,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计 2、小样本的情况 例题:从某小学三年级随机抽取12名学生,其阅读能力得分为28、32、36、22、34、30、33、25、31、33、29、26。试估计该校三年级阅读能力总体平均数95%和99%置信区间。 分析 条件 假定样本所在总体呈正态分布, 总体标准差未知, 小样本(n=1230) 结论 样本平均数与总体平均数离差统计量服从t分布; 总体平均数置信区间的上下限用估计值计算。,52,第二

21、节 总体平均数的估计,解: 由原始数据计算出 =29.917;S=4.100; =3.926 通过查附表2 (1)用S计算 总体平均数95%置信区间为总体平均数99%置信区间为,53,第二节 总体平均数的估计,(2)用 计算总体平均数95%置信区间为总体平均数99%置信区间为,54,第二节 总体平均数的估计,(3)用原始数据计算总体平均数95%置信区间为总体平均数99%置信区间为,55,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计3、大样本的情况当总体呈正态分布,总体未知,样本容量无论大小,即大样本或小样本时,样本平均数与总体平均数离差都呈t分布。但由t分布的性质可知,当样本容

22、量比较大,自由度在逐渐增大,这时的t分布已经非常接近正态分布。,56,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计3、大样本的情况若样本容量较大(n30),样本平均数与总体平均数离差统计量的t分布接近正态分布,在这种条件下对总体平均数进行区间估计时,可用正态分布近似处理。这时临界值就不用查表获得。当显著水平定为95%时,就可以把1.96直接代入;同理,99%对应2.58。这时就得到所求估计区间。,57,第二节 总体平均数的估计,三、未知条件下总体平均数的区间估计3、大样本的情况例题:从某年高考随机抽102份作文试卷,算得平均分为26,标准差为1.5,试估计总体平均数95%和99

23、%置信区间。 分析 假定高考分数是从正态总体中抽取的随机样本, 总体的标准差未知; 样本平均数与总体平均数离差统计量呈t分布; 但样本容量较大n=10230,t分布接近正态分布,可用正态分布近似处理。,58,第二节 总体平均数的估计,解 总体平均数95%置信区间为,平均数标准误的估计量为,但因样本容量较大,分母可近似为n。,总体平均数99%置信区间为,59,第三节 假设检验的基本原理,假设检验利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。,60,第三节 假设检验的基本原理,假设检验的基本原理假设: 某个样本来自于某个总体; 样本统计量的值与总体参数值

24、之间的差异是由抽样误差所致。那么: 像这样一切可能样本的统计量的值,应当以总体参数值为中心形成该种统计量的一个抽样分布。,61,第三节 假设检验的基本原理,假设检验的基本原理如果: 这个随机样本统计量的值在其抽样分布上出现的概率较大,这时就保留这个假设。于是,承认: “这个样本是来自于这个总体; 样本统计量的值与总体参数值之间的差异是由抽样误差所致。”,62,第三节 假设检验的基本原理,假设检验的基本原理如果: 这个随机样本统计量的值在其抽样分布上出现的概率极小,根据小概率事件在一次随机抽样中几乎是不可能发生的。于是,否定: “这个样本统计量的值是来自于这个总体参数值” 。 同时,承认: “样

25、本统计量的值与总体参数值的差异不是由抽样误差所致,而是存在着本质差异。”,样本均值,= 50,基本思路 Basic Idea,抽样分布,则样本均值 不大可能 为这个值,如果总体均值真的如此,因此拒绝零假设 = 50,20,H0,64,第三节 假设检验的基本原理,一、假设 假设检验一般有两个相互对立的假设:零假设(H0)是关于当前样本所属的总体与假设总体无区别的假设。零假设是假设检验中希望拒绝的假设。备择假设(H1)是关于当前样本所属的总体与假设总体有差异的假设。是与零假设相互排斥的假设。是研究者根据样本信息期待证实的假设,是否定了零假设后应当采取的假设。,65,第三节 假设检验的基本原理,一、

26、假设假设检验的两大特点: (1)根据一定的概率来下结论; (2)采用反证法。例如:根据经验我们可以说北京的6月天不会下雪,假如有一年的6月份下了一场雪,则原来的结论就被推翻。这样的推理方法就是反证法。再如:天下乌鸦一般黑。如果能够找到另外一种颜色的乌鸦,则原来的假设就被推翻。,假设检验的基本思想,前提: 承认 原假设,小概率 事件发生,大概率 事件发生,拒绝 原假设,接受 原假设,进行一次实验,67,第三节 假设检验的基本原理,二、小概率事件样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时,就认为小概率事件发生了。把出现的小概率的随机事件称为小概率事件。小概率事件是否出现,

27、这是对假设作决断的根据。,68,第三节 假设检验的基本原理,二、小概率事件在假定“零假设”真实的前提下,来考察样本统计量的值在以假设的总体参数值为中心的抽样分布上出现的概率如何(反证法)。如果出现的概率很大,则保留零假设,承认样本来自于该总体的结论;如果出现的概率极小(小到等于或小于事先规定的水平,即小概率事件发生了),则否定零假设。,69,第三节 假设检验的基本原理,三、显著性水平样本统计量的值在以总体参数值为中心的抽样分布上出现的概率,小到什么程度才算小概率事件发生了? 由可靠性程度决定。一般有两种水平: 等于或小于0.05的事件,作为小概率事件; 等于或小于0.01的事件,作为小概率事件

28、。,接受域,拒绝域,拒绝域,71,第三节 假设检验的基本原理,三、显著性水平统计学中把这种拒绝零假设的概率称为显著性水平, 用=0.05,=0.01表示。也可以说,显著性水平是统计推断时,可能犯错误的概率。如果在99%的可靠度上对假设进行检验,则显著性水平为0.01; 如果在95%的可靠度上对假设进行检验,则显著性水平为0.05。,72,第三节 假设检验的基本原理,四、统计决断的两类错误及其控制(一)两类错误拒真和存伪 对于总体参数的假设检验,有可能犯两种类型的错误。1、错误拒绝了属于真实的零假设。 如果在0.05显著水平上检验假设,犯错的概率为5%; 如果在0.01显著水平上检验假设,犯错的

29、概率为1%。2、错误保留了属于不真实的零假设。,73,第三节 假设检验的基本原理,四、统计决断的两类错误及其控制(二)控制1、错误 通过选择适当的显著性水平加以主动控制。当拒绝一个属真的零假设其后果非常严重时,可选择较高的显著性水平,如0.01,0.005当拒绝一个属真的零假设其后果不甚严重时,可选择较低的显著性水平,如0.05,0.10,74,第三节 假设检验的基本原理,四、统计决断的两类错误及其控制2、错误 使错误的概率保持在需要的水平上,而控制错误的概率有以下两种方法:1)利用已知的实际总体参数值与假设参数值之间的大小关系,合理安排拒绝区域的位置。2)使样本容量增大,可同时减少两类错误的

30、概率,或减少其中一种错误的概率而不致增加另一种错误的概率。,75,第三节 假设检验的基本原理,四、统计决断的两类错误及其控制 错误 如果不能预测总体平均数的值与假设总体平均数的值之间关系时,可采用双侧检验。 假设形式为 H0:=0 , H1:0 如果能预测到总体平均数的值大于假设的值,可采用右侧检验。 假设形式为 H0:0 , H1:0 如果能预测到总体平均数的值小于假设的值,可采用左侧检验。 假设形式为 H0:0 , H1:0,双尾检验,左尾检验 定义:拒绝性概率值置于理论分布的左尾 H0: Ha:,样本统计量,右尾检验,定义:拒绝性概率值置于理论分布的右尾 H0: Ha:,双侧检验,左侧检

31、验,右侧检验,假设检验的几种形式,81,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验例1:某小学历届毕业生汉语拼音测验平均分为66分,标准差为11.7。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试题,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?,82,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验检验的步骤: (1)提出假设 H0:=66 H1:66 (2)选择检验统计量并计算其值 学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本,并已知总体标准差=11.7,无论样本容量大小,样

32、本平均数与总体平均数的离差统计量(呈标准正态分布)为:,83,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验检验的步骤: (3)确定检验形式 因为没有资料可以说明应届毕业生汉语拼音成绩高于还是低于历届毕业生,故采用双侧检验。(4)统计决断 Z=1.091.96=Z0.05,则P0.05,于是保留H0,而拒绝H1。 结论:该校应届与历届毕业生汉语评语成绩无显著性差异。,84,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验,表6.2 双侧Z检验统计决断规则,85,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验例2: 某市高中入学考试

33、数学平均分数为68分,标准差为8.6。 其中某所中学参加此次考试的46名学生的平均分数为63。过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市的平均分数。,86,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验 例2: 检验的步骤: (1)提出假设 H0:68 H1:68 (2)选择检验统计量并计算其值 该校学生高中入学考试数学分数可以假定是从正态总体中抽出的随机样本,并已知总体标准差=8.6,无论样本容量大小,样本平均数与总体平均数的离差统计量(呈标准正态分布)为:,87,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的

34、显著性检验 例2: 检验的步骤: (3)确定检验形式 过去的资料表明,该校数学成绩低于全市平均水平,故采用左侧检验。 (4)统计决断 Z=3.942.33=Z0.01,则P0.01,于是在0.01显著性水平上拒绝H0,而接受H1。结论:该校高中入学考试数学的平均分数极其显著地低于全市的评价分数。,88,第四节 总体平均数的显著性检验,一、已知条件下总体平均数的显著性检验,表6.3 单侧Z检验统计决断规则,89,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验1、小样本的情况例1: 某区初三英语统一测验平均分数为65,该区某校20份试卷的分数为:72、76、68、78、62、5

35、9、64、85、70、75、61、74、87、83、54、76、56、66、68、62。问该校初三英语平均分数与全区是否一样?,90,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验1、小样本的情况 检验的步骤: (1)提出假设 H0:=65 H1:65 (2)选择检验统计量并计算其值 学生英语测验分数可以假定是从正态总体中抽出的随机样本,而总体标准差未知。样本容量较小,n=2030,在此条件下,样本平均数与总体平均数的离差统计量呈t分布。可用平均数标准误估计量的三种不同形式分别计算t值。,91,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验1、小样本的情

36、况 检验的步骤: 由原始数据计算出的 S=9.474 用S计算,92,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验1、小样本的情况 检验的步骤: 由原始数据计算出的 S=9.474 用 计算,93,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验1、小样本的情况 检验的步骤: 由原始数据计算出的 S=9.474 用原始数据计算,94,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 1、小样本的情况检验的步骤: (3)确定检验形式 因为没有资料可以说明该校初三英语成绩是高于还是低于全区的平均水平,故采用双侧检验。 (4)统计决断 根据d

37、f=n-1=20-1=19,查附表2,由于2.0932.2662.861,按表6.4 t检验统计决断的规则,则0.01P0.05,于是在0.05显著水平上拒绝H0,而接受H1。 结论:该校初三英语平均分数与全区平均分数有本质区别。或者说,它不属于平均数为65的总体。,95,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 1、小样本的情况,t,t,t,t,t,t,96,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 1、小样本的情况例2:某校上一届初一学生自学能力平均分数为38,这一届初一24个学生自学能力平均分数为42,标准差为5.7,假定这一届初一学生

38、的学习条件与上一届相同,试问这一届初一学生的自学能力是否高于上一届?,97,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 1、小样本的情况 检验的步骤: (1)提出假设 H0:38 H1:38 (2)选择检验统计量并计算其值 这一届初一24个学生自学能力的得分可以假定是从正态总体中抽出的随机样本,而总体标准差未知。样本容量较小,n=2430,在此条件下,样本平均数与总体平均数的离差统计量呈t分布,其检验统计量为:,98,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 1、小样本的情况 检验的步骤:(3)确定检验形式 根据假设的形式应当采取右侧检验 (4

39、)统计决断 根据df=n-1=24-1=23,查附表2, 由于t=3.3652.50= ,则P0.01, 于是在0.01显著性水平上拒绝H0,而接受H1。 结论:该校这一届初一学生的自学能力极其显著地高于上一届。,99,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验2、大样本的情况例如: 某年高考某市数学平均分为60,现从参加此次考试的文科学生中,随机抽取94份试卷,算得平均分数为58,标准差为9.2,问文科数学成绩与全市考生是否相同?,100,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 2、大样本的情况检验的步骤: (1)提出假设 H0:=60 H

40、1:60 (2)选择检验统计量并计算其值 文科学生数学高考分数假定是从正态总体抽出的随机样本,而总体标准差未知,样本平均数与总体平均数离差统计量呈t分布,但因样本容量较大,n=9430,t分布接近于正态,故可用正态分布近似处理,即,101,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 2、大样本的情况 检验的步骤:在平均数标准误估计量 中,由于样本容量较大,n减1与不减1相差不多,也可以不减1。,102,第四节 总体平均数的显著性检验,二、未知条件下总体平均数的假设检验 2、大样本的情况检验的步骤: (3)确定检验形式 因为没有资料可以说明文科学生数学成绩低于还是高于全市平均水平,故采用双侧检验。 (4)统计决断 Z0.05=1.96Z=2.112.58=Z0.01,则0.01P0.05,于是在0.05显著性水平上拒绝H0,而接受H1。 结论:某市文科学生数学高考平均分数与全市平均分数有本质区别,或者说它不属于平均数为60的总体。,103,第四节 总体平均数的显著性检验,总体参数区间估计和假设检验的异同相同点: 都是对总体参数的统计推断。 在条件相同的情况下,它们用的是同一个统计量函数。不同点: 区间估计对总体参数事先并不提出一个假设的值, 而假设检验对总体参数事先提出一个假设的值,最后视其被拒绝的机会如何。,谢 谢 大 家!,104,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报