1、第六章 抽样分布,数理统计的基本任务:由部分来推断总体,或者由过去来推断未来.,这样就涉及到两个问题:1)如何选取部分?2)如何利用部分?,由于抽取的部分具有一定的随机性,因此据此得出的推论多多少少的总含有一定程度的不确定性.因此,我们必须对试验所提供的信息进行“合理”的加工和处理,以使做出错误推断的概率尽可能的小.一般地,在数理统计中所做出的许多推断我们都用一定的概率来表明推断的可靠或可信程度.这种伴随着一定概率的推断就称为统计推断.,第一节 基本概念,一、总体(Population)和样本(Sample),对每个个体来说,它有许多方面的特性,而在实际问题中,人们关心的往往只是个体的某个或某
2、几个数量指标以及该指标在总体中的概率分布情况.,通常我们把被研究的对象的全体称为总体,而把组成总体的元素叫做个体.,例如,在研究一批电子元件组成的总体时,可能关心的是电子元件的寿命指标以及所有电子元件寿命的分布情况. 虽然每一个电子元件的寿命是客观存在的,但是却无法事先确定任何一个电子元件的寿命,因此可认为电子元件的寿命是一个随机变量.,这样,我们就把总体与一个随机变量联系起来,而把对总体的研究转化为对某个随机变量的研究.由于一个随机变量的分布函数全面描述了该随机变量的统计规律,因此对总体进行研究的一个重要目的,就是确定相应的随机变量的分布.,统计推断要解决以下两方面的问题:,1、如何进行试验
3、和观测来获取部分;,2、如何根据试验和观测所得到的统计资料对被研究总体的分布作出合理的推断.,为了使所抽取的部分客观地反映总体的特性,我们将依据如下两个假设来从总体中抽取部分:,1)假设每个个体被抽中的机会是均等的;,2)抽取一个个体后不影响总体.,这种获取部分的方式我们称之为简单随机抽样.,定义 设 是 维随机变量,若相互独立且其中每个都与总体 具有相同的分布,则称,是取自总体X的容量为n的简单随机样本,简称为样本.,对抽取的n个个体进行试验,当试验完成时,就得,到一组数据,它们依次是,的,观察值,称,是样本观察值或样本值,获取样本只是进行统计推断的第一步,但是样本所含的信息往往不能直接用于
4、解决所要研究的问题,而需要将样本所含的信息进行适当的加工和处理将其“浓缩”为所需要的信息,然后据此作出推断.在数理统计中,我们往往通过构造一个合适的样本的函数统计量来实现这一目的.,从部分推断总体,实际上就是利用样本对总体的未知分布(或者是分布中的某些特征)进行统计推断,因此可以说数理统计学是研究和处理带有随机性影响的数据的一门学科.,统计量,几个重要的统计量,1、样本均值,称统计量,为样本均值。,2、样本方差,3、样本矩,称,为样本k阶中心矩。,4、顺序统计量,以上定义的各个统计量的观察值分别为:,作为样本的函数,统计量是随机变量,因此它有自己的分布.称统计量的分布为抽样分布.,上 分位点,
5、可查书后附表得到,如,标准正态分布的上 分位点记为,由于标准,正态概率密度为偶函数,所以若,则,且,第二节 三个重要的分布,一、 分布,2. 的概率密度为,3.概率密度图形的示意图,可以将绿色的曲线视为 概率密度的代表图形,4. 分布具有可加性,二、t分布,1.定义 设 ,而且 独立,称随机变量,所服从的分布为自由度为 的 分布,记为,2. 分布的概率密度为,注:f(t)是偶函数,因此其图形关于y轴对称.,n取不同值时t分布及N(0,1)的概率密度的比较图,3.上 分位点,若,则有,由对称性知,有,并且,三、F分布,服从的分布为自由度为n,m的F分布,记为,2.F分布的概率密度为,F分布密度函
6、数的图形,3.F(n,m)分布的上 分位点记为,如图所示,由定义,若,则,所以,例1 设正态总体 ,而 是来自X的样本,令,试确定随机变量Y的分布.,解 由已知条件知,利用样本的独立性知, 与 相互独立,于是,由F分布的定义,有,解 由已知条件及正态分布的独立可加性有,第三节 正态总体的抽样分布,设 是取自正态总体 的样本,样本均值和方差分别为,几个重要的结论,1.,于是有,3.,2,3的证明需要较多的知识,从略,4.,证明,因为,于是,由t分布的定义,有,则,其中,证明 易知,又由给定条件知,且它们相互独立,故由 分布的可加性知,由于两组样本独立,再考虑到结论2,可知U与V相互独立,从而由t分布的定义,例1 从正态总体 中抽取容量为n的样本,如果要求其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问样本容量n应取多大?,从而由,所以n至少应取35,例2 一类导弹发射装置,弹着点偏离目标中心的距离X服从正态分布 ,这里 进行了25次发射试验, 是这25次试验中弹着点偏离目标中心的距离的样本方差,试求 超过50m2的概率.,解,所以,故所求的概率在97.5%以上.,(2),由于,所以,故,又,从而,