收藏 分享(赏)

第七章样本分布.ppt

上传人:dcjskn 文档编号:9504879 上传时间:2019-08-11 格式:PPT 页数:57 大小:850.50KB
下载 相关 举报
第七章样本分布.ppt_第1页
第1页 / 共57页
第七章样本分布.ppt_第2页
第2页 / 共57页
第七章样本分布.ppt_第3页
第3页 / 共57页
第七章样本分布.ppt_第4页
第4页 / 共57页
第七章样本分布.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、数理统计简介,数理统计,第七章 样本分布,7.1 总体与样本 7.2 样本分布函数 7.3 样本分布的数字特征 7.4 几个常用统计量的分布,7.1 总体与样本,定义7.1. 总体:研究对象的全体。 通常指研究对象的某项数量指标。 组成总体的每个基本单位称为个体。,从本质上讲,总体就是所研究的随机变量或随机变量的分布。,总体可以包含有限个个体,也可以包含无限个个体.在一个有限总体所包含的个体相当多的情况下,可以把它作为无限总体来处理.例如,一麻袋稻谷,一个国家的人口.,每一总体中的个体,具有共同的可观察的特征,把它作为不同总体的区别.例如,灯泡厂一天生产5万个25万瓦白炽灯泡,按规定,使用寿命

2、不足0.1万小时的为次品.在考察这批灯泡的质量时,“该天生产的5万个25瓦白炽灯泡的全体”组成一个总体,每一个灯泡是总体中的一个个体,其共同的可观察的特征为灯泡的使用寿命.数轴上的“一条线段所有点的全体”组成一个总体,其中的每一个点是总体的一个个体,其共同的可观察的特征为点在数轴上的位置.,对于一个总体来说,其每一数量特征就是一个随机变量 .由于人们主要是研究总体的某些数量特征,所以把总体看作所研究对象的若干数量特征的全体,而直接用一个随机变量(也可以是一个多元随机变量)的代表.,定义7.2 总体中抽出若干个体而成的集体,称样本.样 本中所含个体的个数,称为样本容量。,样本:来自总体的部分个体

3、X1, ,Xn 如果满足:,(1)同分布性: Xi,i=1,n与总体同分布. (2)独立性: X1, ,Xn 相互独立; 则称为容量为n 的简单随机样本,简称样本。 而称X1, ,Xn 的一次实现为样本观察值,记为x1, ,xn,在进行抽样时,样本的选取必须是随机的,即总体中每个个体都有同等机会被选入样本.抽样通常有两种方式:一种是不重复抽样,即每次抽取一个不放回去,再抽取第二个,连续抽取n次;另一种是重复抽样,指每次抽取一个,进行观察后再放回去,再抽取第二个,连续抽取n次,构成一个容量为n的样本.,简单随机样本:进行重复抽样所得的随机样本称为简单随机样本.,如上所述,所谓总体就是一个随机变量

4、,所谓样本就是n个相互独立且与总体有相同分布的随机变量X1,Xn (n是样本容量).通常把它们看成一个n元随机变量(X1,Xn),而每一次具体抽样所得的数据,就是n元随机变量的一个观察值(样本值),记为(x1,xn).一个容量为n的样本有双重意义:有时指一次抽样的具体数值(x1,xn),有时泛指一次抽出的可能结果,这就是指一个n元随机变量.用大写字母(X1,Xn)表示.,3.总体、样本、样本观察值的关系,总体,样本,样本观察值,?,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可

5、以用样本观察值去推断总体,二、统计量,定义7.3:称样本X1, ,Xn 的函数 f (X1, ,Xn )是总体X的一个统计量,如果 f (X1, ,Xn )不含 未知 参数,几个常用的统计量 :,3.样本k阶矩,7.2 样本分布函数,(一)分组数据的统计表和频数直方图,简单表:依出现先后顺序或按其大小顺序列成的表格,分组数据统计表:把数据分成若干组,同一组中的数据看成是相同的,都以组中值代表,分法:一般采取等区间分组,区间长度称为组距。,找出最大的和最小的数据,把区间a,b分成若干等份,一般n个数据分成,组较合适, 列出分组数据统计表,组限xi, xi+1), 以组距为底,以组频数为高,画出频

6、数直方图,例1 观察新生女婴儿的体重(它是一个连续型随机变量),取170名按出生顺序测得体重如表7-1.采取等区间分组,将表7-1中170个数据分为13组得到如表7-2所示的频数分布表(每组不包括上限 ).,表7-1 简单统计表,表7-2,频数分布表(分组数据统计表),例2 将例1中前20个新生女婴儿体重按大小顺序列成一个简单统计表,如表7-3所示.若进一步把20个数据分为5组(每组不包括上限),得分组数据的频数分布表,见表7-4.根据表7-4画成频数直方图,见图7-1.,表7-3,表7-4,表7-3,表7-4,频数m,体重x,频数直方图,以组距为底,以组频数为高,画出频数直方图,(二)频率直

7、方图和累积频率直方图,设组频数m,总频数N,组频率f,第i组的组频率,在频率直方图中,第i个长方形的高度取为相应的频率 的k倍,k是组距的倒数。,频率直方图能大致的描述出的概率分布情况, 而每个长方形面积正好近似的代表了体重的取值 落入相应一组的概率。根据频率直方图,可以大致 划出概率密度函数曲线。,因此,频率直方图可以作为概率密度曲线的一种近似。但是,他只适用于连续型随机变量。,累积频率曲线所代表的函数,无论对于离散型和连续型随机变量都可以用,因此 累积频率直方图是总体分布函数的良好近似。,体重x,频率,频率直方图,以组距为底,以组频率为高,画出频率直方图,以组距为底,以累积频率为高,画出累

8、积频率直方图,体重x,累积频率,1,累积频率直方图,(三)样本分布函数,总体就是一个随机变量.把的分布看作某统计总体的分布,则的分布函数F(x)即为一总体分布函数.,设 是总体的一个样本观察值, 将它们按大小排列为:,的图形 就是累积频率曲线,Fn(x)的图形就是累积频率曲线.它是一条跳跃式上升的阶梯曲线。若观测值不重复,则每一跃度为1/n若有重复情形,则按1/n的倍数跳跃上升.对于任何实数x, Fn(x)等于样本的n个观察值中不超过x的个数除以样本容量n.,由频率与概率的关系知道, Fn(x)可以作为未知分布函数F (x)的一个近似. n越大近似的越好. 称Fn(x)为样本分布函数(或经验分

9、布函数).,例如,随机地观察总体,得10个数据如下:3.2,2.5,-4,2.5,0,3,2,2.5,4,2 将它们由小到大排列为-402=22.5=2.5=2.533.24,其样本分布函数是:,频率,来自总体X的随机样本X1, ,Xn可记为,显然,样本联合分布函数或密度函数为,或,7.3样本分布的数字特征,样本的数字特征,是显示一个样本分布某些特征的数字.人们经常用它们来估计总体的数字特征.,(一)样本平均数 定义7.4 对于样本(X1,Xn),称,为样本平均数.,比如,7.2例1中170个新生女婴儿的平均体重是,若样本观察值整理成分组数据 (设分成k组,1kn),属于同一组的数据以组中值

10、为代表,则 可按下式计算:,对于某具体样本值(x1, xn),样本平均数是,其中mi 为第i组的组频数(i=1,2,k),7.2 例2当中的20个新生婴儿的平均体重是,(二)样本方差,定义7.5 对于样本(X1Xn),称,(二)样本方差,由(7.3)式,有,以及,分别为样本方差和样本标准差.,7.4几个常用统计量的分布,后面的几章,所涉及的多为正态分布,因此,这一节里将介绍有关正态分布随机变量函数的一系列分布.其中有些定理(如定理7.3-定理7.5)的证明用到较多的线性代数知识,书中没有进行证明.对于定理7.1和定理7.2也只是强调它们的结论本身.,定理7.1,独立的服从正态分布的随机变量的

11、非零线性组合仍服从正态分布,定理7.1的推论:,定理7.2,定理7.3,定理7.3的推论,定理7.4 设两个随机变量与相互独立,并且,t 分布的密度函数由(4.17)式给出。,定理7.4的推论1,定理7.4的推论2,定理7.5,其中, 为第一自由度为n1 ,第二自由度为n2的F分布,其概率密度由(4.18)给出。,则有:,定理7.5的推论,一、 2分布,统计量的分布称为抽样分布。数理统计中常用到如下三个分布:2分布、 t 分布和F分布。,2.2分布的密度函数f(y)曲线,3. 分位点 设X 2(n),若对于:01,存在,满足,则称,为,分布的上分位点。,1-,4.性质: a. 2分布可加性 若

12、X 2(n1),Y 2(n2 ), X, Y独立,则 X + Y 2(n1+n2 ) b.期望与方差 若X 2(n),则 E(X)= n,D(X)=2n,1.构造 若N(0, 1), 2(n), 与独立,则,t(n)称为自由度为n的t分布。,二、t分布,t(n) 的概率密度为(p99)(4.17)式,2.基本性质: (1) f(x)关于x=0(纵轴)对称。(2) f(x)的极限为N(0,1)的密度函数,即,3.分位点 设Tt(n),若对 :00, 满足PTt(n)=, 则称t(n)为 t(n)的上侧分位点,注:,三、F分布,1.构造 若1 2(n1), 22(n2),1, 2独立,则,称为第一

13、自由度为n1 ,第二自由度为n2的F分布,其概率密度为,2. F分布的分位点 对于:00, 满足 PFF(n1, n2)=, 则称F(n1, n2)为 F(n1, n2)的 上侧分位点;,证明:设FF(n1,n2),则,注:,得证!,正态总体的抽样分布定理,证明:,是n 个独立的正态随机变量的线性组合,故服从正态分布,结论(3)的证明:,且U与V独立,根据t分布的构造,得证!,例1:设总体XN(10,32), X1, ,Xn是它的一个样本,(1)写出Z所服从的分布;(2)求P(Z11).,例2:设X1, ,X10是取自N(0,0.32)的样本,求,例3:设X1, ,Xn是取自N(,2)的样本,求样本方差S2的期望与方差。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报