收藏 分享(赏)

5概率基础知识7_总体、样本与统计量.ppt

上传人:hyngb9260 文档编号:6338248 上传时间:2019-04-07 格式:PPT 页数:82 大小:2.07MB
下载 相关 举报
5概率基础知识7_总体、样本与统计量.ppt_第1页
第1页 / 共82页
5概率基础知识7_总体、样本与统计量.ppt_第2页
第2页 / 共82页
5概率基础知识7_总体、样本与统计量.ppt_第3页
第3页 / 共82页
5概率基础知识7_总体、样本与统计量.ppt_第4页
第4页 / 共82页
5概率基础知识7_总体、样本与统计量.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

1、probability,probability,第七章 抽样调查,总体、样本与统计量,常用统计分布,一、抽样调查的概念1、概念:是按照随机原则,从研究总体中抽取部分单位进行调查,并推断总体数量特征的一种非 全面调查(运用数理统计原理,根据被抽取那部分单位的数量特征来推算总体数量特征)。2、特点: 抽样调查是非全面调查; 一定要遵守随机原则; 利用样本数据推算总体数量特征; 抽样调查必然产生抽样误差。,7.1 抽样调查概述,二、抽样调查的作用1、适用于不能或者很难进行全面调查的场合;主要是无限总体和破坏性试验。2、适用于理论上能进行全面调查,但实际上 没有必要的场合;3、能节约人力、费用和时间,

2、比较灵活;4、可以验证和修正全面调查的正确性和不足;5、可用于工业生产过程的质量控制;6、可用于某种总体的假设检验。,三、抽样调查的几个基本概念,以概率论为理论基础,研究,2) 研究如何合理地分析随机数据从而作出科学的推断 (称为统计推断).,1)研究如何以有效的方式收集和整理随机数据;,总体:研究对象的单位元素所组成的集合.,个体:组成总体的每个单位元素.,例1 要考察本校男生的身体情况,则将本校 的所有男生视为一个总体,而每一位男生就是 一个个体.,(一)总体,总 体 是 随 机 变 量,总体指标:根据总体标志值计算的指标。,(二)样本,从总体中抽取一部分(取 n 个)进行观测,再依据这

3、n个个体的试验(或观察)的结果去推断总体的性质.,样本: 按照一定的规则从总体中抽取的一部分个体.,抽样:抽取样本的过程.,样本容量:样本中个体的数目 n .,抽样指标:根据样本总体标志值计算的指标。,为使样本具有代表性,抽样应满足什么条件,从民意测验看抽样,?,(1)Xi 与总体同分布;,(2) X1 , X2 , , Xn 相互独立.,从民意测验看抽样,1936年,Franklin Delano Rosevelt(罗斯福)与共和党的候选人 - Kansas州州长Alfred Landon(兰登)竞选总统. 绝大多数观测家认为罗斯福会是获胜者,但文学摘要却预测兰登会以 57% : 43% 的

4、优势获胜.,摘要自1916年以来的历届总统选举中都正确地预测出获胜的一方, 但这次罗斯福以 62% : 38% 的压倒优势取胜! (不久文学摘要就垮了),#,摘要调查的过程是将问卷寄给一千万人, 这些人的名字和地址摘自电话簿或俱乐部会员名册,这筛掉了不属俱乐部或未装电话的穷人.,这在1936年前影响不大, 因为穷人富翁以类 似的思考投票;但1936年经济正在从大萧条中恢复,故穷人选罗斯福,而富翁们选兰登.,抽样方法和规则:1)抽样必须遵循随机原则2)抽样调查必然会产生误差,抽样误差是可以事先计算和控制的。,抽样调查的组织方式(一)简单随机抽样(二)类型抽样(三)机械抽样,(四)整群抽样,(五)

5、多阶段抽样,四、抽样调查的组织方式(一)简单随机抽样(二)类型抽样(三)机械抽样,(四)整群抽样,(五)多阶段抽样,(一)简单随机抽样,1、概念:又称纯随机抽样,是对总体不作任何处理,随机抽取样本单位的方法。 2、种类:(1)直接抽选法(2)抽签法(3)随机数字表法3、特点:简单,最符合随机原则,但误差较大。,(二)类型抽样,1、概念:又称分类抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本单位的方法。2、种类:(1)类型比例抽样(1)不等比例抽样,3、特点:把分组法与随机抽样有机结合,提高了样本的代表性,误差较小。,(三)机械抽样,1、概念:又称等距抽样或系统抽样,

6、是先对总体按一定顺序加以排列,然后按一定的间隔抽取样本单位的方法。2、种类:(1)按排队标志与研究目的是否有关分:按无关标志机械抽样,按有关标志机械抽样(2)按抽样单位抽选的方法不同分为随机起点等距抽样、半距起点等距抽样、对称等距抽样3、特点:简便易行,但容易出现系统误差。,(四)整群抽样,1、概念:是先对总体按某一标志分为若干群或组,然后,以群为抽样单位抽取样本的方法。2、特点:方便节约费用,但误差较大。,(五)多阶段抽样,1、概念:样本不是一次性抽取,而是分两个或两个以上阶段。 2、特点:节约人力和物力;可以以现成的行政区域、组织系统作为划分各阶段的依据。,五、抽样方法,(一)重复抽样特点

7、:N保持不变,各单位中选的机会均等。(二)不重复抽样特点:N逐渐减小,各单位中选的机会逐渐提高。,六、统计量,统计量:样本的不含任何未知参数的函数。,总 体 是 随 机 变 量,统计量 是 随机变量(或向量),样 本 是 随 机 向 量,样本均值: 样本方差:,常见统计量:,样本 k 阶原点矩: 样本k阶中心矩:,统称样本矩,抽样误差的意义 纯随机抽样抽样平均误差的计算 分类抽样抽样平均误差的计算 机械抽样抽样平均误差的计算 整群抽样抽样平均误差的计算,7.2 抽样误差,一、抽样误差的意义,(一)抽样误差的概念抽样误差是指样本指标与总体指标之间数量上的差 别,用符号表示为:,抽样误差的来源为:

8、,(二)影响抽样平均误差的因素1、总体标志变动度(2或):与抽样平均误差呈正比关系。2、抽样单位数(n):与抽样平均误差呈反方向变化。3、抽样组织方式。4、抽样方法。(三)抽样平均误差的概念简例以平均数抽样平均误差为例,例有四个工人,各人每月产量分别是40,50,70,80 件,现在随机从其中抽取2人,并求平均加工零件数,用以代 表4人总体的平均产量水平。,为方便说明问题,先计算出4人的月平均产量为:,1、重复抽样:样本配合数=44=16,2、不重复抽样:样本配合数=43=12,很明显,重复抽样平均误差大于不重复抽样平均误差。(四)抽样平均误差的的意义1、可以衡量抽样调查的准确性;2、是抽样推

9、断和估计的基本根据。,重复抽样抽样平均误差计算表,不重复抽样抽样平均误差计算表,二、纯随机抽样平均误差的计算,(一)平均数抽样平均误差的计算1、重复抽样 根据数理统计证明:在纯随机重复抽样条件下,抽样平均 误差与全及总体的标准差成正比,与样本总体单位数的平方根 成反比,利用此关系可得出重复抽样平均数抽样误差的计算公 式为:,1、过去调查所得资料,选多个方差中最大的 2、用样本标准差代替总体标准差:用s代替。 3、用小规模调查资料 4、用估计资料,2、不重复抽样,其中,(1 n/N)是修正系数。(二)成数抽样平均误差的计算假定,某一现象有两种表现,具有一种表现的单位数为N1, 变量值为1,不具有

10、该种表现的单位数为N0,变量值为0,则 平均数、方差分别为:,2、不重复抽样平均误差,1、重复抽样平均误差,三、分类抽样平均误差的计算,关键问题是影响抽样平均误差的主要因素:组内方差,计算抽样平均误差时用平均组内方差。总体:用 表示,样本:用 表示。(一)平均数抽样平均误差的计算1、重复抽样:,2、不重复抽样:,其中,平均组内方差为: 总体平均组内方差:,样本平均组内方差:,例: 假定用分类比例抽样方式,从山区、丘陵、平原三种类型的200亩耕地上抽取10块(每块1亩,亩产量见下表)进行抽样调查,用来推断全部耕地的平均亩产量,求平均亩产量的抽样平均误差。,三、分类抽样平均误差的计算,解:(1)计

11、算各组内方差:,(2)计算平均组内方差:,(3)计算抽样平均误差:,(二)成数抽样平均误差计算,2、不重复抽样:,1、重复抽样:,其中,平均组内方差为: 总体平均组内方差:,样本平均组内方差:,仍用上述资料计算成数的抽样平均误差。 假设亩产450斤以上为高产田,不到450斤的为低产田,计算高产田所占比重的抽样平均误差。,三、分类抽样平均误差的计算,解:(1)计算平均组内方差:,(2)计算抽样平均误差:,三、分类抽样平均误差的计算,四、机械抽样平均误差的计算,机械抽样一般都用不重复抽样。 无关标志排队机械抽样类似于简单随机抽样,计算公式为:,有关标志排队机械抽样类似于分类抽样,计算公式为:,五、

12、整群抽样平均误差的计算,其中:R:总体群数;r:样本群数;总体或样本平均 数群间方差的计算公式为:,关键问题是影响抽样平均误差的主要因素:群间方差,总体:用 表示。 整群抽样一般都用不重复抽样,需要修正系数。(一)平均数抽样平均误差的计算,(二)成数抽样平均误差的计算,其中:R:总体群数;r:样本群数;总体或样本成数 群间方差的计算公式为:,数 理 统 计 的 引 入,某厂生产的一批产品中次品率为 p 。从中抽取10件产品装箱。,1)没有次品的概率,2)平均有几件次品,概率,3)为以 0.95的概率保证箱中有10件正品,箱中至少要装多少件产品。,所有这些问题的关键是 p 是已知的!,如何获取

13、p ?,这就是数理统计的任务了!,一个很自然的想法就是:,首先从这批产品中随机抽取产品进行检验。,怎样随机抽取这属于抽样理论与方法问题。,其次利用概率论的知识处理实测数据。,如何分析、处理实测数据。这属于统计推断的问题。也是我们研究的内容。,统计推断常解决的问题:,1)如何估计次品率 p ?,2)如果以 p 0.01为出厂的标准,这批产品能否出厂?,数 理 统 计 的 引 入,参数估计问题,假设检验问题,#,7.3 常用统计分布,上侧分位数u ( 0 1)满足,标准正态分布分位数,一、四种常用统计分布,对于正态分布有:,上侧分 位数u,阴影部分面积为,查表 如 0.025 时, u?,a分位数

14、例,2. 2 分布,统计量的分布 (之一),定理7.2.1 设 X1,X2,Xn 相互独立且都服从标准正态分布,则,即随机变量 2 服从自由度为 n 的卡方分布.,标准正态随机变量的独立平方和,2分布的三条性质:,性质1. (数字特征) 设 2 2(n) ,则有E( 2 ) = n , D( 2 ) = 2n,性质2(可加性) 设Y1,Y2相互独立, 且Y12(n1) , Y12(n2),则 Y1+Y2 2(n1+ n2) .,性质3.(大样本分位数 ) 当n 足够大(如 n 45 )时,有,2(n) 的上侧分位数( 0 1 ):,阴影部分面积为,3.自由度为 n的 t 分布 Tt(n),又称

15、学生氏分布-第一个研究者以Student 作笔名发表文章.,即随机变量 T 服从自由度为 n 的 t 分布.,定理7.2.2 设随机变量X, Y 相互独立, X N(0,1),Y 2(n),则,阴影部分面积为,t (n) 的上侧分位数 t (n) ( 0 1 ):,T 分布的特点:,1.关于纵轴对称:,例 查表计算:,t,- t= t1-,因 =PTt=PT-t=1- PT -t,故 PTt=1.,即 t= - t1-,例 查表计算:,2. n 较大时,,4. F 分布 F F ( n1 , n2 ),称X 服从第一自由度为n1,第二自由度为n2的 F分布.,定理7.2.3 设随机变量X,Y

16、相互独立, X 2(n1) ,Y 2(n2),则,即随机变量 F 服从第一自由度为n1,第二自由度为n2 的F分布.,例 统计量的分布(之二),F ( n1 , n2 )的上侧分位数F ( n1 , n2 ) ( 0 1 ):,阴影部分面积为,推论1,推论2,证,二、抽样分布定理,定理7.2.4,应用例,定理6.2.5,设正态总体 X 与 Y 相互独立,,X , 样本为X1, X2, X n1,样本均值和样本方差为 ;,Y ,样本为Y1, Y2, Y n2,样本均值和样本方差为 .,有,分析,证明: (2),服从正态分布,Sw2可化为2分布, 二者组合而成的统计量应服从 t 分布.,因 , 相

17、互独立,故U 与 V也相互独立,从而,总体、个体,简单随机样本,统计量,统计量的分布,正态总体的 2个抽样定理,样本均值 样本方差 样本矩(样本相关系数),2分布 t 分布 F分布,分位数,结构定理,例7.2.1 设随机变量X 服从正态分布N(0,1), 对给定的(01),数u满足 ,,则 x 等于,u是上侧分位数.,解,阴影部分面积为 (1-)/2,面积为,#,例7.2.2 统计量的分布(之一),解,设 X1, X2 , , Xn 是来自正态总体 的容量为 n 的样本,求下列统计量的概率分布:,#,例7.2.3 查表计算概率,注意 应注意分布表的定义与查法!,#,解,例7.2.4 统计量的分

18、布(之二),设 X1, X2, , Xn +m是来自正态总体 的样本,求下列统计量的概率分布,由 t 分布结构定理,,#,3. 因Zt(m), 根据 t 分布结构定理,有,例7.2.5 设X1 ,X2 ,X9是来自正态总体X的随机样本,令,证明统计量Z 服从自由度为2 的t 分布.,证 记 D(X)=2(未知),有,由于Y1, Y2相互独立 , 故,从而,由抽样分布定理知,因Y1和Y2相互独立, Y1和S2 相互独立, 而且 Y2和S2 相互独立,故Y1Y2 和S2 相互独立.,根据t 分布结构定理知,服从自由度为2 的 t 分布.,#,证明,且 X1,X2,,Xn相互独立,XiN(0,1),,证 因,也相互独立同分布,,根据独立同分布中心极限定理有,近似成立,故,#,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报