1、第六章 抽样调查,1,第六章 抽样调查,本章内容 第一节 抽样调查概述 第二节 抽样调查中的基本概念 第三节 抽样平均误差 第四节 总体指标的推断 第五节 样本容量的确定,第六章 抽样调查,2,第一节 抽样调查概述,一、抽样调查的概念:按照随机原则从总体中抽取一部分单位 进行调查,用调查所得的指标数值来推断总体 的指标数值的一种调查方法。 二、抽样调查的特点:,二、抽样调查的特点,只抽取总体中一部分单位进行调查用一部分单位的指标值去推断总体的指标值抽取部分单位要遵循随机原则 抽样误差可以计算,并且可以控制,第六章 抽样调查,4,一、全及总体和抽样总体 二、全及指标和抽样指标 三、样本容量和样本
2、个数 四、抽样方法 五、抽样组织形式,第二节 抽样调查中的基本概念,第六章 抽样调查,5,(一)全及总体 1、概念:简称总体,指所要认识的对象的全体。 2、总体的分类:(1)变量总体:各单位用数量标志计量 有限总体和无限总体(2)属性总体:各单位用品质标志描述 3、总体单位数:N,一、全及总体和抽样总体,第六章 抽样调查,6,(二)抽样总体简称样本,是从全及总体中随机抽取出来,作为代表的单位组成的集合体。样本单位数:n,第六章 抽样调查,7,二、全及指标和抽样指标,(一)全及指标:根据总体计算的、反映总体属性的指标。 1、变量总体: 总体平均数,总体标准差,第六章 抽样调查,8,2、属性总体(
3、成数指标)总体平均数 总体标准差,P,(二)抽样指标:根据样本计算的、反映样本属性的指标。 1、变量总体 (抽样平均数)样本平均数,抽样标准差,第六章 抽样调查,10,2、属性总体(成数指标)抽样成数 抽样成数的标准差,p,第六章 抽样调查,11,1、样本容量:指一个样本所包含的单位数。通常用n表示。2、样本个数:又称样本可能数目,是指从一个总体中可能抽取多少个样本。,三、样本容量和样本个数,第六章 抽样调查,12,1、重复抽样: 有放回抽样。样本个数:2、不重复抽样:无放回抽样。样本个数:,四、抽样方法,第六章 抽样调查,13,一、抽样平均误差的概念 二、抽样平均误差的计算 三、影响抽样平均
4、误差的因素,第三节 抽样平均误差,第六章 抽样调查,14,抽样误差:指样本指标与总体指标之间的差距。表示为:抽样平均误差:是指所有可能出现的样本指标和总体指标的平均离差。用 表示。,一、抽样平均误差的概念,第六章 抽样调查,15,(一)抽样平均数的抽样平均误差 1、重复抽样:2、不重复抽样:为总体标准差。 若未知,且样本单位数较大时,可以用样本标准差代替。,二、抽样平均误差的计算,第六章 抽样调查,16,(二)抽样成数的抽样平均误差 1、重复抽样:2、不重复抽样:P为总体成数。在总体成数未知,且样本单位数较大时,可以用样本成数p来代替。,练习,第六章 抽样调查,17,某灯泡厂对10000个产品
5、进行使用寿命检验,随机抽取2%的样本进行测试,所得的资料如下:按照质量规定,灯泡使用寿命在1000小时以上为合格品。 要求:(1)计算灯泡的平均使用时间、标准差和平均使用时间的平均误差;(2)计算灯泡的合格率和合格率的平均误差。,(1)求灯泡平均使用时间、标准差和灯泡合格率(样本),(2)求灯泡使用时间抽样平均误差: 在重复抽样下 抽样平均误差,在不重复抽样下 抽样平均误差,(3)求灯泡合格率的抽样平均误差: 在重复抽样下 抽样平均误差,在不重复抽样下 抽样平均误差,第六章 抽样调查,21,某灯泡厂某月生产500万个灯泡,在进行质量检查中,随机抽取500个(可重复)进行检验,这500个灯泡的耐
6、用时间见下表:,试求:该厂全部灯泡平均耐用时间的抽样平均误差,课堂练习,第六章 抽样调查,22,(1) 计算抽样平均误差,第六章 抽样调查,23,1、样本单位数的多少。抽样单位数越多,抽样平均误差越小。 2、总体标志的变异程度(即标准差)。总体标志变异程度越大,抽样平均误差越大。 3、抽样调查组织方式和抽样方法。类型抽样的抽样平均误差最小。对于抽样方法,不重复抽样的抽样误差要小。,三、影响抽样平均误差的因素,第六章 抽样调查,24,一、抽样极限误差 二、可信程度 三、抽样推断,第四节 全及指标的推断,一、抽样极限误差,(一)概念:抽样极限误差是指全及指标和抽样指标之间误差的允许的最大可能范围。
7、 1、抽样平均数的抽样极限误差2、抽样成数的抽样极限误差,(二)总体范围的估计 1、总体平均数的范围2、总体成数的范围这便是总体的估计区间,也称为置信区间。,举例,第六章 抽样调查,27,例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。 样本成数 p=190/200=95% 总体成数下限=95%-2%=93% 总体成数上限=95+2%=97% 即该产品合格率在93%97%之间。,(三)抽样极限误差与抽样平均误差的关系 抽样极限误差通常用抽样平均误差的倍数表示。 即:,t称为概率度,或误差系数。,二、可信
8、程度,可信程度是表示估计的可靠程度,也称为概率保证程度或置信度。1、 如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。2、可靠程度与t之间有一定正比关系。 例:概率为0.95,查表得t=1.96概率为0.9545,查表得t=2,三、抽样推断,抽样推断的步骤 1、计算抽样平均误差 2、给定概率保证程度,查表得概率度t 3、计算抽样极限误差4、估计总体指标区间,例题,某灯泡厂某月生产500万个灯泡,在进行质量检查中,随机抽取500个(可重复)进行检验,这500个灯泡的耐用时间见下表:,试求:该厂全部灯泡平均耐用时间的取值范围 (概率保证程度0.9973)检查500个灯泡中不合格产品
9、占0.4%,试在 0.6827概率保证下,估计全部产品中不合格率的取值 范围。,(1) 计算抽样平均误差由概率保证程度0.9973,查表得概率度t=3(P339) 计算抽样极限误差估计总体指标区间,(2) p=0.4%,概率保证程度为0.6827时,t=1,第六章 抽样调查,34,一、重复抽样的样本容量确定 二、不重复抽样的样本容量确定,第五节 样本容量的确定,练习,第六章 抽样调查,35,一、重复抽样的样本容量确定,1、抽样平均数的样本容量2、抽样成数的样本容量,第六章 抽样调查,36,二、不重复抽样的样本容量确定,1、抽样平均数的样本容量2、抽样成数的样本容量,第六章 抽样调查,37,练习
10、1,从某市400个小型零售商店中随机抽取10%进行调查,获得月均营业额资料如下:已知样本方差为71。要求(1)在不重复抽样情况下以95.45%(t=2)的可靠性估计平均每户的月营业额置信区间;(2)若在其它条件不变的情况下,使极限误差减少20%,则至少应抽多少户进行调查?,第六章 抽样调查,38,解答:(1)根据题意:N=400户,n=40户,即:平均每户的月营业额置信区间为19.48,24.52万元。 (2),第六章 抽样调查,39,练习2,某地区小麦的播种面积为20万亩,根据抽样调查结果,平均亩产为455公斤,抽样平均误差为12公斤,试在F(t)=80%的概率保证程度下,推算该地区小麦总产
11、量的范围。(t =1.28,精确到0.01),第六章 抽样调查,40,(1)依题意可知:,即平均亩产的范围为439.65,470.36公斤。 (2)该地区小麦总产量的范围为: 439.6520104,470.3620104 =87958000,94072000公斤。,第六章 抽样调查,41,练习3,从一批产品中随机抽取400件(允许重复)进行质量检查,发现不合格产品有32件。要求:以95%的可靠性估计该产品不合格率的区间(t=1.96)。,第六章 抽样调查,42,第六章 抽样调查,43,4、抽样平均误差 ( CD )A、是抽样平均数(或抽样成数)的平均数B、是抽样平均数(或抽样成数)的平均差C
12、、是抽样平均数(或抽样成数)的标准差D、是反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度,下一页,第六章 抽样调查,44,5、抽样调查的基本特点 ( BDE )A、它是一非常准确的全面调查 B、采用随机原则确定调查单位 C、采用主观原则确定调查单位 D、误差可以计算并控制 E、用样本指标推算总体参数,第六章 抽样调查,45,6、抽样平均误差与样本容量之间存在一定的数量关系,在简单重复抽样时( BE ) A、样本单位数增加一倍,抽样平均误差减少一半B、样本单位数增加三倍,抽样平均误差减少一半C、抽样平均误差扩大30%,样本容量减少30%D、抽样平均误差扩大30%,样本容量增加30%E、样本单位数增加两倍,抽样平均误差减少42.3%,第六章 抽样调查,46,7、影响抽样误差的因素有 ( BCDE )A、是有限总体还是无限总体 B、全及总体标志的变异程度 C、抽样方法的不同 D、抽样单位数的多少 E、抽样组织方式的不同,