收藏 分享(赏)

讲稿4-整群抽样.ppt

上传人:无敌 文档编号:31042 上传时间:2018-03-05 格式:PPT 页数:76 大小:986.50KB
下载 相关 举报
讲稿4-整群抽样.ppt_第1页
第1页 / 共76页
讲稿4-整群抽样.ppt_第2页
第2页 / 共76页
讲稿4-整群抽样.ppt_第3页
第3页 / 共76页
讲稿4-整群抽样.ppt_第4页
第4页 / 共76页
讲稿4-整群抽样.ppt_第5页
第5页 / 共76页
点击查看更多>>
资源描述

1、第4章 整群抽样,第一节 概述,一 整群抽样及特点什么是整群抽样 将总体划分为若干群,以群为抽样单元,对群中 的所有单位进行调查。整群抽样的特点抽样框编制得以简化实施调查便利,节省费用估计效率较低对某些特殊结构的总体却有好的估计效果,与多阶段抽样,多阶段整群抽样的关系,二 群的划分大致可分为两类根据行政或地域形成的群体调查人员人为确定的分群的原则可用方差分析原理说明:群内差异尽可能大,群间差异尽可能小,第一节 概述,三 群的规模无法控制规模的群可控制规模的群,群规模不宜过大有群规模相等与不相等两种情况四 符号说明 (page136-137),第一节 概述,一 符号说明 N: 总体群数 n: 样

2、本群数 Yij: 总体第i群的第j单位数值 yij: 样本中第i群的第j单位数值 Mi: 第i群规模(单位个数) 本节中,M1 M2 MN M,第二节 群规模大小相等时的估计,第二节 群规模大小相等时的估计,Mt: 总体单位总数Yi: 总体中第i群的总量yi: 样本中第i群的总量,第二节 群规模大小相等时的估计,: 总体中第i群个体均值 : 样本中第i群个体均值 : 总体的群均值 : 样本的群均值,第二节 群规模大小相等时的估计,: 总体中的个体均值 (各群 ) : 样本中的个体均值,第二节 群规模大小相等时的估计,: 总体方差 : 总体群间方差 : 总体群内方差,第二节 群规模大小相等时的估

3、计,: 样本方差 : 样本群间方差 : 样本群内方差,第二节 群规模大小相等时的估计,二 估计量均值估计量 SRS,群规模相同,均为M,则 的估计为:,比较SRS抽取nM个样本,第二节 群规模大小相等时的估计,估计量 的性质 性质1: 是 的无偏估计,即因为是按简单随机方法抽取群,所以样本群总值的均值 是总体群总值的均值 的无偏估计,因而,第二节 群规模大小相等时的估计,性质2 的方差为,第二节 群规模大小相等时的估计,已知 ,又 故,第二节 群规模大小相等时的估计,性质3 的样本估计为 因为 是的 无偏估计,所以 是 的 无偏估计,第二节 群规模大小相等时的估计,总体总值据此,可直接推出其估

4、计量及相应的方差,第二节 群规模大小相等时的估计,三 整群抽样效率分析群内相关系数 表达式为:上式中的分子为:,第二节 群规模大小相等时的估计,上式中的分母为:故 又可写为:,第二节 群规模大小相等时的估计,事实上, 的方差可用群内相关系数近似表示,第二节 群规模大小相等时的估计,简单随机抽样的方差公式为由此可计算出等群抽样的设计效应为,第二节 群规模大小相等时的估计,整群抽样的估计效率,与群内相关系数 的关系密切 当 1时,deffM 当 0时,deff1 当 为负时,deff1 的取值范围是,群内方差为,群内方差与总体方差相等,群间方差为,第二节 群规模大小相等时的估计,群内相关系数也可由

5、样本统计量 估计例一,当N很大,而M相对于NM很小时,,i,240,187,162,185,206,197,154,173 188.00 27.19 210,192,184,148,186,175,169,180 180.50 17.98 149,168,145,130,170,144,125,167 149.75 17.32 202,187,166,232,205,263,198,210 207.88 29.17 210,285,308,198,264,275,183,231 244.25 45.20 394,256,192,280,267,334,216,289 278.50 63.87

6、192,121,172,165,152,224,195,241 182.75 38.77 230,205,187,176,212,253,189,240 211.50 27.48 274,208,195,307,264,258,210,309 253.13 44.52 232,187,150,182,175,212,169,222 191.13 28.29 342,294,267,309,258,198,244,286 274.75 43.70 228,294,182,312,267,254,232,298 258.38 43.52,第二节 群规模大小相等时的估计,解:已知N510,n12,M

7、8,fn/N=0.0235故,第二节 群规模大小相等时的估计,于是 的置信度为95的置信区间为也即,第二节 群规模大小相等时的估计,例2 由例1数据,计算群内相关系数与设计效应解:由前已算出样本群间方差 而群内方差为,第二节 群规模大小相等时的估计,第二节 群规模大小相等时的估计,若 令为简单随机抽样的样本量则即可达到整群抽样96户样本量相同的估计精度,第三节 群规模不等时的估计,当群Mi规模不等时,有不同的抽取方法和估计方法一 等概抽样,简单估计对总体均值 的估计为可以看出,此公式与上节(1)式同 的方差估计为,第三节 群规模不等时的估计,此法特点估计量 是有偏的操作简便,易于掌握和使用适用

8、条件,群之间的规模差异不大时,第三节 群规模不等时的估计,二 等概抽样,加权估计思路:以群规模Mi为权数,得到群总和yi, 进而求得群总和均值 ,再除以群 平均规模,第三节 群规模不等时的估计,估计公式为:若 未知,可用样本群平均规模代替,第三节 群规模不等时的估计,总体总量Y的估计为总量估计的另一公式为,第三节 群规模不等时的估计,估计量的方差为它的无偏估计为均值估计 的方差为,第三节 群规模不等时的估计,三 等概抽样,比率估计总体均值估计为这里辅助变量不是Xi而是群规模Mi总体总量估计为,第三节 群规模不等时的估计,估计量的方差分别是,第三节 群规模不等时的估计,与 的样本估计分别是,第三

9、节 群规模不等时的估计,第三节 群规模不等时的估计,五 案例分析 背景:某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。 调查资料如下:,样本乡编号,村庄数 Mi,作物总产量(乡) yi(万公斤),种植面积(乡) xi(亩),12345678910,15182614202821193117,22.022.830.221.725.331.226.020.533.823.6,800780100070088011008508001200830,1.46671.26671.16151.551.2651.11431.23

10、811.0791.09031.3882,合计 209 257.1 8940 ,第三节 群规模不等时的估计,分别采用几种方法估计等概抽样,简单估计,第三节 群规模不等时的估计,评价:方法虽简单,却是有偏估计,第三节 群规模不等时的估计,2 等概抽样,加权估计,第三节 群规模不等时的估计,评价:虽是无偏估计量,但方差估计没有改观,第三节 群规模不等时的估计,3 等概抽样,比率估计,评价:有偏,n较大时比较理想,第三节 群规模不等时的估计,其它辅助变量的估计 已知:种植面积X30525(亩) 用种植面积为辅助变量评价:和 相比, 更小,因而有 更好的估计效果。选择关系密切的辅助变量,例2 有下列资料

11、,分厂编号 职工人数 Mi 累积区间,12345678,12004502100860284019103903200,11200120116501651375037514610461174507451936093619750975112950,第三节 群规模不等时的估计,n3,采用PPS抽样,随机抽取的3个数为02011,07972,10281。调查结果如下:,第三节 群规模不等时的估计,故置信区间为估计总量,第四节 等概率两阶段抽样,多阶段抽样分多个阶段抽到最终接受调查的样本。初级单元(PSU)-Primary Sampling Unit二级单元 (SSU)-Second-stage Samp

12、ling Unit三级单元(TSU)-Third-stage Sampling Unit最终单元 (USU)-Ultimate Sampling Unit,第四节 等概率两阶段抽样,多阶段抽样推断原理,两阶段抽样为例,推导过程,估计量方差一般公式为:于是有:,(1),假定n=1, 第二阶段抽取m个单位用 估计 , 误差大小取决于 和m,即 其次,用 推断 时,第二次推断误差大小取决于 和n,当n=1时, ,这时若以n个 的均值 推断 ,其方差为则(1)式成立。,证明: (2) 即 是 的无偏估计,但,不是,的无偏估计,计算 时 不受二阶抽样影响,计算 的 则不然。,即:,(3),【例1】欲调查

13、4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如下:,要求根据这些数据推算100家企业该指标的总量,并给出估计的95置信区间。,方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的m倍,而且它还要乘以小于1 的f1如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果:这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元的均值就可以得到方差的估计。,(4),(5),由上式看出,m与 , 成正比,与 , 成反比。求出m后,利用(4),(5)式,即可求出n.,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报