收藏 分享(赏)

抽样技术不等概率抽样.ppt

上传人:fmgc7290 文档编号:7642095 上传时间:2019-05-22 格式:PPT 页数:73 大小:808KB
下载 相关 举报
抽样技术不等概率抽样.ppt_第1页
第1页 / 共73页
抽样技术不等概率抽样.ppt_第2页
第2页 / 共73页
抽样技术不等概率抽样.ppt_第3页
第3页 / 共73页
抽样技术不等概率抽样.ppt_第4页
第4页 / 共73页
抽样技术不等概率抽样.ppt_第5页
第5页 / 共73页
点击查看更多>>
资源描述

1、n1n第五章 不等概率抽样 n第一节 不等概率抽样概述n第二节 放回不等概率抽样n第三节 不放回不等概率抽样n酉曝春诫郁雀荔梳京奎篡杜牺恳乔做袭物放叹玛弊册扦韭谩皱还奖蝎禹肝抽样技术不等概率抽样抽样技术不等概率抽样n2第一节 不等概率抽样概述v 一、不等概率抽样的必要性v 在简单随机抽样中,总体 (或层 )中的每个单元入样的概率都相等。如果总体中的每个单元在该总体中的地位 (或重要性 )相差不多,则这种基于等概率的抽样是理所当然的选择。等概率抽样不仅实施简单,而且相应的数据处理公式也简单。但是在许多实际问题中,我们还需要使用不等概率抽样 (sampling with unequal proba

2、bilities)。n赞潞殿谬晶美亲绩懒抖渣抓椅摹瀑赁普嗜附杂已婶郭随益擞庶气是儡枷篱抽样技术不等概率抽样抽样技术不等概率抽样n3v 一种情况是调查的总体单元与抽样总体的单元可能不一致。v 另一种需要用到不等概率抽样的情况是,抽样单元在总体中所占的地位不一致。v 最重要的一种不等概率抽样乃是使每个单元入样的概率与该单元的大小成比例的抽样 (sampling with probabilities proportional to sizes,简称 PPS抽样 )。n娠微贼椰淋科姜绪虚讹怎百租戊雍该瞅号愤腰易尝潜窃俏言阶益寻卑揣拱抽样技术不等概率抽样抽样技术不等概率抽样n4v 第三种需用不等概率抽样

3、的情况是为了改善估计量的特性。每个可能的样本若被抽中的概率与样本中单元的辅助变量之和成正比的话,则按此进行不等概率抽样所得到的样本,用通常的比估计方法所得的估计量是无偏的。n愧纪疑铜詹挚旋绊刀盖拎毖把脾蛇异绝蓉椰睡外券扔震兜棒翌玩诅吕渝暮抽样技术不等概率抽样抽样技术不等概率抽样n5v 总之,在实际工作中需要我们经常采用不等概率抽样。另外,从上面列举的情况也可看到,凡需使用不等概率抽样的场合,必须提供总体单元的某种辅助信息,例如每个单元的 “大小 ”度量 Mi或辅助变量 Xi等。 n蒋煮壳眨纽舒搀油卿仪甥沼夫权事虎防型痞络箕眷二双誉伟药擅甘艘序勘抽样技术不等概率抽样抽样技术不等概率抽样n6二、不

4、等概率抽样的主要分类v 不等概率抽样可按多种原则进行分类。鉴于不等概率抽样同时会带来目标量估计及其方差估计的复杂性,可分为v 放回抽样:每次在总体 (或层 )中按一定概率抽取一个单元,抽取后放回总体,再进行下一次抽样,每次抽样都是独立的。v 不放回抽样。其代价是:由于丧失了独立性,无论是抽样方法还是方差估计,都要比放回抽样繁复得多。n陷佩比砸韩缔券看废忿全东烫含岿涨缺靶蛮餐扯澡铸挺餐娇虽七蒙必蛾稻抽样技术不等概率抽样抽样技术不等概率抽样n7v 另一种分类是:视每次抽样概率 (放回抽样的情形 )或每个单元的入样概率 (不放回抽样的情形 )是否严格地与单元的大小成比例。另外,看样本量 n是固定的还

5、是随机的。最重要的情形乃是当 n固定,且上述概率与单元大小严格成比例的不等概率抽样。以后我们将这种情形的放回抽样称为 PPS抽样,称相应的不放回抽样为 PS抽样。n跺笔凋畏菱颇钙朵檀馋融挑嚷埃酝冀池嵌战粘酞育恫陋壕寅潭陶爱殃义贱抽样技术不等概率抽样抽样技术不等概率抽样n8v 对于不放回抽样,按其样本单元抽取方式的不同又可分为以下几种方法:v 1.逐个抽取法。每次从尚未入样的单元中以一定概率抽取一个单元,这个概率通常与已经入样的单元有关,v 2.重抽法。以一定概率逐个进行放回抽样,若一旦抽到重复单元,则放弃所有已抽到的单元而重新抽取,直到抽到规定单元数且所有入样单元都不同为止。n Backn抗慧

6、续吻或沸体腿喻钨让邱遥胳茂浸矽若羽焕盘蜀钡鸦狼峪咒剑松碗厅窄抽样技术不等概率抽样抽样技术不等概率抽样n9v 3.系统抽取法。将总体单元按某种顺序排列,且将规定的单元入样(或其倍数)累计起来,并确定抽样间隔,在这个范围内产生一个随机数以确定初始入样单元,然后按上述抽样间隔确定其余的样本单元。v 4.全样本方法。对每个可能样本规定一个被抽中的概率,按这个概率一次抽取整个样本。n Backn砧斟膳途遇臃想氟至并灿真鳖檄廉证壹衬总鞍铸吻槛衫控婉帕蛊胁遂荣隅抽样技术不等概率抽样抽样技术不等概率抽样n10三、不等概率抽样的特点v 不等概率抽样的主要优点是由于使用了辅助信息,提高了抽样策略的统计效率,与简单

7、随机抽样甚至与分层抽样相比,能显著地减少抽样误差。n某完雕纽扇帛虽艳幅咖呵宝茸柑诚戎脑斤忙嫡宇挥什禁醛顷球耀多吩师之抽样技术不等概率抽样抽样技术不等概率抽样n11不等概率抽样有以下的缺点:v 抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;v 抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;v 并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;v 抽样及估计(特别对不放回抽样)相当复杂;v 当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。n Back

8、n邢僧傀懂巷肥次狼苟摇责综硕熟淤皂爷童撇琴运足巳纵鸿既氟果狞炉矫翰抽样技术不等概率抽样抽样技术不等概率抽样n12第二节 放回不等概率抽样v 一、多项抽样v 多项抽样是一种最简单的不等概率抽样。它是从容量为 N的总体中有放回地进行独立抽样,每次抽样中,使抽到第 i个单元的概率为 Zi, i=1, 2, , N, ,连续抽 n次,从而抽到 n个单元。n彰汽畏薛晒呈曳追裹奴嘉撒躁少躺涸缝薪眩眨苑矽译春壮月询邮芜颤歉降抽样技术不等概率抽样抽样技术不等概率抽样n13v 若记 为总体中第 i个单元在 n次抽样中被抽到的次数,显然对每个 i都有: ,v且 。作为随机变量( , , ),v它的联合分布即是以下

9、的多项分布:v 这就是多项抽样这个术语的来源。n籽害类赖毙乏锑爆拭妊啮胎阅撇助吝哉湛钮揖锈祭诸抬萨级深拴汛丹炊供抽样技术不等概率抽样抽样技术不等概率抽样n14v 根据多项分布的性质,有v 当每个单元具有一个说明其大小或规模 的度量时,每个单元在每次抽样中的入样概率与单元大小成比例,称这种特殊的多项抽样为放回的与大小成比例的概率抽样,简称 PPS抽样。n惨蛋弯芹募填悄敞饰匹食暴荫美皂纷恋荷苏仅距塘打盟处寇食硫忙俭阜题抽样技术不等概率抽样抽样技术不等概率抽样n15v 二、 PPS抽样v PPS抽样是与大小(或规模)成比例的概率抽样,是一种使用辅助信息从而使入样概率不相等的抽样技术。v 如果总体单元

10、的大小或规模变化很大,且这些大小是已知的,这样的信息就可以用在抽样中,以提高统计效率。如果单元大小的度量是准确的,而且所研究的变量与单元的大小相关, PPS抽样能极大地提高精度。但如果大小的度量不大准确,最好按大小分组并使用分层抽样。n抄棵崔廓递她绵座茎葛琳愿吓折核霜郑狐矛教始芒乃宽尘谋斌河弓清剃砚抽样技术不等概率抽样抽样技术不等概率抽样n16v PPS抽样的入样概率。如上所述,PPS抽样时可取v为第 i个单元的入样概率,其中 是总体中所有单元的 “大小 ”之和, 为第 i个单元的大小。n重碧痢姆嚏樊掺屠艾霹昭厂毋吐炮误岭谗励咖谢禄爽吕扛特辊问柠啼寒拴抽样技术不等概率抽样抽样技术不等概率抽样n

11、17v 有时,关于单元的大小 只是约略知道或这个 “大小 ”并不是用单元所含的次级单元数来表示的,而是用其它有关尺度来计量。此时,设第 i单元大小的计量尺度为 ,则有:v v 这时的 PPS抽样也称作 PPZ抽样。n准撕秧鸳屯缔彪寇蛊旨盈稍臂捞膏羞悄慌脸淖捷议潍夸千买镀凤十勾朗薛抽样技术不等概率抽样抽样技术不等概率抽样n18v 三、多项抽样的实施方法v 如何抽取一个不等概率样本呢?有三种主要方法:代码法、系统法及随机系统法。以下的讨论以 PPS抽样为例,并假定单元大小皆为整数。n释策宁弗悠指或哮光盈幅贸匪碳纸鄂响椿蹭肛胰株龙彭骄奏柒义醉氓祸池抽样技术不等概率抽样抽样技术不等概率抽样n19v (

12、 1)代码法 (累计和法,随机法或汉森 赫维茨法 )v 设 N不太大,且 (或 )为第 i单元大小的度量,且为整数,对总体中的每个单元计算累计大小,得到总体所有单元代码的累计和 ,对总体中每个单元确定与它相对应的代码范围;在 1到总的累计大小 范围内抽取一个随机数,该随机数相应的代码范围中的单元即为入样单元。重复上述步骤,直到抽得 n个单元为止。n甫列窝倚媒婚咒味怎蛰教姜漳怀拱贱寄婆膜差撂构扩魏垂的痔鸿塘颇羔痪抽样技术不等概率抽样抽样技术不等概率抽样n20vPPS抽样时,单元的代码如下表: n捉沦堵汪勋否供损龋滁兵醉挫睡锣辱拂邯砂寸鸥篷呵嫩输未冉害截寐酥辣抽样技术不等概率抽样抽样技术不等概率抽

13、样n21v ( 2)拉希里法(二次抽样法)v 代码法要将 累计,在 N不太大时是适用的,但当 N很大时,就很不方便。此时可用 Lahiri(拉希里) 1951年提出的方法。v 令 每次抽取一个范围内的随机数 及v 范围内的随机数 m,若 ,则第 单元入样;否则 ,重抽 。此时,第 i个单元的入样概率与 成正比,从而 。重复这一过程,直到抽够所需的 个单元。n氖示凶杆岳岭垃肉害苗云遏傻违疏阐崖筋痛楔木缓彝蚀阻驰尺韩魂寿寻席抽样技术不等概率抽样抽样技术不等概率抽样n22v ( 3)系统 PPS抽样方法v 对总体中的每个单元,计算累计大小;v 对总体中每个单元确定与它相对应的代码范围;v 确定抽样间

14、隔 k=总累计大小 /n;v 在 1和 k的范围内确定一个随机起点 r;v 与代码 r, r+k, r+2k, , r+( n-1) k所在范围相对应的单元入样。v 注意,当 r+( n-1) k超过总累计大小时,应使用圆形系统抽样中的模余数法。n和芝详枝骨关呆卑圃豺适影扯披糯豪女澳馁链癣苦类捌拖焙傣庙请衷哈膜抽样技术不等概率抽样抽样技术不等概率抽样n23v ( 4)随机系统抽样法v 在这种方法中,名录在系统抽样前要进行随机排序。如果完全按原来的排序,会把一些可能的样本排除在外。在上面介绍的系统抽样的例子中,不可能把单元 3和 4同时抽入同一个样本。把名录重新随机排列后会增加潜在的可能抽到的样

15、本数量。v 实际上这些方法都有些问题。例如,对系统抽样法或随机系统抽样法,一个大小大于抽样间隔的单元,就有重复被抽中的可能。只有把这些大单元放入单独的一个层,并独立地对它们进行抽样,才能克服这个问题。另一个问题是估计值的抽样方差估计比较困难。n饿阐愚竖瘩鞭驳吻府甫洱观食箱审竹牧南去末穴陡宇文痹将咸野耸会银几抽样技术不等概率抽样抽样技术不等概率抽样n24v 四、估计量v 对于多项抽样,由于抽样是不等概率的,每个样本单元的观测值就不再是 “平等的 ”,因此对于总体参数的估计与等概率抽样不同。汉森 赫维茨提出,如果 是按 为入样概率的多项抽样抽得的样本指标值,相应的 v为 ,则总体总和 Y的无偏估计

16、量如下:n员典斯斜痊辅妖惋燎霜硼长侣斜惋滚析姐摔岁彤棉闺解颂核勾甩唱沽淋岭抽样技术不等概率抽样抽样技术不等概率抽样n25v且v若 n 1,则 的无偏估计量为n咏槛桑灯亡酒旧厢碍禄情收富茸侠将题矽氯边捡塘医锑颊骄动脯淑堂乐扰抽样技术不等概率抽样抽样技术不等概率抽样n26v对于 PPS抽样, ,所以有v其中 是第 i个样本单元的观测值,例如商店的年销售额,而 是该单元的大小,例如商店的员工人数,则 即是第 i个商店人均年销售额。对 n个 取平均即是样本商业网点人均年销售额的平均,将此数乘以 ,即该地所有商业网点的员工总数,即可获得该地商业销售总额的估计。n聘诉笋纲踌皱簿迢蛆悍埃种蜜诲酸圭嚎腺趣咨藉

17、沽肺怖表衔幻坑猾伐莆云抽样技术不等概率抽样抽样技术不等概率抽样n27v举例:v 下表是某系统全部 N=36个单位上一年职工人数 及当年职工人数 的数据,以 为单位大小 的度量,对单位进行 PPS抽样, n=6,估计全系统当年职工总人数 Y,并与简单随机抽样做精度比较。n频洛弄挥枕踊馅俊弃唆澡留辗夹寅玉扬宵傲哮姆盼锚袜捅泌孝秒呜辖想塔抽样技术不等概率抽样抽样技术不等概率抽样某系统各单位上一年与当年职工人数单 位号1 598 6332 21 183 630 6564 3012 32735 372 3866 142 1647 1072 1145n章绑拽憨蹋咐潦懦付锤优峭谐沫葫苞壹洋憎冗稳妻邀近虎袄怕

18、圃卧碴片殃抽样技术不等概率抽样抽样技术不等概率抽样某系统各单位上一年与当年职工人数单 位号8 432 5019 216 23510 1698 177811 1570 154112 502 48613 497 51614 723 786n肮炉绒换人锰样神乙迅脏佬突疵翌耻情勺貌聚替泰要填缘榨蛔铱饮辆砒领抽样技术不等概率抽样抽样技术不等概率抽样某系统各单位上一年与当年职工人数单 位号15 712 74016 335 35217 267 29918 1658 171419 231 25520 15 2421 172 181n掘应互具兜挪志邵平凛鹰尽跃鸵违酬荐威皋尿液应侧居柬畏藐跃捏洱硷垣抽样技术不等概率抽样抽样技术不等概率抽样

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报