收藏 分享(赏)

分层随机抽样(答案).doc

上传人:weiwoduzun 文档编号:5661898 上传时间:2019-03-11 格式:DOC 页数:7 大小:254.67KB
下载 相关 举报
分层随机抽样(答案).doc_第1页
第1页 / 共7页
分层随机抽样(答案).doc_第2页
第2页 / 共7页
分层随机抽样(答案).doc_第3页
第3页 / 共7页
分层随机抽样(答案).doc_第4页
第4页 / 共7页
分层随机抽样(答案).doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、分层随机抽样一、单选题1、分层抽样设计效应满足(B)A、 B、 C、 D、1def1def1def1def2、分层抽样的特点是(A)A、层内差异小,层间差异大B、层间差异小,层内差异大C、层间差异小D、层内差异大3、下面的表达式中错误的是(D)A、 B、 C、 D、1hfnh1hW1hN4、在给定费用下估计量的方差 达到最小,或者对于给定的估计量方差 使得总费)(styVV用达到最小的样本量分配称为(C)A、常数分配 B、比例分配 C、最优分配 D、奈曼分配5、最优分配( ) 、比例分配( )的分层随机抽样与相同样本量的简单随机抽样(opt pro)的精度之间的关系式为(A)srVA、 B、

2、srprotVsroptprVC、 D、srtrtrsr6、下面哪种样本量分配方式属于比例分配?( A)A、 B、 Nnh hLhcSNn1C、 D、LhSn1 LhW17、下面哪种样本量分配属于一般最优分配?( B)A、 B、 Nh hLhcSNn1C、 D、LhSNn1 LhSWn1二、多选题1.分层抽样又被称为( BC )A. 整群抽样 B. 类型抽样 C. 分类抽样 D. 系统抽样 E. 逆抽样2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD )A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计3.样本量在各

3、层的分配方式有( ABCD )A. 常数分配 B. 比例分配 C. 最优分配 D. 奈曼分配 E. 等比分配4.分层抽样的优点有( ABCDE ) A. 在调查中可以对各个子总体进行参数估计 B. 易于分工组织及逐级汇总C. 可以提高估计量的精度 D. 实施方便 E. 保证样本更具有代表性5.关于分层数的确定,下面说法正确的有( CE ) A. 层数多一些比较好 B. 层数少一些比较好 C. 层数一般以不超过 6 为宜D. 层数一般以 4 层为最好 E. 应该充分考虑费用和精度要求等因素来确定层数6.下面哪种样本量分配方式属于奈曼分配? ( CD )A. B. C. hnN1/hLhNScn1

4、khLnNSD. E. 1hhLWSn 1/hLhWcnS7.事后分层的适用场合有(ABCD ) A. 各层的抽样框无法得到B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道D. 总体规模太大,事先分层太费事E. 一般场合都可以适用三、名次解释1. 分层随机抽样 2. 自加权 3. 最优分配四、简答题1. 简述分层随机抽样相对于简单随机抽样的优点。2. 请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。3. 怎样分层能提高精度?4. 总样本量在各层间分配的方法有哪些?5. 分层的原则及其意义。五、计算题1.

5、抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财产的倍, 与第 层的均值的平方根成正比。高房租层有 4000 个住户,低房租层hS有 2000 个住户。请问:(1)包含 1000 个住户的样本应该如何在这两层中分配?(2) 若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费用相等)?2. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。农场规模(英亩) 农场数 hN平均每一农场的玉米面积 hY标准差 hS040418

6、0811201211601612002012402413944613913341691131485.416.324.334.542.150.163.88.313.315.119.824.526.035.2总和或均值 2010 26.3 -现要抽出一个包含 100 个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:(1)按比例分配时,各层的样本量为多少?(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)(3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。3. 设费用函数具有形式 ,其中 及 均为已知数,请证明当总费0hCctn0cht用固定时,为了使 达到

7、最小值, 必与 成比例。并求出下述条件中,()stVyh2/3()hWSt一个含量为 1000 的样本所对应的 。hn层 Sht1230.40.30.34561244. 在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由 400 人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测,这些设备 40%到 50%是由男性使用的,20%到 30%是由女性使用的,5%到 10%是由管理人员使用的。请问:(1)你如何把样本单位分配在这三组人之间?(2)若真正使用者占的比例分别是 48%,21%和 4%,则估计比例 的标准误是多少?s

8、tp(3)n=400 的简单随机样本算得的 p 的标准误是多少?5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对 14 岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率 P 的估计及其标准差的估计。高血压患病率调查数据年龄组 层权 hW层样本量 hnhphq1425 岁2640 岁4160 岁61 岁以上0.2810.3220.2130.8144006506003500.0830.1740.3100.4640.9170.8260.6900.5366. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到 的较好的估计值。第三层是一

9、些新开设的商店和以前调查中没有销售额的商店,因此,2hS的值只好加以猜测。若 的实际值是 10,当被猜作( a)5, (b) 20 时,请分别计算3 3S一下由奈曼分配所得的估计量的 。并请证明在这两种情况下,与真正的最优值相比,()stVy方差中按比例的增量稍大于 2%。估计的 hS层 hW真值hS(1) (2)1230.30.60.1302010302053020207. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取 10 个村作为样本单元,经过调查获得下列数据:样本村养牛头数层 村总数1 2 3 4 5 6 7 8 9 101 1411 43

10、84 98 0 10 44 0 124 13 02 4705 50 147 62 87 84 158 170 104 56 1603 2558 228 262 110 232 139 178 334 0 63 2204 14997 17 34 25 34 36 0 25 7 15 31请估计该地区养牛总头数 Y 及其估计量的相对标准差 。A()/sY8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料:工人 技术人员 行政管理人员=1321N=362S=922=25S=273N=92S若总样本量 n=30,试用奈曼分

11、配确定各层的样本量。9. 上题中若实际调查了 18 个工人、10 个技术人员、2 个行政人员,其损失的工时数如下:工人 技术人员 行政管理人员8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8试估计总的工时损失数并给出它的置信度为 95%的置信区间。10. 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分为平原和山区两层采用分层抽样。同时当年产量和去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有 120 个村,去年总产量为 24500(百斤) ,山区共有 180 个村,去年总产出为 212

12、00(百斤) 。现从平原用简单随机抽样抽取 6 个村,从山区抽取 9 个村,两年的产量资料列在下表中。试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。平原样本 去年产量(百斤) 当年产量(百斤)1 204 2102 143 1603 82 754 256 2805 275 3006 198 190山区样本 去年产量(百斤) 当年产量(百斤)1 137 1502 189 2003 119 1254 63 605 103 1106 107 1007 159 1808 63 759 87 9011. 一公司希望估计某一个月内由于事故引起的工时损失

13、。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:工人 技术人员 行政管理人员N1=132 N2=92 N3=27S12=36 S22=25 S32=9若样本量 n=30,试用你乃曼分配确定各层的样本量。12. 上题中若实际调查了 18 个工人,10 个技术人员,2 个行政人员,其中损失的工时数如下:工人 技术人员 行政管理人员8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8试估计总的工时损失数并给出它的置信度为 95%的置信区间。13. 在估计比例问题时:(1) 假设 P=0.5,W1

14、=W2=0.5,则 P1和 P2为何值时可以使按比例分配的分层抽样精度可以得益 20%(即 =0.8))(srproV(2) 若 P=4%,其中 W1=0.05,P 1=45%;W 2=0.2,P 2=5%; W3=0.75, P3=1%.则采用按比例分配的分层抽样比简单随机抽样精度得益有多大?14. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取 10 个村作为样本单元,经过调查获得下列数据层 村总数 样本村养牛头数1 2 3 4 5 6 7 8 9 10 12341411470525581499743 84 98 0 10 44 0 124 13 0

15、50 147 62 87 84 158 170 104 56 160228 262 110 232 139 178 334 0 63 22017 34 25 34 36 0 25 7 15 31要求:(1) 估计该地区养牛总头数 Y 及其估计量的相对标准误差 Ys)(2) 讨论分层抽样与不分层抽样比较效率有否提高。(3) 若样本量不变采用乃曼分配可以减少方差多少?15. 用下面的工厂分组资料按工人人数分组 工厂数目 每工厂产值(万元) 标准差14950991002492509991000 人以上18260431522331057567100250500176022508020060019002

16、500(1) 若欲抽取 3000 个工厂作样本来估计产值,试比较下列各种分配的效率:(2) 按工厂数多少分配样本;按最优(奈曼)分配。16. 一个样本为 1000 的简单随机样本,其结果可分为三层,相应的=10.2,12.6,17.1, =10.82(各层相同), =17.66,估计的层权是 =0.5,0.3,0.2,2y2hs2shw已知这些权数有误差,但误差在 5%以内,最不好的情况是 =0.525,0.285,0.190 或hW=0.475,0.315,0.210,你认为是否需要分层?hW17. 设费用函数具有形式 ,其中 , (h=1,L)均为已知数。LhhTncC100ch试证明当总的费用固定时,为了使 达到最小, 必与 成比例。)(styVh32)(hSW18. 假设总体包含大小相等的 L 个层,且 N 相对于 L 和 n 来说很大。 表示简单随ranV机样本均值的方差, 表示按比例分配的分层随机抽样时的相应方差。试证明下列两式pro近似成立:(1) LhranYSV122)((2) 2pro其中 表示层内的平均方差,即hSLhS122

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报