1、 第四章 分层随机抽样 第一节 概述 南非摄影师 迈克 首创,拍摄 100张当地人像,合成地域特色的女性面容。 据英国 太阳报 10日报道,南非摄影师迈克在世界各地拍摄数千张图片,然后通过软件合成了几十张全球女性“大众脸”。 合成的香港大学生大众脸 一、分层抽样和分层随机抽样的概念 (一)分层抽样 1 层:互不重叠且穷尽的若干个子总体 2 分层抽样 3 分层样本 分层抽样样本图示 (二)如果每层中的抽样都按简单随机抽样进行,那么,抽样就称为分层随机抽样,所得的样本就称为分层随机样本。 (三)分层抽样的步骤 1 总体分层 2 在每一层中抽样 3 得到总体的估计量。 4 得到总体估计量的方差估计。
2、 二、分层抽样的特点和 适用场合 (一)特点: 1 既可用于总体参数的估计,还可用于对层的参数进行估计 2 实施灵活,便于组织,数据处理简单 3 样本分布更加均匀 4 能较大的提高调查的精度 (二)适用场合: 1 总体简单随机抽样框无法编制,或难以编制; 2 总体各部分特点不同; 3 总体分布不均匀或差异大,为降低方差。 三 记号1 总体分为 L 层,以 h 表示层的编号 ,h = 1 , 2 , L 。第 h 层的单元数为 Nh,已知。 NNNLhh 1Wh = Nh/N ,层权,也是已知的。2 Yhi, yhi分别为 h 层总体和样本中的第 i 个单元的指标值。3 第 h 层总体 (样本)
3、均值分别为:hhnihihhNihihhynyYNY111,14 第 h 层总量及样本总量分别为:hhnihihhhNihihhhyynyYYNY11,5 第 h 层方差及样本方差分别为:hhnihhihhNihhihhyynsYYNS122122)(11,)(116 第 h 层抽样比为:hhhNnf 第二节 简单估计量及其性质 一、对总体均值与总量的估计 (一) 对总体均值与总量的估计 1 对一般分层抽样: ststhhhLhhstLhhhstYNYYNYYYYWY,11 则:如果每个2 对一般的分层抽样: LhhstLhLhhhhstststhhYVYVYVWYWVYVYYYYYY11 1
4、2)()()()()()()(独立的,因此:由于各层的抽样是相互的无偏估计:也是则的无偏估计,是若3 对分层随机抽样:hhststhhststyNyNYyWyY(二 ) 分层随机抽样估计量 的性质 1 总体均值的简单估计量: ( 1 )样本均值是总体均值的无偏估计 YyEst )( 2) 估计量的方差起的方差减少。即有限总体修正系数引放回的,其意义为由于抽样是不其中, ,111)()(22222221221212hhhhhhhhhhhLhhhhhLhhhhLhhhstNSWNSWNSWnSWSNnWSnfWyVWyV( 3) 估计量方差的估计 NsWnsWfnsWyvyVSsEyynsShhh
5、hhhLh hhhststhhnihhihhhh222122221222)1()()()(.)(11的无偏估计为2 总体总量的简单估计量hhhhhhhhhhststnsnNNYvnSnNNYVYYE22)()()()()(例:某市进行家庭收入调查,分城镇和 农村居民两部分进行抽样, .1 71 9 80,2 54 6,9 85 6,2 50,1 48 4 203 97 2,1 51 8 0,3 00,2 35 6 02122221111NNNsynNsynN农村:城镇:抽样均按简单随机抽样进行,求全市年 平均户收入的估计及其 90% 的置信区间。 解: 计算层权:W1=N1/N=0.137,
6、W2=N2/N=0.863 。49.0 8 1 9129.1 0 3 5 1312.142645.139.1 0 5 8 5%90645.1%,901312.142)()(67.2 0 2 5 210.4577.2 0 2 9 7)(10.451 7 1 9 8 02 5 4 6863.03 9 7 2137.077.2 0 2 9 72502 5 4 6863.03003 9 7 2137.0)()2(39.1 0 5 8 59 8 5 6863.01 5 1 8 0137.0)1(2222222222211元元,即:的置信区间为的全市年户均收入求YyvysyvNsWnsWyvyWyWyst
7、ststhhhhhstst二、对总体比例(成数) 的估计 1 成数 P 或总数 A 的估计 : 层比例 Ph=Ah/Nh , Qh=1 Ph层样本比例 ph=ah/nh , qh=1 phAh与 ah是第 h 层总体及样本中具有 所研究特征的单元数。 2 总体成数 P 的无偏估计为 )1()()()(12121hLhhhhhsthLhhhstLhhhstfnQPWpVNpVWpVpWpP很大,则:3 估计量方差的估计估计量方差的一个无偏估计为:hhLh hhhhhLh hhhhstqpnnNNNfnqpWpv1)(1)1(1)(2124 总体具有某种特征单元总数 A 的估计量及方差为:hhLh hhhhsthhhLh hhhhstLhhhststqpnnNNpvnQPNnNNAVpNNpA11211)()(1)()(