1、第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号 164,在 099中产生随机数 r,若 r=0或 r64则舍弃重抽。(2)总体编号 164,在 099中产生随机数 r,r 处以 64的余数作为抽中的数,若余数为 0则抽中 64.(3)总体 2000021000,从 11000中产生随机数 r。然后用 r+19999作为被抽选的数。解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。因此(1)中只有 164是可能被抽中的,故
2、不是等概的。 (2)不是等概的【原因】 (3)是等概的。2.2抽样理论和数理统计中关于样本均值 的定义和性质有哪些不同?y解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论 概率统计定义 niy1 niy1性质1.期望 YCPENNCnn1ii1iiy2.方差 iiiiyVnN21nNCiiiyEnN1212Sf1.期望 niyE1niyE1i2.方差 2iyV1niEnyn2i2.3为了合理调配电力资源,某市欲了解 50000户居民的日用电量,从中简单随机抽取了 300户进行,现得到其日用电平均值 9.5(千瓦时) , 206.试y2s估计该市居民用电量的 95%置信区间。如果
3、希望相对误差限不超过 10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300, ,5.9206s170632*30511)( 222 snfNyvYV9.4876()v该市居民用电量的 95%置信区间为 =4750001.96*41308.19)(y2Vz即为(394035.95,555964.05)由相对误差公式 10%y)(vu2可得 %10*5.96n501*96. 即 n862欲使相对误差限不超过 10%,则样本量至少应为 8622.4某大学 10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到 P=0.35,是
4、估计该大学所有本科生中暑假参加培训班的比例的 95%置信区间。解析:由已知得: 10N2n35.0p02.Nnf又有: .)(Ep 1.)(1)(pV该大学所有本科学生中暑假参加培训班的比例 95%的置信区间为:)()(2PVZE代入数据计算得:该区间为0.2843,0.41572.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为 20的样本,调查结果列于下表:编号 文化支出 编号 文化支出1 200 11 1502 150 12 1603 170 13 1804 150 14 1305 160 15 1006 130 16 1807 140 17
5、1008 100 18 1809 110 19 17010 240 20 120估计该小区平均的文化支出 ,并给出置信水平 95%的置信区间。Y解析:由已知得: 20Nn根据表中数据计算得: 5.1420iy06842.72012iis.3)()2sNnyV105.6)(yV该小区平均文化支出 的 95%置信区间为: 即是:132.544 Yy2z,156.456故估计该小区平均的文化支出 =144.5,置信水平 95%的置信区间为132.544 ,156.456。2.6某地区 350个乡为了获得粮食总产量的估计,调查了 50个乡当年的粮食产量,得到 =1120(吨) , ,据此估计该地区今年
6、的粮食总产量,并给y2560S出置信水平 95%的置信区间。解析:由题意知: =1120 1429.3nNf 560S1s置信水平 95%的置信区间为: 代入数据得:y2snfz置信水平 95%的置信区间为:1079.872,1160.8722.7某次关于 1000个家庭人均住房面积的调查中,委托方要求绝对误差限为 2平方千米,置信水平 95%,现根据以前的调查结果,认为总体方差 ,是682S确定简单随机抽样所需的样本量。若预计有效回答率为 70%,则样本量最终为多少?解析:简单随机抽样所需的样本量 221SZNdn%701n由题意知: 10N68296.2代入并计算得: 13.61n8714
7、.701n故知:简单随机抽样所需的样本量为 61,若预计有效回答率为 70%,则样本量最终为 872.8某地区对本地 100家化肥生产企业的尿素产量进行调查,一直去年的总产量为 2135吨,抽取 10个企业调查今年的产量,得到 ,这些企业去年的25y平均产量为 。试估计今年该地区化肥总产量。2x解析:由题可知 , ,35.210NXy则,该地区化肥产量均值 的比率估计量为Y26.45.xXY该地区化肥产量总值 Y的比率估计量为 .*10RN所以,今年该地区化肥总产量的估计值为 2426吨。2.9如果在解决习题 2.5的问题时可以得到这些家庭月总支出,得到如下表:单位:元编号 文化支出 总支出
8、编号 文化支出 总支出1 200 2300 11 150 16002 150 1700 12 160 17003 170 2000 13 180 20004 150 1500 14 130 14005 160 1700 15 150 16006 130 1400 16 100 12007 140 1500 17 180 19008 100 1200 18 100 11009 110 1200 19 170 180010 140 1500 20 120 1300全部家庭的总支出平均为 1600元,利用比估计的方法估计平均文化支出,给出置信水平 95%的置信区间,并比较比估计和简单估计的效率。解析
9、:由题可知1580317023xn1i )( 5.4y091.18.xrR又32.465*6yX053.826)(12niiyS18.4)(1niiixy x579.83)(122niixS故平均文化支出的 95%的置信区间为 ,)2(1 22 xyxR SRnfZy )2(122 xyxR SRSnfZy代入数据得(146.3291.96*1.892)即为142.621,150.0372.10某养牛场购进了 120头肉牛,购进时平均体重 100千克。现从中抽取 10头,记录重量,3 个月后再次测量,结果如下:单位:千克编号 原重量 现重量1 95 1502 97 1553 87 1404 1
10、20 1805 110 1756 115 1857 103 1658 102 1609 92 15010 105 170用回归估计法计算 120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。解:由题可知, 6.1025910xni )( 37y1i)( 2.190*)(122 niiS3.467)(1niiixy xy93.1064.2*9)(122 niixxS故有 3680420xy所以总体均值 的回归估计量为Y43.159)6.021(*.1)(0 Xylr其方差估计为:)()( 0202xyxlr SSnfV= )3.146*8.93.16*81(02=1.097而
11、 2y(SnfV)= .1*0=19.454显然 )(yVlr所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考)1解:(1)不合适(2)不合适(3)合适(4)不合适2将 800名同学平均分成 8组,在每一级中抽取一名“幸运星” 。3根据表中调查数据,经计算,可得下表:h 21 10 256 0.3033 0.0391 11.2 2867.2 94.42 10 420 0.4976 0.0238 25.5 10710 302.53 10 168 0.1991 0.0595 20 3360 355.6总计 30 844 1 16937.2= =20.113=1V( )= -=122=12
12、=9.7681-0.2962=9.4719=3.0777 V( )(2)置信区间为 95%相对误差为 10%,则有按比例分配的总量:n= =185.4407 185=12+=12 =n =56, =92, =3711 2 3按内曼分配:n= =175( =12)2+1=12=33, =99, =431 2 34根据调查数据可知:h 1 0.18 0.92 0.21 0.9333 0.14 0.94 0.08 0.8675 0.16 0.9336 0.22 0.967= =0.924=1根据各层层权 及抽样比 的结果,可得 ( )= =0.000396981124=12(1)1=1.99% (
13、)估计量的标准差为 1.99%,比例为 9.24%按比例分配:n=2663=479, =559, =373, =240, =426, =5861 2 3 4 5 6内曼分配:n=2565=536, =520, =417, =304, =396, =3921 2 3 4 5 65解:由题意,有= =75.79=1购买冷冻食品的平均支出为 75.79元又由 V( )= +1 =1212=1(1)2又 n=1/V( )=53.8086 =7.3354V( )95%的置信区间为60.63 ,90.95。7解:(1)对(2)错(3)错(4)错(5)对8解:(1)差错率的估计值 = 70%+ 30%=0.
14、027143 257估计的方差 v( )= =3.1967=1212 104标准差为 S( )=0.0179。(2)用事后分层的公式计算差错率为 = =0.03=1(1=1)估计的方差为;v( )= - =2.572622 12 1049解:(1)所有可能的样本为:第一层 第二层1 1 2 23,5 0,3 8,15 6,93,10 0,6 8,25 6,155,10 3,6 15,25 9,15(2)用分别比估计,有 =0.4, =0.65,所以用分别比估计可计算得1 2=6.4。用联合比估计,有 =0.5, =0.625,所以用联合比估计可计算得 =6.5。1 2 第四章习题4.1 邮局欲
15、估计每个家庭的平均订报份数,该辖区共有 4000户,划分为 400个群,每群 10户,现随机抽取 4个群,取得资料如下表所示:群 各户订报数 ijy iy1 1,2,1,3,3,2,1,4,1,1 192 1,3,2,2,3,1,4,1,1,2 203 2,1,1,1,1,3,2,1,3,1 164 1,1,3,2,1,5,1,2,3,1 20试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。解:由题意得到 , , ,40Nn0M01.4Nnf故 (份)875.1412691 niyMY(份)75.8.0y(份)75041yNMYniibs122)(niibyfsnfyv122)()
16、( 4)75.180()75.89(104. 2223. 6270039185.)()( 22 yvMNYv于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为0.00391875。该辖区总的订阅份数为 7500,估计量方差为 62700。4.2 某工业系统准备实行一项改革措施。该系统共有 87个单位,现采用整群抽样,用简单随机抽样抽取 15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:单位 总人数 赞成人数1 51 422 62 533 49 404 73 455 101 636 48 317 65 388 49 309 73 5410 61 4511
17、 58 5112 52 2913 65 4614 49 3715 55 42(1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过 8%,则应抽取多少个单位做样本?解:题目已知 , ,87N15n8715Nnf1)由已知估计同意改革的比例 709.1641niiiMyp73.601nii 0867.)()(122 niiiMpyfMpv此估计量的标准差为 932.0867.)(vs4.3 某集团的财务处共有 48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公费用支出的数额,随机抽取了其中的 10
18、个抽屉,经过清点,整理出办公费用的票据,得到下表资料:抽屉编号 票据数 iM费用额( ,百元)iy1 42 832 27 623 38 454 63 1125 72 966 12 587 24 758 14 589 32 6710 41 80要求以 95%的置信度估计该集团办公费用总支出额度置信区间( =0.05) 。解:已知 N=48, n=10, f= , 由题意得 , ,4810Nn7361niy3651niiM则办公费用的总支出的估计为 (元)8.520481niY群总和均值 (元)6.7310niy)()1()(122nfNYvnii= 9)6.7380(.)6732()6.738(
19、10)4(8 222 = 182.4 3590.49= 72765.44=269.7507)(Yv则 的置信度为 95%的置信区间为 3532.8 1.96 269.7507,即3004.089,4061.511.4.4 为了便于管理,将某林区划分为 386个小区域。现采用简单随机抽样方法,从中抽出 20个小区域,测量树的高度,得到如下资料:区域编号数目株数 iM平均高度(尺)iy区域编号 数目株数 iM平均高度 (尺)iy1 42 6.2 11 60 6.32 51 5.8 12 52 6.73 49 6.7 13 61 5.94 55 4.9 14 49 6.15 47 5.2 15 57
20、 6.0 6 58 6.9 16 63 4.97 43 4.3 17 45 5.38 59 5.2 18 46 6.79 48 5.7 19 62 6.110 41 6.1 20 58 7.0 估计整个林区树的平均高度及 95%的置信区间。解:由已知得 , ,386N20n0518.362Nnf整体的平均高度 9.104yY1-iiniiM3.521niiM方差估计值 1)(1)( 22nyMfyvYiii076.标准方差 64.0.)(vs在置信度 95%下,该林区的树木的平均高度的置信区间为 )231.,58.()1.960.5()Yt/2 (s4.5 某高校学生会欲对全校女生拍摄过个人艺
21、术照的比例进行调查。全校共有女生宿舍 200间,每间 6人。学生会的同学运用两阶段抽样法设计了抽样方案,从 200间宿舍中抽取了 10间样本宿舍,在每间样本宿舍中抽取 3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表:样本宿舍 拍照人数 样本宿舍 拍照人数1 2 6 12 0 7 03 1 8 14 2 9 15 1 10 0试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:题目已知 , , , , ,0Nn6M3m5.21Nnf5.2Mmf 3.019nypi 0574.)()(12 niimpyfmv78.054.)(ps在置信度 95%下,p 的置信区间为=)(2
22、/vt )0.4856,.132()5.9613.4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿舍间的标准差为 =326元,宿舍内同学之间的标准差为1S=188元。以一位同学进行调查来计算,调查每个宿舍的时间 为 1分钟,2S c为了调查需要做各方面的准备及数据计算等工作,所花费的时间为 是 40小时,如果总时间控制在 8小时以内,则最优的样本宿舍和样本学生是多少?解:由已知条件得到以下信息:(元) (元) (分钟) (分钟)326S118S210c1c2(分钟)40c0由此得到, ,1627S35S2 3.10856354102712u MS8.0618m
23、21opt c因而取最优的 ,进一步计算optn由于总时间的限制 ,由关系式480C得到ncC210 optt212计算方程得到 ,因而取opt0n则最优的样本宿舍数为 20间,最优样本学生数为 2。4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有 500名居民,居住在 10个单元中。现先抽取 4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以 10分钟为 1个单位):单元 i居民人数 iM样本量 im健身锻炼时间 ijy1 32 4 4,2,3,62 45 5 2,2,4,3,63 36 4 3,2,5,84
24、 54 6 4,3,6,2,4,6试估计居民平均每天用于锻炼的时间,并给出估计的标准差。(1) 简单估计量(2) 比率估计量(3) 对两种估计方法及结果进行评价。解:(1)简单估计 niiniuYNyMY11= )17.45.364.57.32(40=1650,则 ,.016Yu又 ,16541uni所以 niiiiniui msfMNYf 122122u )()(N)Yv()分别计算 19263578 )1652()165()1653()1650()( 22212 nniui48.626.)541( 47)361(58.2)41(92.)341(2)(2 22 niiiimsfM所以, 16
25、2.0485.156.0)1()(n(N)( 221220 niiiiniuiu msfMNYfMYv)所以标准差 )()(uuYvs(2) 比率估计 9532.5436217.457.31 niiiiRMy niiiiniuiR msfMNYfyv 122122 )()(N)()其中 niiiiRyMY1075.)(20vyR2647.01.)()(RRs(3) 简单估计标准差 ,比率估计标准差.)(uYs 2647.0)(Rys比率估计更好第五章不等概抽样习题答案5.1解:分析题目可知“代码法”与“拉希里法”都是 PPS抽样(放回的与规模大小成比例的不等概抽样)的实施方法,而此题需要用此两
26、种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复:(1) 代码法:由 = 可假设 =1000000,则 M = M 列成数据iZN1iii0iM0iZ0表为:PSU Mi 累计 Mi 代码1 110 110 11102 18556 18666 111186663 62999 81665 18667816654 78216 159881 816661598815 75245 235126 1599822351266 73983 309109 2351273091097 76580 385689 30
27、91103856898 38981 424670 3856904246709 40772 465442 42467146544210 22876 488318 46544348831811 3721 492039 48831949203912 24971 517010 49204051701013 40654 557664 51701155766414 14804 572468 55766557246815 5577 578045 57246957804516 70784 648829 57804664882917 69635 718464 64883071846418 34650 75311
28、4 71846575311419 69492 822606 75311582260620 36590 859296 82260785929621 33853 893049 85929789304922 16959 910008 89305091000823 9066 919074 91000991907424 21795 940869 91907594086925 59185 1000054 9408701000054我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为 444703, 615432, 791937, 921813 , 738207, 176266,
29、405706 935470, 916904, 57891按照范围我们可以知道抽取的 PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第 2组和 24组重复抽取了,故进行重新抽取,抽到 4组和 6组;综上所述,抽取的样本为 2,4,6,8,9,16,18,19,23,24 组(2)拉希里法:M =78216,N=25,在1, 25和1, 78216中分别产生(n,m):(13,38678) ,M =40654 38678,入样;13(8, 57764) ,M =3898157764,舍弃,重抽;8(23,1336
30、5) ,M =906613365,舍弃,重抽;23(19,38734) ,M =69492 38734,入样;19以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:2,3,5,6,7,12 ,13,16, 19,24 组5.2解:由数据可得:t = =20, t ,t =38, t =24, t =21; 1iMjjy215Mjjy345结合 t值数据,我们可以推得 Z的值Z = ,Z =0.16,Z =0.32,Z =0.2,Z =0.12,12.050 345由公式 Niiji jijiij ZZ12214样本 ij1,2 0.2737691,3 0.2174051,4 0.2
31、830791,5 0.2438262,3 0.1662512,4 0.2131422,5 0.2438263,4 0.6039033,5 0.535464,5 0.2438265.3 解:设: =1,则有: ,得到下表:0MiiZi i 10iM累计 10i 代码1 0.104 104 104 11042 0.192 192 296 1052963 0.138 138 434 2974344 0.062 62 496 4354965 0.052 52 548 4975486 0.147 147 695 5496957 0.089 89 784 6967848 0.038 38 822 7858
32、229 0.057 57 879 82387910 0.121 121 1000 88010001 1000先在1,1000中产生第一个随机数为 731,再在1,1000里面产生第二个随机数为 103,最后在1,1000中产生第三个随机数为 982,则它们所对应的第7、1、10 号单元被抽中。5.4 解:利用汉森-赫维茨估计量对总体总值进行估计:9.3287.79543.1060.217.096.2170. .38.1 06.217.096.1238.0 22 2 niHiHniiYZyYv=20318.85.4HHYvs5.5解:由题可知=2+9+3+2+1+6=23 6110iiNiXX由
33、 得下表:0niii 指标值 iX包含概率 iiZ1 2 0.1739 0.0872 9 0.7826 0.39133 3 0.2609 0.13044 2 0.1739 0.0875 1 0.087 0.04356 6 0.5217 0.2609由上表显然有 1/2,于是我们可以采用布鲁尔方法:iZNiiji jijiij Z12214经计算可得下表:样本 ij1,2 0.00681,3 0.01531,4 0.00971,5 0.00461,6 0.03972,3 0.16072,4 0.10462,5 0.05122,6 0.36133,4 0.01533,5 0.00743,6 0.0
34、624,5 0.00464,6 0.03975,6 0.0191附注:(1) 78.254.076.1053.764.9.1053.21 NiiZ(2)样本 jiZjiZ1,2 0.0340 1.26131,3 0.0133 0.21741,4 0.0076 0.1741,5 0.0038 0.13051,6 0.0227 0.34792,3 0.051 0.52172,4 0.034 0.47832,5 0.017 0.43482,6 0.1021 0.65223,4 0.0113 0.21743,5 0.0057 0.17393,6 0.034 0.39134,5 0.0038 0.130
35、54,6 0.0227 0.34795,6 0.0113 0.3044验证:niiHZxX1 iiniiHTnZxX1T另外: 2121 Niij jiijjHTiNiH XXVZXnXV 代入数据,经计算得到:HTHXV05.6 解:i iyixiR1 10 7 1.432 9 5 1.83 5 3 1.674 2 1 25 4 2 2平均 6 3.6 1.78由题可计算出:(1)i iYiYiPiR1 10 50 10 1.432 9 45 9 1.83 5 25 5 1.674 2 10 2 25 4 20 4 2=11.56YNiiYS122所以有: =10.062521nfyVxyR
36、yPNY562.10625.12 VYyV(2)由定义有:3218.5 5.1112 22 XYNSS YNSRXYYiiiyxx iiR所以得到下表:i RiYRiR1 5.148 25.74 1.432 6.48 32.4 1.83 6.012 30.06 1.674 7.2 36 25 7.2 36 2 RVNXYVRXYVSSnfRiRi xyx22221所以有下表:i Ri Ri R1 1296 51.84 4.6 1.432 1846.8 73.872 5.7 1.83 1717.2 68.688 5.3 1.674 2041.2 81.648 6.3 25 2041.2 81.6
37、48 6.3 2(3)结合题目已知条件,我们选择的包含概率与 成正比:iX(第 i项被选中)PZiii i iyHY2YS1 7/18 10 25.7 18.492 5/18 9 32.4 5.763 3/18 5 30 04 1/18 2 36 365 2/18 4 36 36254.71183620376.9.18721YZYVHNi由以上计算结果可以看出: ,比估计在样本量很小的YVVHR情况下即使是最小的方差也远比另外两种估计的方差大,而简单估计又比 PPS汉森-赫维茨估计略好。5.7 解:已知 n=2 m=5 设公司总人数为3401nimjiy0M由于这个样本是自加权的,所以有:(分
38、钟)0010 34MynmMYijij (分钟)340y所以该公司职工上班交通平均所需时间为 34分钟。2401 34063410410 222212 nimjijyy(分钟)6.5ys5.8 说明: 216y解:由题可知: (吨)4.9521860101 iiiiniiH yZyY所以,全集团季度总运量为 495299.4吨.的一个无偏估计为:HYV 951836018690122 iHiniHiH YyYZ因为 =2.306 所以 =22497.82/t 2/t530所以置信度 95%的置信区间为472894.6 , 517890.2第 6章第 2题证明:将总体平方和按照全部可能的系统样本
39、进行分解,可以得到+krnjrjYySN12_2)()( krnjrjy12_)(knjrY12_)(+kr12_)(krnjrj12_)(+krYyn12_)(krnjrjy12_)(krYy12_)(2)(SNkkrnjrj12_)(根据 的定义,且 ,有_syV)(sykrY12_)(2)(SNkrnjrjy12_)(令 2wsySkrnjrjy12_)()(则有_syV2SN21wsyS证明:在样本量相同的情况下)(_sy)(_sy2)2)(wsyNnk21Snf1(S)(wsyk2)2syNk)(wsn)()12wsySNnk立即可得到当且仅当 时,系统抽样优于简单随机抽样。2Sws
40、y第 3题解: ,k 取最接近于 5.7而不大于 5.7的整数 5,则将7.540nNk该班同学编号 140,随机起点 r=5,则该样本单元序号为5,10,15,20,25,30,35。 , , 。375nkSethi对称系统抽样: ,入样单元为:5,6,10,16,15,26,20rSingh对称系统抽样:由于 为奇数,则从两个断点开始分层,最后中间的半层取中间位置的单元, ,入样单元为:5r5,31,10,26,15,21,18第 4题解:由题,N=360,k=8,则 n=N/k=45取 ,1 451Y0rj rj第 号 住 户 的 户 主 为 汉 族第 号 住 户 的 户 主 不 为 汉
41、 族, ,28 ,2j则可能样本如下表:jr145 样本均值样本内方差1 0000110000010000000000000000000000000001111000.15560.13432 0000000100111010000100100000000000000111111000.28890.21013 0000000000111100000000000000000000000111111000.22220.17684 0001110010010100000100000000000000000111000000.22220.17685 000011001011110000000000000
42、0000000000011111000.26670.20006 0000100000110100000000000000000000000111101000.20000.16367 0001111000000000000000000001000000000111110000.22220.17688 0001101000000000000000000001000000001111110000.22220.1768由上表可得:总体均值 0.1972Y总体方差 2845210.158rjrjSYN平均样本内方差 2.37640.21630.79r则: 2()S0rsyknV运用简单随机抽样:n=45
43、, ,45.136f2.syfVSn显然: ,说明等距样本的精确度较简单随机样本的精确度sysy要高。第 5题答:欲估计汉族所占比例,选择第种系统抽样的方法好。按照题给条件排序,在户口册中每 5人中抽 1人,且平均每户有 5口人,分布较均匀,且如此抽样,每户人家基本均有 1人入样。男性所占比例与孩子所占比例。采用简单随机抽样的方法较合适,因为按题条件排序后,采用等距抽样,若抽得初始单元为 1,则男生比例为1,孩子比例为 0,如此,则有较大误差。第 6题解:取 Y =rj 特 征个 单 元 不 具 有 所 研 究 的第群, 若 总 体 中 第 征个 单 元 具 有 所 研 究 的 特第群, 若
44、总 体 中 第 jr“0则总体比例 P的简单估计量为 =P= ,即对总体比例的估计可Psynjrj_1化成对总体均值的估计。 估计男性所占比例:则,取 Y =rj, 其 他 个 单 元 为 男 性第群, 第0“j由题意,系统抽样 K=5,n=10,则所有可能样本如下表:1 2 3 4 5 6 7 8 9 10 群平均群内方差 S2rj1 1 1 1 0 0 1 0 0 0 1 0.5 0.27782 0 0 0 1 1 0 1 1 1 0 0.5 0.27783 0 0 1 0 0 0 0 1 0 0 0.2 0.17784 1 1 0 1 0 0 1 0 0 1 0.5 0.27785 0
45、0 1 1 1 1 1 1 1 0 0.7 0.2334总体均值_Y48.510rjrN总体方差 S ,257.0)(51_02rjrjY平均群内方差 489.5122.jrjrS以行为“系统样本”的系统抽样:k=5,n=10 0256.9.)1()()( 2.222_ rwsysy SNnkSNnkV简单随机抽样:n=10,f=20%=0.2 056.4.57.01)(2_ Sf,说明简单随机抽样精度较高。)(_yVsy 估计孩子所占比例:取 Y =rj, 其 他 个 单 元 为 小 孩第群, 第0“1j由题意,系统抽样:k=5,n=10,则所有可能样本如下表:1 2 3 4 5 6 7 8 9 10 群平均群内方差