1、 89第四章 抽样分布与参数估计思考与练习一、单项选择题1 抽样平均误差与极限误差间的关系是( d ) 。a. 抽样平均误差大于极限误差 b. 抽样平均误差等于极限误差c. 抽样平均误差小于极限误差d. 抽样平均误差可能大于、等于或小于极限误差2 在其它条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量( a ) 。a. 扩大为原来的 4 倍 b. 扩大为原来的 2 倍c. 缩小为原来的二分之一 d. 缩小为原来的四分之一3类型抽样影响抽样平均误差的方差是( b ) 。a. 组间方差 b. 组内方差 c. 总方差 d. 允许误差4当样本单位数充分大时,样本估计量充分地靠近总体指标的
2、可能性趋于 1,称为抽样估计的( b ) 。a.无偏性 b.一致性 c.有效性 d.充分性二、多项选择题1 影响抽样平均误差的因素有( a b c d ) 。a.总体标志变异程度 b.样本容量 c.抽样方式d.抽样的组织形式 e.样本指标值的大小2 抽样估计的抽样平均误差(a c e) 。a.是不可避免要产生的 b.是可以通过改进调查方法消除的c.是可以事先计算的 d.只有调查结束之后才能计算e.其大小是可以控制的3确定样本容量时,可用以下方法取得近似的总体方差估计值(a b c ) 。a.参考以往调查的经验资料 b.以试点调查的样本方差来估计90c.在做成数估计时,用成数方差最大值 0.25
3、 来代替d.假定总体不存在标志变异,方差为零三、计算题1某市居民家庭人均年收入是服从 =4 000 元, =1 200 元的正态分布,求该市居民家庭人均年收入:(1)在 5 0007 000 元之间的概率;(2)超过 8 000 元的概率。解:(1) 。120,40.1975593.02.86.283.05.25.218.83.07057 zprobzprobzrzrpobxxprob (2) 035. 3.23.1.808 zprobzprobzxprobr 912某小组 5 个工人的周工资分别为 140、160、180、200、220 元,现在用重复抽样的方法从中抽出 2 个工人的工资构成
4、样本。要求:(1)计算总体工人平均工资和标准差;(2)列出样本平均工资的抽样分布;(3)计算样本平均工资的平均数,并检验是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)按公式计算抽样平均误差,并验证是否等于(4)的结果;(6)用不重复抽样方法抽取样本,重新计算(1)(5)。解:(1)总体平均=(140+160+180+200+220)/5=200。总体标准差=28.284。(2)平均工资 140 160 180 200 220140 140 150 160 170 180160 150 160 170 180 190180 160 170 180 190 200200 170 18
5、0 190 200 210220 180 190 200 210 220(3)样本平均=4500/25180,不等于总体平均。(4)平均工资的标准差=20.41241(5)重复的抽样误差为 ,接近平均工19.824.8nX资标准差的计算值。(6)总体平均=(140+160+180+200+220)/5=200。标准差=28.284。不等重复时的抽样分布平均工资 140 160 180 200 220140 150 160 170 180160 170 180 190180 190 200200 210平均工资加总=1800,样本平均=1800/10=180,不等于总体平均平均工资的标准差= 1
6、8.25741858。92不重复的抽样误差为,接近平均工资17.830228.412 NnX的标准差计算值。3某地区粮食播种面积 5000 亩,按不重复抽样方法随机抽取了 100亩进行实测,调查结果,平均亩产 450 公斤,亩产量标准差为 52 公斤。试以 95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。解:已知 =450 公斤,n=100(大样本) ,n/N=1/50 , ,不X 1Nn考虑抽样方式的影响,用重复抽样计算。s=52 公斤,1- =95%,=5%。这时查标准正态分布表,可得临界值: 96.025./z该地区粮食平均亩产量的置信区间是: 196.4502nszx=439
7、.808,460.192 (公斤)总产量的置信区间是:439.808 5000,460.192 5000 (公斤)=2199040,2300960(公斤)4已知某种电子管使用寿命服从正态分布。从一批电子管中随机抽取16 只,检测结果,样本平均寿命为 1490 小时,标准差为 24.77 小时。试以95%的置信度估计这批电子管的平均寿命的置信区间。解:(1)已知 =1490 小时, n=16,s=24.77 小时,1-=95% , =5%。X这时查 t 分布表,可得 2.345)1(2/t该批电子管的平均寿命的置信区间是:93167.2435.14902nstx= 1476.801,1503.1
8、99(小时)因此,这批电子管的平均寿命的置信区间在 1476.801 小时与 1503.199小时之间。5回顾本章开头的引例,如果已知居民每天观看该电视台节目时间的总体方差为 1 小时。试求:(1)该地区内居民每天观看该电视台节目的平均时间的置信区间(置信度是 95%);(2)如果要求估计的误差不超过 27 分钟,这时置信度是多少?解:(1)已知 =4 小时,n =100, =1.5 小时,1-=95% , =5%。X这时查标准正态分布表,可得临界值: 96.025./z由于样本容量在地区居民总人数中所占的比重太小,重复与不重复抽样效果相差不大,我们按重复抽样计算。该地区内居民每天看电视平均时
9、间的置信区间是: 105.96.42nszx=3.71,4.29 (小时)即该地区居民每天看电视时间在 3.71 到 4.29 个小时之间。(2) 小 时分 45.(7310/./nz查表得到置信度是 99.73%。6采用简单随机重复抽样的方法,从 2 000 件产品中抽查 200 件,其中合格品 190 件。要求:(1)计算合格品率及其抽样平均误差。(2)以 95.45%的置信度,对合格品率和合格品数量进行区间估计。94(3)如果极限误差为 2.31%,则其置信度是多少?解:(1)合格品率:P=190/200 100%=95%抽样平均误差: =0.015np)1()(2)%395105.2%
10、95)(2/07./ pZP 196084208( ,的 置 信 区 为 :件合 格 品 数 量 ,:合 格 品 率 的 置 信 区 间 为)(3) %64.87)(8764.01,5320)(2/zFZp查 表 得7从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:工资水平(元) 600 700 800 900 1000工人数(人) 5 10 11 20 4试求:(1)以 95.45的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于 800 元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过 30 元,估计工资不少于 800 元的工人所占比重
11、的允许误差范围不超过 10%,置信度仍为95.45,试问至少应抽多少工人?解(1)通过 EXCEL 计算可得: =816 元,n=50 人,s=113.77 元。工资X不少于 800 元的工人所占比重:P=35/50=70%。1-=95.45%。这时查标准正态分布表,可得临界值: 2/z工人平均工资的置信区间:95507.132862nszx=783.82, 848.18工资不少于 800 元的工人所占比重的置信区间: %83,570.2%70)1()(2npzpzp(2) 抽样平均数和成数的极限误差分别是: ,0%1p按抽样平均数与成数计算的样本容量分别是:=58(人)22/130.1zn=
12、84(人)2/2.7P取以上计算结果中较大者,即 n=84,应抽取 84 人作样本以保证抽样调查的准确性。四、问答题11932 年美国总统大选。美国的文摘杂志向 1000 万个电话用户和文摘的订户发放了关于总统选举的民意调查问卷。结果收回了 240 万份问卷,根据调查结果, 文摘杂志预测共和党候选人兰登将以较大的比例战胜民主党候选人罗斯福。而刚成立的盖洛普研究所采用随机抽样的方法抽选了 2000 多选民进行问卷调查,得出了与文摘杂志相反的结论。最后大选的结果表明只调查 2000 户的盖洛普研究所的预测,居然比调查了成百万户的文摘杂志的预测更准确。请你分析其中的原因,进而考虑,应如何正确地开展抽
13、样调查的问题。答题要点:(1) 统计推断优良性的一个基本要求是无偏性。统计推断优良性要求包括无偏性、有效性与一致性,但无偏性统计推断的基本要求。是美国的文摘杂志向 1000 万个电话用户和文96摘的订户发放了关于总统选举的民意调查问卷,显然有电话的用户和订杂志的读者是有文化的阶层,不能反映全体民众的意见,存在系统偏差可能;(2) 抽样调查的误差是可控误差。在样本是随机地从总体中抽出时,样本与总体间存在密切的联系,这种联系建立了样本推断总体的桥梁。显然样本是随机地从总体中抽出来的,通过样本的统计量推断总体参数,肯定存在抽样误差,但是抽样误差是可以控制的。抽样误差受样本容量、抽样方式、总体离散性和抽样组织形式等影响。抽样设计过程中可以通过这些影响因素来控制抽样误差。特别是样本容量的控制,在给定抽样的可靠性要求与精度要求条件下,可计算出应抽取的样本容量大小。样本容量满足了这个要求,也就能控制到抽样的概率保证与精度,从而满足控制抽样误差的需要。1000万个电话用户和文摘的订户的大容量,并不说明比随机抽样的方法抽选了 2000 多选民进行问卷调查误差控制更好,如果前者是有偏估计的话。(3) 抽样的组织形式的选择取决于对总体信息的了解与应用。当对总体结构缺乏充分信息的前提下,简单有机抽样是优先考虑的抽组织形式。