1、1应用统计学练习题第一章 绪论一、填空题一、填空题1. 统计工作与统计学的关系是_统计实践_和_统计理论_的关系。2. 总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是_总体_的组成单位。3. 统计单体具有 3 个基本特征,即_同质性_、_变异性_、和_大量性_。4. 要了解一个企业的产品质量情况,总体是_企业全部产品_,个体是_每一件产品_。5. 样本是从_总体_中抽出来的,作为代表_这一总体_的部分单位组成的集合体。6. 标志是说明单体单位特征的名称,按表现形式不同分为_数量标志_和_品质标志_两种。7. 性别是_品质标志_标志,标志表现则具体体现为_男_或_女 _两种结果。8
2、. 统计指标按其数值表现形式不同可分为_总量指标_、_相对指标_和_平均指标_。9. 指标与标志的主要区别在于:(1)指标是说明_总体_特征的,而标志则是说明_总体单位_特征的。(2) 标志有不能用_数量_表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。10. 一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和_统计分析_4 个阶段。二、单项选择题二、单项选择题1. 统计总体的同质性是指( A ) 。 A.总体各单位具有某一共同的品质标志或数量标志2. 设某地区有 800 家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D
3、 ) 。D.800 家工业企业的全部工业产品3. 有 200 家公司每位职工的工资资料,如果要调查这 200 家公司的工资水平情况,则统计总体为( A ) 。A.200 家公司的全部职工4. 一个统计总体( D ) D.可以有多个指标5. 以产品等级来反映某种产品的质量,则该产品等级是( C ) 。 C.品质标志6. 某工人月工资为 1550 元,工资是( B ) 。 B.数量标志7. 某班 4 名学生金融考试成绩分别为 70 分、80 分、86 分和 95 分,这 4 个数字是( D ) 。 D.变量值8. 工业企业的职工人数、职工工资是( D ) 。 D.前者是离散变量,后者是连续变量9.
4、 统计工作的成果是( C ) 。 C.统计资料10. 统计学自身的发展,沿着两个不同的方向,形成( C ) 。 C.理论统计学与应用统计学三、多项选择题三、多项选择题1. 统计的含义包括( ACD ) 。 A.统计资料 C.统计工作 D.统计学2. 统计研究运用各种专门的方法,包括( ABCDE ) 。A.大量观察法 B.统计分组法 C.综合指标法 D.统计模型法 E.统计推断法3. 全国第 5 次人口普查中( BCE ) 。 B.总体单位是每一个人 C.全部男性人口数是统计指标 E.人的年龄是变量4. 下列各项中,属于连续变量的有( ACD ) 。A.基本建设投资额 C.国民生产总值中 3
5、次产业比例 D.居民生活费用价格指数5. 下列指标中,属于数量指标的有( AC ) 。 A.国民生产总值 C.全国人口数6. 下列标志中,属于品质标志的有( BE ) 。 B.所有制 E.产品质量7. 下列各项中,哪些属于统计指标?( ACDE )A.我国 2005 年国民生产总值 C.某地区出生人口总数 D.某企业全部工人生产某种产品的人均产量 E.某市工业劳动生产率8. 统计指标的表现形式有( BCE ) 。 B.总量指标 C.相对指标 E.平均指标9. 总体、总体单位、标志、指标间的相互关系表现为( ABCD ) 。A.没有总体单位也就没有总体,总体单位也不能离开总体而存在 B.总体单位
6、是标志的承担者C.统计指标的数值来源于标志 D.指标是说明总体特征的,标志是说明总体单位特征的10. 国家统计系统的功能或统计的职能有( ABCD ) 。 A.收集信息职能 B.提供咨询职能 C.实施监督职能 D.支持决策职能四、判断题四、判断题1. 总体的同质性是指总体中的各个单位在所有标志上都相同。 ()2. 数量指标是指由数量标志汇总来的,质量指标是由品质标志汇总来的。 ()3. 品质标志和质量指标一般不能用数值表示。 ()4. 全国人口普查的总体单位是户。 ()5. 商品的价格在标志分类上属于数量标志。 ()6. 因为统计指标都是用数值表示的,所以数量标志就是统计指标。 ()7. 差异
7、性是统计研究现象总体数量的前提。 ()8. 统计分组法在整个统计活动过程中都占有重要地位。 ()9. 推断统计学是描述统计学的基础。 ()10. 可变标志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。 ()2第二章 统计数据的收集一、填空题一、填空题1. 常用的统计调查方式主要有_普查_、_抽样调查_、_重点调查_、_典型调查 _、_统计报表 _等。2. 典型调查有两类:一是_解剖麻雀式_,二是_划类选典式_。3. 统计调查按调查对象包括的范围不同可分为_全面调查_、_非全面调查_。4. 重点调查是在调查对象中选择一部分_重点单位_进行调查的一种_非全面_调查。5. 抽样调查属于_
8、非全面_调查,但其调查目的是要达到对_总体数量_特征的认识。6. 常用的统计调查方法主要有_访问调查_、_邮寄调查_、_电脑辅助电话调查_、_电话调查_和_网络调查_等。7. 无论采用何种调查方法进行调查都要先制定_调查方案_。8. 若要调查某地区工业企业职工的生活状况,调查对象是_工业企业全部职工_,调查单位是_工业企业每一名职工_,填报单位是_每一个工业企业_。9. 调查表一般由_表头_、_表体_和_表外附加_3 部分组成。10. 调查表一般有_一览表_和_单一表_两种形式。二、单项选择题二、单项选择题1. 某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量 80%的 5 个大
9、型水泥厂的生产情况进行调查,这种调查方式是( D ) 。 D.重点调查2. 全面调查是对调查对象总体的所有个体进行调查,下述调查属于全面调查的是( B ) 。 B.某地区对工业企业设备进行普查3. 抽样调查与重点调查的主要区别是( D ) 。 D.选取调查单位的方法不同4. 人口普查规定统一的标准时间是为了( A ) 。 A.避免登记的重复与遗漏5. 以下哪种场合宜采用标准式访问( A ) 。 A.居民入户调查6. 某地区进行国有商业企业经营情况调查,则调查对象是( B ) 。 B.该地所有国有商业企业7. 调查项目( A ) 。 A.是依附于调查单位的基本标志8. 统计调查的基本任务是取得原
10、始统计资料,所谓原始统计资料是( C ) 。 C.直接向调查单位进行登记取得的资料9. 某市进行工业企业生产设备普查,要求在 7 月 1 日至 7 月 10 全部调查完毕,则这一时间规定是( B ) 。 B.调查期限10. 问卷设计的主体部分是( C ) 。 C.问题和答案三、多项选择题三、多项选择题1. 普查是一种( BCD ) 。 B.专门调查 C.全面调查 D.一次性调查2. 某地对集市贸易个体户的偷漏税情况进行调查,1 月 5 日抽选 5%样本检查,5 月 1 日抽选 10%样本检查,这种调查是( ABC ) 。A.非全面调查 B.一次性调查 C.不定期性调查3. 邮寄问卷适用于以下哪
11、些调查对象( ABCD ) 。 A.企业 B.机关团体 C.个人 D.特定的群体4. 非全面调查是指( CDE ) 。 C.重点调查 D.典型调查 E.抽样调查5. 某市对全部工业企业生产设备的使用情况进行普查,则每一台设备是( AC ) 。 A.调查单位 C.总体单位6. 下列各调查中,调查单位和填报单位一致的是( CD ) 。 C.工业企业普查 D.商业企业调查7. 制定一个周密的统计调查方案,应确定( ABCE ) 。A.调查目的和调查对象 B.调查单位和填报单位 C.调查项目和调查表 E.调查时间和时限8. 调查单位是( BCE ) 。 B.需要调查的社会经济现象总体中的个体 C.调查
12、项目的承担者 E.调查对象所包含的具体单位9. 抽样调查的优越性表现在( ABCE ) 。 A.经济性 B.时效性 C.准确性 E.灵活性10. 在一份问卷中有这样一问题“您的职业是 ?教师 公务员 军人 企业管理人员 职工 个体户 其他 ” ,请问该问题属于( ABC ) 。 A.事实性问题 B.半开放半封闭问题 C.答案的设计是多项式的四、判断题四、判断题1. 重点调查中的重点单位是根据当前工作的重点来确定的。 ( )2. 对有限总体进行调查只能采用全面调查。 ( )3. 我国的人口普查每 10 年进行一次,因此它是一种连续性调查方法。 ( )4. 制定调查方案的首要问题是确定调查对象。
13、( )5. 开放式问题是指备选答案可供选择的问题。 ( )6. 访问调查回答率较低,但其调查成本低。 ( )7. 电话调查的问题要明确且数量要少。 ( )8. 实验法是一种特殊的观察法。 ( )9. 一览表是指一份表格上只体现一个调查单位的情况表。 ( )10. 表头是统计调查表的主体。 ( )3第三章 统计数据的整理与显示一、填空题一、填空题1. 统计整理的关键在于_统计分组_。2. 按每个变量值分别作为一组叫_单项式分组_,其组数等于_变量值个数_。3. 已知一个组距式分组的最后一组的下限为 900,其相邻的组中值为 850,则最后一组的上限和组中值分别为_1000_和_950_。4. 在
14、确定组限时,最小组的下限要低于或等于_最小变量值_,最大组的上限要高于或等于_最大变量值_。5. 为了消除异距数列中组距不同对各组次数的影响,需要计算_频数密度_。6. 统计数据的显示形式主要有_统计表_和_统计图_。7. 统计表主要由_表头_、_行标题_、_列标题_和_数字资料_4 部分组成。8. 数据的预处理是数据整理的先行步骤,它是在对数据分类或分组之前对_原始数据_和_第二手数据_所做的处理,包括对数据的_审核_、_筛选_和_排序_。9. 对统计数据准确性审核的主要方法有_逻辑检查_和_计算检查_两种。10. 直方图是用_矩形_的宽度和高度来表示频数分布的图形。二、单项选择题二、单项选
15、择题1. 进行统计分组的关键是( B ) 。 B.正确选择分组标志2. 按某一标志分组的结果表现为( B ) 。 B.组内同质性,组间差异性3. 划分离散变量的组限时,相邻两组的组限( C ) 。 C.既可以是间断的,也可以是重叠的4. 某连续变量的分组中,其末组为开口组,下限为 200,又知其邻组的组中值为 170,则末组的组中值为( C ) 。 C.2305. 下列分组中按品质标志分组的是( B ) 。 B.产品按质量优劣分组6. 用组中值代表各组内的一般水平的假定条件是( D ) 。 D.各组频数在本组内呈均匀分布7. 频数分布用来表明( A ) 。 A.总体单位在各组的分布状况8. 在
16、分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B ) 。 B.下限所在组9. 在进行组距式分组时,当全距不变的情况下,组距与组数的关系是( B ) 。 B.反比例关系10. 多变量的图示方法是( D ) 。 D.雷达图三、多项选择题三、多项选择题1. 统计分组的作用在于( ABE ) 。A.区分现象的类型 B.反映现象总体的内部结构变化 E.研究现象之间数量的依存关系2. 指出下列分组哪些是按品质标志分组( AD ) 。 A.企业按所有制分组 D.产品按合格与不合格分组3. 构成频数分布表的基本要素是( AD ) 。 A.各组的组别 D.分配在各组的次数4. 组限的确定通
17、常有两种方法,它们是( BC ) 。B.对连续变量采用重叠分组法 C.对离散变量采用不重叠分组法5. 对统计总体进行分组时,采用等距分组还是异距分组,决定于( AD ) 。A.现象的特点 D.数据分布是否均匀6. 统计数据的审核主要是审核数据的( ABC ) 。 A.准确性 B.及时性 C.完整性7. 统计数据整理的内容一般有( ABCE ) 。A.对原始数据进行预处理 B.对统计数据进行分组 C.对统计数据进行汇总 E.编制统计表、绘制统计图8. 国民经济中常用的统计分组有( ABCDE ) 。A.经济成分分组 B.登记注册类型分组 C.国民经济行业分类 D.3 次产业分类 E.机构部门分类
18、9. 某单位 100 名职工按工资额分为 3000 元以下、30004000 元、40006000 元、60008000 元、8000 元以上等 5 个组。这一分组( BDE ) 。 B.分组标志是连续变量 D.相邻的组限是重叠的 E.某职工工资 6000 元,应计在 60008000 元组内10. 变量数列中频率应满足的条件是( BC ) 。 B.各组频率大于或等于 0 C.各组频率之和等于 1四、判断题四、判断题1. 统计数据整理就是对原始资料的整理。 ( )2. 能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的。 ( )3. 对一个既定的统计总体而言,合理的分组标志
19、只有一个。 ( )4. 组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。 ( )5. 凡是分组表都是次数分布表。 ( )6. 按数量标志分组的目的,就是要区别各组在数量上的差别。 ( )7. 连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。 ( )8. 在组距相等的条件下,频数分布和频数密度的分布是一致的。 ( )9. 年代都是以数字表示的,所以按年代排列各种指标属于按数量标志分组。 ( )10. 饼形图是以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。 ( )4六、计算题六、计算题1. 有一个班 40 名学生的统计学考试成绩
20、如表 3-3 所示。表 3-3 40 名学生的统计学考试成绩表89 88 76 99 74 60 82 60 93 9994 82 77 79 97 78 87 84 79 6598 67 59 72 56 81 77 73 65 6683 63 89 86 95 92 84 85 79 70学校规定:60 以下为不及格;6075 分为中;7689 分为良;90100 为优。试把该班学生分为不及格、中、良、优 4 组,编制一张频数分布表。解:统计学考试成绩频数分布表如下表 3-7 所示。表 3-7 40 名学生的统计学考试成绩频数分布表成绩分组 学生人数(人) 比率(%)60 分以下 2 5.
21、060 75 11 27.576 89 19 47.590 100 8 20.0合 计 40 100.02. 宏发电脑公司在全国各地有 36 家销售分公司,为了分析各公司的销售情况,宏发公司调查了这 36 家公司上个月的销售额,所得数据如表 3-4 所示。 表 3-4 分公司销售额数据表 (单位:万元)60 60 62 65 65 66 67 70 7172 73 74 75 76 76 76 76 7778 78 79 79 80 82 83 84 8486 87 88 89 89 90 91 92 92根据上面的资料进行适当分组,并编制频数分布表。解:“销售额”是连续变量,应编制组距式频数
22、分布表。具体过程如下:第一步:计算全距: 92603R第二步:按经验公式确定组数: 1.lg67K第三步:确定组距: /75d第四步:确定组限:以 60 为最小组的下限,其他组限利用组距依次确定。第五步:编制频数分布表。如表 3-8 所示。表 3-8 分公司销售额频数分布表按销售额分组(万元) 公司数(个) 频率(%)60 65 3 8.33 65 70 4 11.11 70 75 5 13.89 75 80 10 27.78 80 85 5 13.89 85 90 5 13.89 90 95 4 11.11 合 计 36 100.00 3. 有 27 个工人看管机器台数如表 3-5 所示。表
23、 3-5 工人看管机器台数表 (单位:台)5 4 2 4 3 4 3 4 42 4 3 4 3 2 6 4 42 2 3 4 5 3 2 4 3试编制一张频数分布表。解:“工人看管机器台数”是离散变量,变量值变动范围很小,应编制单项式频数分布表。编制结果如表 3-9 所示。表 3-9 工人看管机器台数频数分布表看管机器台数(台) 工人数(人) 工人数的比重(%)2 6 223 7 2654 11 415 2 76 1 4合 计 27 100 4. 对下面职工家庭基本情况调查表(如表 3-6 所示)中的答复进行逻辑检查,找出相互矛盾的地方,并进行修改。表 3-6 职工家庭基本情况调查表解:职工家
24、庭基本情况调查表修正如表 3-10 所示。表 3-6 职工家庭基本情况调查表姓名 性别 年龄 与被调查者 的关系 工作单位 参加工作年月 职务或工 种 固定工或 临时工刘 盛 男 44 被调查者本人 长城机电公司 1973.7 干部 临时陈心华 女 40 夫妻 市第一针织厂 1975.4 工人 固定刘淑影 女 18 长女 待业青年 1999 无 临时刘平路 男 16 长子 医学院 2000 学生 无姓名 性别 年龄 与被调查者 的关系 工作单位 参加工作年月 职务或工 种 固定工或 临时工刘 盛 男 44 被调查者本人 长城机电公司 1973.7 干部 固定陈心华 女 40 夫妻 市第一针织厂
25、 1975.4 工人 固定刘淑影 女 18 父女 待业青年 无 无刘平路 男 16 父子 医学院学习 2000 学生 无6第四章 数据分布特征的测度一、填空题一、填空题1. 平均指标的数值表现称为_平均数_,其计算方法按是否反映了所有数据水平而可分为_数值平均数_和_位置平均数_两类。2. 加权算术平均数的公式为 xf,从中可以看到,它受_变量值_大小和_权数_大小的影响。3. 当变量值较大而次数较多时,平均数接近于变量值较_大_的一方;当变量值较小而次数较多时,平均数靠近于变量值较_小_的一方。4. 某班 70%的同学平均成绩为 85 分,另 30%的同学平均成绩为 70 分,则全班总平均成
26、绩为_80.5_。5. 统计中的变量数列是以_平均数_为中心而左右波动,所以平均数反映了总体分布的_集中趋势_。6. 中位数是位于一组数据_中间位置_的那个变量值,众数是在总体中出现次数_最多_的那个变量值。中位数和众数也可以称为_位置_平均数。7. 在_左偏_分布下, ,在_右偏_分布下, ,在_正态_分布之下,oeMxoeMx。在适度偏态情况下, 等于_3_ 倍 。oeMxoex8. 极差是一组数据的_最大值_与_最小值_之差,在组距分组资料中,其近似值是_ _最高组上限最低组下限_。9. 已知某组数据的平均数是 200,离散系数是 30%,则该组数据的方差是_3600_。10. 测定峰度
27、,往往以 4 阶中心矩 为基础。依据经验,当 时,频数分配曲线为_正态曲线_;当 时,为_平顶4m00_曲线;当 时,为_尖顶_曲线。0二、单项选择题二、单项选择题1. 计算平均指标时最常用的方法和最基本的形式是( D ) 。 D.算术平均数2. 若两组数据的标准差相等而平均数不等,则( B ) 。 B.平均数大代表性大3. 如果所有变量值的频数都减少为原来的 1/5,而变量值仍然不变,那么算术平均数( A ) 。 A.不变4. 已知 5 个水果商店苹果的单价和销售额,要求计算 5 个商店苹果的平均单价,应该采用( C ) 。 C.加权调和平均法5. 计算平均数的基本要求是所要计算的平均数的总
28、体单位应是( B ) 。 B.同质的6. 由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( C ) 。C.各组标志值在本组内呈均匀分布7. 离中趋势指标中,最容易受极端值影响的是( A ) A.极差8. 当数据组高度偏态时,哪一种平均数更具有代表性?( C ) C.众数9. 一组数据的偏态系数为 1.3,表明该组数据的分布是( D ) 。 D.右偏分布10. 当一组数据属于左偏分布时,则( D ) 。 D.众数在右边、平均数在左边三、多项选择题三、多项选择题1. 加权算术平均数的大小受哪些因素的影响( ABC ) 。A.受各组频数或频率的影响 B.受各组标
29、志值大小的影响 C.受各组标志值和权数的共同影响2. 平均数的作用是( ABD ) 。A.反映总体的一般水平 B.对不同时间、不同地点、不同部门的同质总体平均数进行对比 D.测定总体各单位分布的集中趋势3. 众数是( ABCD ) 。A.位置平均数 B.总体中出现次数最多的标志值 C.不受极端值的影响 D.适用于总体单位数多,有明显集中趋势的情况4. 加权算术平均数的计算公式有( BC ) 。B. C.xffx5. 几何平均数主要适用于( BCDE ) 。B.标志值的连乘积等于总比率的情况 C.标志值的连乘积等于总速度的情况 D.具有等比关系的变量数列 E.求平均比率时6. 标志变异指标能反映
30、( CD ) 。 C.总体分布的离中趋势 D.变量分布的离散趋势7. 在下列哪些情况下,必须计算离散系数来比较两数列的离散程度大小( AD ) 。A.平均数大的标准差亦大,平均数小的标准差亦小 D.两数列的计量单位不同8. 不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数( AB ) 。A.消除了不同数据组各标志值的计量单位的影响 B.消除了不同数列平均水平高低的影响9. 关于极差,下列说法正确的有( ABD ) 。A.只能说明变量值变异的范围 B.不反映所有变量值差异的大小 D.最大的缺点是受极端值的影响10. 平均指标与变异指标结合运用体现在( ACE ) 。A.用
31、变异指标说明平均指标代表性的大小 C.以平均指标为基础,用变异指标说明经济活动的均衡性E.以平均指标为基础,用变异指标说明总体各单位的离散程度四、判断题四、判断题1. 权数对算术平均数的影响作用取决于本身绝对值的大小。 ( )2. 一个数列不可能没有众数,也不可能没有中位数。 ( )3. 中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。 ( )4. 标志变异度指标越大,均衡性也越好。 ( )5. 在正态分布情况下, 与 、 之间相等。 ( )XoMe76. 若数据组的均值是 450,标准差为 20,那么,所有的观察值都在 的范围内。 ( )45027. 总体中各标
32、志值之间的差异程度越大,标准差系数就越小。 ( )8. 如果两个数列的极差相同,那么,它们的离中程度就相同。 ( )9. 离中趋势指标既反映了数据中各标志值的共性,又反映了它们之间的差异性。 ( )10. 在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于 0。 ( )六、计算题六、计算题1. 某厂对 3 个车间 1 季度生产情况分析如下:第 1 车间实际产量为 190 件,完成计划 95%;第 2 车间实际产量为 250 件,完成计划 100%;第 3 车间实际产量为 609 件,完成计划105%。则 3 个车间产品产量的平均计划完成程度为:。另
33、外,1 车间产品单位成本为 18 元/件,2 车间产品单位成本为 12 元/件,3 车间产品单位成本为95%050%15 元/件,则 3 个车间平均单位成本为: 元/件。以上平均指标的计算是否正确?如不正确请说明理由并改正。8513答:两种计算均不正确。平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度指标的特定含义。正确的计算方法是:平均计划完成程度 9206.84%19.5.mx平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接的影响。所以正确的计算方法为:平均单位成本 (元/件)81551.8309f2. 某高校
34、某系学生的体重资料如表 4-6 所示。试根据所给资料计算学生体重的算术平均数、中位数和众数。表 4-6 学生体重资料表按体重分组(公斤) 学生人数(人)52 以下 285255 395558 685861 5361 以上 24合计 212解:先列表计算有关资料如表 4-8 所示。表 4-8 学生体重计算表按体重分组(公斤) 组中值(x) 学生人数(f) xf 向上累积频数52 以下 50.5 28 1414.0 285255 53.5 39 2086.5 675558 56.5 68 3842.0 1355861 59.5 53 3153.5 18861 以上 62.5 24 1500.0 2
35、12合计 _ 212 11996.0 _(1)学生平均体重:(公斤)1965.82xf(2)学生体重中位数:(公斤)1267535.28mefSMLd(3)学生体重众数: 1()6839556.98()()mo mff为3. 已知某公司职工的月工资收入为 1965 元的人数最多,其中,位于全公司职工月工资收入中间位置的职工的月工资收入为 1932 元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入是何种分布形式?8解:月平均工资为:(元)319326519.02eoMx因为 ,所以该公司职工月工资收入呈左偏分布。eox4. 当每天生产线的每小时产量低于平均每小时产量,并大于
36、 2 个标准差时,该生产线被认为是“失去控制” 。对该生产线来说,昨天平均每小时产量是 370 件,其标准差每小时为 5 件。表 4-7 所示的是该天头几个小时的产量,该生产线在什么时候失去了控制?表 4-7 生产线产量表时间(时) 8:00 9:00 10:00 11:00 12:00 1:00 2:00产量(件) 369 367 365 363 361 359 357解:由已知得:产量控制界限的上限为:370+25=380(件)产量控制界限的下限为:370-25=360(件)因此,可以认为该生产线在下午 1 时失去控制。在下午 1 时,产量跌到了 360 件以下,它在控制界限以外。第五章
37、抽样及抽样分布一、填空题一、填空题1. 抽样调查可以是_随机_抽样,也可以是_非随机_抽样,但作为抽样推断基础的必须是_随机_抽样。2. 在抽样推断中,不论是总体参数还是样本统计量,常用的指标有_均值_、_比例 _和方差。3. 抽样误差是由于抽样的_随机性_而产生的误差,这种误差不可避免,但可以_控制_。4. 样本平均数的平均数等于_总体平均数_。5. 在实际的抽样推断中,常用的抽样方法有_简单随机抽样_、_分层抽样_、_等距抽样_和_整群抽样_等。二、单项选择题二、单项选择题1. 抽样推断是建立在( C )基础上的。 C.随机抽样2. 在抽样方法中,最简单和最基本的一种抽样方法是( C )
38、。 C.简单随机抽样3. 在抽样推断中,可以计算和控制的误差是( B ) 。 B.抽样标准误差4. 样本统计量是( B ) 。 B.不唯一但可抽样计算而可知5. 样本容量也称( B ) 。 B.样本单位数三、多项选择题三、多项选择题1. 在重复抽样中( ABDE ) 。A.每个单位在每次抽样都有相同被抽中的概率 B.每个单位都有可能在样本中出现 次nD. 次抽样之间相互独立 E.可以形成 个可能样本nnN2. 影响抽样误差的因素有( ABDE ) 。A.总体方差 B.样本容量 D.抽样方式 E.抽样方法23. 从一个总体中可以抽取许多个样本,因此( ABDE ) 。A.抽样指标的数值不是唯一确
39、定的 B.抽样指标是用来估计总体参数的 D.样本指标是随机变量 E.样本指标称为统计量4. 重复抽样下,影响样本容量的因素有( ABCE ) 。A.概率度 B.抽样极限误差 C.总体方差 E.抽样估计方法5. 抽样调查的误差可包括( ABC ) 。 A.系统性误差 B.登记性误差 C.偶然性误差四、判断题四、判断题1. 抽样调查是非全面调查,但却可以对全面调查的资料进行验证和补充。 ( )2. 样本容量是指一个总体一共可以组成多少不同的样本,而样本个数则是一样本中的单位数。 ( )3. 每一次抽样的实际误差虽然不可知,但却是唯一的,因而抽样误差不是随机变量。 ( )4. 系统性误差和登记误差是
40、可加以避免的,而偶然性误差是不可避免的。 ( )5. 分层抽样要求组与组之间的差异越大越好,而整群抽样则希望群与群之间的差异越小越好。 ( )六、计算题六、计算题1. 假定总体共有 1000 个单位,总体均值 ,总体标准差 。从中抽取一个样本容量为 30 的简单随机样本用于获得总体信325息。 (1) 的数学期望是多少? (2) 的标准差是多少?xx解:(1)样本均值的数学期望=总体均值=32 (2)样本均值的标准差 50.913n2. 从一个总体标准差为 5 的总体中抽出一个样本容量为 40 的样本,样本均值为 25。样本均值的抽样标准差 等于多少?x解:样本均值的抽样标准差 50.794x
41、n3. 设总体均值 ,总体标准差 。从该总体中抽取一个样本容量为 100 的随机样本,样本均值为 。则 的抽样分171 1009布是什么?解:因为样本均值的期望值=总体均值=17样本均值的标准差= 10n为又因为样本容量大于 30,是大样本,所以 (7,1)xN:4. 假定总体比例 ,从该总体中分别抽取样本容量为 100、200、500 和 1000 的样本。0.5(1)分别计算样本比例的标准差 。 (2)当样本量增大时,样本比例的标准差有何变化?p解:(1) 时,样本比例的标准差n(1)0.5(.)0.51pn同理可以计算出, 时的样本比例的标准差分别为 0.035,0.022,0.16。2
42、,(2)当样本容量增大时,样本比例的标准差越来越小。第六章 参数估计一、填空题一、填空题1. 抽样推断的主要内容有_参数估计_和_假设检验_两个方面。2. 抽样推断运用_概率估计_方法对总体的数量特征进行估计。3. 总体参数估计的方法有_点估计_和_区间估计_两种。4. 优良估计的三个标准是_无偏性_、_有效性_和_一致性_。5. 表示_误差范围_。/2Zn二、单项选择题二、单项选择题1. 抽样推断的目的是( A ) 。 A.以样本指标推断总体指标2. 总体参数是( B ) 。 B.唯一但未知3. 在重复抽样条件下,平均数的抽样平均误差计算公式是( B ) 。 B. n4. 抽样平均误差和抽样
43、极限误差相比,其差值( D ) 。 D.不一定5. 随着样本单位数增大,样本统计量也趋于接近总体参数,成为抽样推断优良估计的( B ) 。 B.一致性三、多项选择题三、多项选择题1. 抽样推断的特点是( ACDE ) 。A.随机取样 C.以部分推断总体 D.运用概率估计方法 E.抽样误差可以计算和控制2. 区间估计的 3 要素是( ABC ) 。A.点估计值 B.抽样平均误差 C.估计的可靠程度3. 影响必要样本容量的因素主要有( ABCDE ) 。A.总体的标志变异程度 B.允许误差的大小 C.抽样方式 D.抽样方法 E.估计的可靠程度4. 在区间估计中,如果其他条件保持不变,概率保证程度与
44、精确度之间存在下列关系( CDE ) 。C.前者愈低,后者愈高 D.前者愈高,后者愈低 E.两者呈相反方向变化5. 计算抽样平均误差,总体标准差常常是未知的,经常采用的方法有( ABCE ) 。A.用过去同类问题的全面调查或抽样调查的经验数据B.用样本的标准差 C.凭抽样调查才经验确定 E.先组织试验性抽样,用试验样本的标准差四、判断题四、判断题1. 抽样误差范围愈小,则抽样估计的置信度也愈小。 ( )2. 在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正比。 ( )3. 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。 ( )4. 在其他条件不变的
45、情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。 ( )5. 扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。 ( )六、计算题六、计算题1. 随机抽取 400 只袖珍半导体收音机,测得平均使用寿命 5000 小时。若已知该种收音机使用寿命的标准差为 595 小时,求概率保证程度为 99.73%的总体平均使用寿命的置信区间。解:已知 ,总体平均使用寿命的置信区间为:/240,5,95,19.73%,nx Z10/25903408.2(17,.)xZn该批半导体收音机平均使用寿命的置信区间是 4910.75 小时5089.25 小时。2. 一个电视节目主持人想了解观众对
46、某个电视专题的喜欢程度,他选取了 500 个观众作样本,结果发现喜欢该节目的有 175 人。试以95%的概率估计观众喜欢这一专题节目的区间范围。若该节目主持人希望估计的极限误差不超过 5.5%,问有多大把握程度?解:已知 因此,在概率保证程度为 95%时,观众喜欢这一专题节目的/217550,0.3,195%,1.96,npZ置信区间为: /2()0.3(.5).03542.8,9.2pZn 若极限误差不超过 5.5%,则 /2 .%58213(1)035(1)dZpn 于是,把握程度为 99%。3. 假定总体为 5000 个单位,被研究标志的方差不小于 400,抽样允许误差不超过 3,当概率保证程度为 95%时,问(1)采用重复抽样需抽多少单位?(2)若要求抽样允许误差减少 50%,又需抽多少单位?解:已知 2 /250,40,3,195%,1.96ndZ