1、1第九章 抽样调查基础一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于 对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。2.抽样调查有全及总体与样本总体之区分。样本容量小于 30 时一般称为小样本。对 于抽样调查来讲全及 总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查 就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。3.大数定律
2、、正态分布理论、中心极限定理是抽 样调查的数理基础。正 态分布的密度函数有两个重要的参数( ;x)。它有 对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如 XxE)(。推出了样本分布的标准差为: 1Nnx。4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。抽样调查既有登记性误差,也有代表性误差,抽 样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本
3、容量的平方根成反比即 nx,不重复抽 样的抽样 平均误差仅与重复抽样的平均误差相差一个修正因子即 Nx1。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。把抽样调查中允许的误差范围称作抽样的极限误差 x或 p。 t,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点估计和区间估计。按估计 的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。二、难点释疑1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体 N 中抽取一个样本容量为 n 的子样最多有多少种抽法,一般用 M
4、 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n)的另一种表现形式。2.大数定律、正态分布理论、中心极限定理都是假定从 N 中抽取一个样本容量为 n 的子样,把所有的样 本都抽到(有 M 种抽法)之后进行验证的,在实际工作中不可能办到。只能用样 本的相应指标去推测总体的相应指标。这些理论只是2为了验证抽样推断的科学性。3. 在实际工作中往往是以重复抽样的方法确定必要抽样数目,以不重复抽样的方法来抽取调查单位, 进行计算估计,而又用重复抽样的误差公式来计算误差,一方面是计算公式简单 ,另一方面,这样计算的 误差比实际存在的误差大,便于提高抽样
5、推断的可靠性。4.在抽样调查中总体的方差是未知的,一般都用样本的方差来代替。对于抽样成数来说,当 p0.5 时 ,抽 样成数的方差取极大 值 0.25。三、练习题(一)填空题1.抽样调查是建立在( )上的一种科学的调查方法。它是从研究对象中( )部分单位进行调查,以其达到 对( )的认识,并可 对( )进行计算和控制。2.样本中所包含的总体单位数称为( ),通常记为 n,当 n( )时称为大样本。3.在抽样调查中总体指标是( ),而样本指标则是随机的。4.对确定的总体来说,可能的样本数目与( )有关,也与( )有关。5一般地说,用抽样指标估计总体指标应该有三个要求。这三个要求是( )、( )、
6、( )。6.常用的抽样方法有( )抽样和( )抽样;( )抽样和( )抽样。7.常用的抽样组织形式有( )、( )、( )、( )、( )。8.抽样平均误差就是抽样平均数(或抽样成数)的( )。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的( )。9.抽样误差是一个( ),抽 样平均误差是一个( )。前者是在不考虑( )条件下,抽样估计值与被估计的真实总体参数之差;后者反映抽样平均数(成数)与总体平均数(成数)的( )。10.影响抽样误差大小的因素有:( )、( )、抽样方法和( )。11.对于同一种抽样组织形式来讲,重复抽样的平均误差( )不重复抽样的平均误差。当( )很小 时,
7、可以用重复抽样的平均误差公式来近似计算不重复抽样的平均误差。12.在其它条件不变的情况下,极限误差增大, 则概率度( ),可靠程度( )。13.在缺少总体的方差时,可用( )代替来计算抽样误差。14.抽样极限误差是指抽样指标与总体指标之间抽样误差的( )。抽样极限误差通常以( )为标准单位来衡量。(二)名词解释1.随机性原则 2.抽样误差 3.样本 4.抽样平均误差5.抽样极限误差 6.区间估计 7.重复抽样 8.不重复抽样(三)判断题1.抽样调查就是凭主观意识,从总体中抽取部分单位进行调查。 ( )2.抽样法不仅是对被研究总体有关指标进行科学推算的方法,而且是搜集统计资料的方法。 ( )33
8、.抽样调查中的随机误差是可以避免的。 ( )4.所有可能的样本平均数的平均数等于总体的平均数。 ( )5.抽样误差是不可避免的,但人们可以调整总体的方差的大小来控制抽样误差的大小。 ( )6.缩小抽样的极限误差便会降低推断的把握程度。 ( )7.由于抽样调查中既有登记性误差又有代表性误差,所以只有登记性误差的全面调查准确性高。 ( )8.重复抽样和不重复抽样是抽取样本的两种方法,各抽样组织方式都可以使用这两种方法。 ( )(四)单项选择题1.随机抽样的基本要求是严格遵守( )A、准确性原则 B、随机性原则C、代表性原则 D、可靠性原则2.抽样调查的主要目的是( )A、广泛运用数学方法 B、计算
9、和控制抽样误差C、修正普查资料 D、用样本指标来推算总体指标3. 抽样调查中( )A、既有登 记 性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差4.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须( )。A、增加 2 倍 B、增加到 2 倍 C、增加 4 倍 D、增加到 4 倍5.抽样平均误差反映了样本指标与总体指标之间的( )。A、实际误 差 B、实际误差的绝对值C、平均误差程度 D、可能误差范围6.反映样本指标与总体指标之间抽样误差可能范围的指标是( )。A、样本平均误差 B、抽样极限误差C、
10、可靠程度 D、概率度7.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )A、抽 样单 位数占总体 单位数的比重很小时B、抽样单位数占总体单位数的比重很大 时C、抽样单位数目很少时 D、抽样单位数目很多时8.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是( )。A、抽样单 位数目越大,抽样误差越大B、抽样单位数目越大,抽样误差越小C、抽样单位数目的变化与抽 样误差的数值无关D、抽样误 差 变化程度是抽 样单位数变动程度的 1/29.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称 为( )。A、分层 抽样 B、简单随
11、机抽样 C、整群抽样 D、等距抽样410.在总体内部情况复杂,而且各单位之间差异程度较大,单位数目又多的情况下,宜采用( )。A、简单 随机抽 样 B、类型抽样 C、等距抽样 D、整群抽样11.用考虑顺序的重置抽样方法,从 4 个单位中抽选 2 个单位组成一个样本,则样本可能数目为( )。A、 1642 B、 10!325C、 1!2 D、 6!412.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( )。A、样本平均数等于总体平均数B、样本成数等于总体成数C、抽样指标等于总体指标D、抽样 指标 的平均数等于 总体指标13.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均
12、误差相比( )。A、前者小于后者 B、前者大于后者C、两者相等 D、无法判断14.当可靠程度大于 0.6828 时,抽样极限误差( )。A、大于抽 样 平均误差 B、小于抽样平均误差C、等于抽样平均误差 D、与抽 样平均 误差的大小依 样本容量而定15.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( )。A、保持不 变 B、随之扩大 C、随之缩小 D、无法确定16.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为( )。A、0.24 B、0.25 C、0.50 D、1(五)多项选择题1.抽样调查适用于下列哪些场合( )。A、不宜进行全面调查 而又要了解全面
13、情况B、工业产品质量检查 C、调查项目多、时效性强D、只需了解一部分单位的情况 E、适用于任何调查2.下列哪些调查中存在系统误差( )。A、抽查 某车间产 品质量时 将两名徒工的产品排除在外B、某县用等距抽样调查农户 收入时决定:如果中选户户 主不在家,则以该户下一户顶替,已知不在家的 农户多为外出经商者C、为了了解学生健康情况而做的普 查D、将学生按来自城乡分组 后采取按比例抽样调查学生开支情况E、简单随机抽 样3.影响抽样误差大小的因素有( )。A、抽样单 位数的多少 B、总体被研究标志的变异程度C、抽样组织方式 D、登记误差大小E、抽到的 样本如何54.合理的或优良的抽样估计,要求用抽样
14、指标估计总体指标时,应该满足如下标准,即( )。A、无偏性 B、代表性 C、一致性 D、时间性E、有效性5.抽样推断中的抽样误差( )。A、是不可避免要产生的 B、可以事先计算C、可通过不同的抽样方式消除D、误差范 围 可事先控制 E、只能事后 进行计 算6.抽样平均误差是( )。A、所有可能样本平均数的 标准差B、所有可能样本平均数的平均差C、抽样推断中作为计算误 差范围的衡量尺度D、反映抽 样 平均数与总体平均数的平均 误差程度E、是一种系 统 性误差7.区间估计的基本要素有( )。A、平均 误差 B、概率度 C、修正系数 D、点估计值E、误差范围8.抽样调查的数理依据主要有( )。A、回
15、归 分析 B、大数定律 C、中心极限定理D、误差分布理论 E、相关分析9、与典型调查相比较,抽样调查的特点有( )。A、理 论 基础是概率论 大数法则B、按随机原则抽选调查单 位C、抽样误差可以事先计算和控制D、调查单 位的 选取方法不同E、排除主 观因素的影响10.抽样估计的特点是( )。A、在逻辑 上运用演 绎推理 B、在逻辑上运用归纳推理C、在方法上运用不确定的概率估 计法D、在方法上运用确定的数学分析法E、结论存在一定的抽 样误 差(六)简答题1.1.什么是随机性原则?在抽样调查中为什么要坚持随机性原则?2.2.什么是抽样估计?它有什么特点?3.3.什么是抽样误差?影响抽样误差的因素有
16、哪些?4.4.什么叫点估计?什么叫区间估计?5.5.什么是极限误差,它与概率度,抽样平均误差有什么关系?(七)论述题重复抽样与不重复抽样有什么不同?为什么不重复抽样的误差总是小于重复抽样的误差?(八)计算题1.某商店有 20 名职工,现从中抽取 5 名职工进行调查。采用简单随机抽样,6试计算各种抽样方法的样本可能数目。2.对某产品进行重量测试,被抽中的 10 袋产品其重量如下(单位:克):48,47,49,50,51,48,46,45,46,49 试计算产品重量的抽样平均误差。3.某灯泡厂生产一批灯泡共 8000 只,随机抽选 400 只进行耐用时间的试验。测试结果平均寿命 5000 小时,总
17、体标准差为 300 小时。求抽样误差。4.某市在家庭平均人数调查中,采用不重置简单随机抽样得到样本的每户平均人数为 3.2 人,标准差为 1.378 人。如果总户数 为 1000 户 ,调查户数为 80 户,试计算抽样的平均误差;在条件下,如果极限误差为 0.2956,试估计户平均人数;在的条件下,如果可靠程度为 0.95,试计算户平均人数;如果要求可靠程度为 95.45%,极限误差为 0.35,试计算重置和不重置抽样各需抽取多少户进行调查(总户数仍为 1000 户)。5.某机械厂生产一批零件共 6000 件,随机抽查 300 件,发现其中有 9 件不合格,求合格率的抽样误差。6.某服装厂对当
18、月生产的 20000 件衬衫进行质量检查,结果在抽查的 200 件衬衫中有 10 件是不合格品,要求:1 (1)以 95.45%概率推算该产品的合格范围;(2)该月生产的产品是否超过规定的 8%的不合格率(概率不变)。7.某地农村种植小麦 150 亩,在麦收前随机不重置抽取了 100 个平方公尺的小麦样本,测得每平方公尺小麦产量为 0.5 公斤, 标准差为 0.05 公斤。 试计算极限抽样误差,并以 95.45%的概率保证,推断 该地区小麦平均 亩产量和总产量。8.某茶叶公司销售一批茗茶,规定每包规格重量不低于 150 克,现抽取 1%检验,结 果是:按每包重量分组(克) 包 数148149
19、10149150 20150151 50151152 20合 计 100试以 99.73%的概率,评估这批茶叶平均每包重量的范围是否符合规定重量要求。9.某厂 4500 名职工中,随机抽取 20%调查每月看电影次数,所得资料如下:看电影次数 02 24 46 68 810职工人数(对总数的百分比) 8 22 40 25 5试以 95.45%的可靠性:(1)估计平均每月看电影的次数;(2)确定每月看电影在 4 次以上的比重,其误差不超过 3%。10.年终在某乡镇储蓄所中按定期储蓄存款账号进行抽样调查,得到如下资料:存 款 额 抽 查 户 数1000 元以下10002000200030005815
20、02007300040004000 元以上6214484(1)试估计该储蓄所所有储户平均存款额的区间(概率为 95.45%);(2)估计定期存款额在 2000 元以上的比重。11.工商部门对某超市经销的小包装休闲食品进行重量合格抽查,规定每包重量不低于 30 克,在 1000 包食品中抽 1%进行检验,结果如下表:按重量分组(克) 包 数(包)2627272828292930303113321合 计 10试以 95.45%概率推算:1 (1)这批食品平均每包重量是否符合规定要求;2 (2)若每包食品重量低于 30 克为不合格,求合格率的范围。12.对某居委会 30 户家庭的月收支情况进行抽样调
21、查,发现平均每户每月用于书报费支出为 45 元,抽 样平均误差为 2 元, 试问应 以多少概率才能保证每户每月书报费支出在 41.08 元至 48.92 元之间。第十章 抽样组织一、本章重点1.保证实现抽样的随机性的原则和保证实现最大的抽样效果的原则是抽样方案设计的基本原则。代表性的检查和准确性的检查是抽样方案检查的两个方面。编制抽样框的目的是将总体所有单位置于可以被抽中的位置上,易于进行抽选工作,提高抽样调查的效果。2.简单随机抽样是抽样调查的基本形式。重点掌握重复抽样的必要抽样数目的确定。等距抽样又称为机械抽样或系统抽样,可分为随机起点等距抽样、半距起点等距抽样、随机起点对 称等距抽样。它
22、没有 专门计 算误差的公式,只能用 简单随机抽样的公式来代替。但它比简单随机抽样的误差要小。3.类型抽样又叫做分层抽样。是分组法和抽样原理的结合。在分组时要坚持层内的齐一性和层间的差异性。必须掌握类型抽样的估计量的计算和推断步骤。在同样的情况下它比简单随机抽样的误差小。4.整群抽样在进行分解时要注意群间的齐一性和群内的差异性。由于抽选单位比较集中,调查较为方便。掌握整群抽样的估计量和平均误差的计算。5. 在多阶段抽样中,前几个阶段的抽样都类似于整群抽样。每个阶段都会存在抽样误差。为提高抽样结 果的代表性,抽取的群数和抽样方式,都 应注意样本单位的均匀分布。对于群间 方差大的阶段, 应适当多抽一
23、些,反之,则可以少抽一些。每阶段的抽样方式可用 简单随机抽样或等距抽样。二、难点释疑1.由于类型抽样对于各组来讲属于全面调查,对于每组内部来说属于抽样调8查。所以,类型抽样的抽样误差仅与组内方差有关,与组间方差无关。与类型抽样正好相反,整群抽样对于组与组之间来讲属于抽样调查,对于中选群内部来讲属于全面调查,因此,整群抽样与组内方差无关与组间方差有关。2.必须澄清几个模糊认识。简单随机抽样最符合随机抽样的原则,但是其误差不一定比其它调查方式小,在具体组织时也有困难;坚持随机原则照样存在着代表性误差;抽样误差最小的方案不一定是最好的调查方案,必须和一定的调查费用联系起来;多阶段抽样的阶段分得越多误
24、差不一定就越小。三、练习题(一)填空题1.抽样方案的检查主要体现在( )检查和( )检查两个方面。2.在计算抽样误差时,常常缺乏总体方差的资料, 实际计算常用( )来代替。3.在其它条件不变的情况下,极限误差增大, 则概率度( ),可靠程度( )。4.整群抽样群内方差对抽样平均误差( )影响,类型抽样群内方差对抽样平均误差( )影响。5.两阶段抽样中,群内方差对抽样平均误差( )影响,群间方差对抽样平均误差( )影响。6.影响样本规模的主要因素有( )、( )、( )、( )。7.对于简单随机重复抽样,若其他条件不变, 则当误差范围缩小一半, 样本容量必须( )倍,若误 差范围扩大一倍, 则抽
25、样单 位数为原来的( )。8.分类抽样是( )和( )相结合的抽样方式。9.整群抽样是对被抽中群内的( )进行( )的抽样组织方式。10.抽样组织形式中, ( )是最基本的抽样组织形式。(二)名词解释1.机械抽样 2.分层抽样 3.整群抽样 4.抽样框(三)判断题1.各种抽样组织方式中,在条件相同的情况下,整群抽样总是误差较大的。 ( )2.一般而言,分类抽样的误差比纯随机抽样的误差小。 ( )3.不重复抽样的误差一定大于重复抽样的误差。 ( )4.抽样误差产生的原因一定是违背了随机抽样的原则。 ( )5.抽样调查中误差最小的方案才是最好的调查方案。 ( )6.抽样调查和典型调查的根本区别在于
26、两种调查中选取调查单位的方法不同。 ( )7.如果抽取群数相同,那么整群抽样的抽样平均误差一定小于二阶段抽样平均误差。 ( )(四)单项选择题1.有一批灯泡共 1000 箱,每箱 200 个, 现抽取 20 箱并检查这些箱中的全部灯泡,此中检查属于( )。A、纯随机抽样 B、类型抽样 C、整群抽样 D、等距抽样2.当单位数目不很多且各单位间差异较小时宜采用( )。A、类型抽 样 B、纯随机抽样9C、整群抽样 D、两阶段抽样3.先按某一标志进行分组,然后在各组中按随机原则抽取一部分单位构成样本,这种抽 样组织方式称为 ( )。A、整群抽 样 B、简单随机抽样C、分类抽样 D、机械抽样4.事前将总
27、体各单位按某一标志排列,然后依排列顺序和按相同间隔来抽选调查单位的抽样称为( )。A、简单 随机抽 样 B、类型抽样C、等距抽样 D、整群抽样5.在总体内部情况复杂,而且各单位之间差异程度较大,单位数又多的情况下,宜采用( )。A、纯随机抽样 B、等距抽样C、整群抽样 D、类型抽样6.抽样调查所特有的一种误差是( )。A、由于 样本的随机性而 产 生的误差 B、登记性误差C、系统性误差 D、前三类都不是7.在抽样设计中,最好的方案是( )。A、抽样误 差最小的方案 B、调查单位最少的方案C、调查费用最少的方案 D、在一定误差要求下费用最少的方案8.在连续生产的电子管厂,产品质量检查是这样安排的
28、,在一天中,每隔一小时抽取 5 分钟的产品进行检验,这是( )。A、简单 随机抽 样 B、类型抽样C、等距抽 样 D、整群抽样(五)多项选择题1.将总体按主要标志进行分级,然后再按随机原则从各组中抽选出样本单位,这种抽样方式是( )。A、机械抽 样 B、类型抽样 C、分层抽样D、简单 随机抽 样 E、整群抽 样2.等距随机抽样( )。A、又称机械抽样 B、又称多阶段抽样C、常用有三种方法,即:随机起点等距抽样;半距起点等距抽 样;随机起点对称等距抽样D、可以按有关标志排队和无关 标志排队E、比整群抽 样 的误差要大3.与典型调查相比较,抽样调查的特点有( )。A、理论 基础 是概率论大数法 则
29、B、按随机原则抽选调查单 位C、抽样误差可以事先计算和控制 D、调查单 位的 选取方法不同E、排除主 观因素的影响4.不重复抽样的平均误差( )A、总是大于重复抽样的平均 误差10B、总是小于重复抽样的平均 误差C、有时大于有时小于重复抽 样的平均误差D、在 Nn很小时,几乎等于重复抽 样的平均误差E、在 趋近于 1 时,可采用重复抽 样的平均 误差的方法计算5.抽样方案的检查主要包括以下几方面,即( )。A、准确性 检查 B、快速性检查 C、全面性检查D、可靠性 检查 E、代表性 检查6.影响整群抽样平均误差的因素有( )。A、群间 方差 B、群内方差 C、系统误差D、群的划分方式 E、中
30、选群的结构7.影响两阶段抽样平均误差的因素有( )。A、群间 方差 B、群内方差 C、抽取群的多少D、各群中抽取单位数的多少 E、样本容量的大小(六)简答题1.1.抽样方案设计的基本原则是什么?2.2.抽样方案的检查有哪几方面?3.3.什么是简单随机抽样?有什么特点?4.4.什么是分层抽样?分层抽样与简单随机抽样相比有什么特点?5.5.什么是整群抽样?简述其特点及适应性。 (七)论述题1.类型抽样与整群抽样相比各有什么特点?2.简述两阶段抽样与整群抽样、类型抽样有什么不同?(八)计算题1.在 2000 名工人中,采取重复抽样方式,随机抽取 144 个工人的土方工程进行测量,测量结果为每一工人的
31、平均工作量为 5.32 立方米。 (1)试以 95%的概率保证程度(t=1.96)来推算抽 样极限误差;(2)根据上述条件,若要求极限 误差不超过 0.1 立方米,t=1,应抽多少个工人进行调查。2.某日化工厂用机械大量连续包装洗衣粉,要求每袋按 1 公斤包装,为保证质量,生 产过程中每隔 8 小 时检查 1 小时的产品,共检验 20 次,算出平均重量为 1.005 公斤,抽样总体各群 间方差平均数为 0.002 公斤。试计算:(1)抽样平均误差;(2)要求概率 99.73%,使产品重量不低于 0.03 公斤为标准,问上述检验的产品是否合格?3.已知某企业职工的收入资料如下:不同收入类型 职工
32、人数(人) 抽 样 人数( 5%) 月平均收入(元) 各类职工收入的 标准差(元)较高的一般的较低的200160012001080601320804600483045合 计 3000 150 根据上表资料计算;(1)抽样月平均收入;(2)月平均收入的抽样平均误差;(3)概率为 0.95 时,职工月平均收入的可能范围。114.某市有职工 100000 人,其中职员 40000 人,工人 60000 人。 现拟进行职工收入抽样调查,并划分职员 和工人两类进行选择。事先按不同类型抽查 40 名职员和 60 名工人,其结果如下表:职 员 工 人平均每人收入(元) 人数 平均每入收入(元) 人数6080
33、100102010608090203010要求这次调查的极限抽样误差不超过 1 元,概率保证程度 95.45%,试按类型抽样调查组织形式计算必要抽样数目。5.某商店对购进的一批大衣的质量进行检查,抽样结果有 1.2%的不合格品,若抽样平均误差为 0.02%,试分别在以下各条件下估计不合格品率。 (1)抽样极限误差为 0.04%;(2)可靠程度为 68.27%。6.为调查农民的生活水平,在某地 5000 户农民中采用不重复简单随机抽样抽取了 400 户进行调查,得知 这 400 户中有彩色电视机的为 87 户,试以 95%的把握估计该区全部农户中拥有彩色电视机的农户所占的比率。又,若要求抽样允许
34、误差不超过 0.02,问至少应抽取多少户作样本?7.要对全及总体 1000 个单位进行 5%的机械抽样。 (1)全及总体要划分为多少部分?(2)每部分的单位数为多少?(3)中选单位间隔是多少?(4)如果第一组抽到第 5 号单位,其他中选单位的号码是多少?8.某工厂对 1000 箱入库产品进行抽检。现从中抽取 100 箱(每箱装 100 个产品),对这 100 箱进行全部 检查, 结果如下:废品率() 12 23 34箱数(箱) 60 30 101 (1)试在 68.27%的把握程度下估计废品率的范围;2 (2)试以 95%的把握估计这批产品的废品数为多少;(3)生产车间称这批产品的不合格率在
35、1%以下,试根据抽样结果说明这一说法是否可信?9.某院有 30 个教学班,每班 40 名学生。从中抽取 8 个班,再从中 选班中各抽 10 名学生检查教学效果, 综合评分结果如下:平均得分 67 82 73 69 85 78 83 80方 差 4.5 3.2 4.4 3.8 4.0 4.3 5.2 3.4试以 95%的把握估计全院平均成绩。第十一章 相关分析与回归分析一、本章重点1相关系数的概念及相关系数的种类。事物之 间的依存关系,可以分为函数关系和相关关系。相关关系又有单向因果关系和互为因果关系;单相关和复相关;线性相关和非线性相关;不相关、不完全相关和完全相关;正相关和负相关等类型。2相
36、关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示,对12于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行科学推断。3回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元 线性回归和非线性回 归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验,利用回归方程进行预测是回归分析的主要内容。4应用相关与回归分析应注意的问题。相关与回 归分析都有它们的应用
37、范围,必须 知道在什么情况下能用,什么情况下不能用。相关分析和回 归分析必须以定性分析为前提,否则可能会闹出笑话,在 进行预测时选取的样本要尽量分散,以减少预测误差,在进行预测时只有在现有条件不变的情况下才能进行,如果条件发生了变化,原来的方程也就失去了效用。二、难点释疑本章难点在于计算公式多,不容易记忆,所以更要注重计算的练习。 为了掌握基本计算的内容,起码应认 真理解书上的例题,做完本指导书上的全部计算题。初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住 Lxx、Lxy、Lyy这三个记号,记住它们的展开式,几个主要的公式就不难记忆了。如果能自己把这些公式推证一下,搞清其关系,那就更
38、容易记住了。三、练习题(一)填空题1 事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为( )和( )两种。2相关关系按相关关系的情况可分为( )和( );按自变量的多少分( )和( );按相关的表 现 形式分( )和( );按相关关系的密切程度分( )、( )和( );按相关关系的方向分( )。3回归方程只能用于由( )推算( )。4一个自变量与一个因变量的线性回归,称 为( )5估计变量间的关系的紧密程度用( )6在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量是( ),因 变量是( )。7已知剩余变差为 250,具有 12 对变量值资料,那么这时的估计标准误差是(
39、 )。8将现象之间的相关关系,用表格来反映, 这种表称 为( ),将现象之间的相关关系用图表示称( )。9若两个变量完全不相关,则相关系数等于( ),若两个变量完全相关,则相关系数等于( )。10在回归方程 y=a+bx 中,待定系数 a 为( ),b 为( )。11若已知 y 为每亩蔬菜产量(单位:百公斤), x 为每亩地施肥量(单位:公斤),已知 y=9.964+0.891x 并已知每亩地最高施肥量为 70 公斤,最低施肥量为 35 公斤,那么每亩地蔬菜产量的大致变动范围为( )到( )。(二)名词解释1.函数关系 2.相关关系 3.单项因果关系 4.互为因果关系 5.回归分析 6.一元线
40、性回归模型 137.估计标准误差 (三)判断题1某一变量的每一个数值都有另一变量的确定的值与之对应,这种关系叫相关关系。 ( )2任何两个有相关关系的现象, 计算其相关系数一定是在-1 至 1 之间。 ( )3当相关系数等于 1 或-1 时,两个 变量的关系是函数关系,当相关系数等于零时,说 明两个变量之间的关系不是相关关系。 ( )4计算相关系数时,首先要确定自变量和因变量。 ( )5积距相关系数的正负号主要取决于计算公式的分子符号。 ( )(四)单项选择题1相关分析研究的是( )。A、变量 间相互关系的密切程度 B、变量之间因果关系C、变量之间严格的相依关系 D、变量之间的线性关系2若变量
41、 X 的值增加时,变量 Y 的值也增加,那么变量 X 和变量 Y 之间存在着( )。A、正相关关系 B、负相关关系C、直线相关关系 D、曲线相关关系3若变量 X 的值增加时,变量 Y 的值随之下降,那么变量 X 和变量 Y 之间存在着( )。A、正相关关系 B、负相关关系C、直线相关关系 D、曲线相关关系4相关系数等于零表明两变量( )。A、是严 格的函数关系 B、不存在相关关系C、不存在线性相关关系 D、存在曲线线性相关关系5相关关系的主要特征是( )。A、某一 现象的 标志与另外的 标志之间的关系是不确定的B、某一现象的标志与另外的 标志之间存在着一定的依存关系,但它 们不是确定的关系C、
42、某一现象的标志与另外的 标志之间存在着严格的依存关系D、某一 现象的 标志与另外的 标志之间存在着不确定的直线关系6时间数列自身相关是指( )。A、两变 量在不同 时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期 变量值之间的依存关系D、一个 变量的数 值与时间 之间的依存关系7如果变量 X 和变量 Y 之间的相关系数为负 1,说 明两个变量之间( )。A、不存在相关关系 B、相关程度很低C、相关程度很高 D、完全负相关8若物价上涨,商品的需求量愈小, 则物价与商品需求量之 间( )。A、无相关 B、存在正相关C、存在负相关 D、无法判断是否相关149相关分析对资料的要求
43、是( )。A、两变 量均 为随机的 B、两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变 量不是随机的,因变量是随机的10回归分析中简单回归是指( )。A、时间 数列自身回 归 B、两个变量之间的回归C、变量之间的线性回归 D、两个变量之间的线性回归(五)多项选择题1下列属于相关关系的有( )。A、农作物收获量和施肥量之 间的关系B、家庭收入与生活费支出 间的关系C、圆面积和圆半径之间的关系D、身高与体重之间的关系E、美国人口数和加拿大粮食产量之间的关系2下述关系中属于负相关的有( )。A、在合理限度内, 农业中施肥量和平均亩产量之间的关系B、工业企业中生产用固定 资产平均价值和
44、产品总产 量之间的关系C、商业企业的劳动效率和流通 费用率之间的关系D、单位 产品成本和原材料消耗量之间的关系E、工业产品产 量和单位产 品成本之间的关系3现象间相互依存的类型有( )。A、函数关系 B、相关关系C、回归关系 D、随机关系 E、结构关系4下列语句中正确的有( )。A、具有明 显 因果关系的两 变量一定不是相关关系B、只要相关系数数值较大,两变量就一定存在密切的相关关系C、相关系数的符号可说明两 变量相互关系的方向D、样本相关系数和总体相关系数之 间存在着抽样误差E、不具有因果关系的变量一定不存在相关关系5回归方程可用于( )。A、根据自 变 量预测因变量B、给定因变量推算自变量
45、C、推算时间数列中缺失的数据D、给定自 变 量推算因变量E、用于控制因变量6、直线相关分析的特点有( )。A、两变 量不是 对等的B、两变量只能算出一个相关系数C、相关系数有正负号D、两个 变量都是随机的E、相关系数的绝对值是介于 01 之间的数(六)简答题1什么是相关关系,相关分析有什么作用?152简述相关分析的特点。3简述相关分析和回归分析的关系。(七)论述题试述相关与回归分析应注意的几个问题。(八)计算题1.某地生猪存栏数资料如下:单位(千头)年份 1979 1980 1981 1982 1983 1984 1985存栏数 52.0 64.9 82.6 107.9 146.2 154.4
46、 172.2计算本期与前期存栏头数的相关系数;2.生产某种产品的八个企业产量与单位成本资料如下:企业编号 1 2 3 4 5 6 7 8产 量(千件)2.5 1.8 3.2 2.3 3.6 4.2 1.2 2.9单位成本(万元)1.6 2.4 1.4 1.8 1.5 1.4 2.3 1.5 计算 单位成本与产 量间的相关系数; 列出正规方程组求单位成本倚产量的回归方程并解释回归方程中各系数的经济意义; 试估 计产量为 3 千件的 单位成本; 计算估 计标准误差。3.已知:6 x=21 y=426 xx=79 yy=30268 xy=1481 要求:计算相关系数建立回归方程计算估计标 准误差4.
47、某市 19951999 年每人平均月收入和商品销售额资料如下表:年 份 平均每人月收入(十元) x商品 销售额(十万元) y1995199619971998199948606468762230283240要求:(1)以人均收入为自变量,商品销售额为因变量,建立直线回归方程;(2)用最小平方法求人均收入数列的直线趋势方程,并估计 2000 年该市的人均收入;(3)根据 2000 年的人均收入的估计值,利用回归方程推算 2000 年该市的商品销售额。165.有 10 个同类企业的生产性固定资产年平均原值和总产值资料如下表:企业编号 生产性固定资产原值(万元) x工 业总产值 (万元) y123456789103139102004094155023141210102212255241019638815913928605151612191624根据上表资料:(1)计算相关系数;(2)建立回归直线方程;(3)计算估计的标准误差;(4)估计生产性固定资产为 1100 万元时的工业总产值。6.某市 19972001 年各年的职工生活费收入和商品销售额的资料如下:年份 职工生活费收入(千元) x商品 销售额(亿元) y199719981999200020015.66.06.16.47.08793100106114计算相关系数,并作简要说明。7.某市电子工业企业的年设备能力和