1、统计学原理形成性考核册答案作业一 (第 1-3 章)四、简答题 1、 统计标志和标志表现有何不同? 答:统计标志是指总体中各单位所的属性和特征,它是说明总体单位属性和特征的名称。 标志表现是标志特征在各单位的具体表现。标志是统计所要调查的项目,标志表现则是调查所得的结果。标志表现是标志的实际体现者。 2、 如何认识总体和样本的关系? 答:统计总体就是根据一定的目的要求所确定的研究事物的全体,它是由客观存在的具有某种共同性质的许多个别事物构成的整体,统计总体必须同时具备大量性,同质 变异性。 总体单位是指总体的个体单位,它是总体的基本单位。 3、 什么是普查? 普查和全面统计报表都是全面调查,二
2、者有何区别? 答:普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。普查和统计报表同属于全面调查,但两者不能互相替代。统计报表不可能象普查那样充满热情如此详尽的全面资料,与定期报表相比较普查所包括的单位、分组目录以及指标内容要广泛详细、规模宏大。解决报表不能解决的问题,但是,要耗费较大的人力、物力和时间。从而不可能经常进行。 4、 调查对象、填报单位与调查单位的关系是什么? 答:调查对象是应搜集资料的许多单位的总体。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包括的具体单位。 5、 单项式分组和组距式分组分别在什么情况下运用? 答:离散型变量如果变量值变动
3、幅度较小,可依次将每个变量值作为一组。租用单项式分组。离散型变量如果变量值变动很大,次数又很多,或是连续型变量,采用组距式分组。 6、变量分配数列编制的步骤 将原始资料按其数值大小重新排列 只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距,组距和组数作准备. 确定全距 全距是变量值中最大值和最小值的差数.确定全距,主要是确定变量值的变动范围和变动幅度.如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列. 确定组距和组数 前面已经介绍过组距数列有等距和不等距之分,应视研究对象的特点和研
4、究目的而定. 组距的大小和组数的多少,是互为条件和互相制约的.当全距一定时,组距大,组数就少;组距小,组数就多.在实际应用中,组距应是整数,最好是 5 或 10 的整倍数.在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义. 在等距分组条件下,存在以下关系: 组数=全距 /组距 确定组限 组限要根据变量的性质来确定.如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散 ,则采用开口式,使最小组只有上限( 用“XX 以下“表示),最大组只有下限(
5、用“XX 以上表示).如果是离散型变量,可根据具体情况采用不重叠组限或重叠组限的表示方法,而连续型变量则只能用重叠组限来表示. 在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊. 编制变量数列 经过统计分组,明确了全距,组距,组数和组限及组限表示方法以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中.六、计算题1、某工业局所属各企业工人数如下:555 506 220 735 338 420 332 369 416 548 422 547 567 288 447 484 417 731 483 560 343 312 623
6、798 631 621 587 294 489 445试根据上述资料,要求:(1)分别编制等距及不等距的分配数列 (2)根据等距数列编制向上和向下累计的频数和频率数列。解:1)等距分配数列 工人数 企业数(频数) 各组企业数所占比重(频率)%2003003 103004005 1674005009 305006007 2336007003 107008003 10合计 30 100不等距分配数列 工人数 企业数(频数)各组企业数所占比重(频率)%2004008 2674005009 305006007 2336008006 20合计 30 1002)向下累计 向上累计工人数 频繁数 累计频数%
7、累计频率%工人数 频繁数 累计频数%累计频率%300 3 3 10 200 3 30 100400 5 8 267 300 5 27 90500 9 17 567 400 9 22 733600 7 24 80 500 7 13 433700 3 27 90 600 3 6 20800 3 30 100 700 3 3 10合计 30 合计 30 2、某 班 40 名 学 生 统 计 学 考 试 成 绩 ( 分 ) 分 别 为 :57 89 49 84 86 87 75 73 72 68 75 82 97 8167 81 54 79 87 95 76 71 60 90 65 76 72 708
8、6 85 89 89 64 57 83 81 78 87 72 61 学 校 规 定 : 60 分 以 下 为 不 及 格 , 60 70 分 为 及 格 , 70 80 分 为 中 , 80 90 分 为 良 , 90100 分 为 优 。 要 求 :( 1) 将 该 班 学 生 分 为 不 及 格 、 及 格 、 中 、 良 、 优 五 组 ,编 制 一 张 次 数 分 配 表 。(2)指 出 分 组 标 志 及 类 型 ; 分 析 该 班 学 生 考 试 情 况 。解:1、成绩(分) 学生人数(个)频率(比重)%60 分以下 4 1060-70 6 1570-80 12 3080-90
9、15 37590 以上 3 75合计 40 1002 分组标志是“成绩” ,其类型是数量标志,分组方法:是变量分组中的组距式分组,而且是开口分组;本班学生考试的成绩分布呈“两头小,中间大”的“正态分布” 。作业二(第 4 章) 1、 结构相对指标、比例相对指标和比较相对指标有什么不同的特点?请举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况。比较相对指标是不同单位的同类指标对比而确定的相对数,借以说明同类现象在同一时期内各单位发展的
10、不平衡程度。 2、什么是变异系数?变异系数的应用条件是什么? 答:变异系数:全距、平均差和标准差都有平均指标相同的讲师单位,也就是与各单位标志值的讲师单位相同。 变异系数的应用条件是:为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的影响,这时就要计算变异系数。 常用的是标准差系数 V6=6/x 3、答 1). 结构相对指标 结构相对指标是反映总体内部结构状况的指标,一般用百分数表示。其计算公式为: 例如,第一、第二和第三产业在国内生产总值中所占比重,产品的合格率等都是结构相对指标。结构相对指标是在统计分组的基础上计算的,总体中各组比重之和等于 100%。 2).强度
11、相对指标 强度相对指标是两个有一定联系而性质不同的总量指标的对比,是用来表明现象的强度、密度和普遍程度的指标。其计算公式为: 强度相对指标分子、分母的计算范围应当一致。强度相对指标多用有名数表示,例如,人口密度、人均占有土地和人均国内生产总值等;也可以用无名数表示,如人口出生率、人口自然增长率等。 3). 动态相对指标(发展速度) 动态相对指标是两个时期同一指标数值的对比,是反映现象发展变化程度的指标,通常用百分数或倍数表示。其计算公式为: 4、请分别写出简单算术平均数、加权算术平均数、加权调和平均数的计算公式并分别说明其应用条件。答:简单算术平均数 它适用于未分组的统计资料;如果已知各单位标
12、志值和总体单位数,可用简,nx单算术平均数计算。加权算术平均数 ,它适用于分组的统计资料,如果已知各组的变量值和变量fx值出现的次数,则可用加权算术平均数。调和平均数 ,在实际工作中,有时由于缺乏总体单位数xm资料,而不能直接计算平均数,这时就可以采用调和平均数。五、计算题:(做题请写出计算公式和主要计算过程。计算结果保留小数)1、某生产车间 40 名工人日加工零件数(件)如下:30 26 42 41 36 44 40 37 43 35 37 25 45 29 4331 36 49 34 47 33 43 38 42 32 25 30 46 29 3438 46 43 39 35 40 48
13、33 27 28要求:(1)根据以上资料分成如下几组:2530,3035,3540,4045,4550,计算出各组的频数和频率,整理编制次数分布表。(2)根据整理表计算工人生产该零件的平均日产量。解:(1)40 名工人加工零件数次数分配表为:按日加工零件数分组(件)x工人数(频数) (人)f 比重(频率) (% )2530 7 1753035 8 2003540 9 2254045 10 2504550 6 150合 计 40 100(2)工人生产该零件的平均日产量方法 1、 (x 取组中值)X1=27.5;X2=32.5X3=37.5X4=42.5X5=47.5=37.5(件)方法 2 (件
14、)答:工人生产该零件的平均日产量为 37.5 件2、某地区销售某种商品的价格和销售量资料如下:商品规格 销售价格(元) 各组商品销售量占总销售量的比重()甲乙丙2030304040-50205030根据资料计算三种规格商品的平均销售价格。解:已知:(元)答:三种规格商品的平均价格为 36 元3、某企业 2003 年某月份按工人劳动生产率高低分组的有关资料如下:按工人劳动生产率分组(件/人)生产班组 生产工人数506060707080809090 以上35822150100703050试 计 算 该 企 业 工 人 平 均 劳 动 生 产 率 。 解: 95,8,75,6,54321 xxx 5
15、0,3,70,1,04321 ffff根据公式:f5.47;.2;5.37;.25.741 xxxf 5.37406.15.29.3785.2.7 3.0%;5.0;2.0%;345;25311 fffxx 360.f 5.683701986f(件/人)答:该企业工人平均劳动生产率为 68.25 件/人4、某厂三个车间一季度生产情况如下:品种 价格(元/公 斤) 甲市场成交额(万 元) 乙市场成交量(完公斤)甲乙丙1.21.41.522.81.5211试问该农产品哪一个市场的平均价格比较高。解:甲市场平均价格 (元/公斤)375.145.182.xm乙市场平均价格 (元/ 公斤)2.f5、甲、
16、乙两个生产小组,甲组平均每个工人的日产量为 36 件,标准差为 9.6 件;乙组工人日产量资料如下:日产量(件) 工人数(人)102020303040405018393112计算乙组平均每个工人的日产量,并比较甲、乙两生产小组哪个组的日产量更有代表性?解:已知:甲班: 6.9;311x乙班: 45,25,1x 12,3,9,1842fff90712391845252乙x702乙答:因为 ,所以甲生产小组的日产量更有代表性21v统计学原理作业(三)(第五第七章)三、多项选择题 四、简答题1、什么是抽样误差?影响抽样误差大小的因素有哪些?答:抽样误差是指由于抽样的偶然因素使样本各单位的结构不足以代
17、表总体各单位的机构,而引起抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。2、什么是抽样平均误差和抽样极限误差?二者有何关系?.382fx6.3.1x 318.072.2x答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即 ;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。3、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准?答:相关系数
18、的简要公式: 2222 11ynyxnxr1)相关系数的数值范围是在 1 和 +1 之间,即时 , 时为正相关, 时为负相关。0r0r2)当 时, x 与 y 完全相关;两变量 是函数关系;微弱相关低度相关当 时,x 与 y 不完全相关(存在一定线性相关) 显著相关高度相关 当 时,x 与 y 不相关4、拟合回归程 yc=a+bx 有什么前提条件? 在回归方程 yc=a+bx,参数 a,b 的经济含义是什么?答:1)拟合回归方程 的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显著相关以上;3)找到全适的参数 a,b 使所确定的回归方程达到使实际的 y 值与对应的理论
19、估计值 的离差平方和为最小。cy2)a 的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示 x=0 时 y 常项。参数 b 称为回归系数,表示自变量增加一个单位时因变量 y 的平均增加值,回归系数 b 正负号可以判断相关方向,当 b0 时,表示正相关,当 b0 表示负相关。五、计算题1、2、外贸公司出口一种食品, 规定每包规格不低于 150 克,现在用重复抽样的方法抽取其中的 100 包进行检验,其结果如下: 要求:(1)以 99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求;每包重量(克) 包 数1481491491501501511511521
20、0205020 100bac3.05.o1.8.10 0(2)以同样的概率保证估计这批食品合格率范围。 解:2)已知: 3%;7.9)(;10ttFn组中值 x 包数 f Xf1485 10 1485 220522.51495 20 2990 4470051505 50 7525 1132512.51515 20 3030 495045合计 10015030 2259085(克) (克)2)已知: 3%;7.9)(;70;1ttFn答:1)以 99.73%的概率估计这批食品平均每包重量的范围为 150.04-150.56 克,大于 150 克,所以平均重量是达到规格要求2) 以 99.73%的
21、概率保证估计这批食品合格率范围为 56.26%-83.74。3、单位按简单随机重复抽样方式抽取 40 名职工,对其业务情况进行考核,考核成绩资料如下:68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60 分以下,6070 分,7080 分,8090 分,90100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以 95.45%的概率保证程度推断全体
22、职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?解:1)分配数列成绩 工人数(频数)f 各组企业数所占比重(频率)%60 以下 3 756070 6 157080 15 3758090 12 3090100 4 10合计 40 1002)全体职工业务考试成绩的区间范围fx2fxffx2872.10.nx 26.087.3xt56.04.56.3.3.6Xxx 58.410)7(.)nPpp4.358.t7.%26.5 %.31Pppf f52.1074262x3)已知: (分) t = 267.1232xx(人)答:(2)根据整理后的变量数列,以 9
23、5.45%的概率保证程度推断全体职工业务考试成绩的区间范围 73.66-80.3;(3)若其它条件不变,将允许误差范围缩小一半,应抽取 160 名职工4、采用简单重复抽样的方法,抽取一批产品中的件作为样本,其中合格品为件。要求:()计算样本的抽样平均误差()以的概率保证程度对该产品的合格品率进行区间估计()解:已知:1) ;195;20n2)已知 t=2答: )样本的抽样平均误差为 1.1%()以的概率保证程度对该产品的合格品率区间为 95.3%-99.70%5、某企业上半年产品产量与单位成本资料如下:要求:()计算相关系数,说明两个变量相关的密切程度。()配合回归方程,指出产量每增加件时,单
24、位成本平均变动多少? 月份 产量(千件)单位成本(元)月份 产量(千件)单位成本(元)123234737271456345736968()假定产量为件时,单位成本为多少元?成绩组中值x工人数 f Xf55 3 165 907565 6 390 2535075 15 1125 8437585 12 1020 8670095 4 380 36100合计 40 3080 241600 %1.20)597(.)(%.7195 npnpp2.4pt7.93.5 5 PPp067.1542xtnfx2038f 52.104)(2fx67.14052.nx.1xt 3.8.734.4 XXXfxffx解:设
25、产品产量为 x 与单位成本为 y月份 产量(千件)x单位成本(元/件)y2x2yxy1 2 73 4 5329 1462 3 72 9 5184 2163 4 71 16 5041 2844 3 73 9 5329 2195 4 69 16 4761 2766 5 68 25 4624 340合计 21 42679 30268 14811)相关系数2)3) 时, (元)答:()相关系数为 09091,说明两个变量相关的密切程度为高度负相关。()回归方程为产量每增加件时,单位成本平均减少 1.8128 元 (3)假定产量为000 件时,单位成本为 66.46 元6、根据某地区历年人均收入(元)与
26、商品销售额(万元)资料计算的有关数据如下: (x 代表人均收入,y 代表销售额) n=9 =546 =260 =34362 =16918xy2xxy计算: (1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义;(2)若 2002 年人均收为 14000 元,试推算该年商品销售额 。解:(1)2) x=1400 (万元)答:(1)建立以商品销售额为因变量的直线回归方程,回归系数的含义:当人均收入每增加 1 元,商品销售额平均增加 0.92 万元;(2)若 2002 年人均收为 1400 元,该年商品销售额为 12853.08 万元 。7、某地区家计调查资料得到,每户平均年收入为 8
27、800 元,方差为 4500 元,每户平均年消费支出为 6000 元,均方差为 60 元,支出对于收入的回归系数为 0.8,要求: (1)计算收入与支出的相关系数; (2)拟合支出对于收入的回归方程;(3)收入每增加 1 元,支出平均增加多少元。解:1)已知:92.6/54926.0/nxbyxyac 9.02.6 08.13.4xyc xyc92.6./13468)(1222xb2xxy2xxy2y901.426308217964)()(222 ynxny 34.76/21)8.(6/42.179/)(122 nxbyxabxyc812.347.6yc8.0;6;08.7;45;60;82
28、byx yxx2)答:(1)收入与支出的相关系数为 0.89; (2)支出对于收入的回归方程;(3)收入每增加 1 元,支出平均增加 0.8 元收入每增加 1 元,支出平均增加 0.8 元。作业四(第 89 章)统计学原理作业(四) (第八第九章)四、简答题1、 写出数量指标指数和质量指标指数的公式,并说明同度量因素固定时期的一般方法是什么? 答:数量指标指数 ,质量指标指数01pqK10qpK确定同度量因素固定时期的一般方法是:编制数量指标指数时,应以质量指标为同度量因素,时期固定在基期;编制质量指标指数时,应以数量指标为同度量因素,时期固定在报告期。2、平均数指数在什么条件下才能成为综合指
29、数的变形?试列式证明二者之间的关系。 答:平均数指数必须在特定权数的条件下才能成为综合指数的变形。 加权算术平均数指数要成为综合指数的变形,必须在基期总值( )为权数的特定条件下;加权调和平均数指数要成为综合指数的变形,必须0qp在报告期总值( )为权数的特定条件下。列式证明如下:1,00pqkKq 01 101qpkqpK103、什么是时期数列和时点数列?二者相比较有什么特点? 写出时期数列和间断时点数列平均发展水平的计算公式。答:时期数列是指由反映现象在一段时期内发展过程总量的时期指标构成的动态数列。时点数列是指由反映在某一瞬间总量的时点指标构成的动态数列。二者相比较有以下特点:(1)时期
30、数列的各指标值具有连续统计的特点,而时点数列各指标值不具有连续统计的特点;(2)时期数列各指标值具有可加性的特点,而时点数列各指标值不能直接相加;(3)时期数列各指标值的大小与所包括的时间长短有直接关系,而时点数列各指标值的大小与时间间隔长短无直接关系。时期数列平均发展水平的计算公式: na间断时点数列平均发展水平计算公式:(间隔不等) ffafa nn11232121 (间隔相等)1221nan4、写出定基发展速度与环比发展速度、累积增长量与逐期增长量的计算公式,并说明它们之间的关系。 答:计算公式:定基发展速度 : , ,0ak012a0n环比发展速度 : , ,1k0121n1048.0
31、6xbya xbxayc 8.0149.7 yc累积增长量 : , ,0ak0102a0an逐期增长量 : , ,11关系:各期环比发展速度的连乘积等于定基发展速度:相邻两个时期的定基发展速度之商等于相应的环比发展速度: 011nna逐期增长量之和等于累积增长量: 相邻两个时期的累积增长量之差 = 相应的逐期增长量五、计算题1、 (1)某年我国城市消费品零售额 12389 亿元,比上年增长 28.2;农村消费品零售额 8209 亿元,增长24.3,扣除价格因素,实际分别增长 13和 6.8,试问城乡消费品价格分别上涨多少? (2)某厂 2003 年的产量比 2002 年增长 313.6,生产费
32、用增加了 12.9。问该厂 2003 年产品成本的变动情况如何?解:(1)城镇物价指数: 农村物价指数:%45.132.18 %39.168.106324城镇物价上涨 13.45,农村物价上涨 16.39(2)产品成本指数: ,即产品成本降低了 72.7。.76.41392、某厂生产的三种产品的有关资料如下: 产量 单位成本(元)产品名称 计量单位 基期 报告期 计量单位 基期 报告期甲乙丙万件万只万个100050001500120050002000元 /件元 /只元 /个104884.57要求: (1)计算三种产品的单位成本指数以及由于单位成本变动使总成本变动的绝对额;(2)计算三种产品产量
33、总指数以及由于产量变动而使总成本变动的绝对额;(3)利用指数体系分析说明总成本(相对程度和绝对额)变动的情况。解:(1)单位成本指数: %04.96812054120.10 qpK单位成本变动影响总成本变动的绝对额 )(461 万 元qp(2)产量总指数: 29.105804101 qpq产量变动影响总成本变动的绝对额; )(64万 元pq(3)因素分析: 010101pq %29.10.976. 010111 qpqp万 元万 元万 元 6943、某公司三种商品销售额及价格变化资料如下:商品销售额(万元) 名称 基期 报告期 价格变动()甲乙丙500200100065020012002510
34、要求:(1)计算三种商品价格总指数和价格变动引起的销售额变动绝对额;3120a 011201 )()()(an(2)计算三种商品销售额总指数及销售额变动绝对数;(3)计算三种商品销售量指数和销售量变动引起的销售额变动绝对数。解: (1)价格总指数 %74.10569.3821.095.20.16ppkqK价格变动引起的销售额变动绝对额 )(.1万 元pkq(2)销售额总指数 %58.1207025601 qpKR销售额变动绝对数 )(31万 元(3) KR=KpKq 销售量指数 3.147.058qK销售量的变动对销售额的影响额:350111.3238.69(万元)4、某工业企业资料如下:指标
35、 一月 二月 三月 四月工业总产值(万元) 180 160 200 190月初工人数(人) 600 580 620 600试计算: (1)一季度月平均劳动生产率; (2)一季度平均劳动生产率。 解: (1) 一季度月平均总产值 万元180326180na一季度月平均工人数 人6025121 bbn一季度月平均劳动生产率= 万元/ 人3.068ac(2)一季度平均劳动生产率= 万元/人935、我国城镇居民人均可支配收入资料如下年份 1997 1998 1999 2000 2001 2002城镇居民可支配收入5760.35425.1 5854.0 6280 6322.6 6860要求: (1)逐期
36、增长量、累积增长量、全期平均增长量;(2)定基发展速度、环比发展速度;(3)定基增长速度、环比增长速度; (4)年平均发展速度和增长速度。解:年份 1997 1998 1999 2000 2001 2002城镇居民可支配收入逐期增长量累积增长量定基发展速度()环比发展速度()定基增长速度()环比增长速度()5760.35425.1335.2335.294.1894.185.825.825854.0428.993.7101.63107.911.637.916280426519.7109.02107.289.027.286322.642.6562.3109.76100.689.760.686860
37、537.41099.7119.09108.519.098.5平均增长量 )(94.2157.0万 吨na平均发展速度 103.56 0356.176850nax平均增长速度平均发展速度13.566、 (1)某地区粮食产量 20002002 年平均发展速度是 1.03,20032004 年平均发展速度是 1.05,2005 年比 2004 年增长 6,试求 20002005 年六年的平均发展速度;(2)已知 2000 年该地区生产总值为 1430 亿元,若以平均每年增长 8.5的速度发展,到 2010 年生产总值将达到什么水平? 解:(1)20002005 年六年的平均发展速度 %2.1046.05.13.62x(2)2010 年生产总值 1430 3233.21(亿元)nxa010%5.8