1、1总体就是统计研究客观现象的全体,它是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体。样本,就是从总体中抽取的一部分个体所组成的集合,也称为子样。个体组成总体的每个个别事物称为个体,也称为总体单位。总体与个体的关系: 1.总体的容量随着个体数的增减可变大变小。 2. 随着研究目的的不同,总体中的个体可以发生变化。3. 随着研究范围的变化,总体和个体的角色可以变换。样本和总体的关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。3.总体和样本的角色是可以改变的。什么是统计指标?他的测量尺度有哪些?用来测度统计活动研究对象某种特
2、征数量的概念称为统计指标,简称指标。测量尺度:定类尺度,定序尺度,定距尺度,定比尺度。什么是统计指标体系?它的设计内容包括哪些?设计统计指标体系应遵守哪些原则?反应总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系,称为统计指标体系。设计内容:设置统计指标体系的框架,确定每一个指标的内涵和外延,确定每个统计指标的计量单位,确定每个统计指标的计算方法原则:目的性原则。科学性原则。可行性原则。联系性原则简述数据调查的一般程序。 (一)数据调查方案的制定 1 确定调查数据的目的 2 确定调查对象和调查单位 3 确定调查项目和调查表 4 确定调查时间和调查期限 5 调查
3、的组织实施(二)现场观测登记(三)数据的显示整理单值分类:将每个不同的取值作为一类,分类项目有几个不同取值就可以分成多少类,比如国民性别。场合:若作为分类依据的个体项目只能去很少的几个数值。组距分类:将个体项目的取值范围划分为若干个不同数值的区间,在同一区间内取值的个体作为一类。场合:若作为分类依据的个体项目有不同的取值个数很多什么是次数分布?构成次数分布的要素有哪些?显示次数分布的方法有哪几种?(1)观测变量的各个不同数值及每个不同数值的出现次数的顺序排列,称为变量的次数分布。 (2)各组名称、次数或频率(3)表示法、图示法:直方图、折线图、曲线图什么是次数分布的理论模型?表示随机变量的概率
4、分布的方法有哪些?(1)对实践中遇到的各种变量的次数分布加以分类整理,每类变量的次数分布能用一个数学模型加以描述。 (2)表示方法:概率分布表、概率分布图、概率分布函数编制组距分布表的步骤确定组数、确定组距、确定组限、计算各组的次数、列出组距分组次数分布表测度变量分布中心有何意义?变量的分布中心是变量取值的一个代表,可以用来反映其取值的一般水平。变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置,可以用来反映变量分布密度曲线的中心位置,即对称中心或尖峰位置。测度指标:I.平均数,易受极端值影响数学性质优良,数据对称分布或接近对称分布时应用 II.中位数,不受极端值影响,数据分布偏斜
5、程度较大时应用 III.众数。不受极端值影响,具有不唯一性,数据分布偏斜程度较大且有明显峰值时应用三者之间的关系:算术平均数、中位数和众数三者之间在数量上的关系取决于变量值在数列中的分布状况。I.在正态分布的情况下,X 平均数=me 中位数=mo 众数。在偏态分布的情况下,众数=3 中位数-2 平均数(mo=3me-2x)测量散布程度意义:可以反映各个变量值之间的差异大小,反映分布中心指标对各个变量值代表性的高低。可以大致反映变量次数分布密度曲线的形状测度指标:极差:不受中间变量值的影响、四分位全距:不易受极端值影响,仍没有充分的利用所有数据信息的缺点、平均差:意义明确,计算不复杂但运算不方便
6、、标准差:可2消除离差正负向的差别,强化了离差的信息、方差:正负偏差相互抵消,从而掩盖了实际偏差的大小判断估计量优劣的标准有哪些?一致性、无偏性、有效性、充分性、稳健性什么是估计标准误?样本估计量的标准误差通常称为该估计量的标准误差,简称标准误。影响因素:1、总体中各个体之间的差异程度 2、样本容量的大小 3、抽样的方式与方法。估计区间:在事先给定的概率保证程度下,根据样本估计量的概率分布,确定出可能包含未知总体参数的某个区间,作为对未知中体参数的估计置信概率:概率 1-a 就是置信概率,表明了期区间估计的可靠程度或把握程度估计精度:置信区间的长度表达了估计的精确程度。长度越短精度越高。置信概
7、率越大,估计的可靠程度越高。简述时间序列的影响因素及其模型。影响因素:长期趋势、循环变动、季节变化和不规则变动。乘法模型:=TSCI 加法模型:=T+S+C+I什么是逐期增长量、累积增长量?它们有什么区别和联系?逐期增长量是报告期水平与前一期水平之差,说明报告期比前一期增长的绝对数量。累积增长期是报告期水平与某一固定时期的水平(通常为最初水平)之差,说明某一段较长时期内的总增长量。联系:累积增长量等于相对应时期的逐期增长量之和。相邻两个时期的累积增长量之差等于相对应时期的逐期增长量。区别:逐期增长是本期数减去上期数,而累计增长量是本期数减去基期数。发展速度:报告期水平和基期水平之比。增长速度:
8、增长量除以基期水平或者是发展速度减 1 的结果。联系:用来表示某一时期内某动态指标发展变化状况的动态相对数区别:增长速度=发展速度-1 简述测定长期趋势的方法。时距扩大法、移动平均法、数学模型法同度量因素:使若干由于度量单位不同不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。作用:使不能相加的量转变为可加的具有经济意义的量。具有权数作用,通过其取值的不同就可以衡量因素的不同的相对重要程度。指数体系:若干个有联系的经济指数之间如能构成一定数量对应关系,经济上有联系、数量保持一定关系的指数之间的客观联系成为指数体系。若干因素指数乘积等于总变动指数,差额之和等于总差额。例:商品总成本的实际
9、增减量=单位成本变动影响额+产量变动的影响额什么是相关系数?他与函数关系有何区别?相关系数是度量两个变量(现象)间线性关系强度的数量指标。区别:函数关系表现的是变量间严格的确定性的数量关系,函数强调数量上的一一对应。相关关系只能说明变量间有数量上的变化关系,而无严格的数值对应关系。相关关系是指存在于现象之间的一种非确定性的数量关系什么是相关系数?它的作用有哪些?相关系数是度量两个变量间线性关系强度的数量指标。作用:相关系数是用以反映变量之间相关关系密切程度的统计指标。34-7、为了了解农民工的月生活费支出情况,某市在全市农民工中随机抽取了 300 名进行调查,调查得样本资料如下表所示:按月生活
10、费支出分组(元) 人数(人)100 以下 10100-200 30200-300 120300-400 100400-500 25500 以上 15合计 300根据表中的样本数据计算下列各种分布特征测度指标:农民工月生活费支出的算术平均数、中位数和众数;组中值 x(元) 人数 f(人) 频率(%) xf 向上累计(人) 向下累计50 10 3.33% 500 10 300150 30 10.00% 4500 40 290250 120 40.00% 30000 160 260350 100 33.33% 35000 260 140450 25 8.33% 11250 285 40550 15
11、5.00% 8250 300 15合计 300 100.00% 89500算术平均数=298.33根据=150 和累计人数确定中位数的位置应在组距数列第三组。按下限公式计算中位数:中位数 m=L+ * d= 200+ + * (300-200) = 291.67(元)由表可以很明显地看出,农民工每月工资收入出现次数最多的是第三组,所对应的变量值在 200-300 元之间。按下限公式计算:众数 m = L + * d=200+*100=281.82农民工工资收入的标准差和标准差系数;组中值 x(元) 人数 f(人) 偏差 偏差2 * f50 10 -248.33 616677.89150 30
12、-148.33 660053.67250 120 -48.33 280294.67350 100 51.67 266978.89450 25 151.67 575094.72550 15 251.67 950066.83合计 300 3349166.67标准差 = (xi -x)2 * fi/ f)0.5 = 105.664标准差系数 = * 100%= 35.4%5-10、为了研究城市居民家庭的构成和生活情况,现从重庆市抽取了由 36 户家庭组成的简单随机样本,调查得到样本资料如下: 家庭人口数(人) 1 2 3 4 5 6 7户数(户) 1 8 14 7 4 1 1试计算并估计:1)该市平
13、均每户家庭的人口数的点估计;(2)在 95的置信概率下估计该市平均每户家庭人口数的置信区间;3)该市 4 口及 4 口以上的家庭户数在总家庭户数中所占比例的点估计;4)在 95.45的置信概率下估计该市 4 口及 4 口以上家庭所占比例的置信区间。 12、从一批电子元件中随机抽取 100 只,若被抽取的电子原件的平均寿命为 1000 小时,标准差 S 为 40 小时,试求该批电子元件的平均寿命的置信区间(置信概率为 95.45%) 。答: 已知=1000 ,n=100 ,s=40 ,1-=95.45%置信区间:上限:+ =- =13、解:第六章18某地区 2004-2009 年社会消费品零售总
14、额资料(单位:亿元)如表所示:5年份 2004 2005 2006 2007 2008 2009社会消费品零售总额 8255 9383 10985 12238 16059 19710要求计算:全期平均增长量、平均发展速度和平均增长速度;平均增长量 = = (19710 - 8255)/(6 - 1) = 2291(亿元)平均发展速度 = -x = (= (19710 / 8255)(1/5) = 119.01%平均增长速度 = 平均发展速度 1 = 119.01% - 1 = 19.01%逐期增长量和累计增长量;年份 2004 2005 2006 2007 2008 2009社会消费品零售总额
15、 8255 9383 10985 12238 16059 19710逐期 1128 1602 1253 3821 3651增长量累计 1128 2730 3983 7804 11455环比 113.66% 117.07% 111.41% 131.22% 122.73%发展速度(%)定基 113.66% 133.07% 148.25% 194.54% 238.76%环比 13.66% 17.07% 11.41% 31.22% 22.73%增长速度(%)定基 13.66% 33.07% 48.25% 94.54% 138.76%逐期增长量:2005 年 =93838255 =1128(亿元);20
16、09 年 =19710-16059 =3651(亿元)累计增长量:2005 年 =9383-8255 =1128(亿元);2009 年 =19710-8255 =11455(亿元)定基发展速度和环比发展速度;定基发展速度:2005 年=9383/8255*100%=113.66%;2009 年=19710/8255*100%=238.76%环比发展速度:2005 年=9383/8255*100%=113.66%;2009 年=19710/16059*100%=122.73%定基增长速度和环比增长速度。定基增长速度:2005 年=113.66% - 1 = 13.66%,2009 年 =238.
17、76% - 1 = 138.76%环比增长速度:2005 年 =113.66% - 1 = 13.66%,2009 年 =122.73% - 1 = 22.73%21、某地区 2000-2009 年人口自然增长数(单位:万人)如表所示:年份 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009增长人口 869 885 899 913 926 936 948 960 971 983判断上表时间序列是否属于直线型。若为直线型,则应用最小二乘法拟合直线方程,并根据直线方程求各年人口增长趋势值。将上表时间序列数据制作成拆线图,从上图可以看出,该时间系列近似
18、于直线型。设直线趋势方程为:Yt = a + b * t,根据最小二乘法的时间代码法可得下表:年份 t 增长人口 y t2 t * y Yt2000 -9 869 81 -7821 873.14552001 -7 885 49 -6195 885.55762002 -5 899 25 -4495 897.96972003 -3 913 9 -2739 910.38182004 -1 926 1 -926 922.79392005 1 936 1 936 935.20612006 3 948 9 2844 947.61822007 5 960 25 4800 960.03032008 7 971
19、 49 6797 972.44242009 9 983 81 8847 984.85456合计 0 9290 330 2048 9290.00a = = 9290/10 = 929b = = 2048 / 330 6.21则其直线趋势方程为:Yt = 929 + 6.21 * t根据直线趋势方程计算的各年人口增长趋势值见上表“Yt”栏。8-4、某公司 8 个所属企业的产品销售资料如下:企业编号 产品销售额(万元) 销售利润(万元)1234567817022039043048065085010008.112.518.022.026.540.064.069.0要求:(1)画出相关图,并判断销售额与
20、销售利润之间对相关方向;(2)计算相关系数,指出产品销售额和利润之间的相关方向和相关程度;(3)确定自变量和因变量,求出直线回归方程;(4)计算估计标准误差 ;(5)对方程中回归系数的经济意义作出解释;(6)在 95%的概率保证下,求当销售额为 1200 万元时利润额的置信区间。788-5、某公司的 10 家下属企业的产量与生产费用之间关系如下:产量/万件 40 42 48 55 65 79 88 100 120 140单位生产费用/元 150 140 138 135 120 110 105 98 88 78要求:(1)画出相关图,并判断产量与单位生产费用之间对相关方向;(2)计算相关系数,指出产量与单位生产费用之间的相关方向和相关程度;(3)确定自变量和因变量,拟合直线回归方程;(4)计算估计标准误差 ;(5)对相关系数进行检验(显著性水平取0.05);(6)对回归系数进行检验(显著性水平取 0.05);(7)在 95%的概率保证下,求当产量为 130 万件时单位生产费用的置信区间。9