1、国民经济统计概论考点串讲第 1 章 绪论第 1 节 统计学的性质及分类【单选、名词解释:】统计学是研究如何有效地收集数据整理数据分析数据或推断数据,并以此为依据,对所研究对象作出判断或者决策的一门方法论科学。【简答:】统计学的性质。统计学的性质可概括为:统计学是一门研究客观现象总体的数量表现及其变动规律的方法论科学。其具体要点概括如下:(1 )统计学研究的客观现象包括社会经济现象和自然现象。(2 )统计学研究的是总体现象的数量表现及其规律。(3 )统计学是一门研究数量方面的方法论科学。第 2 节 统计学的基本概念【多选、简答:】样本的特点。样本有以下几个特点:(1 )样本中的每一个个体都必须取
2、自于总体的内部。(2 )从一个总体中可以抽取许多不同的样本。(3 )样本是总体的代表。(4 )样本的随机性。【单选、名词解释:】变量的概念有广义与狭义之分。广义的变量是指对客观现象进行计量的概念,凡是客观现象的特征取值或类别在一个以上者均可定义为变量。它包括可以用数字表示变量取值的数值变量,如年龄、收入和消费支出等;也包括不能用数字计量、只能用类别表示的属性变量,如反映人口特征的性别,产品质量的合格与不合格,宗教信仰和文化程度等。狭义的变量仅指可用具体数字表示取值的数值变量。【多选、简答:】变量的分类。在实际工作中,为了满足不同的研究需要,对变量可以进行不同的分类,具体来讲主要有以下几种:(1
3、 )变量按其取值是否可用数字表示,一般分为属性变量与数字变量两种。(2 )变量按其取值是否连续,可分为离散变量和连续变量。(3 )变量按其变动是否具有确定性,可分为确定性变量和随机变量。(4 )变量按其在因果关系中所处的位置不同,可分为因变量与自变量。(5 )变量按其是否有研究对象体系范围内决定,可分为内生变量和外生变量。(6 )变量按其取值是否具有客观性,可分为实在变量和虚拟变量。【单选、名词解释:】用来测度研究对象标准特征数量的概念称为统计指标,简称指标。其中测度总体特征数量的概念成为总体指标,而测度个体特征数量的概念则成为个体指标。【简答:】测度计量尺度的分类。由于总体中的个体特征往往有
4、许多不同的类型,对于个体的不同特征测度计量的尺度,往往也不同。通常可将个体特征分成四种不同的类型,相应的测度计量尺度也有四种。(1 ) 订立尺度。订立尺度又称为名义尺度,他是对个体进行类别划分的测度计量尺度,是既不能用数值大小直接测度,又不能用等级顺序计量,而只适合用划分类别来测度的计量尺度。(2 ) 定序尺度。定序尺度又称为顺序尺度,是对个体进行排序或分等基础上的测度计量尺度,是不能直接用数值大小测度而只能用顺序等级来说明个体特征表现位次的测度计量尺度。(3 ) 定距尺度。定距尺度又称差距尺度,他是对个体特征的差距进行测量的测度计量尺度。(4 ) 定比尺度。定比尺度又称比例尺度,他是对个体特
5、征的绝对数量大小进行测量的测度计量尺度。第 3 节 统计指标体系及其设计【多选、名词解释:】所谓绝对数指标是反映统计研究对象某一方面绝对数量的统计指标,通常又称总量指标。这类指标的主要功能是用来描述研究对象的规模大小,或者水平高低,如人口数、财政收入,货币供应量,社会商品零售额,进出口总额,利润总额,存款总额等。其数值的表现形式为绝对数,都有计量单位。绝对数指标按其所反映的时间状况不同,可分为时期指标和时点指标两类。时期指标是反映研究对象在某一段时间内累计发生数值总量的指标;时点指标是反映研究对象在某个时点上所表现数值总量的指标,对绝对数指标按其所使用的计量单位不同,可分为实物指标和价值指标两
6、类。实物指标是指使用实物单位进行计量的指标;价值指标是指使用货币单位进行计量的指标。【名词解释、计算:】动态相对指标。动态相对指标是指本期数量与过去某期相同性质数量的比率或者本期与过去某期相减的增长量与过去该期数量的比率,统称为动态相对指标。在实际中又分别称为发展速度和增长速度。可以用来反映事物发展变化的相对程度。其计算公式为:动态相对指标报告期水平基期水平【名词解释、计算:】弹性相对指标。弹性相对指标又称弹性系数,是指一定时期内相互联系的两个经济指标增长速度的比率,它反映一个经济变量的增长幅度对另一个经济变量增长幅度的依存关系。其计算公式为:弹性系数= 一个经济变量的增长率/另一个经济变量的
7、增长率【名词解释、计算:】强度相对指标。强度相对指标是指两个性质不同但有联系的总量指标值的比率。其计算公式为:强度相对指标= 某一总量指标值/另一有联系但性质不同的总量指标值【简答、论述】统计指标体系设计的原则。在设计统计指标体系时,通常必须遵守以下几个原则:(1) 目的性原则。(2) 科学性原则。(3) 可行性原则。(4) 联系性原则。第 2 章 数据的调查与整理第 1 节 数据调查的方式与程序【单选、简答】数据调查的方式。根据研究目的和研究对象的不同,统计数据的调查方式主要有现场调查和试验观测两种。(1)现场调查。现场调查是指为了了解客观对象的实际情况而对其进行的直观的观测。(2)试验观测
8、。试验观测是指为了揭示事物之间的因果关系而在人为安排的环境条件下对所研究对象进行的观测。【简答、论述】统计调查方案的制定。一般来说,一个完整的数据调查方案应包括以下几个方面的内容:(1)确定调查目的。确定调查目的是调查方案必须明确的首要问题。数据调查目的是调查项目和调查方法选择的依据和出发点,数据调查的目的不同,调查的项目和使用的方法也有所不同。因此,调查的目的应该具体明确。(2)确定调查对象和调查单位。所谓调查对象是指需要进行调查的客观现象总体,它是由性质相同的许多个体所组成的集合体。调查单位是调查对象中所要调查的具体单位,它与总体中的个体可能一致,也可能不一致。(3)确定调查项目和调查表。
9、调查项目就是调查中所要登记的调查单位特征。(4)确定调查时间和调查期限。调查时间是指调查资料所属的时间。调查期限是指进行调查工作的时限,包括搜集资料和报送资料的工作所需要的时间。(5)调查的组织实施。调查组织工作包括调查机构的设立,组织和培训调查人员,落实调查经费的来源,编制调查经费的使用预算,以及确定调查资料的报送方法和公布调查结果的时间等。第二节 现场调查【多选、名词解释】在实际抽样调查工作中随机抽样调查的基本方法主要有下列几种:(1)简单随机抽样。简单随机抽样是以总体中的个体为抽样单位,并使得每个个体被抽中的机会都相等的一种抽样方式。(2)等距抽样。这种抽样方式又称为系统抽样。它是先将总
10、体中各个个体按照某种特征值的顺序排队,然后按固定的顺序和间隔在总体中抽取若干个个体组成样本的一种抽样方式。 (3)分层抽样。这种抽样方式又称为类型抽样。它是先将总体中各个个体按照某种特征分成若干大类(或组) ,每类(或组) 内部的各个个体都相差不大,而类与类之间则相差较大,然后在每一类内采用简单随机抽样方式抽取若干个体,所有类中抽出的个体的集合构成样本。(4)整群抽样。这种抽样方式是先将总体分成若干个群,它与分层抽样不同,当总体内部差异较大而又没有明显的类型标志或界限时,便不能将总体分成内部相似而外部差异较大的不同类型,这时只能依据其他外观或地域标志将总体分成若干个相互之间差异很小、内部却差异
11、很大的群体,然后再随机地抽取一些群体组成样本来进行调查。【名词解释】访问法就是将所要调查的个体指标拟成问题,用口头或书面形式向被调查者提出询问,根据被调查者的回答取得所需的数据资料的一种方法。【名词解释】观察法就是调查人员到调查现场,对被调查对象亲自进行观察、计数和记录,以获取所需要的数据资料。【简答、论述】调查观测方法的优缺点。当面访问的优点是访问时间可以长些,并可在询问时观察被调查者的反应,能得到较深入的资料,且问卷回收率较高。其缺点是调查成本较高。调查结果正确与否受调查人员访问技术熟练程度以及被访问者诚实与否的影响很大。电话访问是利用电话来对被调查者进行访问,因而调查成本较低。并可在短时
12、间内访问很多被调查者。但这种方法不易获得被调查者的合作。也不能询问较为复杂的问题。邮局邮寄和利用互联网传递的方式成本较低,但问卷回收率一般也较低,且回收的问卷可能只来自某一阶层,从而会影响调查结果的代表性。调查人员登门送收方式成本较高。但问卷回收率也较高。观察法的优点是所得资料真实可靠,缺点是调查过程中 观察不到诸如行为动机等内在因素,并且有时需要作较长时间的观察才能得到结果,调查成本较高。而且实践中使用这种方法的限制性条件也较多。对有些现象的调查如居民家庭收支情况调查就不能采用这种方法进行。【多选、论述】提问方式的类型及其优缺点。通常,调查问卷的提问方式主要有封闭型提问和开放型提问两种类型。
13、(1 )封闭型提问。封闭型提问方式是在问卷上同时列出问题和各种可能的答案,然后由被调查者在已给出的答案中选出一项或几项作为回答。封闭型提问的优点主要是谓查时节省时间,从而可多问一些问题,且资料分类整理易于处理,其缺点是被调查者不能自由表达看法,问卷上给出的答案可能并不包含被调查者想要给出的回答,从而被调查者只好选择一种并非真正代表自己意见的答案,降低了调查所得资料的客观性。(2 )开放型提问。开放型提问方式是在问卷上仅给出问题,并不给出可供选择的答案,由被调查者根据问题自由回答。开放型提问的优点是拟定问题不受拘束。比较容易,并且对被调查者不限制回答范围。能收到一些建设性的意见和调查者所忽略的答
14、案与资料。这种提问方式的缺点主要在于对资料的整理与分析比较困难。第三节 试验观测【多选、简答:】试验观测的方法。(1 )完全随机试验观测。完全随机试验观测类似于现场调查中的简单随机抽样调查。即将各试验单位随机地安排到所登进行试验的因素与水平配合之中进行试验观测。(2)随机区组成试验观测。随机区组试验观测类似于现场调查中的分层随机抽样调查。很明显。在完全随机试验观测中各个试验单位本身必须具有同质性,如果各个试验单位本身就存在较大的差异。那么各因素水平配合的试验结果之间的差异将难以判明究竟是因素水平差异引起的还是试验单位本身的差异引起的。第四节 数据整理与显示【简答:】分类的原则。 分类是对总体或
15、样本的划分和对个体的合并。所以,任何分类都必须遵循下面两个原则:(1 ) 互斥性。即所分各类不能交叉重叠,每个个体只能用归入一个类别之中。(2 ) 完备性。即所分的类能够涵盖全部个体,总体中的任何一个个体都有一个类 可以归入,而且只能有一个类可归入,不能有遗漏。【简答、论述】编制统计表应注意的问题。在统计表的编制过程中,需要注愈下列几个问题:(1) 全面安排,合理布局。(2) 各种标题应简明扼要。(3) 项目排列应合理。(4) 计量单位必须注明。(5)栏数多时 应加以编号。(6)数字填写,整齐规格。(7)若有必要,加注说明。第 3 章 次数分布第 1 节 次数分布的编制与显示【多选、简答】次数
16、分布表的方法。对于不同的观测变量,编制其次数分布表的方法也就有所不同。实践中,编制观测变量次数分布表的方法通常有单值分组次数分布表和组距分组次数分布表两种形式。(1 )单值分组次数分布表,对于离散的只取少数几个不同数值的观测变量,要列出其次数分布,就可以采用单值分组的方法,将此观测变量的每一个不同取值作为一组,即用每一个不同的取值代表一个组的变量值。并计算出各组变量值出现的个数即各组次数,然后顺序列在次数分布表中。这样的次数分布表就称为单值分组次数分布表。(2)组距分组次数分布表。所谓观测变量的组距分组次数分布表,就是将观测变量的整个取值范围依次划分成若干个区间,每个区间作为一个分组,并计算出
17、每个分组区间上观测变量的变量值的个数,然后依次将各个分组区间和各分组区间上变量值的个数在一个统计表中顺序列出,就得到了观测变量的组距分组次数分布表。【简答】编测组距分组次数分布表的步骤。(1 )确定组数。采用组距分组方法对变量的取值进行分组,各组的区间长度可以相等,也可以不等,各组区间长度相等的称为等距分组,各组区间长度不相等的称为异距分组。(2)确定组距。在组距分组中,每组的最大值(max )和最小值(min)之间的距离称为组距。(3)确定组限。在组距分组中,每组的最大值称为该组的上限,每组的最小值称为该组的下限,上限和下限统称为组限。(4)计算各组的次数 (频数)。在确定了各组的组限以后,
18、就需要计算出变量值中落入各组之内的个数,每组所分配的变量值的个数也就是该组的次数(频数) 。(5)列出组距分组次数分布表。当各组变量值的变动范围和各组的次数确定之后.接下来就可以将各组变量值按照从小到大的顺序排列,并列出相对应的次数,就形成组距分组次数分布表,通常又将这种次数分布表称为变量数列。第 2 节 次数分布的理论模型【多选】随机变量的概率分布的表示方法主要有三种,即概率分布表、概率分布图和概率分布函数。【单选、多选】两点分布的应用条件是:若互相独立的重复试验只有“成功”和“失败”两种结果,这种试验称为贝努里试验。这类实验具有以下特征:(1)实验只有两种对立的结果。假定一种是“成功” ,
19、另一种就是“失败” 。(2)若成功事件的概率是 p,那么失败事件的概率为 1p 或者 q,即:p+q=1。(3)实验为独立试验。【多选】超几何分布的应用条件是:(1)从一个含有 N 个个体的总体中,以不重复方式随机抽取 n 个个体作为样本,各次抽样(试验)并非独立。(2)总体中的全部个体分为两类,假设为成功与失败。其中成功类的个体数目为 D 个。 “失败”类的个体数目为 N-D 个。(3)样本中从成功类 D 中抽取个体数目为 k 个,从“失败”类 N-D 中抽取个体数目为 n-k 个。【简答】正态分布的性质。正态分布的概率分布密度曲线,简称正态曲线。同时,正态分布具有下列策要性质:(1)f(x
20、)关于直线 x= 对称。在 x= 处有拐点。 (2)f(x)在 x= 处达到最大值 该处也是分布的中位数和众数。21(3)当 x时,f(x)0,即曲线 y= f(x)以 x 轴为渐近线。(4)当 越大时,曲线越平缓;当 越小时,曲线越陡峭。【单选】F 分布是两个互相独立的 x,分布随机变量除以各自的自由度以后二者再相除之商所构成的随机变量的概率分布模型。第 4 章 分布特征的测度第 1 节 分布中心的测度【单选、简答】分布中心的概念及意义。所谓分布中心,是指距离一个变量的所有取值最近的数值。揭示变量的分布中心有着十分重要的意义:(1 )变量的分布中心是变量取值的一个代表。可以用它来反映其取值的
21、一般水平。一个变量往往有许多个不同的取值,假若要用一个数值作为它们的代表,反映其一般水平。分布中心值无疑是一个最合适的数值。(2)变量的分布中心可以揭示其取值的次数分布在直角坐标系上的集中位置。可以用来反映变量分布密度曲线的中心位置。即对称中心或尖峰位置。【名词解释】算术平均数又称均值。它是一组变量值的总和与其变量值的个数总和的比值。是测度变量分布中心最常用的指标。算术平均数的计算方法主要有简单算术平均数和加权算术平均数两种。【简答】数学期望的性质。数学期望的性质如下:(1)设 c 为常数,则 E(c)=c。(2)设 X 为随机变量,a 为常数,则 E(aX)=aE(X)。(3)设 X,Y 是
22、两个随机变量,则 E(X1Y)=E(X)E(Y)。(4)设 X,Y 是相互独立的随机变量,则 E(XY) =E(X)E(Y)。【名词解释】所谓中位数,是指将某一变量的变量值按照从小到大的顺序排成一列,位于这列数中心位置上的那个变量值。【计算】未分组资料中位数的确定。由未分组资料求中位数。首先将所有的变量值由小到大排列;然后用(n+1)/2 确定中位数所处的位置。最后,寻找该位 A 的变量值,即为中位数。若变量值的个数,为偶数时,则应以排在数列中第 项与2n项变量值的简单算术平均数作为中位数。21n)( 【名词解释】所谓众数,是指某一变量的全部取值中出现次数最多的那个变量值。利用众数作为某一变量
23、取值一般水平的代表,有其特殊的应用条件。【计算】众数的确定。若掌握某一变量的一组未分组的变量值。则只需要统计出现次数最多的那个变量值即可;若掌握的资料是单项数列,则频数(或频率 )最大组的变量值就是众数。若掌握的资料是组距数列,要确定众数,首先依据各组变量值出现次数的多少确定众数所在的组;然后采用上限公式或者下限公式确定众数即可。其计算公式如下:下限公式:m0=L+ d21上限公式:m0=U- d21式中:m 0 代表众数 ;L 和 U 分别代表众数组的下限和上限。d 代表众数组的组距; 1:代表众数组的次数与前一组次数之差。 2:代表众数组的次数与后一组次数之差。第 2 节 离散程序的测度【
24、单选、名词解释】极差又称全距,是指一组变量值中最大变量值与最小变量值之差,用来表示变量的变动范围,通常用 R 代表极差。R=max(si)-min(xi)【名词解释】四分位全距是指将一组由小到大排列的变量值分成四等分,可得到三个分割点 Q1、 Q2 、 Q3,分别称为第一个、第二个、第三个四分位数;然后用第一个四分位数 Q1 减去第三个四分位数 Q3 所得差的绝对值,即为四分位全距。【名词解释】标准差是变量的各个取值离差平方的平均数的平方根,又称为根方差。它的计算方法与平均差的思想方法类似,为了使变量各取值的偏差相加不会正负相抵,因此,先将每个偏差平方后再相加求平均,然后再开平方求出其平方根,
25、即为标准差。标准差是最常用的反映变量分布离散程度的指标。【计算】标准差的计算。由于所掌握的资料不同,标准差的计算方法有简单平均法与加权平均法两种,即简单标准差和加权标准差。(1) 简单标准差。当所掌握的资料是未分组资料,计算标准差应采用简单平均的方法,其计算公式为:= nxi2)(2) 加权标准差。当所掌握的资料是已分组的变量数列资料时,则计算标准差应采用加权算术平均法。其计算公式为:= fx2)(标准差和平均差,同样是根据一组变世值中的所有变最值计算差异程度,也同样以算术平均数作为标准,所不同的是:标准差不是用离差的绝对值求平均数,而是用离差的平方求平均数。【简答】方差的性质。方差的性质如下
26、:(1)设 C 为常数,则 D(c)=0。(2)设 X 为随机变量,C 为常数,则有 D(cX)=c2D(X)。(3)设 X,Y 是两个相互独立的随机变量,则有 D(X+Y)=D(X)+D(Y)。第 5 章 抽样估计第 1 节 抽样估计的理论基础【单选】设 XB(n, p) ,0p1,则Lim P n = xpn)1( dtex21此定理称为德莫佛一拉普拉斯中心极限定律。它的结果表明:二项分布的极限分布是正态分布,因此,当n 充分大时, 若随机变量 XB(n, p) ,则近似地有:XN(np,np(1-p) ,于是我们可以利用正态分布近似地计算二项分布的概率。第 2 节 抽样方法与抽样分布【单
27、选、名词】不重复抽样(即不重置抽样或不放回抽样)是指每次从有限总体中随机抽取一个个体。登记结果后不放回原总体。下一个个体继续从总体中余下的个体中随机抽取。其特点是:第一,n 个个体的样本是由 n 次抽取的结果组成。第二,每次抽取的结果不是独立的。第三,虽然在同次试验中每个个体被抽中的概率是相同的,但在不同次试验中每个个体被抽中的概率是不相同的。对于不重复抽样而言,如果考虑顺序,其总样本个数为PnN= ,但在实践中,抽样一般不考虑顺序,这时其总样本个数为)!(CnN= 每个样本被抽中的概率都为 。正因为每个样本被抽中的概率相等,!)(n !)(1NnCn而且总体中的每个个体被一视同仁,所以,这时
28、也称它为简单随机抽样。第 3 节 点估计【名词解释】所谓矩法估计,是指用样本矩作为总体同一矩的估计量或者用样本矩的函数作为总体相应矩的函数的估计量。也就是说,若总体指标是所考察的随机变量的某阶矩,则可用样本观测值的同阶矩作为其估计量;若总体指标虽不是所考察随机变量的某阶矩,但却是某些矩的函数,则也可用样本相应的这些矩来构造成同样的函数作为其估计量。总体指标的估计量通常用代表该总体指标的字母戴一个尖帽表示,如总体指标为 ,则其估计量就记为 。【简答、论述】判断估计量优劣一的标准。判断一个估计量优劣的常用标准主要有一致性、无偏性、有效性、充分性和稳健性等。(1)一致性。作为一个好的估计量,最直观、
29、最基本的要求就是估计误差应该随着样本容量的增大而减小。(2)无偏性。有无系统性偏差存在可以作为判断估计量优劣的又一个标准。对于总体指标 ,若其估计量 取值的数学期望等于总体指标 的真值,即 E( )= ,或估计误差( -)的数学期望为 0,即 E( -)=0 ,则该估计量 就称为总体指标 的无偏估计量。若 E( -)=B,且 B 不为0,则 就是总体指标 的有偏估计量,即 B 为估计偏差。(3)有效性。对于任一总体指标 ,若存在两个无偏估计量 和 。其中估计量 的估计误差平均121来说小于估计量 的估计误差,则称估计量 比 有效。由于无偏估计量的数学期望就等于被估2 2计的总体指标,所以衡量无
30、偏估计量的估计误差大小可用其方差 D( )=E -E( ) 2。因此,两个无偏估计量比较,方差较小者较为有效,即若有 D( )D( ) ,则估计量 ,比121有效。2(4)充分性。对于总体指标 ,若其估计量 提取了样本中包含的有关总体指标 的全部信息,则估计量 就称为总体指标 的充分估计量。(5)稳健性。如果用来估计总体指标 的样本估计量对样本数据的污染不敏感,也就是说,估计量的数值不受被污染数据的干扰或受其干扰不大,那么该估计量就是总体指标 的一个稳健统计量。【名词解释】样本估计量的标准差通常称为该估计量的标准误差,简称标准误。记所要估计的总体指标。其估计量为 ,则此估计量的标准误就定义为:
31、 = 2)()(ED【简答】影响标准误的因素。影响估计 k 的标准误数值大小的因素主要有以下三个方面:(1)总体中各个体之间的差异程度。对于所考察的变量来说,总体中各个体在该变量的取值之间的差异程度越大,即 2 越大,总体指标估计量的标准误的数值也就越大,抽样估计误差也就越大。反之,若 2 较小,则估计量的标准误差也就越小。(2)样本容量的大小。样本容量越大,总体指标估计量的标准误就越小,抽样估计误差也就越小;反之,样本容量越小,抽样估计误差及其标准误也就越大。(3)抽样的方式与方法。第 4 节 区间估计【名词解释】所谓区间估计,就是在事先给定的概率保证程度下,根据样本估计量的概率分布,确定出
32、可能包含未知总体参数的某个区间,作为对未知总体参数的估计。【计算】大样本情形下总体均值的区间估计。在事先给定的置信概率为 1-a 的概率保证下,可认为总体均值 被包含在以样本均值x 为中心,以为半径的区间之内,由此可得出总体均值 的置信区间为:nz2nzxx2/,/在事先给定的置信概率 1-a 之下,由概率关系式 也可以很容易地导出:12/zP12/nzxP 在该式中, 是用样本均值 估计总体均值 所产生的抽样估计误差。该式表明,在给定的 1-ax的概率保证下,可认为抽样估计误差不超过 ,或者说抽样估计误差不超过 的可靠nz/2 nz/2程度为 1 一 。记为:nz2/则此 就给出了抽样估计误
33、差的范围或界限,因此,通常称此 为抽样估计的极限误差或误差限。【单选、计算】对于有放回的简单随机抽样,如果事先给定在 1-a 的置信概率之下,用样本均值估计总体均值的抽样估计误差不超过 ,也就是给定总体均值的抽样估计误差限为 S,则有放回抽样下总体均值的抽样估计误差的计算公式为: nz2/【单选、计算】对于不放回的简单随机抽样,其样本均值统计量的标准误要比有放回抽样的标准误多一个有限总体校正因子,因此,用样本均值估计总体均值的误差限的计算公式也就有所不同,此估计误差的计算公式为: Nnz12/第 6 章 相关与回归分析第 1 节 相关分析【单选】相关分析主要是分析现象之间星否存在相关关系以及相
34、关关系的方向、形式和关系的密切程度,具体来说,相关分析的主要内容有以下几方面:(1 )确定现象之间有无相关关系。这是相关分析的起点,只有存在相关关系,才有必要进行进一步的分析。(2 )确定相关关系的表现形式。(3 )测定相关关系的密切程度。【单选、多选】当两个变量的变动方向相同,即一个变量增加,另一个变量也相应地增加,或一个变量减少,另一个变量也相应地减少时,两个变量之间的关系称为正相关;若两个变量变动的方向相反,即一个变量增加的同时,另一个变量随之减少,则两个变量之间的关系称为负相关。【单选、多选】相关系数的性质与具体含义包括:(1 ) r 的取值范围在-1 1 之间,即-1r1。r0 表明
35、两个变量之间存在正线性相关关系, r0 表明两个变量之间存在负线性相关关系;当 =1 时,表现为完全相关,当 r=0 时,表现为无线性相关,当0 |r|1 表现为不完全相关。(2)r 具有对称性。x 与 y 之间的相关系数与 Y 与 x 之间的相关系数相等。(3)r 的数值的大小与 x 和 y 的计量尺度无关。改变 x 和 y 的数据的计量尺度,并不改变 r 的数值。(4)r 是两个变量之间线性关系的度量指标,但无法反映两变量之间的因果关系,即使 r 很高,也不一定意味着 x 和 y 之间一定存在着因果关系。第 2 节 一元线性回归分析【单选、计算】理论回归模型中的参数是未知的。回归分析的主要
36、任务之一就是通过样本观测值对 , 进行估计,在此用 b0,b1 分别表示 , 的估计值,ixy, 01 01则称= b0+b1y为估计的线性经验回归方程,或估计的线性回归方程。【名词解释】所谓经济意义的检验就是利用相关的经济学原理及我们所积累的丰富的经验,对所估计的回归方程的回归系数进行分析与判断,看其是否能得到合理的解释。对回归模型进行检验,首先要进行的就是经济意义的检验。第 3 节 多元线性回归分析【计算】普通最小二乘法的基本思想是:对每一样本观测值(y i,x 1i,x 2i,x pi) ,考虑观测值 yi 与其回归值 的离差越小越好,综合地考虑 n 个离差值,定义离差平方和为:iy21
37、0121 ipiiniin xbbQ所谓最小二乘法,就是要寻找 , , 的估计值 b0,b 1,.,bp,使 Q 达到最小。求解 01pb0,b 1,.,bp,是一个求极值问题,由于 Q 是关于 b0,b 1,.,bp,的非负二次函数,因而它的最小值总是存在的。第 7 章 时间数列分析与预测第 1 节 时间数列的编制与分类【名词解释】时间数列是把不同时间上的同一指标数据按时间先后顺序排列所形成的数列。【简答、论述】编制时间数列的基本原则。编制时间数列时要注意保证各指标值之间的可比性,这是编制时间数列的基本原则。可比性的具体要求主要有:(1 )同一时间数列的数据所属时间长短及数据之间的间隔长度具
38、有可比性。(2 )不同时期的数据核算范围应当一致。(3 )不同时期的数据的内容应具有一致性。(4 )计算价格和计量单位应具有一致性。【名词解释】绝对数时间数列又称总量指标时间数列。总量指标是反映总体数最绝对规模和水平的指标,其数值大小受总体范围的影响,将其按时间先后顺序排列而成的时间数列称为绝对数时间数列。【单选、名词解释】相对数时间数列又称相对指标时间数列。相对指标是两个有联系的统计指标对比得到的派生指标,其具体数值表现为相对数。相对数时间数列是将同类的相对指标按时间先后顺序排列起来形成的数列,它可以用来反映社会经济现象之间相互数量关系的发展过程。由于相对数时间数列是派生数列,因此构成相对指
39、标的分子、分母可以是时期指标,也可以是时点指标。并且由于其计算的基数不一定相同,各期的相对指标之间不具有直接可加性。【单选、名词解释】平均数时间数列又称平均指标时间数列,是将同类指标时间数值按时间先后顺序排列起来形成的数列,它可以用来反映社会经济现象总体一般水平的发展变动趋势。与相对数时间数列相同,平均数时间数列的各项数据也不具有直接可加性。第 2 节 时间数列特征指标的测度【单选、名词解释】时间数列的平均发展水平又称为序时平均数或动态平均数,它是将社会经济现象在不同时间上的数量差异抽象化,从边查上反映各期数据在一段时间内达到的一般发展水平。【单选、计算】增长量是指报告期水平与基期水平之差,它
40、反映报告期较基期增长(或减少) 的绝对数址,由于计算时采用的基期不同,增长量分为逐期增长量和累计增长量。其中逐期增长量是报告期比前一时期增长的绝对数量,即报告期与前一期水平之差。而累计增长量是报告期水平与某一固定时期水平之差。说明本期比某一固定基期增长的绝对数量,即在某一段较长时期内总的增量。其计算公式为:逐期增长量=报告期水平前期水平= 1iiy累计增长量=报告期水平某一固定时期水平= 0i【计算】平均增长量 t 是逐期增长量的序时平均数,它反映一定时期内平均每期增加(或减少) 的绝对数量。一般用简单算术平均法计算,计算公式为:1-数 列 项 数累 计 增 长 量逐 期 增 长 量 的 项
41、数逐 期 增 长 量 之 和平 均 增 长 量 【计算】发展速度一般用百分数表示,有时也可以用倍数表示。由于采用的基期可以用前一期,也可以用固定时期作为对比基期,因而发展速度可分为环比发展速度和定基发展速度。其中环比发展速度反映了现象逐期发展的变动程度,而定基发展速度表明现象在较长时期内总的发展速度,也称总速度。其计算公式如下: % 10y 10一t=0ty某 一 固 定 时 期 水 平报 告 水 平 期【计算】环比发展速度与定基发展速度之间存在如下关系:第 1,环比发展速度的连乘积等于对应的定基发展速度,即: 1-120tt yy第二,相邻时期的两个定基发展速度相除,等于相应的环比发展速度,
42、即:10tttyy此外,对于具有季节变动的一些社会经济现象,为了消除季节变动的影响,可以计算年距发展速度,用以说明本期发展水平与去年同期发展水平对比的发展程度。其计算公式为:%10平去 年 同 月 ( 季 ) 发 展 水 平本 年 某 月 ( 季 ) 发 展 水本 距 发 展 速 度【名词解释、计算】增长速度是增长量与基期水平对比的结果,反映现象增长程度的动态相对指标,其计算公式为: 10%一=10%一=【计算】增长速度由于采用的基期不同可分为环比增长速度和定基增长速度。环比增长速度是逐期增长量与前一时期发展水平对比的结果,反映现象的逐期增长程度;定基增长速度是累计增长量与某一固定时期发展水平
43、对比的相对数,反映现象在较长时期内总的增长程度,其公式为:10%-一=10%一-=发 展一 固 第 3 节 时间数列的影响因素分析【单选、名词解释】长期趋势是指客观现象在一个相当长的时期内,受某种稳定性因素影响所呈现出的上升或下降趋势。长期趋势可能是线性的,也可能是非线性的。【名词解释】季节变动是时间数列受季节因素的影响,在一定时期内随季节变化呈现出来的一种周期性的波动。【名词解释】循环变动也是一种周期性的波动,但其是一种非固定周期长度且周期相对较长的周期性波动,即, 事物以若干年为周期的涨落起伏的变动。【名词解释】不规则波动是指客观现象由于突发事件或偶然因素引起的无规律性的变动,也称为随机波
44、动。一个时间数列可能由一种要素构成,也可能同时包含有多种构成要素。【名词解释】移动平均法是采取逐项依次递移的方法将时间数列的时距扩大,计算扩大时距后的序时平均数,形成一个新的时间数列。【简答】长期趋势模型的选择。一般确定长期趋势模型的方法有两类:(1)第一类方法是根据时间数列的观测数据绘制时间数列曲线图,观察图形的基本特征选择相对比较合适的、符合现象发展变化特征的趋势线。(2)第二类方法是可以根据数据本身的特点确定曲线趋势模型的类型。第 8 章 国民生产统计第 1 节 国民生产统计的范围与行业分类【单选、多选】按照联合国等组织制定的国民经济核算体系 2008的规定,凡是有形产品的生产,不论其产
45、品是面向市场对外销售还是只供自己使用,都须纳入生产统计的范围;而对于各种服务的生产,则只有向市场和社会提供的服务以及家庭和机构自有住房的自用服务才纳入生产统计的范围。居民家庭成员在自己家里所进行的各种家务劳动,如家庭主妇在自己家里为家人做饭、清扫卫生、伺候老人、照看孩子等各种家务劳动,不属于市场活动,没有报酬的支付,则不纳入国民经济生产统计的范围。【单选、简答】三次产业分类。根据国家统计局 2013 年的修订规定,第一、二、三次产业的范围分别是:(1)第一产业是指农、林、牧、渔业(不含农、林、牧、渔服务业) 。(2)第二产业是指采矿业 (不含开采辅助活动),制造业( 不含金属制品、机械和设备修
46、理业) 电力,热力,燃气及水生产和供应业,建筑业。(3)第三产业即服务业,是指除第一产业、第二产业以外的其他行业。第三产业包括:批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业、科学研究和技术服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务业,教育,卫生和社会工作,文化、体育和娱乐业,公共管理、社会保障和社会组织,国际组织,以及农、林、牧、渔业中的农、林、牧、渔服务业,采矿业中的开采辅助活动,制造业中的金属制品、机械和设备修理业。第 2 节 产出实物量统计【单选、多选】 统计用产品分类目录的基本产品类别与代码分为
47、五层,每层为 2 位代码,用阿拉伯数字表示,共有 10 位代码。各层代码为:第一层为大类产品,由 2 位代码表示;第二层为中类产品,由 4 位代码表示;第三层为小类产品,由 6 位代码表示;第四层为组产品,由 8 位代码表示;第五层为小组产品,由 10 位代码表示。 【简答】主要工业产品统计。工业产品产量的统计是国民经济统计的核心内容。(1)一次能源生产总量。(2)粗钢产量。(3)钢材产量。(4)集成电路产量。(5)移动通信手持机产量。第 3 节 国内生产总值统计【单选、计算】企业生产所增加的价值就是企业产品的总产值减去其生产过程中所消耗的各种原材料及辅助材料、燃料及动力以及外购服务的价值以后
48、所余的价值。在国民经济统计中,企业生产过程中所消耗的各种原材料及辅助材料、燃料及动力以及外购服务,统称为中间投入或中间消耗。因此,可得企业增加值的计算公式为:增加值总产值中间投入价值【单选、计算】将该国家所有企业在本时期内生产的增加值加总,称为该企业国民经济的生产总值。即有:生产总值=增加值按市场价格计算的一个国家所有常住单位在一定时期内生产活动的最终成果称为该国的国内生产总值,英文简称为 GDP。即有:国内生产总值(GDP)本国经济领土内各常住单位增加值第 4 节 生产要素资本和劳动力统计【单选、简答】资产的分类。资产作为资本的具体表现形式,从整个国民经济的角度来看,可以划分为固定资产和流动
49、资产两大类。(1)固定资产。固定资产是指企业为生产商品、提供服务、出租或经营管理而持有的、使用期限在一年以上,单位价值在规定的标准以上,并在使用过程中保持原来物质形态的有形资产。包括房屋及建筑物、机器设备、运输设备、工具器具等。固定资产属于产品生产过程中用来改变或者影响劳动对象的劳动资料,是固定资本的实物形态,其特点有二:一是其价值一般比较大,使用时间比较长,能长期地、重复地参加生产过程,二是在生产过程中虽然发生磨损。但是并不改变其本身的实物形态,但其价值则随着其磨损程度而逐渐地转移到产品中去,并构成产品价值的一个组成部分。根据经济用途的不同,企业的固定资产可以分为生产经营用和非生产经营用两类。根据实物形态的不同,企业的固定资产又可分为房屋和