1、1计量经济学习题一、名词解释1、普通最小二乘法:为使被解释变量的估计值与观测值在总体上最为接近使 Q= 最小,从而求出参数估计量的方法,即之。2、总平方和、回归平方和、残差平方和的定义:TSS 度量 Y 自身的差异程度,称为总平方和。TSS 除以自由度 n-1=因变量的方差,度量因变量自身的变化; RSS 度量因变量 Y 的拟合值自身的差异程度,称为回归平方和, RSS 除以自由度(自变量个数-1)=回归方差,度量由自变量的变化引起的因变量变化部分;ESS 度量实际值与拟合值之间的差异程度,称为残差平方和。RSS 除以自由度(n-自变量个数-1)=残差(误差)方差,度量由非自变量的变化引起的因
2、变量变化部分。 3、计量经济学:计量经济学是以经济理论为指导,以事实为依据,以数学和统计学为方法,以电脑技术为工具,从事经济关系与经济活动数量规律的研究,并以建立和应用经济计量模型为核心的一门经济学科。而且必须指出,这些经济计量模型是具有随机性特征的。4、最小样本容量:即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限;即样本容量必须不少于模型中解释变量的数目(包扩常数项) ,即之。5、序列相关性:模型的随机误差项违背了相互独立的基本假设的情况。6、多重共线性:在线性回归模型中,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。7、工具变量法
3、:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。这种估计方法称为工具变量法。8、时间序列数据:按照时间先后排列的统计数据。9、截面数据:发生在同一时间截面上的调查数据。10、相关系数:指两个以上的变量的样本观测值序列之间表现出来的随机数学关系。11、异方差:对于线性回归模型提出了若干基本假设,其中包括随机误差项具有同方差;如果对于不同样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。12、外生变量:外生变量是模型以外决定的变量,作为自变量影响内生变量,外生变2量决定内生变量,其参数不是模型系统的元素。因此,外生变量本身不能在模型体系内得到说明。
4、外生变量一般是确定性变量,或者是具有临界概率分布的随机变量。外生变量影响系统,但本身并不受系统的影响。外生变量一般是经济变量、条件变量、政策变量、虚变量。一般情况下,外生变量与随机项不相关。二、填空题1、计量经济学中, 经济学 提供理论基础, 统计学 提供资料依据, 数学 提供研究方法2、研究经济问题时,一般要处理三种类型的数据:(1) 截面 数据;(2) 时间序列 数据;和(3) 虚拟变量 数据。3、 OLS 参数估计量具有如下统计性质,即 线性 、 无偏性 、 有效性 。4、 时间序列数据与横截面数据的最大区别在于 数据的顺序性 _。5、 在模型中引入多个虚拟变量时,虚拟变量的个数应按下列
5、原则确定:如果有 M 个互斥的属性类型,则在模型中引入 M-1 个虚拟变量。6、在现实经济活动中往往存在一个被解释变量受到多个解释变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型被称为 多元线性回归模型。7、在多元线性回归模型中,参数的最小二乘估计量具 线性性、无偏性、最小方差性,同时多元线性回归模型满足经典假定,所以此时的最小二乘估计量是最优的线性无偏估计量,又称 BLUE 估计量。8、计量经济学的核心内容是建立和应用 计量经济模型。9、R 2 是一个回归直线与样本观测值拟合优度的数量指标,其值越大,拟合优度越好,其值越小,拟合优度就越差。10、自相关 就是指总体回归方程的
6、误差项 ui 之间存在着相关,即:按时间或空间排序的观察值序列的个成员之间存在的相关。三、单项选择题1.经济计量模型是指( C ) A.投入产出模型 B.数学规划模型 C.包含随机方程的经济数学模型 D.模糊数学模型 2.回归分析中定义的( B ) A.解释变量和被解释变量都是随机变量 3B.解释变量为非随机变量,被解释变量为随机变量 C.解释变量和被解释变量都为非随机变量 D.解释变量为随机变量,被解释变量为非随机变量 3.设 k 为回归模型中的参数个数,n 为样本容量。则对总体回归模型进行显著性检验(F检验)时构造的 F 统计量为( A )A. B. kn/RS1E )kn/(RS1E1F
7、C. D. F4. D-W 检验,即杜宾-瓦尔森检验,用于检验时间序列回归模型的误差项中的一阶序列相关的统计量,DW 统计量以 OLS 残差为基础:D.W= ,如果 D.W 值越接近于 2,则( C )nttte1221)(A.则表明存在着正的自相关 B.则表明存在着负的自相关C.则表明无自相关 D.无法表明任何意义5.容易产生异方差的数据为( C ) A.时序数据 B.修匀数据 C.横截面数据 D.年度数据 6、计量经济模型分为单方程模型和( C ) 。A.随机方程模型 B.行为方程模型 C.联立方程模型 D.非随机方程模型7、同一统计指标按时间顺序记录的数据列称为( B )A.横截面数据
8、B.时间序列数据 C.修匀数据 D.平行数据8、样本数据的质量问题,可以概括为完整性、准确性、可比性和( B ) 。A.时效性 B.一致性 C.广泛性 D.系统性9、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来煤炭行业的产出量,这是违反了数据的( A )原则。4A.一致性 B.准确性 C.可比性 D.完整性10、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值的( B ) 。A. (消费) (收入)iCiI8.05B. (商品需求) (收入) (价格)diQi1iP9.0C. (商品供给) (价格)si i75.2D. (产出量) (资本) (劳动)
9、iY6.0iK4.0iL四、多项选择题1、不满足 OLS 基本假定的情况,主要包括:( ABCD ) 。A.随机序列项不是同方差,而是异方差B.随机序列项序列相关,即存在自相关C.解释变量是随机变量,且与随机扰动项相关D.解释变量之间相关,存在多重共线性E.因变量是随机变量,即存在误差2、随机扰动项产生的原因大致包括如下几个方面,它们是( ABCD ) 。A.客观现象的随机性(人的行为、社会环境与自然影响的随机性)B.模型省略变量(被省略的具有随机性的变量归入随机扰动项)C.测量与归并误差(估计时测量和归并误差都归入随机扰动项)D.数学模型函数的形式的误定E.从根本上看是由于经济活动是人类参与
10、的活动3、内生变量( ABDE ) 。A.在联立方程模型中,内生变量由系统内方程决定,同时又对模型系统产生影响;既作为被解释变量,又可以在不同的方程中作为解释变量。B.一般情况下,内生变量与随机项相关。C.内生变量决定外生变量D.内生变量一般都是经济变量E.内生变量 Y 一般满足:5Cov(Y i, )0,即 E(Y i )0。i4、下列哪些变量属于前定变量( CD )。A.内生变量 B.随机变量C.滞后变量 D.外生变量E.工具变量五、简答1、随机扰动项产生的原因答:(1)客观现象的随机性。引入 e 的根本原因,乃是经济活动是人类参与的,因此不可能像科学实验那样精确。(2)此外还有社会环境和
11、自然环境的随机性。(3)模型省略了变量。被省略的变量包含在随机扰动项 e 中。(4)测量与归并误差。测量误差致使观察值不等于实际值,汇总也存在误差。(5)数学模型形式设定造成的误差。由于认识不足或者简化,将非线性设定成线性模型。经济计量模型的随机性,正是为什么要采用数理统计方法的原因。2、采用普通最小二乘法,已经保证了模型最好地拟合样本观测值,为何还要进行拟合优度检验?答:普通最小二乘法所保证的最好拟合,是同一个问题内部的比较,拟合优度检验结果所表示的优劣是不同问题之间的比较。两个同样满足最小二乘原则的模型,对样本观测值的拟合程度不一定相同。3、针对普通最小二乘法,线性回归摸型的基本假设答:(
12、1)解释变量是确定性变量,而且解释变量之间不相关。(2)随机误差项具有 0 均值且同方差。(3)随机误差项在不同样本点之间独立,不存在序列相关。(4)随机误差项与解释变量之间不相关。(5)随机误差项服从 0 均值且同方差的正态分布。七、综合题1、某人试图建立我国煤炭行业生产方程,以煤炭产量为被解释变量,经过理论和经验分析,确定以固定资产原值、职工人数和电力消耗量变量作为解释变量,变量的选6择是正确的。于是建立了如下形式的理论模型:煤炭产量= 固定资产原值+ 职工人数+ 电力消耗量+0123选择 2000 年全国 60 个大型国有煤炭企业的数据为样本观测值;固定资产原值用资产形成年当年价计算的价
13、值量,其它采用实物量单位;采用 OLS 方法估计参数。指出该计量经济学问题中可能存在的主要错误,并简单说明理由。答: 模型关系错误。直接线性模型表示投入要素之间完全可以替代,与实际生产活动不符。 估计方法错误。该问题存在明显的序列相关性,不能采用 OLS 方法估计。 样本选择违反一致性。行业生产方程不能选择企业作为样本。 样本数据违反可比性。固定资产原值用资产形成年当年价计算的价值量,不具备可比性。2、材料:为证明刻卜勒行星运行第三定律,把地球与太阳的距离定为 1 个单位。地球绕太阳公转一周的时间为 1 个单位(年) 。那么太阳系 9 个行星与太阳的距离(D )和绕太阳各公转一周所需时间(T)
14、的数据如下:obs 水星 金星 地球 火星 木星 土星 天王星 海王星 冥王星DISTANCE 0.387 0.723 1 1.52 5.2 9.54 19.2 30.1 39.5Time 0.24 0.615 1 1.88 11.9 29.5 84 165 248D3 0.057 0.377 1 3.512 140.6 868.3 7078 27271 61630T2 0.057 0.378 1 3.534 141.6 870.2 7056 27225 61504用上述数据建立计量模型并使用 EVIEWS 计算输出结果如下7问题:根据 EVIEWS 计算输出结果回答下列问题(1)EVIEWS
15、 计算选用的解释变量是_(2)EVIEWS 计算选用的被解释变量是_(3)建立的回归模型方程是_(4)回归模型的拟合优度为_(5)回归函数的标准差为_(6)回归参数估计值的样本标准差为_(7)回归参数估计值的 t 统计量值为_(8)残差平方和为_(9)被解释变量的平均数为_(10)被解释变量的标准差为_答案如下:(1)Log(distance) (2)Log(time) (3)Log(distance)=1.500033 Log(time)+u(4)0.999999 (5)0.002185 (6)0.000334 (7)4492.202(8)3.82e-05 (9)2.181016 (10)2
16、.5871823、(中国)国内生产总值与投资及货物和服务净出口单位:亿元年份 国内生产总值(Y ) 资本形成额(X1 ) 货物和服务净出口(X2)1991 21280.40 7517.000 617.50001992 25863.70 9636.000 275.60001993 34500.70 14998.00 -679.40001994 46690.70 19260.60 634.10001995 58510.50 23877.00 998.50001996 68330.40 26867.20 1459.3001997 74894.20 28457.60 2857.2001998 7900
17、3.30 29545.90 3051.5001999 82673.10 30701.60 2248.80082000 89340.90 32499.80 2240.2002001 98592.90 37460.80 2204.7002002 107897.6 42304.90 2794.2002003 121511.4 51382.70 2686.200用上述数据建立计量模型并使用 EVIEWS 计算输出结果如下Dependent Variable: YMethod: Least SquaresDate: 10/19/09 Time: 21:40Sample: 1991 2003Include
18、d observations: 13Variable Coefficient Std. Error t-Statistic Prob. C 3871.805 2235.263 1.732147 0.1139X1 2.177916 0.120692 18.04527 0.0000X2 4.051980 1.282402 3.159680 0.0102R-squared 0.991494 Mean dependent var 69929.98Adjusted R-squared 0.989793 S.D. dependent var 31367.13S.E. of regression 3168.
19、980 Akaike info criterion 19.15938Sum squared resid 1.00E+08 Schwarz criterion 19.28975Log likelihood -121.5360 F-statistic 582.8439Durbin-Watson stat 0.926720 Prob(F-statistic) 0.000000(1)建立投资与净出口与国民生产总值的二元线性回归方程并进行估计,并解释斜率系数的经济意义。解:建立 Y 与 X 、X 之间的线性回归模型:Y = + X1 + X2+ ei 0根据普通最小二乘法参数估计有0519.47628.
20、3)(11B9故所求回归方程为Y = 3871.805 + 2.177916 X1 + 4.051980X2X1 的系数 1=2.177916 表明,如果其他变量保持不变,为使国民生产总值增加一亿元投资需增加 2.18 亿元,净出口增加 4.05 亿元也能使国民生产总值增加一亿元。(2)对偏回归系数及所建立的回归模型进行检验,显著性水平 =0.05。81.)0(5.t解:假设 H0 : ,H 1 : 。在 H0 成立的条件下ii检验统计量 t (n-k) t (n-k) )()(111St )()(122St0.120692 1.282402121)(CkneSi 22)(CkneSi其中 C
21、ii 是 对角线的值。 ,为残差平方和。)(XT2iiYe所以: =18.04527 =3.15968012069.7)(1St 2840.159)(2St给定 =0.05. 。从上面结果看出.)10)(25.2 ttkntwt 、 t 的绝对值均大于 2.2281,故拒绝 H0,认为 1、 2 均显著不等于 0,X 1、 X2 对Y 的影响均显著。(3)估计可决系数,以显著性水平 =0.05 对方程整体显著性进行检验,并估计校正可决系数,说明其含义。 39.)10,2(5.F解: R 2= =0.9914942)(1YeTSi假设 H0: 1 =2 =0。H 1: 1 、 2 不全为 0。检
22、验统计量 F= 582.8439knYknRSkEii 2)()(给定 =0.05. ,F 远大于 F0.05 39.)10,(),(5. FFw(2,10),故拒绝 H0,认为总体参数 1、 2 不全为等于 0,资本形成额 X1 和货物和服务净10出口 X2 对国民生产总值 Y 的影响显著。4、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:方程 A: 3215.05012 XXY 75.02R方程 B: 4743 3其中: 某天慢跑者的人数; 该天降雨的英寸数; 该
23、天日照的小时数;1 2X该天的最高温度(按华氏温度) ; 第二天需交学期论文的班级数。3X 4X请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?答案:(1)方程 B 更合理些。原因是:方程 B 中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。(2)解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程 A 和方程 B 中由于选择了不同的解释变量,如方程 A选择的是“
24、该天的最高温度”而方程 B 选择的是“第二天需交学期论文的班级数” ,由此造成 与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到2X不同的符号。5、收集 1978-2001 年的消费额 XF(亿元) ,国内生产总值 GDP(亿元)资料,建立消费函数,Eviews 结果如下:Dependent Variable: LOG(XF)Method: Least SquaresDate: 10/21/09 Time: 20:16Sample: 1978 2001Included observations: 24Coefficient Std. Error t-Statistic Prob.
25、 11C -0.042662 0.033247 t1= 0.2128LOG(GDP) 0.936417 0.084454 t2= 0.0000R-squared 0.999503 Mean dependent var 6.829620Adjusted R-squared 0.998480 S.D. dependent var 1.308850S.E. of regression 0.029846 Akaike info criterion -4.105890Sum squared resid 0.019597 Schwarz criterion -4.007719Log likelihood
26、51.27068 Hannan-Quinn criter. -4.079845F-statistic 44210.44 Durbin-Watson stat 1.682476Prob(F-statistic) 0.000000要求:(1)把表中缺失的数据补上;(5 分)(2)把回归分析结果报告出来;(5 分)(3)进行经济意义、统计学意义和经济计量学意义检验;(6 分)(4)解释系数经济含义。 (4 分)6、1978-2000 年天津市城镇居民人均可支配销售收入(Y,元)与人均年度消费支出(CONS,元)的样本数据、一元线性回归结果如下所示: Dependent Variable: LNCON
27、SMethod: Least SquaresDate: 06/14/02 Time: 10:04B B B0B B B B 12Sample: 1978 2000Included observations: 23Variable Coefficient Std. Error t-Statistic Prob. C _ 0.064931 -3.193690 0.0044LnY 1.050893 0.008858 _ 0.0000R-squared 0.998510 Mean dependent var 7.430699Adjusted R-squared S.D. dependent var 1
28、.021834S.E. of regression Akaike info criterion -6.336402Sum squared resid 0.034224 Schwarz criterion -6.237663Log likelihood 42.23303 F-statistic 14074.12Durbin-Watson stat 0.842771 Prob(F-statistic) 0.000001在空白处填上相应的数字(共 4 处) (计算过程中保留 4 位小数) (8 分)2根据输出结果,写出回归模型的表达式。 (5 分)3给定检验水平 =0.05,检验上述回归模型的临界值
29、t0.025=_,F 0.05=_; 并说明估计参数与回归模型是否显著?(6 分)4解释回归系数的经济含义。 (5 分)10.2079 118.6344 0.9984 0.0384 (每空 2 分)2 (5 分)LNYLNCOS9.01274.(-3.19) (118.63)32.08,4.32由回归结果可以看出,估计参数的 t 值分别为-3.19 和 118.63,其绝对值均大于临界值 2.08,故估计参数均显著;F 统计量的值为 14074.12 远远大于临界值 4.32,因此回归模型的估计也是显著的。 (6 分)4回归参数 1 的经济含义是:当人均可支配收入增加 1%时,人均年度消费支出
30、增加 1.05%。反映天津市改革开放以来人均消费支出的增加速度略快于人均可支配收入的增加速度。 (5 分)7、已知某市 33 个工业行业 2000 年生产函数为:(共 20 分)13Q=ALKeu 1说明、的经济意义。 (5 分)2写出将生产函数变换为线性函数的变换方法。 (5 分)3假如变换后的线性回归模型的常数项估计量为 ,试写出 A 的估计式。 (5 分)04此模型可能不满足哪些假定条件,可以用哪些检验(5 分)解:(每小题 5 分)1, 分别表示产出对劳动投入和资本投入的弹性系数, 表明劳动投入增长 1%,产出增长的百分比; 表明资本投入增长 1%,产出增长的百分比。2生产函数的两边分
31、别取自然对数lnQ=lnA+lnL+lnK+u令 QL=lnQ , LL=lnL , KL=lnK , 0=lnA则生产函数变换为QL= 0 +LL+KL+u3 0eA4因为使用的样本为横截面数据,随机误差项可能存在异方差;变量 L 和 K 之间可能存在较严重的多重共线性。8、假设模型为 。给定 个观察值 , , ,tttXYn),(1YX),(2),(nYX按如下步骤建立 的一个估计量:在散点图上把第 1 个点和第 2 个点连接起来并计算该直线的斜率;同理继续,最终将第 1 个点和最后一个点连接起来并计算该条线的斜率;最后对这些斜率取平均值,称之为 ,即 的估计值。(1)画出散点图,给出 的
32、几何表示并推出代数表达式。(2)计算 的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解释理由。(3)证明为什么该估计值不如我们以前用 OLS 方法所获得的估计值,并做具体解释。解答:(1)散点图如下图所示。14(X 2,Y2)(X n,Yn) (X 1,Y1)首先计算每条直线的斜率并求平均斜率。连接 和 的直线斜率为),(1YX),(t。由于共有 1 条这样的直线,因此)/()(11XYttn21ntttY(2)因为 X 非随机且 ,因此0)(tE )( 1111 XEXYE tttt这意味着求和中的每一项都有期望值 ,所以平均值也会有同样的期望值,则表明是无偏的。(3)根据高斯
33、马尔可夫定理,只有 的 OLS 估计量是最付佳线性无偏估计量,因此,这里得到的 的有效性不如 的 OLS 估计量,所以较差。9、对于人均存款与人均收入之间的关系式 使用美国 36 年的年度数据tttYS得如下估计模型,括号内为标准差: )01.()5.1(67384ttS0.538 2R239(1) 的经济解释是什么?(2) 和 的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在 1%水平下) 。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。
34、你的结论是什么?15解答:(1) 为收入的边际储蓄倾向,表示人均收入每增加 1 美元时人均储蓄的预期平均变化量。(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期 的符 号为正。实际的回归式中, 的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度,表明收入的变化可以解释储蓄中 53.
35、8 %的变动。(4)检验单个参数采用 t 检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下 t 分布的自由度为 n-2=36-2=34。由 t 分布表知,双侧 1%下的临界值位于 2.750 与 2.704 之间。斜率项计算的 t 值为 0.067/0.011=6.09,截距项计算的 t 值为 384.105/151.105=2.54。可见斜率项计算的 t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。10、考虑下列两个模型:、 iiii uxy321、 iiiiix)(要求:(1)证明: , ,213(2)证明:残差的最小二乘估计量相
36、同,即: iiu(3)在何种情况下,模型的拟合优度 会小于模型拟合优度 。2R21R解答:证明:(1)由参数估计公式可得下列参数估计值161)(2 23322332233223323322332iiiiiiii iiiii xxxyxxy3 233233222323322332233223 )(iiiiiiii iiiii xxxyxxy132321)(xy证毕。证明: i iiiiiiuxyx)1(32322证毕。设: iiixyz2I 式的拟合优度为: 221 )(1yuTSERi17II 式的拟合优度为: 22 )(1zuTSERi在中已经证得 成立,即二式分子相同,若要模型 II 的拟合优度 小于模型 Iii 2R的拟合优度 ,必须满足: 。21 22)()(yzii (另 ,应用 Eviews 软件得出参数估计的结果为0.25(1).3t18)19