1、1计量经济学练习题一.名词解释1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值 ,普通最小二乘法要niYXi ,21:),(求样本回归函数尽可以好地拟合这组值,即样本回归线上的点 与真实观测点 Yt 的“总体误差”尽可能地小。普通最小二乘法iY给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。2.广义最小二乘法 GLS:加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取 1 时的一种特殊情况。从此意义看,加权最小二乘法也称为广义最小二乘法。3.加权最小二乘法 WLS:加权最小二乘法是对原模
2、型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。 4.工具变量法 IV:工 具 变 量 法 是 克 服 解 释 变 量 与 随 机 干 扰 项 相 关 影 响 的 一 种 参 数 估 计 方 法 。5.两阶段最小二乘法 2SLS, Two Stage Least Squares:两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。6.间接最小二乘法 ILS:间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
3、7.异方差性 Heteroskedasticity:对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。8.序列相关性 Serial Correlation:多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。9.多重共线性 Multicollinearity:对于模型 ,其基本假设之一是解释变量ikii XXY210iX1,X2,Xk 是相互独立的。如果某两个或多个解释变量之间出现了相关性,则称为存在多重共线性。10.时间序列数据:时间序列数据是一批按照时间先后排列的统计数据。 11
4、.截面数据:截面数所是一批发生在同一时间截面上调查数据。 12.虚拟数据:也称为二进制数据,一般取 0 或 1. 13.内生变量 Endogenous Variables:内生变量是具有某种概率分布的随机变量,它的参数是联立方程系统估计的元素。内生变量是由模型系统决定的,同时也对模型系统产生影响。内生变量一般都是经济变量。 14.外生变量 Exogenous Variables:外生变量一般是确定性变量,或者是具有临界概率分布的随机变量,其参数不是模型系统研究的元素。外生变量影响系统,但本身不受系统的影响。外生变量一般是经济变量、条件变量、政策变量、虚变量。15.先决变量 Predetermi
5、ned Variables:外生变量与滞后内生变量(Lagged Endogenous Variables)统称为先决变量。22)(YyTSii216.总离差平方和: 称为总离差平方和,反映样本观测值总体离差的大小。 17.残差平方和: 称为残差平方和,反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。18.回归平方和: 反映由模型中解释变量所解释的那部分离差的大小。 19.可决系数 coefficient of determination :可决系数 R2 是检验模型拟合优度的指标,越接近于 1,模型的拟合优度越高。22,1RTSER20.随机干扰项 stocha
6、stic disturbance: 称为观察值 Y 围绕它的期望值 E(Y X)的离差(deviation ) ,记)|(iii XY,它是一个不可观测的随机变量,称为随机误差项(stochastic error) ,通常又不加区别地称为随机干扰项() 。21.结构式模型 Structural Model:根据经济理论和行为规律建立的描述经济变量之间直接结构关系的计量经济学方程系统称为结构式模型。 22.简化式模型 Reduced-Form Model:将联立方程计量经济学模型的每个内生变量表示成所有先决变量和随机干扰项的函数,即用所有先决变量作为每个内生变量的解释变量,所形成的模型称为简化式
7、模型。 23.恰好识别 Just Identification:如果某一个随机方程具有一组参数估计量,称其为恰好识别。24.过度识别 Over identification:如果某一个随机方程具有多组参数估计量,称其为过度识别。(前 15 个解释看下理解就好,但要会翻译即可,后面的 9 个就要深记了)1.普通最小二乘法(Ordinary Least Squares,OL 2.广义最小二乘法 GLS3.加权最小二乘法 WLS 4.工具变量法 IV 5.两阶段最小二乘法 2SLS, Two Stage Least Squares6.间接最小二乘法 ILS 7.异方差性 Heteroskedasti
8、city8.序列相关性 Serial CorrelationS) 9.多重共线性 Multicollinearity10.时间序列数据 Time series data 11.截面数据 Cross-section data 12.虚拟数据 Virtual data13.内生变量 Endogenous Variables 14.外生变量 Exogenous Variables15.先决变量 Predetermined Variables二.填空() 最小二乘法原理是求 式子达到最小值。考查最小二乘法的定义,() 由系统本身所决定的变量称为 内生变量 此题很可能换成影响系统,但本身不受系统的影响称
9、为:外生变量 或者换成先决变量由什么组成?22)(Yyii 22)(iieRS3() 在线性模型 Yi = B0 + B1Xi + i 中若 Var( i) =i 称为 异方差 此题考到方差的定义,有可能改为 Var( i) = 就变成同方差了() 计量经济学的应用 结构分析、经济预测、政策评价、检验的发展经济理论 此题考第一章的内容,大体掌握下纲要,可能会考,常见计量经济学的软件有:() 收集到 1980 年到 2004 年 A,B 两地区人均收入、人均消费、人均住房面积、人均能源消耗四个指标进行对比分析,称以上数据为 平行 数据。这题考到数据类型,一般分为时间序列数据、截面数据、虚拟数据,
10、还有一个是平行数据(截面数据和时间系列结合在一起的数据组)所以这从有可能换成其他数据() 用 19 年历史数据,做经济模型 Yi=B0 + B1X1i + B2X2i + B3X3i + i 要检验该模型的显著性,需用 F 检验; H 0: 0=1=2= =k=0 ;临界值(=0.05)要查 F 分布 表,自由度为 15(n k1 ) 此题考查 F 分布,这次会考 t 检验 ,则 H0: j=0,要查 t 分布表,自由度为(n k1 )三.选择题(1) 由 20 年数据,用 CobbDauglas 生产函数对某地区经济做分析,得出模型为 LOG(Y) = LOG(1.78)+ 0.87LOG(
11、L)+ 0.13LOG(K)+ 其中 Y 为产出,L 为劳动力,K 为资金。参数1.78 的 t 检验值为 1.738; 参数 0.87 的 t 检验值为 8.69; 参数 0.13 的 t 检验值为 2.59; 用 =0.05 水平判断该地区经济结构?临界值参考数值如下: t 0.05(17) = 1.74 t 0.05(18) = 1.734 ( 此题考查的是如何判断是否显著性,题中一个是资本,一个是劳动,先判断是否为资本的,则 )高新技术型 劳动密集型 资本密集型 劳动资本密集型(2) 以下哪些是计量经济模型所包含随机误差(干扰)项的古典模型要求( 此题考查古典模型的要求后面那些假设要记
12、,到时随便选项改下也会 ) COV(Xi, i) 0 E(i)=0 Var(i)=i E(ij)=0(3) 线性模型 Yi=B0+B1Xi + i , 已知 cov(X i , i) 0 ,应采用下列什么方法对模型参数进行估计? ( 这题考查的是以下四个方法的条件,这次可能换成其他形式的 c )广义最小二乘法 加权最小二乘法 工具变量法 间接最小二乘法(4) DW 检验可以发现以下哪些问题?( 此题考查 DW 检验的用途 ) 存在一阶自相关 存在二阶自相关 存在非线性 存在共线性三.简答题(1) 多元线性计量经济模型 Y = XB + N , 求其参数最小二乘估计矩阵表达式;和加权最小二乘估计
13、矩阵表达式,广义最小二乘估计矩阵表达式,工具变量法矩阵表达式。 (写出矩阵内容)(1)普通最小二乘估计量 OLS YX1)(4(2)加权最小二乘估计量 WLS(3)广义最小二乘估计量 GLS P127(4)IV 工具变量法 P148 YZX1)( knkk nXX211121Z称为工具变量矩阵此题不会难记,模式基本一样的(2)多元线性性回归模型的基本假设?(也可能换成一元线性回归模型的假设,很多一样的)对模型设定的假设假设 1. 回归模型是正确设定的(没有设定误差)假设 2. 解释变量 X1,X2,Xk 是非随机的或固定的变量,且各 Xj 之间严格线性相关性(无完全多重共线性) ; 假设 3.
14、 假设 4. 随机误差项 具有零均值,同方差和不序列相关性:E(i|Xi)=0 i=1,2, ,nVar (i|Xi)=2 i=1,2, ,nCov(i, j|Xi, Xj)=0 ij i,j= 1,2, ,n(一元性假设 1. 回归模型是正确设定的(没有设定误差)假设 2. 解释变量 X 是确定性变量不是随机变量假设 3. 随机误差项 具有零均值,同方差和不序列相关性:E(i|Xi)=0 i=1,2, ,nVar (i|Xi)=2 i=1,2, ,nCov(i, j|Xi, Xj)=0 ij i,j= 1,2, ,n21()/niiXnQn21)/nii nQn5(3)什么叫序列相关?序列相
15、关会产生怎样不良后果?如何解决序列相关参数估计?系列相关:对于模型Yi=0+1X1i+2X2i+kXki+i i=1,2, ,n在 其 他 假 设 仍 成 立 的 条 件 下 , 关关关关 即 意 味 着0)(jiE 2112)()() nnECov 2112 nn I22如果仅存在 E(i i+1)0 i=1,2, ,n 称为一阶序列相关,或自相关(autocorrelation2、序列相关性的后果(1 ) 、 参数估计量非有效(2) 、变量的显著性检验失去意义(3). 模型的预测失效系列相关的补救:3、用一下相关性的检验方法检验发现图示法、回归检验法、D-W 检验法、拉格朗日乘法检验3、解
16、决方法如果模型被检验证明存在序列相关,则需要发展新方法估计模型() 广义最小二乘法、广义差分法() 序列相关稳健法此题目还可以把主语换成异方差性、多重共线性、随机变量问题,是非常有可能,所以其他三个也要掌握)四、综合题(1) 判断下列联立方程组识别性? Bij 为大于零参数, j 为随机误差项( j=1,2,3),Ct = B11+ B12Yt+ B13Ct-1+ B14Pt-1 + tIt = B21+B22 Yt +B23 Yt-1 + 2Yt = B31Ct +B32 It+ 3例 1解:结构参数为tt tt tttICYI21210 136首先判断第一个结构的识别状态,对于第一个方程,
17、有其中 g=3 k=4 g1=2 k1=3则所以,该方程可以识别。因为所以,第 1 个结构方程为恰好识别的结构方程。 判断第 2 个结构方程的识别状态 g=3 k=4 g2=2 k2=2则所以,该方程可以识别。因为,所以第 2 个结构方程为过度识别的结构方程第 3 个方程是平衡方程,不存在识别问题。综合以上结果,该联立方程模型是可以识别的。(以下看看就好,这题已经够详解了,肯定会考的) 联 立 方 程 计 量 经 济 学 模 型 的 结 构 式 YX 中 的 第 i个 方 程 中 包 含 gi个 内 生 变 量 ( 含 被 解 释 变 量 ) 和 ki个 先决 变 量 ( 含 常 数 项 )
18、, 模 型 系 统 中 内 生 变 量 和 先 决 变 量 的 数 目 仍用 g和 k表 示 , 矩 阵 ()0表 示 第 i个 方 程 中 未 包 含 的 变 量 ( 包括 内 生 变 量 和 先 决 变 量 ) 在 其 它 g1个 方 程 中 对 应 系 数 所 组 成 的矩 阵 。 于 是 , 判 断 第 i个 结 构 方 程 识 别 状 态 的 结 构 式 条 件 为 : (2)二 以下是用 Excel 软件计算出回归结果SUMMARY OUTPUT回归统计Multiple R 0.999230120)(0gR11gk0320)(0gR 122gk7R Square 0.998461A
19、djusted R Square ?标准误差 ?观测值 9方差分析df SS MS FSignificance F回归分析 ? 10745525 ? ? 1.89E-07残差 ? ? ?总计 ? 10762092 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%Intercept -136.628 70.10659 -1.94886 0.108829 -316.842 43.58708X Variable 1 0.758905 0.154199 4.921603 0.004391 0.362525 1.155286X Variable 2
20、 -0.39993 0.190474 -2.09968 0.08979 -0.88956 0.089694X Variable 3 -0.17757 0.216712 -0.81936 0.449855 -0.73464 0.37951RESIDUAL OUTPUT观测值 预测 Y 残差1 1754.471 4.5286582 2053.311 -48.31123 2325.235 -8.235424 2539.051 64.948945 2862.738 5.2622666 3163.354 19.646117 3747.54 -72.54028 4528.936 60.063919 520
21、0.363 -25.36311) 完成上述表格问号处的填空 2)求样本容量 n 3) 该模型是否通过 F 检验? 5)模型具体形式 6)求观察值 Y3 7)从以上输出内容,试对模型做分析(有专门发一份,很详细)(3) 课本 p.350 第一题; p.351 第五题例。分析课本 9.1.1 的问题,回答:为什么按照(1) 、 (2) 、 (3)的方法建立的农户借贷因素模型都是不正确的)解:此题考查的是计量经济学应用模型的设定,属于截面数据单方程计量经济学应用模型类型的选择)对于截面数据,只有当数据是在截面总体中由随机抽样得到的样本观测值,并且变量具有连续的随机分布时,才能够将模型类型设定为经典的
22、计量经济学模型。例。某人以我国人均食品需求量 Q 为被解释变量,以食品价格指数 p 为解释变量,以 19782007 的数据位样8本,建立了如下的食品需求模型LnQ=a+lnP+u t=1978,.2007 由于我国的人均食品需求量是逐年上升的,食品价格指数也是逐年上升的,所以该模型得到的 为正,于是得到结论。需求法则不适合于我国。试以该问题为例,分别从经济学、逻辑学和统计学三方面理论出发,说明计量经济学总体回归模型必须遵循“从一般到简单”的原则?1.总体回归模型设定的“研究目的导向”及其问题任何应用研究都有特定目的性,若按特定目的进行计量经济学模型总设定,成为计量经济学应用研究的普遍现象和严
23、重的问题。2.总体回归模型设定的“一般性”原则计量经济学模型总体设定,必须遵循“一般性”原则,即从“一般到简单”思路。(考这题的话,就要学会扯,越多越好,但不要写的不清不楚的)(4)以下宏观经济模型,其中 Y 为收入,I 为投资,C 为消费,G 为政府支出,t 为税收,r 为银行利率,为税率,Ms 为货币发行量。 其中税率 0 1 参数 Bi0 ( i=1,7 ) 且 B2B5 1Y=I+C+G C=B1+B2(Yt)t= YI=B3B4r + B5(Yt)Ms=B6YB7r若政府采取增加货币发行量 Ms,银行利率 r 不变 ,税率 不变措施。则政府支出 G 应如何变动才能保持经济平衡? (这
24、题我实在是看不出在考什么东西,按常理是可以做出来,哪个知道的要说)补充1、 什么是异方差?有什么后果?如何发现?如何解决?异方差:对于模型 ikiiii XXY210 ,如果出现 Varii()2即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。后果:、.参数估计量非有效 2、变量的显著性检验失去意义 3、模型的预测失效检验:1、图示法 2、帕克(Park)检验与戈里瑟(Gleiser)检验 3、戈德菲尔德-匡特(Goldfeld-Quandt)检验4、4 怀特(White)检验修正:模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Sq
25、uares, WLS)进行估计。加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用 OLS 估计其参数。92、什么是多重共线性?有什么后果?如何发现?如何解决?多重共线性:对于模型 ikiiii XXY210 其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。后果:1、完全共线性下参数估计量不存在 2、近似共线性下 OLS 估计量非有效 3 参数估计量经济含义不合理4、变量的显著性检验失去意义 5、模型的预测功能失效检验:(1)检验多重共线性是否存在:对两个解释变量的模型,采用简单相
26、关系数法;对多个解释变量的模型,采用综合统计检验法(2)判明存在多重共线性的范围: 判定系数检验法;逐步回归法克服多重共线性的方法:1、排除引起共线性的变量 2、差分法 3、减小参数估计量的方差3、什么是随机解释变量问题?有什么后果?如何发现?如何解决?随机变量问题:对于模型: ikiiii XXY210 基本假设:解释变量 X1,X2,Xk 是确定性变量。如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。后果:1、如果 X 与 相互独立,得到的参数估计量仍然是无偏、一致估计量。 2、如果 X 与 同期不相关,异期相关,得到的参数估计量有偏、但却是一致的3、如果 X 与
27、同期相关,得到的参数估计量有偏、且非一致。 解决:模型中出现随机解释变量且与随机误差项相关时,OLS 估计量是有偏的。如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量; 但如果是同期相关,即使增大样本容量也无济于事。这时,最常用的估计方法是工具变量法(Instrument variables) 。 选择为工具变量的变量必须满足以下条件:(1)与所替代的随机解释变量高度相关;(2)与随机误差项不相关;(3)与模型中其它解释变量不相关,以避免出现多重共线性4、模型的类型与变换 (看看就好)1、倒数模型、多项式模型与变量的直接置换法 例如,描述税收与税率关系的拉弗
28、曲线:抛物线s = a + b r + c r2 c0s:税收; r:税率设 X1 = r,X2 = r2, 则原方程变换为s = a + b X1 + c X2 c0 2、幂函数模型、指数函数模型与对数变换法 例如,Cobb-Dauglas 生产函数:幂函数Q = AKLQ:产出量,K:投入的资本;L:投入的劳动10方程两边取对数:ln Q = ln A + ln K + ln L3、复杂函数模型与级数展开法 5、参数估计量的性质(3) 、有效性(最小方差性)6、样本容量所谓“最小样本容量” ,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本
29、最小容量必须不少于模型中解释变量的数目(包括常数项),即n k+1因为,无多重共线性要求:秩(X)=k+1满足基本要求的样本容量7、拟合度检验11拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2Y 的观测值围绕其均值的总离差 (total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS) 。称 R2 为(样本)可决系数/判定系数(coefficient of determination) 。 可决系数的取值范围:0,1 R2 越接近 1,说明实际观测点离样本线越近,拟合优度越高。8、虚拟变量
30、这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量例如,反映文程度的虚拟变量可取为:1, 本科学历D=0, 非本科学历基础类型、肯定类型取值为 1; 比较类型,否定类型取值为 0。虚拟变量的引入:加法方式和乘法方式。TSRE1记2129、生产函数模型要素替代弹性要素替代弹性定义为两种要素的比例的变化率与边际替代率的变化率之比。C-D 生产函数模型 年技术进步速度 y-k-L 为技术进步速度 为资本、劳动力的产出弹性Y K L 分别为产出、资本、劳动力增长速度例:用 19631984 年我国全民所有制工业数据,估计出如下
31、C-D 生产函数Y=0.6479e0.0128t K0.3608 L0.6756 由样本数据计算得到产出、资本、劳动力平均增长速度分别为:y =10.5% k = 8.74% L = 5.71%dKLdMPLK(/)(/)YAKL13= 0.3608 =0.6756 代入 y-k-L 3.4910.、DW 检验假设条件:(1)解释变量 X 非随机;(2)随机误差项 i 为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i计算 DW 值,给定 ,由样本容量 n 和解释变量个数 k 的大小查 DW 分布表,得
32、临界值 dL 和 dU比较、判断,若 0D.W.dL 存在正自相关dLD.W.dU 不能确定dU D.W.4dU 无自相关4dU D.W.4 dL 不能确定4dL D.W.4 存在负自相关 当 D.W.值在 2 左右时,模型不存在一阶自相关。11、估计联立方程的参数常用哪几种方法?特点?(1)工具变量法(IV,Instrumental Variables)工具变量法只适用于恰好识别的结构方程的估计(2)间接最小二乘法只适用于恰好识别的结构方程的参数估计,因为只有恰好识别的结构方程,才能从参数关系体系中得到唯一一组结构参数的估计量。 间接最小二乘法也是一种工具变量方法 (3)二阶段做小二乘法(2
33、SLS)是一种既适用于恰好识别的结构方程,又适用于过度识别的结构方程的单方程估计方法。二阶段最小二乘法也是一种工具变量方法 12、F 检验即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n 中的参数 j 是否显著不为 0。H0: 0=1=2= =k=0H1: j 不全为 0在原假设 H0 成立的条件下,统计量 14)1/(knRSEF服从自由度为( k , n-k-1)的 F 分布。 给定显著性水平 ,可得到临界值 F(k,n-k-1),由样本求出统计量 F 的数值,通过F F(k,n-k-1) 或 FF (k,n-k-1)来拒绝或接受原假设 H0,以判定原方程 总体上的线性关系是否显著成立。 (后面这些补充的很多理解就好,该记得还是要记得,以前面为主)