1、1计量经济学期末试题答案(2007 年秋季)(开卷,满分 70 分,A 卷)(21 分,每小题 3 分)多元线性回归模型:ikiiii XXY210 ),0(2Ni ni,1其矩阵形式为: ,满足所有基本假设。 分别写出 的分布、 的分布和 的分布。22Y2 指出“偏回归系数” 的含义,并指出解释变量满足什么条件时可以用一元回归模型得到相同的 的估计结果?2 如果 ,采用 WLS 估计得到 ,写出其21()iiiVarx11()XWY中 的具体表达式。W 证明: 是 的无偏估计。)()(2knXY2 如果解释变量 和 为与 相关的随机变量,仍然采用 OLS 估计得到1k,指出其中哪些是有偏估计
2、?哪些是无偏估计?简单说明理由。k,1210 如果受到条件限制,被解释变量只能取大于 的样本观测值,用 OLS 和 ML 分别估计a模型,参数估计量是否等价?为什么? 如果 为只有 2 种类别( A、B)的定性变量, 为具有 3 种类别(C 、D 、E)的定1X2X性变量,重新写出该线性回归模型的表达式。答案: ;),0(22N ),( 22120 kY), 22X1Y “偏回归系数” 的含义是 对 的直接影响。当 与全体解释变量完全独立时,Y2X可以用 对 的一元回归模型得到相同的 的估计结果。2X2 2121221 )(000)()( nXX W 被解释变量的估计值与观测值之间的残差2XY
3、eMI)()(11残差的平方和为: e因为 为对称等幂矩阵,所以有 ,于是)(1XI Me)1()(2121 kntrEXIEe12kn显然, ,即该估计量是无偏估计量。2)(E 是有偏估计,其它是无偏估计。因为根据1,k )()()(1XY1EE可得上述结论。 如果被解释变量只能取大于 的样本观测值,用 OLS 和 ML 分别估计模型,参数估计a量不等价。对于 OLS,只要样本观测值相同,无论被解释变量是否受到限制,其估计结果是相同的。而对于 ML,在被解释变量受到限制时,抽取同一个样本的概率发生了变化,因而似然函数发生了变化,估计结果也发生变化。 ikiiiiii XDDY 322110
4、),0(2Ni 其 它类 别其 它类 别类 别类 别 102211 DCBA(15 分)指出下列论文中的主要错误之处:在一篇关于中国石油消费预测研究的论文中,作者选择石油年消费量(OIL,单位:万吨标准煤)为被解释变量,国内生产总值(GDP,按当年价格计算,单位:亿元)为解释变量,19902006 年年度数据为样本。首先假定边际消费倾向不变,建立了线性模型:3206,19,tGDPOILttt 采用 OLS 估计模型,得到 ,18325.0.139 tI tt然后假定消费弹性不变,建立了对数线性模型: 206,19,lnln tGDPOILttt 采用 OLS 估计模型,得到 ,l4583.0
5、12.5l tI tt分别将 2020 年国内生产总值预测值(500000 亿元)代入模型,计算得到两种不同假定情况下的 2020 年石油消费预测值分别为 104953 和 68656 万吨标准煤。答案:(指出每个错误 3 分) 模型函数关系错误。不可能两种假定同时成立,只能建立一种模型。 变量选择错误。影响石油消费的因素,除了 GDP 外,还应该包括产业结构、能源结构、技术水平等。 国内生产总值按当年价格计算,样本数据不具有可比性。石油年消费量采用实物量单位,是可比的。 时间序列数据作样本,而且舍弃了许多显著变量,肯定存在序列相关性,不能采用OLS 估计。 得到的 104953 和 6865
6、6 万吨标准煤不是预测值,而是预测值的一个估计值。 时间序列数据非平稳,没有经过单位根检验和协整检验。( 该问题不扣分,如果回答正确,可以顶替前面)(12 分,每小题 4 分)回答下列问题: 为什么要对联立方程模型中的随机方程进行识别?为什么恒等方程不能被排除在识别问题之外? 联立方程模型第 i 个结构方程识别状态的结构式条件为:如果 ,则第Rg()01i 个结构方程不可识别;如果 ,则第 i 个结构方程可以识别,并且如果Rg()01,则第 i 个结构方程恰好识别,如果 ,则第 i 个结构方程过kgii1kgii1度识别。为什么在秩条件中没有讨论 的情况?为什么在阶条中没有讨论0()的情况?i
7、ik 为什么 2SLS 既适合于恰好识别方程又适合于过度识别方程的估计?为什么它在实际联立方程模型的估计中并不具有实用性?4答案: 联立方程模型中的随机方程可能不具有确定的统计形式,即模型系统中的方程的线性组合可能构成与该随机方程相同的统计形式,这时利用同一组样本数据进行估计,得到的参数估计值可能是新组合方程的参数,也可能是该方程的参数,所以,只有具有确定统计形式的方程才是可以估计的。于是需要对每个随机方程是否具有确定的统计形式进行识别。恒等方程虽然无须估计,本身也不存在识别问题,但是它们是模型系统的一部分,它们参与方程系统的线性组合可能影响其它随机方程的识别性质。所以,恒等方程不能被排除在识
8、别问题之外。 矩阵 为 阶矩阵,它的秩不可能大于 ,所以,在秩条件)(0)()1ikg)1(g中没有讨论 的情况。R如果 ,必然使得 ,为不可识别。所以,在可以识别情iikRg()01况下的阶条中没有讨论 的情况。1iikg 2SLS 估计过程中没有涉及上述阶条件,所以它既适合于恰好识别方程又适合于过度识别方程的估计。但是,2SLS 估计的第一步需要用模型系统的所有先决变量作为内生解释变量的解释变量,而在实际联立方程模型中先决变量数目一般较大,为了实现第一阶段的估计,需要很大的样本容量,所以,它在实际模型的估计中并不具有实用性。(共 12 分,每小题 4 分)改进的 CES 生产函数模型的表达
9、式为: mLKeAYt )(210其中,Y 为产出量,K、L 为资本和劳动投入量,t 为时间变量,其它为参数。 指出模型中每个参数的经济意义和数值范围。 写出由该理论模型导出的用于参数估计的线性总体回归模型。 设计一个假设检验,检验该生产函数模型可否采用 C-D 生产函数的形式,并写出两种不同的检验统计量。答案: 为基期的技术进步水平, ;0A0A为技术进步速度,一般 ,但接近 0;为替代参数, ;1为规模报酬参数,处于 1 左右;m为分配系数, 。21,1,0,212 该理论模型导出的用于参数估计的线性总体回归模型: 221221 )(lnlnlln LKmLKmtAY5即 243210 )
10、(lnllnln LKKtY 0:,:44H变量显著性检验的统计量 )5(4ntSt约束条件检验的统计量 ),1()/(FRFU(10 分)在一篇研究我国工业资本配置效率的论文中,作者利用我国 39 个工业行业(编号 i =1,2,39)的 9 年(t=1991,1991,1999)的 351 组数据为样本,以固定资产存量 I 的增长率为被解释变量,以利润 V 的增长率为解释变量。分别建立了如下 3 个模型: ittitiI1,1,lnlnittiiiti VI1,1, llittitttiI1,1, lnln利用全部样本,采用 OLS 估计模型,结果表明我国资本配置效率不仅低于发达国家,也低
11、于大多数发展中国家。为了分析我国工业行业的成长性,分别利用每个行业的时间序列数据,对模型进行 OLS 估计,从结果中发现了最具发展潜力的 5 个行业。为了定量刻画我国每年的资本配置效率,分别用每年的行业数据,采用 OLS 估计模型,从估计结果可以看出,我国资本配置效率呈逐年下滑趋势。分别从 Panel Data 的模型设定和估计方法两方面,指出该论文存在的问题,并简单说明理由。答案:模型设定存在的问题: 对于该 39 个行业 9 年的 351 组样本,只能设定一种总体模型,不可能 3 种模型同时都是正确的。 模型缺少重要的设定检验。 按照经济学中的资本配置效率理论,模型选择 作为 的唯一解释变量。但是,我国实际的行1/tV1/tI业资本配置并不仅仅取决于行业的利润增长率,至少国家的产业政策仍然具有很强的作用,而且由于经济并没有处于一般均衡状态,帐面上的利润并不是资本收益的真实反映。估计方法存在的问题:Panel Data 既存在异方差问题,又存在序列相关问题;而且对于模型,还存在截面个体之间的相关性问题。所以,采用 OLS 估计,无论对于哪个模型都是不合适的。