1、第八章 线性回归模型扩展一、填空题1. 将非线性回归模型转换为线性回归模型,常用的数学处理方法有_、_、_。2. 在计量经济 建模时, 对非线性模型的处理方法之一是线性化,模型 线性XY/10化的变量变换形式为_, 变换后的模型形式为_ 。3. 虚拟变量的用途表现在多方面,如 , , , 。在虚 拟变量的应用中,要防止 问题。4. 二元选择模型的类型有 , , 。5. LPM 模型可以直接用 方法进行估计。模型的估 计优 度直接由 进行反映,估计得到的 反映了 ,但出 现的问题是,得出的 Y 可能超出 区间,同时存在 问题。 6.LOGIT 模型为 数学形式,但可以 。PROBIT 模型是 数
2、学形式的模型,但 。两个模型都可以采用 法进行估计,所得参数的估计值具有 性,但不能直接反映解释变量变化产生的 。7.可决系数 R2 不适合于 LOGIT 和 PROBIT 模型的拟合优度检验,测定两者拟合优度的常用方法有 和 。8. F 检验 不适合于 LOGIT 和 PROBIT 模型中多个参数之间约束关系的检验,可以采用 。9. 模型中遗漏了重要的解释变量,会 导致 , , 等后果。二、选择题1. 在双对数线性模型 中,参数 的含义是( )。uXYlnln101A. Y 关于 X 的增长量 B. Y 关于 X 的发展速度 C. Y 关于 X 的边际倾向 D. Y 关于 X 的弹性2. 根
3、据样本资料已估计得出人均消费支出 Y 对人均收入 X 的回归方程为,这表明人均收入每增加,人均消费支出将增加( )。eln75.0lnA.500 ; B.0.75% ; C. 5% ; D.7.5%3. 半对数模型 中,参数 的含义是( )。 uXYl101AX 的绝对量变化,引起 Y 的绝对量变化; BY 关于 X 的边际变化; CX 的相对变化,引起 Y 的期望 值绝对量变化 ;DY 关于 X 的弹性4. 半对数模型 中,参数 的含义是( )。u10ln1A. X 的绝对量发生一定变动时,引起因变量 Y 的相对变化率B. Y 关于 X 的弹性C. X 的相对变化,引起 Y 的期望值绝对量变
4、化 D. Y 关于 X 的边际变化5. 在模型 中( )。ulnln10A. 与 是非 线性的; B. 与 是非线性的Y1C. 与 是线性的 D. 与 是线性的Yl1 lnXE. 与 是线性的Xn6. 某商品需求模型 为 ,其中 Y 为需求量,X 为价格。 为了考虑“地区”ub10(农村、城市)和“ 季节”(春、夏、秋、冬)两个因素的影响,拟 引入虚拟变量, 则应引入虚拟变量的个数为( )。 A.2 B.4 C.5 D.67. 根据样本资料建立某消费函数模型如下: ,其中 C 为消费,uDXC5.01X 为收入,虚拟变量 D (其中 D=1 表示城镇,D=0 表示农村),所有参数均检验显著,
5、则城镇家庭的消费函数为( )。A. B. uXC5.01.C. D. u5018. 假设某需求函数 为 ,为了考虑“季节”因素(春、夏、秋、冬四个不同bY10的状态),引入 4 个虚拟变量形成截距 变动模型, 则模型的( )。A. 参数估计量将达到最大精度 B. 参数估计量是有偏估计量C. 参数估计量是非一致估计 量 D. 参数将无法估计9. 对于模型 ,为了考虑“地区” 因素(北方、南方),引入 2 个虚拟变量uXbY10形成截距变动模型,则会产生( )。A. 序列的完全相关 B. 序列的不完全相关C. 完全多重共线性 D. 不完全多重共线性10. 设消 费函数 为 ,其中虚拟变量 D (其
6、中 D=1 表示uDbXbY3210城镇, D=0 表示 农村),当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( )。A. ; B. ;C. ; D. 0 ,21b0 ,21b0 ,21b0 ,21b11. 消费 函数模型 ,其中 Y 为消费, X 为收入,uXbDbY43210, , ,该模型中包含了几个质的影响其 他 季 度第 一 季 度 01D其 他 季 度第 二 季 度 2其 他 季 度第 三 季 度 03因素( )。A.1 B.2 C.3 D.412. 设消费函数 ,其中虚拟变量 ,如果统计检验表uDbXY210 南 方北 方 013D明 成立,则北方的消费
7、函数与南方的消费函数是( )。10bA. 相互平行的 B. 相互垂直的 C. 相互交叉的 D. 相互重叠的三、简答题1在建立计量经济模型时,什么时候、为什么要引入虚拟变量?2举例说明虚拟变量在模型中的作用。3什么是“虚拟变 量陷阱”?4试在消费函数 中(以加法形式)引入虚拟变 量,用以反映季 节因素(淡、XY旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。5现有如下估计的利润函数: (2.86) (8.6) (35.7) 037340.21 iiit XDXY其中: 、 分别为销售利润 和销售收入; 为虚拟变量,旺季时 ,淡季时 ;X 10D,试 分析:(1)
8、季节因素影响情况;(2)写出模型的等价形式。D6请判断下列陈述是否正确:A. 在回归模型 中,如果虚拟变量 的取值为 0 或 2,而非通常iii uY21i情况下的为 0 或 1,那么参数 的估计值将减半,其 T 值 也将减半;B. 在引入虚拟变量后,普通最小二乘法的估计值只有在大样本情况下才是无偏的;7. 在模型 设定时,如果遗 漏重要变量,那么模型中保留下来的变量系数的 OLS 估计是无偏和一致的吗?请举简例说明。四、实践题1. 根据某种商品销售量和个人收入的季度数据建立如下模型:uXbDbDbY43210其中,定义虚拟变量 为第 i 季度时其数值取 1,其余为 0。这时会发生什么问题,参
9、数是否iD能够用最小二乘法进行估计?2. 根据美国 1961 年第一季度至 1977 年第二季度的数据,我们得到了如下的咖啡需求函数的回归方程: (-0.37) (-6.) (-3.74) (-.6) (0.5) (1.23) (-2.14) 097.1509.081489lnln670789.1ln 32tttttt uDDTPIPQ 。其中,Q=人均咖啡消 费量(单位:磅);P=咖啡的价格(以 1967 年价格为不变价格);.2RI=人均可支配收入( 单位:千元,以 1967 年价格为不变价格); =茶的价格(1/4 磅,以 1967年价格为不变 价格);T=时间趋势变 量(1961 年第
10、一季度为 1,1977 年第二季度为 66);D1=1:第一季度; D2=1:第二季度;D 3=1:第三季度。请回答以下问题:(1)模型中 P、I 和 的系数的经济含义是什么?(2)咖啡的需求是否很有弹性?(3)咖啡和茶是互补品还是替代品?(4)你如何解释时间变量 T 的系数?(5)你如何解释模型中虚拟变量的作用?(6)哪一个虚拟变量在统计上是显著的?(7)咖啡的需求是否存在季节效应?3. 为研究体重与身高的关系,我们随机抽样调查了 51 名学生(其中 36 名男生,15 名女生),并得到如下两种回归模型:()(8.63) (-5.21) 5703hW()(5.16) (4.02) (-2.5
11、9) 74hD其中,W(weight)=体重(单位:磅);h(height)= 身高 (单位:英寸)女 生男 生 01请回答:(1) 你将选择哪一个模型?为什么?(2) 如果模型()确实更好,而你选择了(),你犯了什么错误?( 3)D 的系数说明了什么?4. 考虑如下回归模型:uXbbY4213210其中,Y=大学教师的年收入; X =教学年份; 女 性男 性 01D其 他白 人 012D请回答:(1)b 4 的含义是什么? (2)求 。)1E(21, X, DY/5. 家庭消费支出 C 除了依赖 家庭收入 Y 之外, 还同下列因素有关:(1)家庭所属民族,有汉、蒙、满、回;(2)家庭所在地域
12、,有南方、北方;(3)户主的文化程度,有大专以下、本科、研究生。试根据以上资料分析确定家庭消费支出的线性回归模型。6. 设某饮料的需求 Y 依赖于收入 X 的变化外,还受:(1)“地区”(农村、城市)因素影响其截距水平;(2)“季节”(春、夏、秋、冬)因素影响其截距和斜率。试分析确定该种饮料需求的线性回归模型。7. 需求 Q 与收入 I 和价格 P 是线性关系: 。uPbIQ210如果在 PP0 和 PP0时, P 对 Q 的影响有显著差异,并且这种影响是随时间而呈线性变化的,则如何修正以上模型。8一个由容量为 209 的样本估 计的解释 CEO 薪水的方程 为:ln(salary)=4.59
13、+0.257ln(sales)+0.011roe+0.158finance+0.181consprod-0.283utility(15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)其中,salary 表示年薪水(万元)、 sales 表示年收入(万元)、roe 表示公司股票收益(万元);finance、consprod 和 utility 均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设对比产业为交通运输业。(1)解释三个虚拟变量参数的经济含义;(2)保持 sales 和 roe 不变,计 算公用事业和交通运输业之 间估计薪水的近似百分比差异。这个
14、差异在 1%的显著水平上是统计显著的吗?(3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接检验这个差异是否统计显著的方程。9为了比较 、 和 三个经济结构相类似的城市由于不同程度地 实施了某项经济改ABC革政策后的绩效差异,从这三个城市 总计 个企业中按一定规则随机抽取CBAN个样本企业,得到 这些企业的劳动生产率 作为被解释变量,如果没有其它可CBAny获得的数据作为解释变量,并且 城市全面实施这项经济 改革政策, 城市部分实施这项B经济改革政策, 城市没有实 施这项经济改革政策。如何建立计量经济模型检验 、 和A这三个城市之间由于不同程度实施某项经济改革政策后存
15、在的绩效差异?参考答案一、填空题1.直接置换法、对数变换法和 级数展开法。 2.Y*=1/Y,X*=1/X,Y*=+X*3.作为质量因素的代表;作为数量因素的代表;测量截距和斜率的移动;调整季节波动;虚拟变量陷阱。4.LPM 模型;LOGIT 模型;PROBIT 模型;5.OLS; R2;X 变化一个单位导致概率相应的变化;01;异方差。6.非 线性;线性化;非线性;无法线 性化;ML;渐近无偏性;边际效果。7.似然比指数;根据模型做出的正确推断来评价拟合优度。8.似然比。 9.参数估计有偏;高估模型真实误差;统计检验失效。二、选择题1.D; 2.B; 3.C; 4.A; 5.D; 6.B;
16、7.A; 8.D; 9.C; 10.A; 11.D; 12.A三、问答题1答:在现实经济生活中,除了诸如:利润、成本、收入、价格等具有数量特征、影响某个经济问题的变量外,还有一类变 量,如:季 节、民族、自然灾害、战争、政府制定的某项经济政策等也会影响某些经济问题且可能是重要的影响因素,如: 讨论改革前后的经济发展的对比,讨论像空调、冷饮等季节性产 品的销售, 讨论女性化妆品的 销售等问题时,不可避免的要考虑后一类变量。这后一类变量所反映的并不是数量而是某种性质或属性,在引入 这类反映性质或属性的变量时需要先将其定量化。在 计量经济学中,把这些反映性质或属性的变量叫“虚拟变量”。规定具备某种属
17、性时把虚拟变量赋值为“1”,反之为“0” 。2答:以调查某地区居民性别与收入之间的关系为例(设解释变量中只含有虚拟变量),可以用模型表示: iii uDy其中 代表收入, 为虚拟变 量,yi )( 01女男i可以看出, 代表女性的收入, 代表男性与女性收入之间的差额,从式很容易得出:iii uDy)( 1,0)( 男女iii DyE检验假设 ,就是检验男女的平均收入之 间是否有差 额。若: 成立,说明收0 0:H入与性别没有明显关系。若 不成立, 说明收入与性 别有明显关系。0:H3答:举例说明虚拟变量陷阱。如对包含常数项的季节变量模型运用 OLS 法时,如果模型中引入 4 个季节虚拟变量,会
18、造成完全多重共 线性, 则参数估 计量不存在;其次,即便是一般共线性,使用 OLS 法参数估 计量非有效;参数估计量经济 含义不合理;变量的显著性检验失去意义;模型的预测功能失效。7答:在模型设定时,如果遗漏重要变量,那么模型中保留下来的变量系数的 OLS 估计通常是有偏和不一致的。例如,假定工资模型为: iiiii uablereducwage 3210xp如果估计时遗漏了变量 ,得到如下估计模型:ibl iii erecb210即使假定 无关,我 们也容易证明 与 也都是有偏和不一致的,且有:erducxp, niii iieducablbE1231由于 ,并且变量 与 正相关,因此, 是
19、正偏误和不一致的。03educailb四、实践题1. 答:发生完全多重共线性问题,参数不能用最小二乘法进行估计。2. 答:(1)-0.1647 表示咖啡的价格每价格提高 1%,咖啡需求量将下降 0.1647%;0.5115表示人均可支配收入每提高 1%,咖啡需求量将提高 0.5115%;0.1483 表示茶的价格每提高 1%,咖啡需求量将提高 0.1483%。(2)咖啡的需求是缺乏价格弹性的;(3)咖啡和茶是替代品;(4)-0.0089 表示每季度咖啡需求量平均下降 0.0089%;(5)虚拟变量用来区别各个季度卡费需求量不同的季节效应;(6)D2 在统计上是显著的;(7)咖啡的需求存在季节效
20、应。3. 答:(1)选择第二个模型。因 为不同的性别,身高与体重的关系是不同的,并且从模型的估计结果看出,性别虚拟变 量统计上是显著的。(2)如果选择了第一个模型,会 发生异方差问题。(3)D 的系数 23.8238 说明当学生身高每增加 1 英寸时,男生比女生的体重平均多23.8238 磅。4.考虑如下回归模型:(1)b4 的含 义是既是男性又是白人的大学教师,与男性非白人以及白人女性的大学教师年收入的平均差异。(2) X, X, DY/ 4321021 )()E( 5答: ubDbbbC765430,其 他汉 族 1,其 他蒙 族 02 其 他满 族 013,北 方南 方 04D,其 他研
21、 究 生 15 其 他本 科 66答: uXbDbXDbXbC 847635423210,农 村城 市 1D,其 他春 季 012 ,其 他夏 季 013其 他冬 季 0147答: , ubPIbQ3210 01P 8答:(1)finance 的参数的经济含义为:当销售收入与公司股票收益保持不 变时,金融业的 CEO 要比交通运输业的 CEO 多获薪水 15.8 个百分点。其他两个可类似解释。(2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的 utility的参数,即为 28.3%。由于参数的 t 统计值为-2.895,它大于 1%显著性水平下自由度为 203的 t 分布
22、的临界值 1.96,因此这种差异是统计上显著的。(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为 15.8%与 18.1%,因此它们间的差异为 18.1% - 15.8% = 2.3%。一个能直接检验这一差异是否显著的方程为 utransutilyconsprdresalsalry 321210)n()n( 其中,trans 为交通运 输业虚拟变量。 这里对比基准为金融 业,因此 表示了消费品工业与金1融业薪水的百分数差异,其 t 统计值可用来进行显著性检验。9答:把 、 两个城市中第 企业的劳动生产率 写成如下模型:ABiiy, iBAii Dy2,0Ni(1)CBABAA
23、 nnnni 1,1,21 这里,虚拟变量 可表示为 :i(2)其 它个 企 业 来 自 于 城 市第,01AiDAi(3)其 它个 企 业 来 自 于 城 市第,BiBi于是,参数 表示城市 C 企业的期望劳动生产率,而参数 表示城市 A 企业的期望劳动生产率与城市 C 企业的期望 劳动生产率之间的差异,即 + 表示城市 A 企业的期望劳动生产率;参数 表示城市 B 企业的期望劳动生产率与城市 C 企业的期望劳动生产率之间的差异,即 + 表示 B 城市企 业的期望劳动生产率,即:(4)0,1,)(BiAiiii DyE要检验城市 A 企业的期望劳动 生产率与城市 B 企业的期望劳动生产率之间的有无显著差异,改写模型为:, iAiBiAiiy)(其中, ; ; 2,0Ni此时,有:(5)0,1,)( BiAiiii DyE运用 检验看参数 是否显著地不为 0,否 则就认为城市 A 企业的期望劳动生产率与城市tB 企业的期望劳动生产率之间 无显著差异