1、*第一章 绪论(一)基本知识类题型1-1 什么是计量经济学?1-3 计量经济学方法与一般经济数学方法有什么区别?它在经济学科体系中的作用和地位是什么?1-6计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?1-7试结合一个具体经济问题说明建立与应用计量经济学模型的主要步骤。1-9计量经济学模型主要有哪些应用领域?各自的原理是什么?1-12模型的检验包括几个方面?其具体含义是什么?1-17下列假想模型是否属于揭示因果关系的计量经济学模型?为什么? S t 112.0 0.12Rt 其中 S t 为第 t 年农村居民储蓄增加额(亿元)、 R t 为第 t 年城镇居民
2、可支配收入总额(亿元)。 S t 1 4432.0 0.30Rt 其中 S t 1 为第( t 1)年底农村居民储蓄余额(亿元)、R t 为第 t 年农村居民纯收入总额(亿元)。1-18指出下列假想模型中的错误,并说明理由:(1) RS t 8300.0 0.24 RI t 112.IVt其中, RS t 为第 t 年社会消费品零售总额(亿元), RI t 为第 t 年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和), IV t 为第 t 年全社会固定资产投资总额1(亿元)。(2) C t 180 1.2Yt其中, C 、Y 分别是城镇居民消费支出和可支配收入。(3) l
3、n Y t 1.15 1.62 ln Kt 0.28ln Lt其中, Y 、 K 、 L 分别是工业总产值、工业生产资金和职工人数。1-19下列假想的计量经济模型是否合理,为什么?(1) GDP i GDPi 其中, GDP i (i 1,2,3) 是第 i 产业的国内生产总值。(2) S 1 S2 其中, S 1 、 S 2 分别为农村居民和城镇居民年末储蓄存款余额。(3) Y t 1 I t 2 Lt 其中, Y 、 I 、 L 分别为建筑业产值、建筑业固定资产投资和职工人数。(4) Y t Pt 其中, Y 、 P 分别为居民耐用消费品支出和耐用消费品物价指数。(5)财政收入 f (财政
4、支出 ) (6)煤炭产量 f (L, K , X1 , X 2 ) 其中, L 、 K 分别为煤炭工业职工人数和固定资产原值, X 1 、 X 2 分别为发电量和钢铁产量。1-20模型参数对模型有什么意义?2习题参考答案第一章 绪论1-1什么是计量经济学?答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。1-6计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?3答:计量经济学的研究对象是经济现象,是研究经济现象中的具体数量规律(或者说,计量经济学是利用数学方法,根据统计测定
5、的经济数据,对反映经济现象本质的经济数量关系进行研究)。计量经济学的内容大致包括两个方面:一是方法论,即计量经济学方法或理论计量经济学;二是应用,即应用计量经济学;无论是理论计量经济学还是应用计量经济学,都包括理论、方法和数据三种要素。计量经济学模型研究的经济关系有两个基本特征:一是随机关系;二是因果关系。1-9答:计量经济学模型主要有以下几个方面的用途:结构分析,即研究一个或几个经济变量发生变化及结构参数的变动对其他变量以至整个经济系统产生何种的影响;其原理是弹性分析、乘数分析与比较静力分析。经济预测,即用其进行中短期经济的因果预测;其原理是模拟历史,从已经发生的经济活动中找出变化规律;政策
6、评价,即利用计量经济模型定量分析政策变量变化对经济系统运行的影响,是对不同政策执行情况的“模拟仿真”。检验与发展经济理论,即利用计量经济模型和实际统计资料实证分析某个理论假说的正确与否;其原理是如果按照某种经济理论建立的计量经济模型可以很好地拟合实际观察数据,则意味着该理论是符合客观事实的,否则则表明该理论不能说明客观事实。1-10答:5第二章 经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回
7、归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的 t 检验完
8、成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov 定理表明 OLS 估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。二、典型例题分析例 6对于人均存款与人均收入之间的关系式
9、 S t Yt t 使用美国 36 年的年度数据得如下估计模型,括号内为标准差:t 384.105 0.067 tS Y(151.105) (0.011)R2 0.538 199.023(1) 的经济解释是什么?(2) 和 的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在 1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?解答:(1) 为收入的边际储蓄倾向,表示人均收入每增加 1 美元时人均储蓄的预期平均变化量。(
10、2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此 符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期 的符号为正。实际的回归式中, 的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度,表明收入的变化可以解释储蓄中 53.8 %的变动。(4)检验单个参数采用 t 检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下 t
11、 分布的自由度为 n-2=36-2=34。由 t 分布表知,双侧 1% 下的临界值位于2.750 与 2.704 之间。斜率项计算的 t 值为 0.067/0.011=6.09,截距项计算的 t 值为384.105/151.105=2.54。可见斜率项计算的 t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。三、习题6(一)基本知识类题型2-1解释下列概念:1) 总体回归函数 11) 最大似然法2) 样本回归函数 12) 估计量的标准差3) 随机的总体回归函数 13) 总离差平方和4) 线性回归模型 14) 回归平方和5) 随机误差项(u i)和残差项(e
12、 i) 15) 残差平方和6) 条件期望 16) 协方差7) 非条件期望 17) 拟合优度检验8) 回归系数或回归参数 18) t 检验9) 回归系数的估计量 19) F 检验10) 最小平方法2-2判断正误并说明理由:1) 随机误差项u i和残差项e i是一回事2) 总体回归函数给出了对应于每一个自变量的因变量的值3) 线性回归模型意味着变量是线性的4) 在线性回归模型中,解释变量是原因,被解释变量是结果5) 随机变量的条件均值与非条件均值是一回事2-3回答下列问题:1) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计?2) 总体方差与参数估计误差的区别与联系。3)
13、随机误差项u i和残差项e i的区别与联系。4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的拟合优度问题?5) 为什么用决定系数R 2评价拟合优度,而不用残差平方和作为评价标准?6) R2 检验与 F 检验的区别与联系。7) 回归分析与相关分析的区别与联系。78) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别?9) 为什么要进行解释变量的显著性检验?10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?2-2下列方程哪些是正确的?哪些是错误的?为什么? y t x t t 1,2, , n y t x t t t 1,2, ,
14、n y t x t t t 1,2, , n y x t 1,2, , nt t t y t x t t 1,2, , n y x t 1,2, , nt t y t x t t t 1,2, , n y x t 1,2, , nt t t其中带“”者表示“估计值”。(二)基本证明与问答类题型2-4对于一元线性回归模型,试证明:(1) E( y i ) xi(2) D( y i ) 28(3) Cov( y i , y j ) 0 i j2-12线性回归模型y t x t t t 1,2, , n的 0 均值假设是否可以表示为 1 n t 0 ?为什么? n t 1(三)基本计算类题型2-21
15、下面数据是对 X 和 Y 的观察值得到的。Y i=1110; Xi=1680; X iYi=204200 X i2=315400; Y i2=133300假定满足所有的古典线性回归模型的假设,要求:(1)b 1和b 2?(2)b 1和b 2的标准差?(3)r2?(4)对B 1、B 2分别建立 95%的置信区间?利用置信区间法,你可以接受零假设:B 2=0吗?四、习题参考答案2-1答:总体回归函数是指在给定 X i 下的Y 的分布的总体均值与 X i 有函数关系。样本回归函数指对应于某个给定的 X 的Y 值的一个样本而建立的回归函数。 随机的总体回归函数指含有随机误差项的总体回归函数,形如:Yi
16、 1 2 X i ui线性回归模型指对参数 为线性的回归,即 只以它的 1 次方出现,对 X 可以是或不是线性的。随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。14残差项是一随机变量,针对样本回归函数而言。条件期望又称条件均值,指 X 取特定 X i 值时的Y 的期望值。回归系数(或回归参数)指 1 、 2 等未知但却是固定的参数。 回归系数的估计量指用 1 、 2 等表示的用已知样本所提供的信息去估计出来的量。估计量的标准差指度量一个变量变化大小的标准。总离差平方和用 TSS 表示,用以度量被解释变量的总变动。回归平方和用 ESS 表示,用以度量由解释变量变化引起的被解释变量的
17、变化。残差平方和用 RSS 表示,用以度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的。协方差用 Cov(X,Y)表示,是用来度量 X 、Y 二个变量同时变化的统计量。2-2答:错;错;错;错;错。(理由见本章其他习题答案)152-14答:线性回归模型: y t xt t 中的 0 均值假设 E(u 2 ) 0 不可以表示为:1 n t 0 ,因为前者表示取完所的可能的样本组合后的平均状态,而后者只是一个样本的 n t 1平均值。20第三章、经典单方程计量经济学模型:多元线性回归模型一、内容提要本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。
18、主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性 F 检验,并讨论了 F 检验与拟合优度检验的内在联系。本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注
19、意各回归参数的具体经济含义。本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以 F 检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的 2 分布为检验统计量的分布特征。
20、非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。二、典型例题分析例 1某地区通过一个样本容量为 722 的调查数据得到劳动力受教育的一个回归方程为edu 10.36 0.094sibs 0.131medu 0.210 feduR2=0.214式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与 fedu 分别为母亲与父亲受到教育的年数。问(1)sibs 是否具有预期的影响?为什么?若 medu 与 fedu 保持不变,为了使预测的受教育水平减少一年,需要 sibs 增加多少?(2)请对 medu 的系数给予适当的解释。(3)如果两个劳动力都没有兄弟
21、姐妹,但其中一个的父母受教育的年数为 12 年,另一个的父母受教育的年数为 16 年,则两人受教育的年数预期相差多少?解答:(1)预期 sibs 对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094 表明,在其他条件不变的情况下,每增加 1 个兄弟姐妹,受教育年数会减少 0.094 年,因此,要减少 1 年受教育的时间,兄弟姐妹需增加 1/0.094=10.6 个。(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加 1 年受教育的机会,其
22、子女作为劳动者就会预期增加 0.131 年的教育机会。(3)首先计算两人受教育的年数分别为10.36+0.13112+0.21012=14.452 10.36+0.13116+0.21016=15.816因此,两人的受教育年限的差别为 15.816-14.452=1.364例 2以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1 )与利润占销售额的比重(X2)为解释变量,一个有 32 容量的样本企业的估计结果如下:Y 0.472 0.32 log(X1 ) 0.05X 2(1.37) (0.22) (0.046)R2 0.099其中括号中为系数估计值的标准差。(1)解
23、释 log(X1)的系数。如果 X1 增加 10%,估计 Y 会变化多少个百分点?这在经济上是一个很大的影响吗?(2)针对 R&D 强度随销售额的增加而提高这一备择假设,检验它不虽 X1 而变化的假设。分别在 5%和 10%的显著性水平上进行这个检验。(3)利润占销售额的比重 X2 对 R&D 强度 Y 是否在统计上有显著的影响?解答:(1)log(x1)的系数表明在其他条件不变时,log(x1)变化 1 个单位,Y 变化的单位数,即 Y=0.32log(X1)0.32(X1/X1)=0.32100%,换言之,当企业销售 X1 增长 100%时,企业研发支出占销售额的比重 Y 会增加 0.32
24、 个百分点。由此,如果 X1 增加 10% ,Y 会增加 0.032 个百分点。这在经济上不是一个较大的影响。(2)针对备择假设 H1: 1 0 ,检验原假设 H0 : 1 0 。易知计算的 t 统计量的值为 t=0.32/0.22=1.468。在 5%的显著性水平下,自由度为 32-3=29 的 t 分布的临界值为 1.699(单侧),计算的 t 值小于该临界值,所以不拒绝原假设。意味着 R&D 强度不随销售额的增加而变化。在 10%的显著性水平下, t 分布的临界值为 1.311,计算的 t 值小于该值,拒绝原假设,意味着 R&D 强度随销售额的增加而增加。(3)对 X2,参数估计值的 t
25、 统计值为 0.05/0.46=1.087,它比在 10%的显著性水平下的临界值还小,因此可以认为它对 Y 在统计上没有显著的影响。例 3下表为有关经批准的私人住房单位及其决定因素的 4 个模型的估计量和相关统计值(括号内为 p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国 40 个城市的数据。模型如下:hou sin g 0 1density 2 value 3income 4 popchang 5unemp 6localtax 7 statetax 式中 housing实际颁发的建筑许可证数量, density每平方英里的人口密度,value 自由房屋的均值(单位:百美元),
26、income平均家庭的收入(单位:千美元),popchang 19801992 年的人口增长百分比,unemp失业率,localtax人均交纳的地方税,statetax人均缴纳的州税变量 模型 A 模型 B 模型 C 模型 DC 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44)Density 0.075 (0.43) 0.062 (0.32) 0.042 (0.47)Value -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07)Income 110.41 (0.14) 133.03 (0.
27、04) 125.71 (0.05) 116.60 (0.06)Popchang 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08)Unemp -76.55 (0.48)Localtax -0.061 (0.95)Statetax -1.006 (0.40) -1.004 (0.37)RSS 4.763e+7 4.843e+7 4.962e+7 5.038e+7R2 0.349 0.338 0.322 0.3121.488e+6 1.424e+6 1.418e+6 1.399e+6 2AIC 1.776e+6 1.634e+6 1.593e+
28、6 1.538e+6(1)检验模型 A 中的每一个回归系数在 10%水平下是否为零(括号中的值为双边备择 p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2)在模型A中,在 10%水平下检验联合假设H 0: i =0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。(3)哪个模型是“最优的”?解释你的选择标准。(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。解答:(1)直接给出了 P-值,所以没有必要计算 t-统计值以及查 t 分布表。根据题意,如果p-值0
29、,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期 40,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期3 估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型 A 是这种情况,但它们的影响却非常微弱。4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:Y 0 1 X1 2 X 2 3 X 3 你想检验的虚拟假设是 H0: 1 22 1 。 (1)用 1 , 2 的方差及其协方差求出Var( 1 22 ) 。(2)写
30、出检验 H0: 1 22 1 的 t 统计量。(3)如果定义 1 22 ,写出一个涉及 0、 、 2和 3的回归方程,以便能直接得到 估计值 及其标准误。解答:(1)由数理统计学知识易知 Var(1 22 ) Var(1 ) 4Cov(1 , 2 ) 4Var(2 )(2)由数理统计学知识易知 1 22 1 t ,其中 se (1 22 ) 为 ( 1 22 ) 的标准差。se(1 22 )( 3)由 1 22 知 1 22 ,代入原模型得Y 0 ( 22 ) X1 2 X 2 3 X 3 0 X1 2 (2X1 X 2 ) 3 X 3 这就是所需的模型,其中估计值 及其标准误都能通过对该模型
31、进行估计得到。三、习题(一)基本知识类题型3-1解释下列概念:1) 多元线性回归 6) 参数估计量的置信区间2) 虚变量 7) 被解释变量预测值的置信区间3) 正规方程组 8) 受约束回归4) 无偏性 9) 无约束回归5) 一致性 10) 参数稳定性检验3-2观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1) Yi 0 1 X i3 i2) Yi 0 1 log X i i3) logYi 0 1 log X i i4) Yi 0 1 (2 X i ) i5) Yi 1 X0 i i6) Y 1 (1 X 1 ) i 0 i i7) Yi 0 1 X1i 2 X 2i
32、10 i3-3多元线性回归模型与一元线性回归模型有哪些区别?3-4为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?3-5多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?3-6请说明区间估计的含义。(二)基本证明与问答类题型3-7什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:yi 0 1 x1i 2 x2i kxkiui,i1,2, , n 的正规方程组,及其推导过程。3-8对于多元线性回归模型,证明:(1) ei 0 ( ) 2 yi ei ( 0 1 x1
33、i k xki )ei 03-9为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?3-10在多元线性回归分析中, t 检验与 F 检验有何不同?在一元线性回归分析中二者是否有等价的作用?3-11设有模型: y 0 1 x1 2 x2 u ,试在下列条件下:(1) 1 2 1(2) 1 2分别求出 1 和 2 的最小二乘估计量。3-12多元线性计量经济学模型y i 0 1 x1i 2 x 2 i k xki i i 1,2,n (2.11.1)的矩阵形式是什么?其中每个矩阵的含义是什么?熟练地写出用矩阵表示的该
34、模型的普通最小二乘参数估计量,并证明在满足基本假设的情况下该普通最小二乘参数估计量是无偏和有效的估计量。3-13有如下生产函数: ln X 1.37 0.632 ln K 0.452 ln L(0.257) (0.219)R2 0.98 Cov(bK , bL ) 0.055其中括号内数值为参数标准差。请检验以下零假设:(1)产出量的资本弹性和劳动弹性是等同的;(2)存在不变规模收益,即 1 。3-14对模型 y i 0 1 x1i 2 x2i kxkiui应用 OLS法,得到回归方程如下: yi 0 1 x1i 2 x2i k xki要求:证明残差 i yi yi 与 y i 不相关,即:
35、yii 0 。3-153-16考虑下列两个模型: 、 yi 1 2 x2i 3 x3i ui 、 ( yi x2i ) 1 2 x2i 3 x3i ui 要求:( 1)证明: 2 2 1 , 1 1 , 3 3(2)证明:残差的最小二乘估计量相同,即: u i ui(3)在何种情况下,模型的拟合优度 R 22 会小于模型 拟合优度 R 12 。(三)基本计算类题型3-20试对二元线性回归模型:Y i 0 1 X1i 2 X 2i ui ,( i 1,2, , n )作回归分 析,要求:( 1)求出未知参数 0 , 1 , 2 的最小二乘估计量 0 , 1, 2;(2)求出随机误差项 u 的方差
36、 2 的无偏估计量;(3)对样本回归方程作拟合优度检验;(4)对总体回归方程的显著性进行 F 检验;(5)对 1 , 2 的显著性进行 t 检验;( 6)当 X 0 (1, X10 , X 20 ) 时,写出 E(Y0 | X 0 ) 和 Y0的置信度为 95%的预测区间。3-21下表给出三变量模型的回归结果:方差来源 平方和( SS) 自由度(d.f.) 平方和的均值 (MSS)来自回归 65965 来自残差 总离差(TSS) 66042 14要求:(1)样本容量是多少?(2)求 RSS?(3)ESS 和 RSS 的自由度各是多少?(4)求 R 2 和 R 2 ?(5)检验假设: X 2 和
37、 X 3 对 Y 无影响。你用什么假设检验?为什么?(6)根据以上信息,你能否确定 X 2 和 X 3 各自对 Y 的贡献吗?3-22下面给出依据 15 个观察值计算得到的数据:Y 367.693 , X 2 402.760 , X 3 8.0 , y i2 66042.269 x22i 84855.096 , x 32i 280.0 , yix2i74778.346 yi x3i 4250.9 , x2i x3i 4796.0其中小写字母代表了各值与其样本均值的离差。要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出 R 2 与 R 2 ?(3)估计 B 2 、 B 3 95%
38、的置信区间;(4)在 5% 下,检验估计的每个回归系数的统计显著性(双边检验);(5)检验在 5% 下所有的部分系数都为零,并给出方差分析表。3-23考虑以下方程(括号内为估计标准差):Wi 8.562 0.364Pt 0.004Pt1 2.560Ut(0.080) (0.072) (0.658) n 19 R2 0.873其中:W t 年的每位雇员的工资和薪水P t 年的物价水平U t 年的失业率要求:(1)对个人收入估计的斜率系数进行假设检验;(尽量在做本题之前不参考结果)(2)讨论 P t 1 在理论上的正确性,对本模型的正确性进行讨论; P t 1 是否应从方程中删除?为什么?3-24
39、下表是某种商品的需求量、价格和消费者收入十年的时间序列资料:年份 1 2 3 4 5 6 7 8 9 10需求量 59190 65450 62360 64700 67400 64440 68000 72400 75710 70680价 格 23.56 24.44 32.07 32.46 31.15 34.14 35.30 38.70 39.63 46.68收入 76200 91200 106700 111600 119000 129200 143400 159600 180000 193000要求:( 1)已知商品需求量 Y 是其价格 X1 和消费者收入 X 2 的函数,试求 Y 对 X1 和
40、 X 2 的最 小二乘回归方程:Y 0 1 X1 2 X 2(2)求 Y 的总变差中未被 X1 和 X 2 解释的部分,并对回归方程进行显著性检验; (3)对回归参数 1 , 2 进行显著性 t 检验。3-25参考习题 2-28 给出的数据,要求:(1)建立一个多元回归模型,解释 MBA 毕业生的平均初职工资,并且求出回归结果;(2)如果模型中包括了 GPA 和 GMAT 分数这两个解释变量,先验地,你可能会遇到什么问题,为什么?(3)如果学费这一变量的系数为正、并且在统计上是显著的,是否表示进入最昂贵的商业学校是值得的。学费这个变量可用什么来代替?3-26经研究发现,学生用于购买书籍及课外读
41、物的支出与本人受教育年限和其家庭收入水平有关,对 18 名学生进行调查的统计资料如下表所示:学生 购买书籍及课外 受教育年限 家庭月可支配收序号 读物支出 Y (元 / X1 (年) 入 X 2 (元 /月)1 450.5 4 171.22 507.7 4 174.23 613.9 5 204.34 563.4 4 218.75 501.5 4 219.46 781.5 7 240.47 541.8 4 273.58 611.1 5 294.89 1222.1 10 330.210 793.2 7 333.111 660.8 5 366.012 792.7 6 350.913 580.8 4
42、357.914 612.7 5 359.015 890.8 7 371.916 1121.0 9 435.317 1094.2 8 523.918 1253.0 10 604.1要求:(1)试求出学生购买书籍及课外读物的支出 Y 与受教育年限 X 1 和家庭收入水平 X 2 的估计 的回归方程:Y 0 1 X1 2 X 2(2)对 1 , 2 的显著性进行 t 检验;计算 R 2 和 R 2 ;(3)假设有一学生的受教育年限 X 1 10 年,家庭收入水平 X 2 480元/月,试预测该学生全年购买书籍及课外读物的支出,并求出相应的预测区间(=0.05)。3-27根据 100 对( x 1 ,
43、 y )的观察值计算出: x12 12 xy9 y230要求:(1)求出一元模型 y 0 1 x1 u 中的 1 的最小二乘估计量及其相应的标准差估计量;(2)后来发现 y 还受 x 2 的影响,于是将一元模型改为二元模型 y 0 1 x1 2 x2 v ,收集 x 2 的相应观察值并计算出: x22 6 x2y8 x1x22求二元模型中的 1 , 2 的最小二乘估计量及其相应的标准差估计量;( 3)一元模型中的 1 与二元模型中的 1 是否相等?为什么?3-28考虑以下预测的回归方程:Y 120 0.10F 5.33RS R 2 0.50t t t其中: Y t 第 t 年的玉米产量(蒲式耳
44、/ 亩)Ft 第 t 年的施肥强度(磅 /亩)RSt 第 t 年的降雨量(英寸)要求回答下列问题:(1)从 F 和 RS 对 Y 的影响方面,说出本方程中系数 0.10 和 5.33 的含义;(2)常数项 120 是否意味着玉米的负产量可能存在?(3)假定 F 的真实值为 0.40 ,则估计值是否有偏?为什么?(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着 RS 的真实值绝对不等于 5.33 ?为什么?3-29已知线性回归模型 Y XB U 式中 U (0, 2 I ), n 13 且 k 3( n 为样本容量, k 为参数的个数),由二次型 (Y XB)(Y XB) 的最小化得到如下线性方程组: 1 2 2 3 3 21 52 3 9 12 63 8要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;(2)如果 YY 53 ,求 2 ;