1、第三章 多元线性回归模型一、名词解释1、多元线性回归模型2、调整的决定系数 2R3、偏回归系数4、正规方程组5、方程显著性检验二、单项选择题1、在模型 的回归分析结果中,有 ,0123tttttYX462.58F,则表明 ( .Fp的 值)A、解释变量 对 的影响不显著 2ttB、解释变量 对 的影响显著1XYC、模型所描述的变量之间的线性关系总体上显著D、解释变量 和 对 的影响显著2t1tt2、设 为回归模型中的实解释变量的个数, 为样本容量。则对回归模型进行总体显著性k n检验( 检验) 时构造的 统计量为 ( FF)A、 B、 (1)ESkRn(1)ESkFRnC、 D、FT3、已知二
2、元线性回归模型估计的残差平方和为 ,估计用样本容量为 ,280ie23n则随机误差项 的方差的 OLS 估计值为 ( t)A、33.33 B、 40 C、 38.09 D 、36.364、在多元回归中,调整后的决定系数 与决定系数 的关系为 ( 2R2)A、 B、 2R2C、 D、 与 的关系不能确定2R2R5、下面说法正确的有 ( )A、时间序列数据和横截面数据没有差异 B、对回归模型的总体显著性检验没有必要C、总体回归方程与样本回归方程是有区别的 D、决定系数 不可以用于衡量拟合优度2R6、根据调整的可决系数 与 F 统计量的关系可知,当 时,有 ( 21R)A、F=0 B、F=1 C、F
3、 + D、F=-7、线性回归模型的参数估计量 是随机向量 的函数,即 。 是 ( Y1()XY)A、随机向量 B、非随机向量 C、确定性向量 D、常量8、下面哪一表述是正确的 ( )A、线性回归模型 的零均值假设是指01iiiYX10niB、对模型 进行方程显著性检验(即 检验) ,检验的零假2iiii F设是 012:HC、相关系数较大意味着两个变量存在较强的因果关系D、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系9、对于 ,如果原模型满足线性模型的基本假设则012iiikiYXXe在零假设 下,统计量 (其中 是 的标准误差)服从 ( j ()jjs()jsj)
4、A、 B、 C、 D、()tnk(1tnk1,Fkn(,1)Fkn10、下列说法中正确的是 ( )A、如果模型的 R2 很高,我们可以认为此模型的质量较好B、如果模型的 R2 很低,我们可以认为此模型的质量较差C、如果某一参数不能通过显著性检验,我们应该剔除该解释变量D、如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量三、多项选择题1、残差平方和是指 ( )A、随机因素影响所引起的被解释变量的变差B、解释变量变动所引起的被解释变量的变差C、被解释变量的变差中,回归方程不能作出解释的部分D、被解释变量的总离差平方和回归平方之差E、被解释变量的实际值与拟合值的离差平方和2、回归平方和是
5、指 ( )A、被解释变量的观测值 与其均值 的离差平方和iYB、被解释变量的回归值 与其均值 的离差平方和C、被解释变量的总体平方和 与残差平方和 之差2i2ieD、解释变量变动所引起的被解释变量的离差的大小E、随机因素影响所引起的被解释变量的离差大小3、对模型满足所有假定条件的模型 进行总体显著性检验,如012iiiiYX果检验结果总体线性关系显著,则很可能出现 ( )A、 B、120120,C、 D、,E、 124、设 k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所用的 F 统计量可以表示为 ( )A、 B、2()/(1)iiYnke2()/1iYkenC、
6、D、2/(1)1)Rnk2(1)/)RkE、2/()5、在多元回归分析中,调整的可决系数 与可决系数 之间 ( 2R2)A、 B、2R2C、 只可能大于零 D、 可能为负值2R2RE、 不可能为负值四、判断题1、满足基本假设条件下,样本容量略大于解释变量个数时,可以得到各参数的唯一确定的估计值,但参数估计结果的可靠性得不到保证 ( )2、在多元线性回归中,t 检验和 F 检验缺一不可。 ( )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零 ( )4、多元线性回归中,可决系数 是评价模型拟合优度好坏的最佳标准。 ( 2R)5、多元线性回归模型中的偏回归系数,表示在其他解释变
7、量保持不变的情况下,对应解释变量每变化一个单位时,被解释变量的变动。 ( )五、简答题1、多元线性回归模型与一元线性回归模型有哪些区别?2、为什么说最小二乘估计量是最优线性无偏估计量?对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是什么?六、计算分析题1、某地区通过一个样本容量为 722 的调查数据得到劳动力受教育年数的一个回归方程为 R2=0.21410.36940.130.21i i i iedusbmedufe式中, 为劳动力受教育年数, 为劳动力家庭中兄弟姐妹的个数, 与medu分别为母亲与父亲受到教育的年数。问f(1)sibs 是否具有预期的影响?为什么?若
8、与 保持不变,为了使预测的受ef教育水平减少一年,需要 增加多少?sib(2)请对 的系数给予适当的解释。medu(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为 12 年,另一个的父母受教育的年数均为 16 年,则两人受教育的年数预期相差多少年?2、考虑以下方程(括号内为标准差): 18.560.34.2.560t tttWPU(0.080) (0.072) (0.658) 19n873.02R其中: 年的每位雇员的工资t 年的物价水平 年的失业率tU要求:(1)进行变量显著性检验; (2)对本模型的正确性进行讨论, 是否应从方程中删除?为什么?1tP3、以企业研发支出(
9、R&D)占销售额的比重(单位: %)为被解释变量(Y) ,以企业销售额(X 1)与利润占销售额的比重( X2)为解释变量,一个容量为 32 的样本企业的估计结果如下: 1220.47.3ln0.5(1)()(46).9i iiYXR其中,括号中的数据为参数估计值的标准差。(1)解释 ln(X1)的参数。如果 X1 增长 10%,估计 Y 会变化多少个百分点?这在经济上是一个很大的影响吗?(2)检验 R&D 强度不随销售额的变化而变化的假设。分别在 5%和 10%的显著性水平上进行这个检验。(3)利润占销售额的比重 X2 对 R&D 强度 Y 是否在统计上有显著的影响?4、假设你以校园内食堂每天
10、卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。假设你看到如下的回归结果(括号内为标准差) ,但你不知道各解释变量分别代表什么。iiiii XXY 4321 9.561.07.4.286.0 63.02R5n(2.6) (6.3) (0.61) (5.9) 试判定各解释变量分别代表什么,说明理由。 5、下表给出一二元模型的回归结果。方差来源 平方和( SS) 自由度(d.f.)来自回归(ESS) 65965 来自残差(RSS) _ 总离差(TSS) 66042 14求:(1)样本容量是多少?RSS 是多少?ESS
11、和 RSS 的自由度各是多少?(2) 和 ?R2(3)检验假设:解释变量总体上对 无影响。你用什么假设检验?为什么?Y(4)根据以上信息,你能确定解释变量各自对 的贡献吗?6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型: 0123iiiiiYX你想检验的虚拟假设是 : 。0H121(1)用 的方差及其协方差求出 。21, )(2Var(2)写出检验 H0: 的 t 统计量。21(3)如果定义 ,写出一个涉及 0、 2 和 3 的回归方程,以便能直接得到 估计值 及其样本标准差。7、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否
12、修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:方程 A: 123125.0.0.5i iiiYXX75.02R方程 B: 43473其中: 第 i 天慢跑者的人数 i第 i 天降雨的英寸数1X第 i 天日照的小时数2i第 i 天的最高温度(按华氏温度)3第 i 天的后一天需交学期论文的班级数4iX请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?8、考虑以下预测的回归方程:ttt RSFY3.510.250.2其中: 为第 t 年的玉米产量(吨 /亩) ; 为第 t 年的施肥强度(千克/
13、亩) ; 为第tRSt 年的降雨量(毫米) 。要求回答下列问题:(1)从 和 对 的影响方面,说出本方程中系数 和 的含义;FRSY10.3.5(2)常数项 是否意味着玉米的负产量可能存在?120(3)假定 的真实值为 ,则 的估计量是否有偏?为什么?40.F(4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计,则是否意味着 的真实值绝对不等于 ?为什么?RS3.59、已知描述某经济问题的线性回归模型为 ,并已根据样本012iiiiYX容量为 32 的观察数据计算得, , ,0.582.4312.)(X48.5e26TS查表得 , 。9,05.F76.)9(.t(1)求
14、模型中三个参数的最小二乘估计值(2)进行模型的置信度为 95%的方程显著性检验(3)求模型参数 2 的置信度为 99%的置信区间。10、下表为有关经批准的私人住房单位及其决定因素的 4 个模型的估计和相关统计值(括号内为 p 值) (如果某项为空,则意味着模型中没有此变量) 。数据为美国 40 个城市的数据。模型如下:staexloctxunemppochangincmvudsiygho765 43210si式中:housing实际颁发的建筑许可证数量; density每平方英里的人口密度,value自由房屋的均值(单位:百美元) ;income平均家庭的收入(单位:千美元) ;popchan
15、g19801992 年的人口增长百分比;unemp失业率;localtax人均交纳的地方税;statetax人均缴纳的州税。变量 模型 A 模型 B 模型 C 模型 DC 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44)Density 0.075 (0.43) 0.062 (0.32) 0.042 (0.47)Value -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07)Income 110.41 (0.14) 133.03 (0.04) 125.71 (0.05) 116.60 (0.0
16、6)Popchang 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08)Unemp -76.55 (0.48)Localtax -0.061 (0.95)Statetax -1.006 (0.40) -1.004 (0.37)RSS 4.763e+7 4.843e+7 4.962e+7 5.038e+7R2 0.349 0.338 0.322 0.3121.488e+6 1.424e+6 1.418e+6 1.399e+6AIC 1.776e+6 1.634e+6 1.593e+6 1.538e+6(1)检验模型 A 中的每一个回归系数在 10%水平下是否为零(括号中的值为双边备择 p-值) 。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2)在模型 A 中,在 5%水平下检验联合假设 H0: i =0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。(3)哪个模型是“最优的”?解释你的选择标准。(4)说明你对最优模型中参数符号的预期并解释原因,确认其是否为正确符号。