1、应用回归分析试题(二)1、选择题1. 在对两个变量 , 进行线性回归分析时,有下列步骤:xy对所求出的回归直线方程作出解释;收集数据 、 ) ,(ixiy, ;求线性回归方程;求未知参数; 根据所搜集1,2in的数据绘制散点图。如果根据可行性要求能够作出变量 具有线性相关结论,则在下列,xy操作中正确的是( D)A B C D2. 下列说法中正确的是(B )A任何两个变量都具有相关关系 B人的知识与其年龄具有相关关系 C散点图中的各点是分散的没有规律 D根据散点图求得的回归直线方程都是有意义的3. 下面的各图中,散点图与相关系数 r 不符合的是(B )4. 一位母亲记录了儿子 39 岁的身高,
2、由此建立的身高与年龄的回归直线方程为 ,据此可以预测这个孩子 10 岁时的7.1.yx身高,则正确的叙述是( D )A身高一定是 145.83cm B身高超过 146.00cmC身高低于 145.00cm D身高在 145.83cm 左右5. 在画两个变量的散点图时,下面哪个叙述是正确的( B )(A)预报变量在 轴上,解释变量在 轴上xy(B)解释变量在 轴上,预报变量在 轴上(C)可以选择两个变量中任意一个变量在 轴上x(D)可以选择两个变量中任意一个变量2、填空题1. y 关于 m 个自变量的所有可能回归方程有 个。21m2. H 是帽子矩阵,则 tr(H)=p+1 。3. 回归分析中从
3、研究对象上可分为一元和多元。4. 回归模型的一般形式是 。pxxy2105. (e 为多元回归的残差阵) 。 )()2IeCov3、叙述题1. 引起异常值消除的方法(至少 5 个)?答案:异常值消除方法:(1)重新核实数据;(2)重新测量数据;(3)删除或重新观测异常值数据;(4)增加必要的自变量;(5)增加观测数据,适当扩大自变量取值范围;(6)采用加权线性回归;(7)改用非线性回归模型; 2. 自相关性带来的问题?答案:(1)参数的估计值不再具有最小方差线性无偏性;(2)均方差(MSE)可能严重低估误差项的方差;(3)容易导致对 t 值评价过高,常用的 F 检验和 t 检验失败;(4)当存
4、在序列相关时, 仍然是 的无偏估计量,但在任一特定的样本中; 可能严重扭曲 的真实情况,即最小二乘估计量对抽样波动变得非常敏感;(5)如果不加处理的运用普通最小二乘估计模型参数,用此模型进行预测和结构分析会带来较大的方差甚至错误的解释。3. 回归分析与相关分析的区别与联系是什么?答案:联系:回归分析和相关分析都是研究变量间关系的统计学课题。区别:a.在回归分析中,变量 y 称为因变量,处在被解释变量的特殊位。在相关分析中,变量 x 和变量 y 处于平等地位,即研究变量y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中涉及的变量 y 与变量 x 全是随机变量
5、。而在回归分析中,因为变量是随机的,自变量可以是随机变量,也可以是非随机的确定量。c.相关分析 的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以提示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。4. 叙述一元回归模型的建模过程?答案:第一步:提出因变量与自变量;第二步:收集数据;第三步:画散点图;第四步:设定理论模型;第五步:用软件计算,输出计算结果;第六步:回归诊断,分析输出结果。4、证明题1. 证明 是 的无偏估计。0证明:E( )=E( - )Y1X=E( - )ni1nixiL1iY=E( )ni ixiX1(=E ( )ni xiL1)(0iX
6、1=E 0ni xi1)(i= E( )0ni xiLX1(i=2. 当 时,证明 。y),(2nIXN)(,12XN证明:E( )=E( ) )T1yT=( ) E(y)=( ) E(X + )XT1T=( ) X=D( )=cov( , )=cov( ) ,( ) )XT1yTX1yT=( ) cov(y,y)( ) )=( ) X( )T1T2T1= ( ) ( )2XX= ( )T13. 证明,在多元线性回归中,最小二乘估计 与残差向量 e 不相关,即 0),(eCov证明: )(,)(1yHIXCovT0)()( )(112112TT TTTXXIv参考题:1. 某同学由 与 之间的
7、一组数据求得两个变量间的线性回归方程xy为 ,已知:数据 的平均值为 2,数据 的平均值为 3,则 ybaxy( A )A回归直线必过点(2,3) B回归直线一定不过点(2,3)C点(2,3)在回归直线上方 D点(2,3)在回归直线下方2. 在一次试验中,测得 的四组值分别是),(yx则 Y 与 X 之间的回归直线方程为( A )54),3(,2),1(DCBAA yx1 B 2 C y2x1 3. 相关系数 的意义是:(1) , (2) 越接近于yxLr 1|r|r1,相关程度越大, (3) 越接近于 0,相关程度越小,|r4. DW 的取值范围为: 40DW5.叙述自变量选择的准则答案:准则 1:自由度调整复决定系数 达到最大;2aR准则 2:赤池信息量 AIC 达到最小;准则 3: 统计量达到最小。pC