1、回归分析一.选择题:本大题共 5 小题,每小题 5 分,共 25 分.1. 在画两个变量的散点图时,下面叙述正确的是 ( B )A.预报变量在 x 轴上,解释变量在 y 轴上B.解释变量在 x 轴上,预报变量在 y 轴上C.可以选择两个变量中任意一个变量在 x 轴上D.可以选择两个变量中任意一个变量在 y 轴上2. 一位母亲记录了她儿子 3 到 9 岁的身高,数据如下表:年龄(岁) 3 4 5 6 7 8 9身高() 94.8 104.2 108.7 117.8 124.3 130.8 139.0由此她建立了身高与年龄的回归模型 ,她用这个模型预测儿子 10 岁时的xy1.93身高,则下列的叙
2、述正确的是 ( C )A.她儿子 10 岁时的身高一定是 145.83 B.她儿子 10 岁时的身高在 145.83以上C.她儿子 10 岁时的身高在 145.83左右 D.她儿子 10 岁时的身高在 145.83以下3. 在建立两个变量 Y 与 x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 R2如下,其中拟合得最好的模型是 ( A )A.模型 1 的相关指数 R2为 0.98 B.模型 2 的相关指数 R2为 0.80C.模型 3 的相关指数 R2为 0.50 D.模型 4 的相关指数 R2为 0.254. 下列说法正确的有 ( B )回归方程适用于一切样本和总体。 回归方程
3、一般都有时间性。样本取值的范围会影响回归方程的适用范围。回归方程得到的预报值是预报变量的精确值。A. B. C. D. 5. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( B )A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数 R2二.填空题(本大题共 4 小题,每小题 5 分,共 20 分)6. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题(1) ;(2) ; (3) ; (4) .7. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50 个州的成年人受过 9 年或更少教育的百分比()和收入低于官方规定的贫困线
4、的人数占本州人数的百分比( )的数据,建立的回归直线方程如下 ,斜率的估计等于 0.8y 0.846yx说明 ,成年人受过 9 年或更少教育的百分比()和收入低于官方的贫困线的人数占本州人数的百分比( )之间的相关系数 (填充“大于 0”或“小于 0”)y8. 已知回归直线的斜率的估计值是 1.23,样本点的中心为(4,5),则回归直线的方程是 9. 线性回归模型 y=bx+a+e 中,b=_,a=_e 称为_ .三.解答题:本大题共 5 小题,共 55 分.解答应写出文字说明,证明过程或演算步骤.10. (本小题 10 分) 为了决定在白鼠中血糖的减少量和注射胰岛素 A 的剂量间的关系,将同
5、样条件下繁殖的 7 只白鼠注射不同剂量的胰岛素 A所得数据如下:A的剂量x 0.200.25 0.25 0.30 0.40 0.50 0.50血糖减少量y 30 26 40 35 54 56 65(1)求出 y 对 x 的线性回归方程;(2)x 与 y 之间的线性相关关系有无统计意义(可靠性不低于 95)11. (本小题 10 分) 大同电脑公司有 8 名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 6 7 8工作年限 x 3 2 10 5 8 4 4 8年推销金额 y 22 18 95 40 75 45 40 78(1)求年推销金额 y 与工作年限 x 之间的
6、相关系数;(2)求年推销金额 y 关于工作年限 x 的线性回归方程;(3)分别估计工作年限为 7 年和 11 年时的年推销金额12. (本小题 11 分) 在 7 块大小及条件相同的试验田上施肥,做肥量对小麦产量影响的试验,得到如下一组数据:施化肥量x15 20 25 30 35 40 45小麦产量 330 345 365 405 445 450 455(1)画出散点图;(2)对 x 与 y 进行线性回归分析,并预测施肥量 30 时小麦的产量为多少?13. (本小题 12 分) 适当饮用葡萄酒可以预防心脏病,下表中的信包是 19 个发达国家一年中平均每人喝葡萄酒摄取酒精的升数 z 以及一年中每
7、 10 万人因心脏病死亡的人数,国家 澳大利亚 奥地利 比利时 加拿大 丹麦 芬兰 法国 冰岛 爰尔兰 意大利x 2.5 3.9 2.9 2.4 2.9 0.8 9.1 0.8 0.7 7.9y 211 167 131 191 220 297 71 221 300 107国家 荷兰 新西兰 挪威 西班牙 瑞典 瑞士 英国 美国 德国x 1.8 1.9 0.8 6.5 1.6 5.8 1.3 1.2 2.7y 167 266 227 86 207 115 285 199 172(1)画出散点图,说明相关关系的方向、形式及强度;(2)求出每 10 万人中心脏病死亡人数,与平均每人从葡萄酒得到的酒精
8、 x(L)之间的线性回归方程.(3)用(2)中求出的方程来预测以下两个国家的心脏病死亡率,其中一个国家的成人每年平均从葡萄酒中摄取 1L 的酒精,另一国则是 8 L.14. (本小题 12 分) 在某化学实验中,测得如下表所示的 6 组数据,其中 x(min)表示化学反应进行的时,y(mg)表示未转化物质的量x(min) l 2 3 4 5 6y(mg) 39.8 32.2 25.4 20.3 16.2 13.3(1)设 x 与 z 之问具有关系 ,试根据测量数据估计 c 和 d 的值;xycd(2)估计化学反应进行到 10 min 时未转化物质的量.参考答案一、选择题: 1. B 2. C
9、3. A 4. B 5. B二、填空题: 6. 【答案】 (1)回归模型只适用于所研究的总体(2)回归方程具有时效性(3)样本的取值范围影响回归方程的适用范围(4)预报值是预报变量可能取值的平均值.7. 【答案】一个地区受过 9 年或更少教育的百分比每增加 1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加 0.8%左右;大于 0 .8. 【答案】 =1.23x+0.08y9. 【答案】 b= , a= ,e 称为随机误差niii12ii(x)ybx三、解答题: 10. 【 解】 (1) (2)由 r=0. 93010.754即 ,故 x,y 之间5.8140.yx0.5r的线性相关
10、关系有统计意义11. 【 解】 12. 【 解】 (1) 画出散点图如图:(2)根据已知数据表得拓展表如下:01002003004005000 10 20 30 40 50由表易得 21027953,3.7xy代人线性相关系数公式得 1772210.973()()iiixyry因此 y 与 x 有紧密的线性相关关系, 回归系数71122()4.75niiiii iiyxybx所以回归直线方程为: 56.8yx当 x=50 时, 也自是说当施化肥量为 50 时,小麦的产量大致接2.47094.3近 494.3. 回归系数=4.75 反映出当化肥施加量增加 1 个单位,小麦的产量将增加 475,而
11、256.8 是不受施化肥量影响的部分13. 【 解】 (1) 散点图0501001502002503003500 2 4 6 8 10负相关,中等强度,线性或者稍微有些弯曲(2) (3)这两个国家的心脏率死亡率分别为每10万人238人和77人260.5.9yx14. 【 解】 (1)在 的两边取自然对数,可得 lny=ln c+xlnd,设 lny=z, ln c=a, ycdlnd=b, 则 z=a+bx,由已知数据有x 1 2 3 4 5 6y 39.8 32.2 25.4 20.3 16.2 13.3z 3.684 3.472 3.235 3.011 2.875 2.588由公式得 a3.905 5,b0. 221 9,线性回归方程为 3.9055+ 0.221 9x,z即 lnc3.905 5,lad0.221 9,故 c49.675,d0.801 0,所以 c,d 的估计值分别为49. 675,0. 801 0(2)54mg