1、1.1 回归分析的基本思想及其初步应用例题:1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在 x轴上,解释变量在 y轴上(B)解释变量在 轴上,预报变量在 轴上(C)可以选择两个变量中任意一个变量在 x轴上(D)可以选择两个变量中任意一个变量在 轴上解析:通常把自变量 x称为解析变量,因变量 y称为预报变量.选 B2. 若一组观测值(x 1,y1) (x 2,y2)(x n,yn)之间满足 yi=bxi+a+ei (i=1、2. n)若 ei恒为 0,则 R2为 解析: e i恒为0,说明随机误差对y i贡献为0.答案:1.3. 假设关于某设备的使用年限 x 和所支出的
2、维修费用 y(万元) ,有如下的统计资料:x 2 3 4 5 6y 22 38 55 65 70若由资料可知 y 对 x 呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为 10 年时,维修费用是多少?解:(1)列表如下: i 1 2 3 4 5x2 3 4 5 6iy22 38 55 65 7044 114 220 325 4202i4 9 16 25 36x, 5y, 012ix, 3.1251iiyx于是 23.45903.1252125 xybiii,8.ya线性回归方程为: 08.31xaby (2)当 x=10 时, 38.120.23.1y(万元)即估计使用 10 年时
3、维修费用是 1238 万元课后练习: 1. 一位母亲记录了儿子 39 岁的身高,由此建立的身高与年龄的回归模型为 y=7.19x+73.93用这个模型预测这个孩子 10 岁时的身高,则正确的叙述是( ) A.身高一定是 145.83cm; B.身高在 145.83cm 以上;C.身高在 145.83cm 以下; D.身高在 145.83cm 左右.2. 两个变量 y与 x的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R如下 ,其中拟合效果最好的模型是( )A.模型 1 的相关指数 2R为 0.98 B.模型 2 的相关指数 为 0.80 C.模型 3 的相关指数 为 0.50 D
4、.模型 4 的相关指数 2为 0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数 R24.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为 609yx,下列判断正确的是() A.劳动生产率为 1000 元时,工资为 50 元 B.劳动生产率提高 1000 元时,工资提高 150 元C.劳动生产率提高 1000 元时,工资提高 90 元 D.劳动生产率为 1000 元时,工资为 90 元5.线性回归模型 y=bx+a+e 中,b=_,a=_e 称为_ 6. 若有一组数据的总偏差平方和为 100,相关
5、指数为 0.5,则期残差平方和为_ 回归平方和为_7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:转速 x(转/秒) 16 14 12 8每小时生产有缺点的零件数 y(件) 11 9 8 5(1)变量 y 对 x 进行相关性检验; (2)如果 y 对 x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制在什么范围内?第一章:统计案例答案1.1 回归分析的基本思想及其初步应用1. D 2.A 3.B 4.C5. a= ybx,e 称为随机误差6. 50,507. (1)r=0.995,所以 y 与 x 有线性性相关关系(2)y=0.7286x-0.8571niii ii yx12)((3)x 小于等于 14.9013