1、第一章 统计案例1.1 回归分析的基本思想及其初步应用课时训练 1 回归分析的基本思想及其初步应用1.为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两位同学各自独立地做了 100 次和150 次试验,并且利用线性回归方法,求得回归直线分别为 l1 和 l2.已知两个人在试验中发现对变量 x 的观测数据的平均值都是 s,对变量 y 的观测数据的平均值都是 t,那么下列说法正确的是( ).A.l1 和 l2 有交点(s,t)B.l1 与 l2 相交,但交点不一定是(s,t)C.l1 与 l2 必定平行D.l1 与 l2 必定重合解析:都过样本中心点(s,t),但斜率不确定.答案:A2.已知
2、 x,y 的取值如下表:x 0 1 3 4y 2.2 4.3 4.8 6.7若 x, y 具有线性相关关系,且回归方程为=0.95x+a, 则 a 的值为( ).A.0.325 B.2.6 C.2.2 D.0解析:由已知得=2,=4.5,而回归方程过点(),则 4.5=0.952+a,a=2.6.来源:学优 gkstk答案:B3.对两个变量 x 和 y 进行回归分析,得到一组样本数据:(x 1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是( ).A.由样本数据得到的回归方程 x+必过样本点的中心()B.残差平方和越小的模型,拟合的效果越好C.用相关指数 R2 来刻画回归效果
3、,R2 的值越小,说明模型的拟合效果越好D.若变量 y 和 x 之间的相关系数 r=-0.936 2,则变量 y 和 x 之间具有线性相关关系解析:R 2 的值越大 ,说明残差平方和越小,也就是说模型的拟合效果越好.答案:C4.若某地财政收入 x 与支出 y 满足线性回归方程 y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|0.5.如果今年该地区财政收入 10 亿元,年支出预计不会超过( ).A.10 亿元 B.9 亿元 C.10.5 亿元 D.9.5 亿元解析:代入数据 y=10+e,因为 |e|0.5,所以|y|10.5,故不会超过 10.5 亿元.答案:C5.若一组观测值(
4、x 1,y1),(x2,y2),(xn,yn)之间满足 yi=bxi+a+ei(i=1,2,n),且 ei 恒为 0,则 R2 为 . 解析:由 ei 恒为 0,知 yi=,即 yi-=0,故 R2=1-=1-0=1.答案:16.调查了某地若干户家庭的年收入 x(单位:万元) 和年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加 万元. 解析:设年收入为 x1 万元,对应的年饮食支出为 y1 万元,家庭年收入每增加 1
5、万元,则年饮食支出平均增加=0.254(万元).答案:0.2547.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月 1 号到 5 号每天打篮球的时间 x(单位:小时) 与当天投篮命中率 y 之间的关系:时间 x 1 2 3 4 5命中率 y 0.4 0.5 0.6 0.6 0.4小李这 5 天的平均投篮命中率为 ,用线性回归分析法的方法,预测小李该月 6 号打 6 小时篮球的投篮命中率为 . 解析:这 5 天的平均投篮命中率为=0.5.=3.(xi-)(yi-)=(1-3)(0.4-0.5)+(2-3)(0.5-0.5)+(3-3)(0.6-0.5)+(4-3)(0
6、.6-0.5)+(5-3)(0.4-0.5)=0.1.(xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10.=0.01,=0.5-0.03=0.47.所以回归直线方程为=0.01x+0.47.当 x=6 时,=0.016+0.47=0.53.答案:0.5 0.538.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2002 2004 2006 2008 2010需求量(万吨) 236 246 257 276 286(1)利用所给数据求年需求量与年份之间的回归直线方程 x+;(2)利用(1)中所求出的直线方程预测该地 2012 年的粮食需求量 .解:
7、(1)由所给数据看出,年需求量与年份之间是近似直线上升 ,下面来配回归直线方程,为此对数据预处理如下:年份-2006 -4 -2 0 2 4需求量-257 -21 -11 0 19 29对预处理后的数据,容易算得=0,=3.2.=6.5,=3.2.由上述计算结果,知所求回归直线方程为-257=(x-2 006)+=6.5(x-2 006)+3.2,即=6.5(x-2 006)+260.2.(2)利用直线方程 ,可预测 2012 年的粮食需求量为 6.5(2 012-2 006)+260.2=6.56+260.2=299.2(万吨)300(万吨).9.关于 x 与 y 有以下数据:x 2 4 5
8、 6 8y 30 40 60来源:gkstk.Com50 70已知 x 与 y 线性相关,由最小二乘法得=6.5,(1)求 y 关于 x 的线性回归方程 .(2)现有第二个线性模型 :=7x+17,且相关指数 R2=0.82.若与 (1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.来源:学优解:(1)依题意设 y 关于 x 的线性回归方程为=6.5x+,(2+4+5+6+8)=5,(30+40+60+50+70)=50,=6.5x+ 经过样本点的中心(),50=6.55+,=17.5,y 与 x 的线性回归方程为=6.5x+17.5.(2)由(1)的线性模型得 yi-与 yi-的关系如下表:yi- -0.5 -3.5 10 -6.5 0.5yi- -20 -10 10 0 20来源:GKSTK.Com所以(y i-)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.(yi-)2=(-20)2+(-10)2+102+02+202=1 000.所以=1-=1-=0.845.由于=0.845,R 2=0.82 知R 2,所以(1)的线性模型拟合效果比较好.