1、第一章检测(时间:90 分钟 满分:100 分)一、选择题(本大题共 10 个小题,每小题 5 分,共 50 分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.甲、乙两人各进行 1 次射击,如果两人击中目标的概率分别为 0.8 和 0.4,则其中恰有 1 人击中目标的概率是( )A.0.32 B.0.56C.0.44 D.0.68解析: 设所求概率为 P,则 P=0.4(1-0.8)+0.8(1-0.4)=0.56.答案: B2.设有一个回归方 程=21.5,则变 量 增加 1个 单 位 时 ( )A.y 平均增加 1.5 个单位B.y 平均增加 2 个单位C.y 平均减少 1.5
2、个单位D.y 平均减少 2 个单位答案: C3.一组观测值有 22 组,则与显著性水平 0.05 相对应的相关系数临界值为( )A.0.404 B.0.515C.0.423 D.0.573解析: 相关系数的临界值可由教材附表查得 .答案: C4.在一个 22 列联表中,由其数据计算得 2=13.097,则这两个变量间有关系的可能性为( )A.99% B.95%C.90% D.无关系解析: 26.635,有 99%的把握认为“两个变量有关系”,故选项 A 最合适.答案: A5.回归直线方程 =+有一 组 独立的 观测 数据 (1,1),(2,2),(,),则 系数 的 值为 ( )A.=1(-)
3、(-)=1(-)2B.=1(-)(-)=12C.=1(-)(-)=1(-)2D.=1(-)2(-)2答案: C6.观测两个相关变量得如下数据:x -9 -6.99 -5.01 -2.98 -5 5 4.999 4y -9 -7 -5 -3 -5.02 4.99 5 3.998则这两个变量间的回归直线方程为( )A.=12+1B.=C.=2+13D.=+1解析: 通过观察可知,这些点近似地分布在直线 y=x 附近,故选 B.答案: B7.下面是一个 22 列联表:y1 y2 合 计x1 a 21 73x2 2 25 27合 计 b 46 100则表中 a,b 的值分别为( )A.94,96 B.
4、52,50C.52,54 D.54,52答案: C8.在一次试验中,当变量 x 的取值分别为 1,12,13,14时 ,变 量 的 值 依次 为 2,4,3,5,则 与 1之 间 的回 归 曲 线 方程是 ( )A.=0.8+1.5B.=2+3C.=2+1D.=1解析: y .与 1是 线 性相关关系答案: A9.经计算得到高中女学生的体重 y(单位:kg)关于身高 x(单位:cm)的回归直线方程为 =0.7569.72,对 于身高 为 162 的高中女学生 ,则 ( )A.可以预测其体重大约为 51.78 kgB.其体重准确值为 51.78 kgC.其体重大于 51.78 kgD.由于存在随
5、机误差,其体重无法预测答案: A10.考察棉花种子经过处理与得病之间的关系得到如下数据:种子处理 种子未处理 合 计得 病 32 101 133不得病 61 213 274合 计 93 314 407根据以上数据,则( )A.种子经过处理与是否生病有关B.种子经过处理与是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的解析: 根据独立性检验知 20.1646.635,这说 明得到患肝病与酗酒有关系的把握 约 有99%.答案: 患肝病与酗酒有关系的可能性很大 99%三、解答题(本大题共 3 个小题,共 25 分.解答时应写出文字说明、证明过程或演算步骤)16.(8 分) 某地区 20
6、10 年至 2016 年农村居民家庭人均纯收入 y(单位:千元)的数据如下表:年 份 2010 2011 2012 2013 2014 2015 2016年份代号 t 1 2 3 4 5 6 7人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求 y 关于 t 的回归直线方程;(2)利用(1)中的回归方程,分析 2010 年至 2016 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2018 年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为 =1(-)(-)=1(-)2 ,= .解: (1)由所给数据计算得=17(1+2+3+4+5
7、+6+7)=4,=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,7=1()2=9+4+1+0+1+4+9=28,7=1()()=(-3)(-1.4)+(-2)(-1)+ (-1)(-0.7)+00.1+10.5+20.9+31.6=14,=7=1(-)(-)7=1(-)2 =1428=0.5,= =4.30.54=2.3,所求回归方程 为=0.5+2.3.(2)由(1) 2010 年至 2016 年该地区农村居民家庭人均纯收入逐年增加,知 ,=0.50,故平均每年增加 0.5 千元.将 2018 年的年份代号 t=9 代入 (1)中的回归方程, 得=0.59+2.3=
8、6.8,故预测该地区 2018 年农村居民家庭人均纯收入为 6.8 千元.17.(8 分) 某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法.收集 300 位学生每周平均体育运动时间的样本数据(单位:h).(1)应收集多少位女生的样本数据?(2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图 (如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过 4 h 的概率;(3)在样本数据中,有 6
9、0 位女生的每周平均体育运动时间超过 4 h,请完成每周平均体育运动时间与性别列联表,并判断是否有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.解: (1)因为 3004 50015 000=90,所以应收集 90 位女生的样本数据.(2)由频率分布直方图得 1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过 4 h 的概率的估计值为 0.75.(3)由(2)知,300 位学生中有 3000.75=225 人的每周平均体育运动时间超过 4 h,75 人的每周平均体育运动时间不超过 4 h.又因为样本数据中有 210 份是关于男生的,90 份是关于
10、女生的.所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生 女生 总计每周平均体育运动时间不超过 4 h 45 30 75每周平均体育运动时间超过 4 h 165 60 225总 计 210 90 300结合列联表可算得 2 4.7623.841.= 3002 25027522521090=10021故有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关 ”.18.(9 分) 有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响 ,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下:气温 x/ -5 0 4 7 12 15 19 23 27 31
11、 36热茶销售杯数 y/杯 156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗?(3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系 ;(4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是 2 ,预测这一天卖出热茶的杯数.解: (1)以 x 轴表示气温,以 y 轴表示热茶杯数 ,可作散点图如下图所示 .(2)从图中可以看出,各点散布在从左上角到右下角的区域里 ,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因 335,为 =16911, 11=12=4 778.=1 22811, 11=1=14 所 -2.35,以 =14 778-11169111 228114 335-11(16911)2=1 22811+2.3516911=147.74.所以回归直线方程 为=2.35+147.74.(5)由(4)的方程,当 x=2 2 ,这一天时 ,=4.70+147.74=143.04,因此若某天的气温 为大约可以卖出 143 杯热茶.