1、- 1 -第 1 章 统计案例(B)(时间:120 分钟 满分:160 分)一、填空题(本大题共 14 小题,每小题 5 分,共 70 分)1对于回归分析,下列说法错误的是_(填序号)在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定;线性相关系数可以是正的,也可以是负的;回归分析中,如果 r21,说明 x 与 y 之间完全相关;样本相关系数 r(1,1)2现在一个由身高预测体重的回归方程:体重预测值4(磅/英寸)身高130(磅)其中体重与身高分别以磅和英寸为单位如果换算成公制(1 英寸2.5 cm,1 磅0.45 kg),则回归方程应该是_3某种产品的广告费支出 x 与
2、销售额 y(单位:万元)之间有下表关系:x 2 4 5 6 8y 30 40 60 50 70y 与 x 的线性回归方程为 6.5 x17.5,当广告费支出 5 万元时,随机误差为y _4一位母亲记录了儿子 39 岁的身高的数据,她根据这些数据建立的身高 y(cm)与年龄 x 的回归模型为 7.19 x73.93,用这个模型预测这个孩子 10 岁时的身高,则叙述正y 确的是_(只填序号)身高一定是 145.83 cm;身高在 145.83 cm 左右;身高在 145.83 cm 以上;身高在 145.83 cm 以下5某报对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表:赞同 反
3、对 合计男 58 40 98女 64 31 95合计 122 71 193由 2公式可知,你是否有 99.9%的把握认为对这一问题的看法与性别有关,填_(“有”或“无”)6已知两个变量 x 和 y 之间有线性相关性,5 次试验的观测数据如下表,那么变量 y 关于 x 的线性回归方程是_.x 100 120 140 160 180y 45 54 62 75 927.若由一个 22 列联表中的数据计算得 24.013,那么在犯错误的概率不超过_的前提下认为两个事件有关系8许多因素都会影响贫穷,教育也许是其中的一个在研究这两个因素的关系时,收集了某国 50 个地区的成年人至多受过 9 年教育的百分比
4、( x)和收入低于官方规定的贫困线的人数占本地区人数的百分比( y)的数据,建立的线性回归方程是 4.60.8 x.这里,斜率的y 估计等于 0.8 说明_9某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别 非统计专业 统计专业男 13 10- 2 -女 7 20为了判断主修统计专业是否与性别有关,根据表中数据,得到 24.844.50 1320 107 223272030因为 23.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性约为_10某市居民 20052009 年家庭年平均收入 x(单位:万元)与年平均支出 Y(单位:万元)的统计资
5、料如下表所示:年份 2005 2006 2007 2008 2009收入 x 11.5 12.1 13 13.3 15支出 Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系11若两个分类变量 X 和 Y 的列联表为:y1 y2x1 5 15x2 40 10则 X 与 Y 之间有关系的概率约为_12下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计干净水 52 466 518不干净水 94 218 312合计 146 684 830据表中数据我们可得出的统计分析推断是_13某工厂为了调查工人文化程度与月收入关
6、系,随机抽取了部分工人,得到如下列表:月收入 2 000 元以下月收入 2 000 元及以上 总计高中文化以上 10 45 55高中文化及以下 20 30 50总计 30 75 105由上表中数据计算得 2 6.109,估计有_105 1030 2045 255503075把握认为“文化程度与月收入有关系” 14下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;线性回归方程 x 必过点( , );y b a x y曲线上的点与该点的坐标之间具有相关关系;在一个 22 列联表中,由计算得 K213.079,则其两个变量间有关系的可能性是 90%.其中错误的是_(填序号)二、解
7、答题(本大题共 6 小题,共 90 分)15(14 分)有两个分类变量 x 与 y,其一组观测值如下面的 22 列联表所示:y1 y2x1 a 20 ax2 15 a 30 a其中 a,15 a 均为大于 5 的整数,则 a 取何值时,在犯错误的概率不超过 0.1 的前提下认为 x 与 y 之间有关系?- 3 -16(14 分)研究某灌溉渠道水的流速 y 与水深 x 之间的关系,测得一组数据如下:水深 x/m流速 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10y/(ms1) 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21(1)求
8、y 对 x 的线性回归方程;(2)预测水深为 1.95 m 时水的流速是多少?17(14 分)某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的 657 人中有416 人哑,而在另外不聋的 680 人中有 249 人哑,你能运用这组数据,得到相应结论吗?请运用独立性检验进行判断18(16 分)在钢中碳含量对于电阻的效应的研究中,得到如下表所示的一组数据:碳含量 x/% 0.10 0.30 0.40 0.55 0.70 0.80 0.9520时电阻 y/ 15 18 19 21 22.6 23.8 26求 y 与 x 的线性回归方程19(16 分)在研究水果辐照保鲜效果问题时,经统计得到如
9、下数据:未腐烂 发生腐烂 合计未辐照 251 249 500已辐照 203 297 500合计 454 546 1 000问:辐照保鲜措施对水果保鲜是否有效?- 4 -20(16 分)某地区 10 名健康儿童头发和血液中的硒含量(1 000 ppm)如下表所示:血硒 74 66 88 69 91 73 66 96 58 73发硒 13 10 13 11 16 9 7 14 5 10(1)画出散点图;(2)求线性回归方程;(3)若某名健康儿童的血硒含量为 94(1 000 ppm),预测他的发硒含量第 1 章 统计案例(B)答案1解析 相关系数 r 的范围是1,12体重预测值0.72身高58.5
10、解析 4 磅/英寸4(0.45 kg/2.5 cm)0.72(kg/cm),130 磅1300.45 kg58.5 kg.310 4 5无 6 0.575 x14.9y 70.05解析 24.0133.841.8一个地区受过 9 年或更少的教育的百分比每增加 1%,则收入低于官方规定的贫困线的人数占本地区人数的百分比将增加 0.8%左右90.051013 正解析 把 20052009 年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为 13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系110.999解析
11、 2 18.810.828, 5 15 40 10 510 4015 2 5 15 40 10 5 40 15 10查表知 P( 210.828)0.001, x 与 y 之间有关系的概率约为 10.0010.999,因此有 99.9%的把握认为 X 与 Y 有关系- 5 -12传染病与饮用不干净水是有关系的解析 通过独立性检验可知1397.5%14解析 正确由回归方程的定义及最小二乘法思想,知正确不正确15解 查表可知,要使在犯错误的概率不超过 0.1 的前提下认为 x 与 y 之间有关系,则 k2.706,而k65a 30 a 20 a 15 a 220451550 .65 65a 300
12、 220451550 13 13a 60 26090由 k2.706 得 a7.19 或 a2.04.又 a5 且 15 a5, aZ,即 a8,9.故 a 为 8 或 9 时,在犯错误的概率不超过 0.1 的前提下认为 x 与 y 之间有关系16解 (1)散点图如图所示由图容易看出, x 与 y 之间有近似的线性相关关系,或者说,可以用一个线性回归方程 x 来反映这种关系y a b 由上面的分析,可采用列表的方法计算 与回归系数 .a b 序号 xi yi x2i xiyi1 1.40 1.70 1.96 2.3802 1.50 1.79 2.25 2.6853 1.60 1.88 2.56
13、 3.0084 1.70 1.95 2.89 3.3155 1.80 2.03 3.24 3.6546 1.90 2.10 3.61 3.9907 2.00 2.16 4.00 4.3208 2.10 2.21 4.41 4.641 14.00 15.82 24.92 27.993于是, 14.01.75, 15.821.977 5.x18 y 18 0.733.b 27.993 81.751.977 524.92 81.7521.977 50.7331.750.694 8.a y 对 x 的线性回归方程为 x0.694 80.733 x.y a b (2)把 x1.95 代入,易得 0.69
14、4 80.7331.952.12 (m/s)y 计算结果表明,当水深为 1.95 m 时可以预测渠水的流速约为 2.12 m/s.17解 能根据题目所给数据得到如下列联表:哑 不哑 总计聋 416 241 657不聋 249 431 680- 6 -总计 665 672 1 337根据列联表中数据得到 K2的观测值k1 337 416431 241249 265768066567295.29110.828.因此在犯错误的概率不超过 0.001 的前提下认为聋与哑有关系18解 钢中碳含量对电阻的效应数据如下表:序号 xi yi x2i y2i xiyi1 0.10 15 0.01 225 1.5
15、2 0.30 18 0.09 324 5.43 0.40 19 0.16 361 7.64 0.55 21 0.302 5 441 11.555 0.70 22.6 0.49 510.76 15.826 0.80 23.8 0.64 566.44 19.047 0.95 26 0.902 5 676 24.7合计 3.8 145.4 2.595 3 104.2 85.61由上表中数据,得 0.543, 145.420.77, x 2.595,x3.87 y 17 7 i 12i所以 12.55.b 85.61 70.54320.772.595 70.543220.7712.550.54313.
16、96.a 所以线性回归方程为 13.9612.55 x.y 19解 根据题中数据,利用公式,得 2 9.295,因为 9.2957.879,因此有1 000 251297 249203 245454650050099.5%的把握认为辐照保鲜措施对水果保鲜有效20解 (1)散点图如下图所示:(2)根据线性回归方程的公式求得: b 10 i 1xiyi 10x y10 i 1x2i 10x2 8 464 1075.410.858 212 1075.420.236, x10.80.23675.46.99.a y b 故所求线性回归方程为 0.236 x6.99.y (3)当 x94 时, 0.236946.9915.2.y 因此,当地儿童的血硒含量为 94(1 000 ppm)时,该儿童的发硒含量约为 15.2(1 000 ppm)