1、11.3 变量间的相关关系、统计案例一、选择题1有五组变量:汽车的重量和汽车每消耗 1 升汽油所行驶的平均路程;平均日学习时间和平均学习成绩;某人每日吸烟量和身体健康情况;圆的半径与面积;汽车的重量和每千米耗油量其中两个变量成正相关的是( )A B C D 解析 由变量的相关关系的概念知,是正相关,是负相关,为函数关系,故选C.答案 C2.通过随机询问 110 名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110由 2 22 2()10(430)7.8)(65nadbcKK算 得 ,附表: 2()Pk0050 00
2、10 00013841 6635 10828参照附表,得到的正确结论是( )A 有 99%以上的把握认为“爱好该项运动与性别有关”B 有 99%以上的把握认为“爱好该项运动与性别无关”C 在犯错误的概率不超过 01%的前提下,认为“爱好该项运动与性别有关”D 在犯错误的概率不超过 01%的前提下,认为“爱好该项运动与性别无关”解析 由 27.8635K,而 2(6.35)0.1PK,故由独立性检验的意义可知选 A.答案 A3在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A100 个吸烟
3、者中至少有 99 人患有肺癌B1 个人吸烟,那么这人有 99%的概率患有肺癌C在 100 个吸烟者中一定有患肺癌的人D在 100 个吸烟者中可能一个患肺癌的人也没有解析 统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生答案 D4设( x1, y1),( x2, y2),( xn, yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( )A 直线 l 过点( , ) B x 和 y 的相关系数为直线 l 的斜率x yC x 和 y 的相关系数在 0 到 1之间D当 n 为偶数时,分布在 l 两侧的样本点的
4、个数一定相同解析 由样本的中心( , )落在回归直线上可知 A 正确; x 和 y 的相关系数表示为 x 与 yx y之间的线性相关程度,不表示直线 l 的斜率,故 B 错; x 和 y 的相关系数应在1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故 D 错答案 A5某产品的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x(万元) 4 2 3 5销售额 y(万元 ) 49 26 39 54根据上表可得回归方程 x 中的 为 9.4,据此模型预报广告费用为 6 万元时销售额为y b a b ( )A63.6 万元 B65.5
5、 万元 C67.7 万元 D72.0 万元解析 3.5(万元), 42(万元),x4 2 3 54 y 49 26 39 544 429.43.59.1, 回归方程为 9.4 x9.1,a y b x y 当 x6(万元)时, 9.469.165.5(万元)y 答案 B6已知数组( x1, y1),( x2, y2),( x10, y10)满足线性回归方程 bx a,则“( x0, y0)满y 足线性回归方程 bx a”是“ x0 , y0 ”的( y x1 x2 x1010 y1 y2 y1010)A充分不必要条件 B必要不充分条件C充要条件 D既不充分也不必要条件解析 x0, y0为这 1
6、0 组数据的平均值,又因为线性回归方程 bx a 必过样本中心( , ),y x y因此( , )一定满足线性回归方程,但满足线性回归方程的除了( , )外,可能还有其他x y x y样本点答案 B7在第 29 届奥运会上,中国健儿取得了 51 金、21 银、28 铜的好成绩,稳居世界金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见有网友为此进行了调查,在参加调查的 2 548 名男性公民中有 1 560 名持反对意见,2 452 名女性公民中有 1 200 人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力( )A平均
7、数与方差 B回归直线方程C独立性检验 D概率解析 由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合 22 列联表的要求,故用独立性检验最有说服力答案 C二、填空题8. 在一组样本数据( x1, y1) , ( x2, y2) , ( xn, yn) ( n2, x1,x2,xn不全相等)的散点图中,若所有样本点( xi, yi)( i=1,2,n)都在直线 y= x+1 上,则这组样本数据的12样本相关系数为_.解析 根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数为 1.答案 189某医疗研究所为了检验某种血清预
8、防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22 列联表计算得 K23.918,经查临界值表知 P(K23.841)0.05.则下列结论中,正确结论的序号是_有 95%的把握认为“这种血清能起到预防感冒的作用” ;若某人未使用该血清,那么他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 95%;这种血清预防感冒的有效率为 5%.解析 K2 3.9183.841,而 P(K23.841)0.05,所以有 95%的把握认为“这种血清能起到预防感冒的作用” ;但检验的是假设是
9、否成立和该血清预防感冒的有效率是没有关系的,不 是同一个问题,不要混淆,正确序号为.答案 10调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:0.254 x0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增y 加_万元解析 由题意,知其回归系数为 0.254,故家庭年收入每增加 1 万元,年饮食支出平均增加 0.254万元答案 0.25411某小卖部为了了解热茶销售量 y(杯)与气温 x()之间的关系,随机统计了某 4 天卖出的热茶的杯数
10、与当天气温,并制作了对照表:气温() 18 13 10 1杯数 24 34 38 64由表中数据算得线性回归方程 bx a 中的 b2,预测当气温为5 时,热茶销售量y 为_杯(已知回归系数解析 根据表格中的数据可求得 (1813101)10, (24343864)x14 y 1440(杯) a b 40(2)1060, 2 x60,当 x5 时,y x y 2(5)6070(杯)y 答案 7012某医疗研究所为了了解某种血清预防感冒的作用,把 500 名使用过血清的人与另外500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22 列联表
11、计算得 K23.918,经查临界值表知 P(K23.841)0.05.则下列结论中,正确结论的序号是_有 95%的把握认为“这种血清能起到预防感冒的作用” ; 若某人未使用该血清,那么他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 95%;这种血清预防感冒的有效率为 5%.解析 因为 K23.9183.841,而 P(K23.814)0.05,所以有 95%的把 握认为“这种血清能起到预防感冒的作用” 要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆答案 三、解答题13在某地区的 1230 岁居民中随 机抽取了 10 个人的身高和体重
12、的统计资料如表:身高(cm) 143 156 159 172 165 171 177 161 164 160体重(kg) 41 49 61 79 68 69 74 69 68 54根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系解析 以 x 轴表示身高, y 轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关14.某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 2002 2004 2006 2008 2010需求量(万吨) 236 246 257 276 286()利用所给数据求年需求量与年份之间的回归直线方程 ;ybxa()利用
13、()中所求出的直线方程预测该地 2012 年的粮食需求量。15有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为非优秀统计成绩后,得到如下的列联表.优秀 非优秀 总计甲班 10乙班 30 合计 105已知从全部 105 人中随机抽取 1 人为优秀的概率为 .27(1)请完成上面的列联表;(2)根据列联表的数据,若按 95%的可靠性要求,能否认为“成绩与班级有关系” ;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号试求抽到 6 号或 10 号的概率附 K2 ,
14、 n ad bc 2 a b c d a c b d解析 (1)优秀 非优秀 总计甲班 10 45 55乙班 20 30 50合计 30 75 105(2)根据列联表中的数据,得到k 6 .1093.841,105 1030 2045 255503075因此有 95%的把握认为“成绩与班级有关系” (3)设“抽到 6 号或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,出现的点数为( x, y),则所有的基本事件有(1,1)、(1,2)、(1,3)、(6,6),共 36 个事件 A 包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4
15、),共 8 个, P(A) .836 2916地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取 100 名同学进行紧急避险常识知识竞赛图 K552(1)和图 K552(2)分别是对七年级和八年级参加竞赛的学生成绩按40,50),50,60),60,70),70,80分组,得到的频率分布直方图图 K552(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2)完成下面 22 列联表,并回答是否有 99%的把握认为“两个年级学生对紧急避险常识
16、的了解有差异”?成绩小于 60 分人数 成绩不小于 60 分人数 合计七年级八年级合计 附: K2 .临界值表:n ad bc 2 a b c d a c b dP(K2 k) 0.10 0.05 0.010k 2.706 3.841 6.635解析 (1)七年级学生竞赛平均成绩为(4530554065207510)10056(分),八年级学生竞赛平均成绩为(4515553565357515)10060(分)(2)22 列联表如下:成绩小于 60 分人数 成绩不小于 60 分人数 合计七年级 70 30 100八年级 50 50 100合计 120 80 200 K2 8.3336.635,200 5030 5070 210010012080有 99%的把握认为“两个年级学生对紧急避险常识的了解有差异”