1、第 2 讲 相关性、最小二乘估计与统计案例A 级 基础演练 (时间:30 分钟 满分:55 分)一、选择题(每小题 5 分,共 20 分)1(2012新课标全国 )在一组样本数据( x1,y 1),(x 2,y 2),(x n,y n)(n2, x1,x 2,x n不全相等)的散点图中,若所有样本点(x i,y i)(i1,2,n) 都在直线 y x1 上,则这组样本数据的样本相关系数为12( ) A1 B0 C. D112答案 D2(2013长春调研 )已知 x,y 取值如下表:x 0 1 4 5 6 8y 1.3 1.8 5.6 6.1 7.4 9.3从所得的散点图分析可知:y 与 x 线
2、性相关,且 0.95xa,则 a( )y A1.30 B1.45 C1.65 D1.80解析 依题意得, (014568)x164, (1.31.85.6 6.17.49.3) 5.25.又直线 0.95xa 必过样y16 y 本中心点( , ),即点(4,5.25),于是有 5.250.954a,由此解得x ya1.45,选 B.答案 B3.(2011陕西 )设(x 1,y 1),(x 2,y 2),(x n,y n)是变量 x和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( )A直线 l 过点( , )x yBx 和 y 的相
3、关系数为直线 l 的斜率Cx 和 y 的相关系数在 0 到 1 之间D当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同解析 由样本的中心( , )落在回归直线上可知 A 正确;x 和 y 的相关系数表x y示为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 B 错;x 和 y 的相关系数应在1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故 D 错答案 A4(2011山东 )某产品的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x(万元) 4 2 3 5销售额 y(万元) 49 26 39 54根据上表
4、可得回归方程 x 中的 为 9.4,据此模型预报广告费用为 6 万y b a b 元时销售额为 ( )A63.6 万元 B65.5 万元C67.7 万元 D72.0 万元解析 3.5( 万元) ,x4 2 3 54 42( 万元) ,y49 26 39 544 429.43.59.1,a y b x回归方程为 9.4x9.1,y 当 x6(万元)时, 9.469.165.5( 万元)y 答案 B二、填空题(每小题 5 分,共 10 分)5已知施化肥量 x 与水稻产量 y 的试验数据如下表,则变量 x 与变量 y 是_相关(填“正”或“负”).施化肥量 x 15 20 25 30 35 40 4
5、5水稻产量 y 330 345 365 405 445 450 455解析 因为散点图能直观地反映两个变量是否具有相关关系,所以画出散点图如图所示:通过观察图象可知变量 x 与变量 y 是正相关答案 正6(2013唐山统一考试 )考古学家通过始祖鸟化石标本发现:其股骨长度 x(cm)与肱骨长度 y(cm)的线性回归方程为 1.197x3.660,由此估计,当股骨长y 度为 50 cm 时,肱骨长度的估计值为_ cm.解析 根据线性回归方程 1.197x 3.660,将 x50 代入得 y56.19,则肱y 骨长度的估计值为 56.19 cm.答案 56.19三、解答题(共 25 分)7(12
6、分) 某班主任对全班 50 名学生进行了作业量多少的调查数据如下表:认为作业多 认为作业不多 合计喜欢玩游戏 18 9不喜欢玩游戏 8 15合计(1)请完善上表中所缺的有关数据;(2)试通过计算说明有多大把握认为喜欢玩游戏与作业量的多少有关系?解 (1)认为作业多 认为作业不多 合计喜欢玩游戏 18 9 27不喜欢玩游戏 8 15 23合计 26 24 50(2)将表中的数据代入公式 2nad bc2a bc da cb d 5.0593.841 ,501815 89226242723即说明有 95%以上的把握认为喜欢玩游戏与作业量的多少有关系8(13 分) 下表提供了某厂节能降耗技术改造后生
7、产甲产品过程中记录的产量x(吨) 与相应的生产能耗 y(吨标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)已知该厂技改前生产 100 吨甲产品的生产能耗为 90 吨标准煤试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解 (1)由题设所给数据,可得散点图如图所示(2)由对照数据,计算得: 86,4i 1x2i 4.5(吨), 3.5( 吨) x3 4 5
8、64 y 2.5 3 4 4.54已知 iyi66.5,4i 1x所以,由最小二乘法确定的回归方程的系数为: 0.7,b 4i 1xiyi 4xy4i 1x2i 4x2 66.5 44.53.586 44.52 3.50.74.5 0.35.a y b x因此,所求的线性回归方程为 y0.7x 0.35.(3)由(2)的回归方程及技改前生产 100 吨甲产品的生产能耗,得降低的生产能耗为:90(0.7 1000.35) 19.65( 吨标准煤) B 级 能力突破(时间:30 分钟 满分:45 分)一、选择题(每小题 5 分,共 10 分)1为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子
9、的身高数据如下:父亲身高 174 176 176 176 178x/cm儿子身高y/cm175 175 176 177 177则 y 对 x 的线性回归方程为 ( )Ayx1 Byx1Cy88 x Dy17612解析 由题意得 176(cm),x174 176 176 176 1785 176(cm),由于( , )一定满足线性回归方程,y175 175 176 177 1775 x y经验证知选 C.答案 C2(2013福州模拟 )下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程 3 5x ,变量 x 增加一个单位时,y 平均增加 5 个单位;y 线性回
10、归方程 x 必过( , );y b a x y在一个 22 列联表中,由计算得 213.079,则有 99%以上的把握认为这两个变量间有关系其中错误的个数是 ( )A0 B1 C2 D3解析 只有错误,应该是 y 平均减少 5 个单位答案 B二、填空题(每小题 5 分,共 10 分)3为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取 50 名学生,得到如下 22 列联表:理科 文科男 13 10女 7 202 4.844.50(1320 107)223272030则认为选修文科与性别有关系的可能性约为_解析 24.844,这表明小概率事件发生根据假设检验的基本原理,应该断定“是否选修
11、文科与性别之间有关系”成立,并且这种判断正确的可能性约为 95%.答案 95%4(2011广东 )某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分别是 173 cm、170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_ cm.解析 由题意父亲身高 x cm 与儿子身高 y cm 对应关系如下表:x 173 170 176y 170 176 182则 173 , 176,x173 170 1763 y 170 176 1823(xi )(yi )(173 173)(170176)(170173)(176176)3i 1 x y(17
12、6 173)(182176) 18,(xi )2(173173) 2(170173) 2(176 173) 218. 1. 3i 1 x b 1818 a y176173 3.b x线性回归直线方程 x x3.y b a 可估计孙子身高为 1823185(cm)答案 185三、解答题(共 25 分)5(12 分)(2013 南通模拟 )某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中的发芽数,得到如下资料:日期 12 月 1 日 12 月 2 日 12 月 3 日 1
13、2 月 4 日 12 月 5 日温差 x/ 10 11 13 12 8发芽数 y/颗 23 25 30 26 16该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求线性回归方程,再对被选取的 2 组数据进行检验(1)求选取的 2 组数据恰好是不相邻 2 天数据的概率;(2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4日的数据,求出 y 关于 x 的线性回归方程 ybx a.解 (1)设抽到不相邻两组数据为事件 A,因为从 5 组数据中选取 2 组数据共有10 种情况,每种情况都是等可能出现的,其中抽到相邻两组数
14、据的情况有 4 种,所以 P(A)1 .410 35(2)由数据,求得 12, 27.x y 112513301226977,11 213 212 2434,由公式,求得 b ,a b 3.52 y x 所以 y 关于 x 的线性回归方程为 y x3.526(13 分) 有甲、乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为非优秀统计成绩后,得到如下的列联表.优秀 非优秀 总计甲班 10乙班 30合计 105已知从全部 105 人中随机抽取 1 人为优秀的概率为 .27(1)请完成上面的列联表;(2)根据列联表的数据,若按 95%的可靠性要求,能否认为“成绩与班级有关系”
15、;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从2 到 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号试求抽到 6 号或 10 号的概率解 (1)优秀 非优秀 总计甲班 10 45 55乙班 20 30 50合计 30 75 105(2)根据列联表中的数据,得到2 6.1093.841,1051030 2045255503075因此有 95%的把握认为“成绩与班级有关系” (3)设“抽到 6 号或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),则所有的基本事件有(1,1)、(1,2)、(1,3)、(6,6),共 36个事件 A 包含的基本事件有(1,5),(2,4) ,(3,3),(4,2),(5,1),(4,6),(5,5) ,(6,4),共 8 个,P(A) .836 29特别提醒:教师配赠习题、课件、视频、图片、文档等各种电子资源见创新设计高考总复习光盘中内容.