1、1第一章 统计案例章末复习学习目标 1.理解独立性检验的基本思想及实施步骤.2.会求线性回归方程,并用回归直线进行预测122 列联表22 列联表如表所示:B B 合计A a b a bA c d c d合计 a c b d n其中 n a b c d 为样本容量2最小二乘法对于一组数据( xi, yi), i1,2, n,如果它们线性相关,则线性回归方程为 x ,其中 , .y b a b ni 1xi xyi yni 1xi x2ni 1xiyi nx yni 1x2i nx2 a y b x3独立性检验常用统计量 2 来检验两个变量是否有相关关系 .nad bc2a bc da cb d2
2、类型一 独立性检验例 1 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得到了如下的 22 列联表:喜爱打篮球 不喜爱打篮球 合计男生 6女生 10合计 48已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 .23(1)请将上面的 22 列联表补充完整;(不用写计算过程)(2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由考点 独立性检验及其基本思想题点 独立性与均值的综合应用解 (1)列联表补充如下:喜爱打篮球 不喜爱打篮球 合计男生 22 6 28女生 10 10 20合计 32 16 48(2)由 2 4.2
3、86.48220 60228203216因为 4.2863.841,所以能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关反思与感悟 独立性检验问题的求解策略通过公式 2 ,nad bc2a bc da cb d先计算出 2,再与临界值表作比较,最后得出结论3跟踪训练 1 某学生对其亲属 30 人的饮食习惯进行了一次调查,并用茎叶图表示 30 人的饮食指数,如图所示(说明:图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高于70 的人,饮食以肉类为主)(1)根据茎叶图,帮助这位同学说明其亲属 30 人的饮食习惯;(2)根据以上数据完成如表所示的 22 列联表;主食蔬菜 主
4、食肉类 合计50 岁以下50 岁以上合计(3)在犯错误的概率不超过 0.01 的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?考点 独立性检验及其基本思想题点 分类变量与统计、概率的综合应用解 (1)30 位亲属中 50 岁以上的人多以食蔬菜为主,50 岁以下的人多以食肉类为主(2)22 列联表如表所示:主食蔬菜 主食肉类 合计50 岁以下 4 8 1250 岁以上 16 2 18合计 20 10 30(3) 2 106.635,308 128212182010故在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮食习惯与年龄有关” 4类型二 线性回归分析例 2 某城市理论预测 201
5、0 年到 2014 年人口总数与年份的关系如表所示:年份 201x(年 ) 0 1 2 3 4人口数 y(十万 ) 5 7 8 11 19(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出 y 关于 x 的线性回归方程 x ;y b a (3)据此估计 2019 年该城市人口总数考点 回归分析思想的应用题点 回归分析思想的应用解 (1)散点图如图:(2)因为 2,x0 1 2 3 45 10,y5 7 8 11 195iyi051728311419132,5i 1x0 21 22 23 24 230,5i 1x2i所以 3.2,b 132 521030 522 3.6.a y b
6、x所以线性回归方程为 3.2 x3.6.y (3)令 x9,则 3.293.632.4,y 故估计 2019 年该城市人口总数为 32.4(十万)5反思与感悟 解决回归分析问题的一般步骤(1)画散点图:根据已知数据画出散点图(2)判断变量的相关性并求回归方程:通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)实际应用:依据求得的回归方程解决实际问题跟踪训练 2 以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据:房屋面积(m 2) 110 90 80 100 120销售价格(万元) 33 31 28 34 39(1)画出
7、数据对应的散点图;(2)求线性回归方程解 (1)数据对应的散点图如图所示:(2) i (1109080100120)100,x155i 1x 15 i (3331283439)33.y155i 1y 15110 290 280 2100 2120 251 000.5i 1x2iiyi1103390318028100341203916 740.5i 1x所以 b 5i 1xi xyi y5i 1xi x25i 1xiyi 5x y5i 1x2i 5x26 0.24,16 740 51003351 000 51002 330.241009.a y b x所以线性回归方程为 x 0.24 x9.y
8、b a 1下面是一个 22 列联表:y1 y2 合计x1 a 21 70x2 5 c 30合计 b d 100则 b d_.考点 题点 答案 8解析 a702149, c30525, b49554, d212546, b d8.2 “回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归根据他的结论,在儿子的身高 y 与父亲的身高 x 的线性回归方程 x 中, 的取值范围是_y b a b 考点 线性回归分析题点 线性回归方程的应用答案 (0,1)解析 子代平均身高向中心回归, 应为正的真分数b 73假如由数据:(1,2),(3,4),(
9、2,2),(4,4),(5,6),(3,3.6)可以得出线性回归方程 y x,则经过的定点是以上点中的_a b 考点 题点 答案 (3,3.6)解析 易知,线性回归方程 x 经过定点( , ),根据计算可知这几个点中满足条件y a b x y的是(3,3.6)4考古学家通过始祖鸟化石标本发现:其股骨长度 x(cm)与肱骨长度 y(cm)的线性回归方程为 1.197 x3.660,由此估计,当股骨长度为 50cm 时,肱骨长度的估计值为_cm.y 考点 题点 答案 56.19解析 根据线性回归方程 1.197 x3.660,将 x50 代入,得 y56.19,则肱骨长度的y 估计值为 56.19
10、 cm.5对于线性回归方程 x ,当 x3 时,对应的 y 的估计值是 17,当 x8 时,对应的y b a y 的估计值是 22,那么,该线性回归方程是_,根据线性回归方程判断当x_时, y 的估计值是 38.考点 线性回归分析题点 线性回归方程的应用答案 x14 24y 解析 首先把两组值代入线性回归方程,得Error!解得 Error!所以线性回归方程是 x14.y 令 x1438,可得 x24,即当 x24 时, y 的估计值是 38.81独立性检验是研究两个分类变量间是否存在相关关系的一种案例分析方法利用假设的思想方法,计算出某一个 2统计量的值来判断更精确些2建立回归模型的基本步骤
11、(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量(2)画出散点图,观察它们之间的关系(3)由经验确定回归方程的类型(4)按照一定的规则估计回归方程中的参数.一、填空题1如果 28.654,可以认为“ x 与 y 无关”的可信度为_考点 独立性检验及其基本思想题点 独立性检验的方法答案 0.5%解析 8.6547.879, x 与 y 无关的可信度为 0.5%.2下表显示出样本中变量 y 随变量 x 变化的一组数据,由此判断它最可能是_模型x 4 5 6 7 8 9 10y 14 18 19 20 23 25 28考点 回归分析题点 建立回归模型的基本步骤答案 线性函数解析 画出散点图
12、(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型93下表是某厂 14 月份用水量(单位:百吨)的一组数据:月份 x 1 2 3 4用水量 y 4.5 4 3 2.5由散点图(图略)可知,用水量 y 与月份 x 之间有较好的线性相关关系,其线性回归方程是0.7 x ,则 _.y a a 考点 线性回归方程题点 样本点中心的应用答案 5.25解析 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得 5.25.a 4某学校开展研究性学习活动,某同学获得一组实验数据如下表:x 1.99 3 4 5.1 6.12y 1.5 4.04 7.5 12 18.01对于表中
13、数据,现给出下列拟合曲线,其中拟合程度最好的是_(填序号) y2 x2; y x; ylog 2x; y (x21)(12) 12考点 题点 答案 解析 可以代入检验,当 x 取相应的值时,所求 y 与已知 y 相差最小的便是拟合程度最高的5某考察团对全国 10 大城市进行职工人均工资水平 x(单位:千元)与居民人均消费水平y(单位:千元)统计调查, y 与 x 具有线性相关关系,回归方程为 0.66 x1.562.若某城y 市居民人均消费水平为 7.675 千元,估计该城市人均消费额占人均工资收入的百分比约为_考点 线性回归分析题点 线性回归方程的应用答案 83%10解析 将 y7.675
14、代入回归方程,可计算得 x9.262,所以该城市人均消费额占人均工资收入的百分比约为 7.6759.2620.83,即约为 83%.6某数学老师身高 176cm,他爷爷、父亲和儿子的身高分别是 173cm、170cm 和 182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的研究方法预测他孙子的身高为_cm.考点 题点 答案 185解析 设父亲身高为 x cm,儿子身高为 y cm,由题意得出下表:x 173 170 176y 170 176 182易得 173, 176,由公式计算得 1, 17611733,则 x3,当x y b a y b x y x182 时, 185.故预测
15、该老师孙子的身高为 185 cm.y 7已知变量 x 和 y 满足关系 y0.1 x1,变量 y 与 z 正相关下列结论中正确的是_(填序号) x 与 y 正相关, x 与 z 负相关; x 与 y 正相关, x 与 z 正相关; x 与 y 负相关, x 与 z 负相关; x 与 y 负相关, x 与 z 正相关考点 线性回归分析题点 线性回归方程的应用答案 解析 因为 y0.1 x1,0.10),所以 z0.1 ax a b,0.1 a6.635.811016 4015225565031因为 P( 26.635)0.01,所以“ x 与 y 之间有关系”出错的可能性为 0.01.1311某
16、医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22 列联表计算得 23.918,经查临界值表知 P( 23.841)0.05.则下列结论中,正确结论的序号是_在犯错误的概率不超过 5%的前提下认为“这种血清能起到预防感冒的作用” ;若某人未使用该血清,则他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 95%;这种血清预防感冒的有效率为 5%.考点 独立性检验及其基本思想题点 独立性检验的方法答案 解析 查对临界值表知 P( 23.841)0.
17、05,故有 95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在 100 个使用血清的人中一个患感冒的人也没有”的可能故答案为.二、解答题12某城区为研究城镇居民家庭月人均生活费支出和月人均收入的相关关系,随机抽取 10户进行调查,其结果如下:月人均收入 x(元) 300 390 420 520 570月人均生活费 y(元) 255 324 335 360 450月人均收入 x(元) 700 760 800 850 1080月人均生活费 y(元) 520 580 600 630 750(1)作出散点图;(2)求出线性回归方程;(3)试预测月
18、人均收入为 1100 元和月人均收入为 1200 元的两个家庭的月人均生活费考点 题点 解 (1)作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系14(2)通过计算可知 639, 480.4,x yx 4 610 300, xiyi3 417 560,10 i 12i 10 i 1 0.659 9, 58.723 9,b 10 i 1xiyi 10x y10 i 1x2i 10x2 a y b x线性回归方程为 0.659 9 x58.723 9.y (3)由以上分析可知,我们可以利用线性回归方程0.659 9 x58.723 9 来计算月人均生活费的预测值y 将
19、 x1 100 代入,得 y784.61,将 x1 200 代入,得 y850.60.故预测月人均收入分别为 1 100 元和 1 200 元的两个家庭的月人均生活费分别为 784.61 元和 850.60 元13在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查调查结果:接受调查总人数 110 人,其中男、女各 55 人;受调查者中,女性有30 人比较喜欢看电视,男性有 35 人比较喜欢运动(1)请根据题目所提供的调查结果填写下列 22 列联表;看电视 运动 合计女男合计(2)能否在犯错误的概率不超过 0.05 的前提下认为“性别与休闲方式有关系”?附: 2
20、 (其中 n a b c d 为样本容量)nad bc2a bc da cb d15P( 2 x0) 0.10 0.05 0.025 0.010x0 2.706 3.841 5.024 6.635考点 独立性检验及其基本思想题点 独立性检验的方法解 (1)根据题目所提供的调查结果,可得下列 22 列联表:看电视 运动 合计女 30 25 55男 20 35 55合计 50 60 110(2)根据列联表中的数据,可计算 2 3.667,1103035 2025250605555因为 23.667 r0.050.514.这说明每单位面积蔬菜产量与使用氮肥量之间存在着很强的线性相关关系(2)设所求的线性回归方程为 x ,y b a 则 0.093 1,b 15i 1xiyi 15x y15i 1x2i 15x2 0.710 2,a y b x则 0.093 1 x0.710 2.y 当每单位面积菜地施肥 150 kg 时,每单位面积蔬菜的年平均产量 0.093 11500.710 y 214.675 2(t)