收藏 分享(赏)

2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt

上传人:kuailexingkong 文档编号:1646026 上传时间:2018-08-15 格式:PPT 页数:52 大小:2.11MB
下载 相关 举报
2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt_第1页
第1页 / 共52页
2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt_第2页
第2页 / 共52页
2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt_第3页
第3页 / 共52页
2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt_第4页
第4页 / 共52页
2019届高考数学一轮复习 第九篇 统计与统计案例 第3节 变量的相关性与统计案例课件 理 新人教版.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、第3节 变量的相关性与统计案例,考纲展示,知识梳理自测,考点专项突破,解题规范夯实,知识梳理自测 把散落的知识连起来,【教材导读】 1.变量的相关关系与变量的函数关系有什么区别? 提示:相关关系是一种不确定关系,函数关系是确定关系. 2.如何判断两个变量间的线性相关关系? 提示:散点图中点的分布从整体上看大致在一条直线附近,或者通过计算相关系数作出判断. 3.独立性检验的基本步骤是什么? 提示:列出22列联表,计算k值,根据临界值表作出结论.,知识梳理,1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2

2、)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的这种相关关系为负相关. 2.回归方程与回归分析 (1)线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在 附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,一条直线,(2)回归方程 最小二乘法:使得样本数据的点到回归直线的 最小的方法叫做最小二乘法.,距离的平方和,(3)回归分析 定义:对具有 的两个变量进行统计分析的一种常用方法.,相关关系,正,负,越强,越弱,3.独立性检验 (1)独立性检验的有关概念 分类变量 可用变量的不同“值”表示个体

3、所属的 的变量称为分类变量.,不同类别,22列联表 假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,(2)独立性检验 利用随机变量K2= (其中n=a+b+c+d为样本容量)来判断“两个分类变量有关系”的方法称为独立性检验. 步骤如下: 计算随机变量K2的观测值k,查表确定临界值k0:,如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关系”.,【重要结论】 1.线性回归直线的斜率为正(负)时,两个变量正(负)相关. 2.线性回归直线一定经

4、过样本点的中心.,双基自测,1.已知x,y的取值如表所示,C,从散点图分析知y与x具有线性关系,且=0.95x+a,则a等于( ) (A)2.2 (B)3.36 (C)2.6 (D)1.95,C,(A)y=0.6x+1.1 (B)y=3x-4.5 (C)y=-2x+5.5 (D)y=-0.4x+3.3,解析:变量x与y负相关,则AB选项错误,回归方程过样本点的中心,当x=2时: -2x+5.5=-22+5.5=1.5符合题意, -0.4x+3.3=-0.42+3.3=2.51.5,不合题意.故选C.,B,(A)68.2 (B)68 (C)69 (D)67,4.对某校高二年级一班63名同学的一次

5、期末考试的英语成绩作统计,得到如下的列联表:,附:K2= ,参照附表,得到的正确结论是( ) (A)在犯错误的概率不超过0.01的前提下认为“该班学生英语成绩优秀与性别有关” (B)在犯错误的概率不超过0.05的前提下认为“该班学生英语成绩优秀与性别有关” (C)没有90%以上的把握认为“该班学生英语成绩优秀与性别有关” (D)有90%以上的把握认为“该班学生英语成绩优秀与性别有关”,C,5.某产品的广告费用x与销售额y的统计数据如表:,答案:73.5,考点专项突破 在讲练中理解知识,考点一,变量的相关性,解析:完全的线性关系,且为负相关,故其相关系数为-1.故选A.,反思归纳 两个具有相关关

6、系的变量之间,可以从散点图直观看出是否具有较好的线性相关关系,定量的方法就是计算相关系数,相关系数的绝对值越接近1,其线性相关关系越强.,跟踪训练1:已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) (A)x与y正相关,x与z负相关 (B)x与y正相关,x与z正相关 (C)x与y负相关,x与z负相关 (D)x与y负相关,x与z正相关,解析:由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关,故选C.,考点二,回归分析,(A)160 (B)163 (C)166 (

7、D)170,(2)某产品的广告费用x万元与销售额y万元的统计数据如表:,(A)36 (B)37 (C)38 (D)39,反思归纳 (1)求回归直线方程要注意正确使用公式、注意题目对精确度的要求;(2)由得出的回归直线方程作出的预测是近似的.,跟踪训练2:(2017广西桂林、百色、梧州、北海、崇左五市5月联合模拟)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如表:,(1)在图中画出表中数据的散点图;,解:(1)作出散点图如图:,(2)根据(1)中的散点图拟合y与x的回归模型,并用相关程度说明;,(3)建立y关于x的回归方程,预

8、测第5年的销售量约为多少?,考点三,独立性检验,【例3】 导学号 38486201 (2017河北石家庄二中三模)近代统计学的发展起源于二十世纪初,它是在概率论的基础上发展起来的.统计工作可以追溯到远古的“结绳记事”和二十四史中大量的关于人口、钱粮、水文、天文、地震等资料的记录.近几年,雾霾来袭,有关部门对某市该年11月份的天气情况进行统计,结果如下:,表一,由于此种情况,市政府为减少雾霾,于次年采取了全年限行的政策. 下表是一个调査机构对比以上两年11月份(该年不限行30天、次年限行30天共60天)的调查结果:,表二,(1)请由表一数据求a,b,并求在该年11月份任取一天,估计该市是晴天的概

9、率;,(2)请用统计学原理计算有没有90%的把握认为雾霾与限行有关系,则限行时有多少天没有雾霾? (由于不能使用计算器,所以表中数据使用时四舍五入取整数),K2=,反思归纳 (1)统计中要注意表达数据的几个图表:频数分布表、频率分布表、频率分布直方图、茎叶图、列联表等;(2)独立性检验类似反证法,即在假设其无关的情况下,得出其假设成立为小概率事件,从而否定其假设,得出两个分类变量有关,并且得出其结论成立的概率.,跟踪训练3:现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如表.,由以上统计数据填22列联表并判断是否能够在犯错误的

10、概率不超过0.01的前提下认为月收入以55百元为分界点对“楼市限购令”的态度有差异.,解:22列联表,k= 6.276.635. 所以不能够在犯错误的概率不超过0.01的前提下认为月收入以55百元为分界点对“楼市限购令”的态度有差异.,备选例题,【例1】 (2017湖南常德一模节选)某网络营销部门为了统计某市网友2016年12月12日的网购情况,从该市当天参与网购的顾客中随机抽查了男女各30人,统计其网购金额,得到如下频率分布直方图和22列联表:,若网购金额超过2千元的顾客称为“网购达人”,网购金额不超过2千元的顾客称为“非网购达人”. 若抽取的“网购达人”中女性占12人,请根据条件完成22列

11、联表,并判断是否有99%的把握认为“网购达人”与性别有关? (参考公式:K2= ,其中n=a+b+c+d),解:22列联表如下:,由于K2= =7.26.635. 所以有99%的把握认为“网购达人”与性别有关.,【例2】 (2017江西师大附中三模)某校为评估新教改对教学的影响,挑选了水平相当的甲、乙两个平行班进行对比试验.甲班采用创新教法,乙班仍采用传统教法.一段时间后进行水平测试,成绩结果全部落在60,100区间内(满分100分),并绘制频率分布直方图如图,两个班人数均为60人,成绩80分及以上为优良.,(1)根据以上信息填好22列联表,并判断出有多大的把握认为学生成绩优良与班级有关?,(

12、2)以班级分层抽样,抽取成绩优良的5人参加座谈,现从5人中随机选3人来作书面发言,求发言人至少有2人来自甲班的概率. (以下临界值及公式仅供参考,K2= ,n=a+b+c+d),解:(2)分层抽样甲班抽取了3人,记作A1,A2,A3,乙班抽取了2人,记作B1,B2,从中任意抽取3人,有A1A2A3,A1A2B1,A1A2B2,A1A3B1,A1A3B2,A1B1B2,A2A3B1,A2A3B2, A2B1B2,A3B1B2,10种情形,其中至少有2人来自甲班的有7种情形, 则至少有2人来自甲班的概率为 .,【例3】 (2016河南许昌二次调研)某校高二年级共有学生1 000名,其中走读生750

13、名,住宿生250名,现采用分层抽样的方法从该年级抽取100名学生进行问卷调查.根据问卷取得了这100名学生每天晚上有效学习时间(单位:分钟)的数据,按照以下区间分为八组:0,30),30,60),60,90),90,120),得到频率分布直方图(部分)如图.,(1)如果把“学生晚上有效学习时间达到两小时”作为是否充分利用时间的标准,对抽取的100名学生,完成下列22列联表;并判断能否在犯错误的概率不超过0.05的前提下认为学生利用时间是否充分与走读、住宿有关? 参考公式:K2= . 参考列表:,(2)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“有效学习时间少于60分钟”

14、的学生人数为X,求X的分布列和数学期望.,解题规范夯实 把典型问题的解决程序化,概率统计综合问题,【典例】(12分)(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;,(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:,(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:,K2=

15、 .,审题指导,满分展示,解:(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”, 由题意知P(A)=P(BC)=P(B)P(C), 旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62, 故P(B)的估计值为0.62,2分 新养殖法的箱产量不低于50 kg的频率为 (0.068+0.046+0.010+0.008)5=0.66, 故P(C)的估计值为0.66,4分 因此,事件A的概率估计值为0.620.66=0.409 2.5分,答题模板 第一步:利用频率分布直方图求取相关数据; 第二步:把相关数据合理分类,准确列出22列联表; 第三步:计算,把相关数据代入公式求值; 第四步:估值下结论,即根据所求数据与临界值的大小,得到相应结论.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报