1、本章归纳整合,专题一 回归方程的求解及相关性检验,1分析两个变量线性相关的常用方法,(1)散点图法,该法主要是用来直观地分析两变量间是否存 在相关关系 (2)相关系数法,该法主要是从量上分析两个变量间相互联 系的密切程度,|r|越接近于1,相关程度越大;|r|越接近于 0,相关程度越小,某餐饮部为研究气温对热饮销售的影响,经过数据统 计,得到热饮杯数与当天气温的对照表:(1)画出散点图; (2)从散点图中可看出气温与热饮杯数之间关系的一般规律 是什么? (3)求线性回归方程; (4)如果某天的气温为3 ,预测这天卖出的热饮杯数 思路探索 根据统计所得数据对照表画出散点图作初步判 断求出线性回归
2、方程后,再解答第(4)问,【例1】,(1)以x轴表示温度,以y轴表示热饮杯数,作散点图 (2)从图中可看出,各散点分布在左上角到右下角的区域 里,气温越高,卖出去的热饮杯数越少 (3)从散点图可看出,这些点大致分布在一条直线附近,两 变量呈现近似的线性关系,因此利用计算器求得下列表中 数据,解,(4)当x3时,y2.3473147.69140.65,因此,某 天的气温为3 ,这天大约可以卖出140杯热饮 规律方法 利用线性回归方程可进行预测,但我们不能说 餐饮部一定能卖出140杯左右的热饮,事实上,有可能因其 他随机因素出现极大的偏差,这个140杯是对气温为3 时 大部分情况下所作的估计,非线
3、性回归问题一般不给出经验公式,这时,应先画出已 知数据的散点图,把它与所学过的各种函数图像作比较, 挑选一种跟这些散点图拟合得最好的函数,采用适当的变 量置换,把问题化为线性回归分析问题,使问题得以解 决,专题二 可线性化的非线性相关问题,下表是一次试验的数据:,思路探索 由已知给出的两变量的数据可知,y与x不具备 相关关系,故需对其进行转化转为线性相关问题,然后 求解,【例2】,规律方法 通过变量代换,把非线性回归问题转化为线性 回归问题,本质上是把要解决的问题转化为已解决的问 题这是数学上常用的重要思想和方法,1条件概率公式揭示了条件概率P(A|B)与事件概率P(B)、P(AB)三者之间的
4、关系下列两种情况可利用条件概率公式:一种情况是已知P(B)和P(AB)时去求出P(A|B);另一种情况是已知P(B)和P(A|B)时去求出P(AB)对于后一种情况,为了方便也常将条件概率公式改写为如下的乘法公式:若P(A)0,有P(AB)P(A)P(B|A) 2乘法公式与条件概率公式实际上是一个公式,要求P(AB)时,必须知道P(A|B)或P(B|A);反之,要求P(A|B)时,必须知道积事件AB的概率P(AB),在解决实际问题时,不要把求P(AB)的问题误认为是求P(A|B)的问题,专题三 条件概率问题,盒子里装有16个球,其中6个是玻璃球,10个是木质 球,玻璃球中有2个是红球,4个是蓝球
5、;木质球中有3个是 红球,7个是蓝球现从中任取一个(假设每个球被取到是 等可能的)是蓝球,问该球是玻璃球的概率是多少? 思路探索 要注意B发生时A发生的概率与A、B同时发生的 概率的区别,【例3】,设事件A:“任取一球,是玻璃球”;事件B:“任取 一球,是蓝球”由题中数据可列表如下:,解,规律方法 本题关系有点复杂,采用列表方法理顺关系, 这样不仅过程简单,同时还能快捷地找出计算条件概率时 所需的相关事件的概率,也减少了许多语言叙述,请注意 借鉴,1解决有关独立性检验的问题时,若题目中没有给出22列联表,需先根据题意画出22列联表,注意表中两个变量的放置位置,列表后可根据表中数据计算2的值,然
6、后比较2值与临界值的大小来较精确地给出“两个变量”的相关程度 2独立性检验问题的基本步骤为:(1)找相关数据,作列联表(2)求统计量2.(3)判断可能性,注意与临界值做比较,得出事件有关的可信度,专题四 22列联表与独立性检验,某矿石粉厂在生产一种矿石粉时,数天内即有部分 工人患职业性皮肤炎,在生产季节开始,随机抽取75名车 间工人穿上新防护服,其余仍穿原用的防护服,生产进行 一个月后,对两组工人进行检查,结果如下:问这种新防护服对预防工人职业性皮肤炎是否有效?并说 明你的理由 思路探索 通过有关数据的计算,作出相应的判断,【例4】,规律方法 判断两个分类变量是否有关系的途径有: (1)通过计
7、算它们发生的频率来初步判断; (2)计算随机变量2的值,利用独立性检验的基本思想 来定量地判断,命题趋势,统计案例作为新课标中的新增内容,主要是通过案例体会运用统计方法解决实际问题的思想和方法,要学会用统计的思想方法解决生活中的问题 1以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系 2以实际生活为背景,重在考查独立性检验、回归方程及回归 分析的思想 3在每年的高考中本部分主要以选择题、填空题的形式出现, 个别省份也出过解答题,但都是中、低档题,难度不大,高考真题,1(2011江西),变量X与Y相对应的一组数据为(10,1), (11.3,2),(11.8,3),(12.5
8、,4),(13,5);变量U与V相对应的一 组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表 示变量Y与X之间的线性相关系数,r2表示变量V与U之间的 线性相关系数,则 ( ) Ar2r10 B0r2r1 Cr20r1 Dr2r1,答案 C,2(2011湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:,附表:参照附表,得到的正确结论是 ( )A在犯错误的概率不超过0.1%的前提下,认为“爱好该 项运动与性别有关” B在犯错误的概率不超过0.1%的前提下,认为“爱好该 项运动与性别无关” C有99%以上的把握认为“爱好该
9、项运动与性别有关” D有99%以上的把握认为“爱好该项运动与性别无关”,解析 根据独立性检验的定义,由K27.86.635可知我们 有99%以上的把握认为“爱好该项运动与性别有关”,故 选C. 答案 C,答案 B,4(2011广东)某数学老师身高176 cm,他爷爷、父亲和 儿子的身高分别是173 cm、170 cm和182 cm.因儿子的 身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.解析 儿子和父亲的身高可列表如下:答案 185,5如图,EFGH是以O为圆心,半径为1的圆的内接正方形将一颗豆子随机地扔到该圆内,用A表示事件“豆子落在正方形EFGH内”,B表示事件“豆子落在扇形OHE(阴影部分)内”,则(1)P(A)_;(2)P(B|A)_.,6(2011安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的线性回归方程yabx;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量,(1)由所给数据看出,年需求量与年份之间是近似直 线上升的,下面求线性回归方程为此对数据预处理如 下:,解,