1、课程目标1双基目标(1)通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用(2)通过典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及其初步应用2情感目标本章提供了数据处理的方法,通过对数据的收集、整理和分析,使学生认识统计方法的直观特点、增强学生的社会实践能力,培养学生分析问题、解决问题的能力,养成科学严谨的良好品质,重点难点本章重点:回归分析、残差分析、相关指数的意义以及独立性检验中K2的有关计算本章难点:借助于回归分析的思想选择恰当的模型拟合变量间的相关关系(尤其是非线性的),由于该部分内容的数据相对较复杂,故在高考中出现大题的可能性不是很大,应以选择、
2、填空题为主,旨在考察对回归方程的求解及预测,K2的计算等,学法探究本章内容是统计案例中常见方法中的两种:回归分析和独立性的检验通过对典型案例的学习,理解问题和方法的实质,进一步体会统计方法在解决实际问题中的基本思想在学习过程中多与社会实践相结合,亲自动手实践,加深对知识的认识,巩固知识,不断创新,多寻找规律,形成方法,11回归分析的基本思想及其初步应用,1知识与技能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系2过程与方法通过求线性回归方程,探究相关性检验的基本思想通过对典型案例的探究,体会回归分析在生产实际和日常生活中的广泛应用,本节重点:了解线性回归
3、模型与函数模型的差异,了解判断刻画模型拟合效果的方法相关指数和残差分析本节难点:解释残差变量的含义,了解偏差平方和分解的思想,1通过复习线性回归方程,探究相关性检验的基本思想2培养类比、迁移、化归的能力,一、相关关系的概念当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系二、回归分析的相关概念1回归分析是处理两个变量之间的一种统计方法若两个变量之间具有线性相关关系,则称相应的回归分析为 ,相关关系,线性回归分析,3线性相关关系强与弱的判断:用 来描述线性相关关系的强弱当r0时,表明两个变量;当r0时,表明两个变量r的绝对值越接近1,表明两个变量的线性相关性越强
4、;r的绝对值接近于0时,表明两个变量之间线性相关关系通常当|r|大于时,认为两个变量有很强的线性相关关系4随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不能用一次函数ybxa来描述两个变量之间的关系,而是用线性回归模型来表示,其中为模型的未知参数,称为随机误差,相关系数r,正相关,负相关,几乎不存在,0.75,ybxae,a和b,e,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越 在线性回归模型中,R2表示解释变量对预报变量变化的R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的线性相关性越强),好,贡献率,(2)利用图形来分析
5、残差特性,作图时纵坐标为,横坐标可以选为,这样作出的图形称为残差图如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高,残差,样本编号,回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法进行转化,转变为线性回归问题,例1有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本
6、点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验其中正确命题的个数是(),A1B2C3 D4分析由题目可获取以下信息:线性回归分析;散点图;相关性检验等的相关概念及意义解答本题可先逐一核对相关概念及其性质,然后再逐一作出判断,最后得出结论,答案C解析反映的正是最小二乘法思想,故正确反映的是画散点图的作用,也正确解释的是回归方程x的作用,故也正确是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系点评线性回归分析的过程:(1)随机抽取样本,确定数据,形成样本点(2)由样本点形
7、成散点图,判定是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势,下列有关线性回归的说法,不正确的是()A变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图C线性回归方程最能代表具有线性相关关系的x,y之间的关系D任何一组观测值都能得到具有代表意义的线性回归方程,答案D解析只有对两个变量具有线性相关性作出判断时,利用最小乘法求出线性方程才有意义.,例2某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1
8、)画出散点图;(2)求y关于x的回归直线方程,解析(1)散点图如图所示,(2)列出下表,并用科学计算器进行有关计算.,点评求回归直线方程,关键在于正确地求出,由于,的计算量较大,计算时要仔细谨慎、分层进行,避免计算失误,例3一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:把零件数x作为解释变量,加工时间y作为预报变量(1)计算总偏差平方和、残差平方和及相关指数;(2)作出残差图;(3)进行残差分析,解析(1)由x,y的数据得散点图如图,由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型来拟合设线性回归方程为x,列出下表:,续表,将
9、数据代入相应公式可得如下数据表:,续表,(2)作出残差图如图,横坐标为零件数的数据,纵坐标为残差,(3)由题中数据可得样本相关系数r的值为0.9998,再结合散点图可以说明x与y有很强的线性相关关系由R2的值可以看出回归效果很好,也说明用线性回归模型拟合数据效果很好由残差图也可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集在这两个样本点的过程中是否有人为的错误点评本题涉及公式多且复杂,计算量也很大,需首先了解公式,明白原理,(2)在利用残差图对数据进行残差分析时,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适这样的带状区域宽度越窄,说明模型拟合精度越高,回归方程
10、的预报精度越高,某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出线性回归方程;(3)作出残差图;(4)计算R2;(5)试预测该运动员训练47次及55次的成绩,解析(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系,(3)残差分析作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适,(4)计算相关指数R2计算相关指数R20.9855.说明了该运动员的成绩的差异有98.55%是由训练次数引起的,例4炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液厂炉渣对包衬耐火材料的侵蚀,使
11、其容积不断增大,请根据表格中的数据找出使用次数x与增大的容积y之间的关系.,续表解析先根据试验数据作散点图,如图所示,点评作出散点图,由散点图选择合适的回归方程类型是解决本题的关键,在这里线性回归模型起了转化的作用对于非线性回归问题,并没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决,例5在一次抽样调查中测得样本的5个样本点数值如下表:试建立y与x之间的回归直线方程,辨析此题解法是错误的,原因是这两个变量之间不是
12、线性相关关系此类问题的解决,应先对两个变量间的相关关系进行相关性检验,然后结合作出的散点图,选择适宜的回归方程,由置换后的数值表作散点如图所示:,由散点图可以看出y与t呈近似的线性相关关系列表如下:,一、选择题1下列说法中错误的是()A如果变量x与y之间存在着线性相关关系,则我们根据实验数据得到的点(xi,yi)(i1,2,n)将散布在某一条直线的附近B如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(i1,2,n)不能写出一个线性方程,答案B解析两变量x与y之间不存在线性关系,根据它们的一组数据(xi,yi)(i1,2,3,n)可通过已有的函数知识进行变换,利用线性
13、回归模型来建立y与x之间的非线性回归方程,Ay平均增加2.5个单位By平均增加2个单位Cy平均减少2.5个单位Dy平均减少2个单位答案C,答案C,4下列两个变量之间的关系不是函数关系的是()A角度和余弦值B正n边形的边数和一个内角的度数C棱锥的体积和底面积D某种物质和溶解度和温度答案D,6某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:已知y与x之间是线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是_万元答案10解析由本节例2可知y关于x的回归直线方程为6.5x17.5由6.5x17.582.5得x10.故广告费支出最少为10万元,三、解答题7在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如下表所示:1.画出数据的散点图;2根据散点图,你能得出什么结论,解析(1)如图所示:(2)结论:设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点大致分布在一条直线附近,其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系,