1、成才之路 数学,路漫漫其修远兮 吾将上下而求索,人教B版 选修2-3,统计案例,第三章,3.2回归分析,第三章,第2课时离散型随机变量的方差,2015年4月25日尼泊尔发生了8.1级地震,此次地震系本世纪陆地第5次八级大地震,余震频繁而且震级还高,仅7级以上余震就发生了2次,你知道地震的震级与地震次数之间有什么关系吗?,求回归直线方程的步骤是什么?答案:作出散点图,判断散点图是否在一条直线附近;如果两变量是线性相关的,那么再用公式求出回归系数和,写出回归直线方程,一、散点图的理解将样本中的n个数据点(xi,yi)(i1,2,3,n)描在平面直角坐标系中来表示具有相关关系的两个变量的一组数据的图
2、形叫做散点图,注意:(1)在散点图中,横坐标代表一个变量,纵坐标代表一个变量,所以散点图中每个点可设为(x,y)(2)从散点图中我们可以看到点散布的位置是从左下角到右上角的区域内,即一个变量的值由小到大时,另一个变量的值也由小到大,这种关系我们称为正相关,反之,如果两个变量的散点图中点散布的位置由左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种关系称为负相关(3)散点图可以说明变量间有无线性相关关系、相关的方向,但不能精确地说明变量之间的密切程度,因此需要计算相关系数来描述两个变量之间关系的密切程度,5个同学的数学和物理成绩如下表:判断它们是否具有相关关系,二、回归
3、直线方程1回归直线方程的思想方法(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(2)最小二乘法:实际上,求回归直线方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”即最贴近已知的数据点,最能代表变量x与y之间的关系,为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是()Al1与l2
4、有交点(s,t)Bl1与l2相交,但交点不一定是(s,t)Cl1与l2必定平行Dl1与l2必定重合答案A,某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:,四、可线性化的回归分析应用研究两个变量的关系时,我们常根据样本作出散点图观察散点图中样本点的分布,从整体看,如果样本点没有在某一条直线附近,称这两个变量间不具有线性相关关系,即这两个变量是非线性相关关系对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题化成线性回归问题,然后用线性回归的方法进行研究,在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与
5、x不具有线性相关关系时,要借助于散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决,(1)指数函数型:yaebx(a0)函数yaebx(a0)的图象,见图,(2)对数函数型:yablnx.函数yablnx的图象,见图,从某大学中随机抽取8名女大学生,其身高和体重数据如下表所示. 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重,说明回归方程中x的系数的实际意义,散点图与回归方程,解析由于问题中要求根据身高预报体重,因此选取身高为自变量x,真实体重为因变量y,作散点
6、图从图中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系,某工厂18月份某种产品的产量与成本的统计数据见下表:以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程,解析(1)散点图如下图所示:,(2)从上图可以看出,这些点基本上分布在一条直线附近,可以认为x和y线性关系显著,下面求其回归方程,首先列出下表,给出施化肥量对水稻产量影响的试验数据:(1)作出两者之间的散点图;(2)若两者之间存在线性相关关系,求其回归直线方程,线性回归分析,解析(1)散点图略(2)表中的数据进行具体计算,列成以下表格:,
7、方法总结要注意从题目中提取有效信息,利用公式求解即可,在试验中得到变量y与x的数据如下表.,在一化学反应过程中某化学物质的反应速度y(单位:g/min)与一种催化剂的量x(单位:g)有关,现收集了8组数据列于表中,试建立y与x之间的回归方程.,非线性回归问题,解析根据收集的数据作散点图:,(1)可认为样本点集中在某二次曲线yc1x2c2的附近令tx2,则变换后样本点应该分布在直线ybta(bc1,ac2)的周围由题意得变换后t与y的样本数据表:,作y与t的散点图由y与t的散点图可观察到样本数据点并不分布在一条直线的周围,因此不宜用线性回归方程ybta来拟合,即不宜用二次曲线yc1x2c2来拟合
8、y与x之间的关系,(2)根据x与y的散点图也可以认为样本点集中在某一条指数型函数曲线yc1ec2x的周围令zlny,则zc2xlnc1,即变换后样本点应该分布在直线zbxa(alnc1,bc2)的周围,由y与x的数据表可得z与x的数据表:,作出z与x的散点图,方法总结非线性回归问题有时并不给出经验公式这时我们可以画出已知数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决,下列散点图中最符合线性回归的是()错解A或B或C辨析线性回归中的“线”指的是直线,当数据分布在一条直线附近或一个条形(带状)区域时宜用线性回归正解D,