1、 核心必知1预习教材,问题导入根据以下提纲,预习教材 P2P 8 的内容,回答下列问题(1)在数学必修 3中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回 归直线方程,并用回归直线方程进行预报 线性回归方程为x Error! .(2)所有的两个相关变量都可以求回归方程吗?提示:不一定2归纳总结,核心必记(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归直线方程方程xError!是两个具有线性相关关系的变量的一组数据( x1,y 1),(x 2,y 2),( xn
2、,y n)的回归方程,其中Error!,是待定参数,其最小二乘估计分别为:其中Error! i, Error! i,(,Error!)称为样本点的中心(3)线性回归模型线性回归模型用 ybx ae 来表示,其中 a 和 b 为模型的 未知参数,e 称为随机误差(4)刻画回归效果的方式残差 把随机误差的估计值 Error!i 称为相应于点( xi,y i)的残差残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精
3、度越高残差平方和残差平方和为(y iError!i) 2,残差平方和越小,模型拟合效果越好相关指数 R2R2 1Error!,R 2 表示解释变量对于预报变量变化的贡献率,R 2 越接近于 1,表示回归的效果越好问题思考(1)通过教材 P2 中的例 1 计算出的回归方程 Error!0.849x 85.712 可以预报身高为 172 cm 的女大学生的体重为 60.316 kg.请问,身高为 172 cm 的女大学生的体重一定是 60.316 kg 吗?为什么?提示:不一定从散点图可以看出,样本点散布在一条直线 的附近,而不是在一条直线上,所以不能用一次函数 ybx a 表示(2)下列说法正确
4、的有哪些?在线性回归模型中,e 是 bxa 预报真实值 y 的随机误差,它是一个可观测的量;残差平方和越小的模型,拟合的效果越好;用 R2 来刻画回归效果,R 2 越小,拟合的效果越好;在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高提示:e 是一个不可观测的量,故 不正确;R 2 越小,残差平方和越大,即模型的拟合效果越差,故不正确; 是正确的课前反思(1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数 R2
5、的定义是什么?它们与回归效果有什么关系?思考 求线性回归方程的步骤是什么?名师指津:(1)列表表示 xi,yi,xiyi,x;(2)计算, ,Error!,iyi;(3)代入公式计算Error!,的值;(4)写出线性回归方程讲一讲1(链接教材 P2例 1)某种产品的广告费用支出 x 与销售额 y(单位:百万元)之间有如下的对应数据:x/百万元 2 4 5 6 8y/百万元 30 40 60 50 70(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为 10 百万元时的销售额尝试解答 (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 合计x
6、i 2 4 5 6 8 25yi 30 40 60 50 70 250xiyi 60 160 300 300 560 1 380x 4 16 25 36 64 145所以,Error! 5,Error! 50,Error!145,iyi1 380.于是可得Error!Error! 6.5,506.5517.5.所以所求的线性回归方程为Error!6.5x17.5.(3)根据(2)中求得的线性回归方程,当广告 费用支出为 10 百万元时,6.51017.582.5(百万元 ),即广告费用支出为 10 百万元时,销售额大约为 82.5 百万元(1)求线性回归方程前必须判断两个变量是否线性相关,如果
7、两个变量本身不具备相关关系,或者它们之间的相关关系不 显著,那么即使求出回 归 方程也是毫无意义的(2)写出回归直线方程Error!xError!,并用回 归直线方程 进行预测说明:当 x 取 x0时,由线性回归方程可得 Error!0 的值,从而可进行相应的判断练一练1某班 5 名学生的数学和物理成绩如下表:学生学科成绩 A B C D E数学成绩 (x) 88 76 73 66 63物理成绩 (y) 78 65 71 64 61(1)画出散点图;(2)求物理成绩 y 对数学成绩 x 的回归直线方程;(3)一名学生的数学成绩是 96,试预测他的物理成绩解:(1)如图所示(2)因为Error!
8、(8876736663) 73.2,(7865716461)67.8,iyi8878766573716664636125 054,88 276 273 266 263 227 174.所以Error! 0.625,Error! 67.80.62573.222.05.故 y 对 x 的回归直线方程是Error!0.625x22.05.(3)x96,则Error!0.62596 22.0582,即可以预测他的物理成绩是 82.思考 如何用残差图、残差平方和、相关指数 R2 分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型 拟合精度越高;残差平方和越小,模型拟合效果越好;R 2 越接近于 1
9、,模型拟合效果越好讲一讲2假定小麦基本苗数 x 与成熟期有效穗 y 之间存在相关关系,今测得 5 组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2(1)以 x 为解释变量,y 为预报变量,作出散点图;(2)求 y 与 x 之间的回归方程,对于基本苗数 56.7 预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求 R2,并说明残差变量对有效穗的影响占百分之几?尝试解答 (1)散点图如下(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系设回归方程为x
10、Error! .30.36,43.5,5 101.56,Error!9 511.43.1 320.66, 2921.729 6,iyi6 746.76.则Error! 0.29,Error! 34.70.故所求的回归直线方程为Error!0.29x34.70.当 x56.7 时,Error! 0.2956.734.7051.143.估计成熟期有效穗为 51.143.(3)由于 Error!iError!x iError! ,可以算得 iy iError! i分别为Error!1 0.35,Error!20.718,Error! 30.5, Error!42.214 ,Error!51.624,
11、残差平方和:Error!8.43.(4)(yi) 250.18 ,故 R21Error! 0.832.所以解释变量小麦基本苗数对总效应约贡献了 83.2%,残差变量贡献了约183.2% 16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来 拟合数据,然后通 过残差 Error!1,Error!2,n来判断模型拟合的效果(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高练一练2某运动员训练次数与运动成绩之间的数据关系如下:次数(x) 30 33 35 37 39 44 46 50
12、成绩(y) 30 34 37 39 42 46 48 51(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算 R2,并说明其含义解:(1)作出该运动员训练次数 x 与成绩 y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875,Error!12 656,13 731, iyi 13 180, 1.041 5,0.003 875,线 性回 归方程为1.041 5x0.003 875.(3)残差分析计算得 11.24, 20.366, 30.551,40.468,51.385,60.178,70.095,81.07
13、1.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)计算相关指数 R2计算相关指数 R20.985 5,说明了该运动员成绩的差异有 98.55%是由训练次数引起的.讲一讲3(链接教材 P6例 2)某地区六年来轻工业产品利润总额 y 与年次 x 的试验数据如下表所示:年次 x 1 2 3 4 5 6利润总额 y 11.35 11.85 12.44 13.07 13.59 14.41由经验知,年次 x 与利润总额 y(单位:亿元)近似有如下关系:yab xe0.其中 a,b 均为正数,求 y 关于 x 的回归方程思路点拨 解答此 题可根据散点图选择恰当
14、的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可尝试解答 对 yab xe0 两边 取自然对数,得 ln yln ae0xln b,令 zln y,则 z 与 x 的数据如下表:x 1 2 3 4 5 6z 2.43 2.47 2.52 2.57 2.61 2.67由 zln ae 0xln b 及最小二乘法公式,得ln b0.047 7,ln ae02.378,即2.3780.047 7x,故Error!10.81.05 x.非线性回归问题有时并不给出经验公式 这时我们可以画出已知数据的散点 图,把它与学过的各种函数(幂函数、
15、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把 问题化为线性回 归分析问题,使之得到解决其一般步骤为:练一练3某电容器充电后,电压达到 100 V,然后开始放电,由经验知道,此后电压 U 随时间 t 变化的规律用公式 UAe bt(b0)表示,现测得时间 t(s)时的电压 U(V)如下表:t/s 0 1 2 3 4 5 6 7 8 9 10U/V 100 75 55 40 30 20 15 10 10 5 5试求:电压 U 对时间 t 的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对 UAe bt两边取对数得 ln
16、Uln Abt,令 yln U,a ln A,xt,则 yabx,y 与 x 的数据如下表:x 0 1 2 3 4 5 6 7 8 9 10y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6根据表中数据画出散点图,如图所示,从图中可以看出,y 与 x 具有较好的线性相关关系,由表中数据求得5,3.045,由公式计算得0.313,Error!4.61,所以 y 对 x 的线性回归方程为Error! 0.313x4.61.所以 ln 0.313t4.61,即e 0.313t4.61 e 0.313t e4.61,因此电压 U 对时间 t 的回归方程为e 0.313t e4.61.课堂归纳感悟提升 1本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题2本节课要重点掌握的规律方法(1)线性回归分析,见讲 1;(2)残差分析,见讲 2;(3)非线性回归分析, 见讲 3.