1、第三课时教学目标 知识与技能能根据散点分布特点,建立不同的回归模型;知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果过程与方法通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法情感、态度与价值观通过案例的解决,开阔学生的思路,培养学生的探索精神和转化能力,并通过合作学习,培养学生的团队合作意识重点难点 教学重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转
2、化为线性回归模型;教学难点:如何启发学生“对变量作适当的变换(等量变换、对数变换 )”,变非线性为线性,建立线性回归模型教 学 过 程Error!我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产其中红铃虫就是危害棉花生长的一种常见害虫,在 1953 年,我国 18 省曾发生红铃虫大灾害,受灾面积 300 万公顷,损失皮棉约二十万吨如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为 2532 ,相对湿度为 80%100% ,低于 20 和高于 35 卵不能孵化,相对湿度 60%以下成
3、虫不产卵冬季月平均气温低于4.8 时,红铃虫就不能越冬而被冻死为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系现收集了红铃虫的产卵数 y 和温度 x 之间的 7 组观测数据列于下表:温度 x/ 21 23 25 27 29 32 35产卵数 y/个 7 11 21 24 66 115 325(1)试建立 y 与 x 之间的回归方程;并预测温度为 28 时产卵的数目(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施活动结果:(1)画散点图:通过计算器求得线性回归方程: 19.87x463.73.y 当 x28 时, 1
4、9.8728463.7393,即温度为 28 时,产卵数大约为 93.y (2)进行回归分析计算得:R20.746 4,即这个线性回归模型中温度解释了 74.64%产卵数的变化设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤Error!提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为 28 时,估计产卵数应该低于 66 个,但是从推算的结果来看 93 个比 66 个却多了 27 个,是什么原因造成的呢?学生活动:分组合作讨论交流学情预测:由于我们所建立的线性回归模型的相关指数约等于 0.746
5、 4,即解释变量仅能解释预报变量大约 74.64%的变化,所占比例偏小这样根据我们建立的模型进行预报,会存在较大的误差我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:残差数据表:x 21 23 25 27 29 32 35y 7 11 21 24 66 115 325残差 53.46 17.72 12.02 48.78 46.5 57.11 93.28画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想之所以造成预报值偏差太大的原因是所选模型并不理想实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不
6、会存在很强的线性相关性设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力Error!提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数学情预测:方案一:建立二次函数模型 ybx 2a.方案二:建立指数函数模型 yc 1ac2x.提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数学生活动:分组合作,教师引导学生观察 ybx 2a 与 ybxa 的关系学情预测:通过比较,发现可利用 tx 2,将 ybx 2a(二次函数)转化成 ybta(
7、 一次函数) 求出 x,t,y 间的数据转换表:x 21 23 25 27 29 32 35tx 2 441 529 625 729 841 1 024 1 225y 7 11 21 24 66 115 325利用计算器计算出 y 和 t 的线性回归方程: 0.367t 202.54 ,y 转换回 y 和 x 的模型: 0.367x 2202.54.y 当 x28 时, 0.36728 2202.5485,即温度为 28 时,产卵数大约为 85.y 计算相关指数 R20.802,这个回归模型中温度解释了 80.2%产卵数的变化提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转
8、化?”学生活动:独立思考也可相互讨论教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系学情预测:可利用取对数的方法,即在 yc 1ac2x 两边取对数,得 logayc 2xlog ac1.提出问题:在上面的运算中,由于底数 a 不确定,对于 x 的值无法求出相应的 logay,这时可取 a10 时的情况,以便利用计算器进行计算,试求出回归模型学生活动:合作协作,讨论解决学情预测:建立数据转换表:x 21 23 25 27 29 32 35zlgy 0.85 1.04 1.32 1.38 1.82 2.06 2.51y 7 11 21 2
9、4 66 115 325根据数据,可求得变量 z 关于 x 的回归方程: 0.118x1.665.z 转换回 y 和 x 的模型: 10 0.118x1.665 .y 当 x28 时, 44,即温度为 28 时,产卵数大约为 44.y 计算相关指数 R20.985,这个回归模型中温度解释了 98.5%产卵数的变化提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同?学生活动:独立思考也可相互讨论,教师加以适当的引导提示活动结果:相关指数 R2 残差平方和 残差图方案一 0.802 15 448.432方案二 0.985 1 450.673无论从图形上直观观察,还是从数
10、据上分析,指数函数模型都是更好的模型设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换” 等方法设计目的:让学生整理建立非线性回归模型的思路Error!例 1 为了研究某种细菌繁殖个数 y 与时间 x 的关系,收
11、集数据如下:天数 x(天) 1 2 3 4 5 6繁殖个数 y(个) 6 12 25 49 95 190试建立 y 与 x 之间的回归方程思路分析:先画出散点图,根据散点图确定回归模型的类型,然后求 y 与 x 之间的回归方程解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线 yc 1ec2x 的周围,于是令 zlny ,则上表变换后如下:x 1 2 3 4 5 6z 1.79 2.48 3.22 3.89 4.55 5.25作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合由表中数据可得,z 与 x 之间的线性回归方程为 0.69x1
12、.112,z 则 y 与 x 之间的回归方程为 e 0.69x1.112 .y 【变练演编】例 2 混凝土的抗压强度 X 较易测定,其抗弯强度 Y 不易测定,已知 X 与 Y 由关系式YAX b 表示,工程中希望由 X 估算出 Y,以便应用现测得一批对应数据如下:X 141 152 168 182 195 204 223 254 277Y 23.1 25.3 25.9 29.8 31.1 31.8 32.5 34.8 35.2试求 Y 对 X 的回归方程思路分析:题目中已经给出回归模型为 YAX b 类型,故只要通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题
13、步骤即可解:对 YAX b 两边取自然对数得:lnYblnXlnA,做变换ylnY,xlnX,alnA,则上述数据对应表格如下:X 141 152 168 182 195 204 223 254 277Y 23.1 25.3 25.9 29.8 31.1 31.8 32.5 34.8 35.2x 4.95 5.02 5.12 5.20 5.27 5.32 5.41 5.54 5.62y 3.14 3.23 3.25 3.39 3.44 3.46 3.48 3.55 3.56根据公式可求得 0.64x0.017 2,则y e 0.64lnx0.017 2 1.02X 0.64.Y 变式 1:若
14、X 与 Y 的关系由关系式 Xb 表示,试根据给出的数据求 Y 对 XY 的回归方程活动设计:学生分组讨论,尝试解决活动成果: 0.086X13.005.Y 变式 2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好?活动成果:计算残差平方和与相关指数,对于模型 YAX b,残差平方和 (1)Q 9.819,相关指数 R 0.930 4;对于模型 Xb ,残差平方和 (2)12.306,相关21 Y Q 指数 R 0.908,故模型 YAX b 的拟合效果较好2设计意图:熟悉判断回归模型拟合效果的方法【达标检测】1变量 x,y 的散点图如图所示,那么 x,y 之间的样
15、本相关系数 r 最接近的值为( )A1 B0.5C0 D0.52变量 x 与 y 之间的回归方程表示( )Ax 与 y 之间的函数关系Bx 与 y 之间的不确定性关系Cx 与 y 之间的真实关系形式Dx 与 y 之间的真实关系达到最大限度的吻合3非线性回归分析的解题思路是_答案:1.C 2.D 3.通过变量置换转化为线性回归分析Error!1数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析2数学思想:数形结合的思想,化归思想及整体思想3数学方法:数形结合法,转化法,换元法Error!【基础练习】1相关指数 R2,残差
16、平方和与模型拟合效果之间的关系是( )AR 2 的值越大,残差的平方和越大,拟合效果越好BR 2 的值越小,残差的平方和越大,拟合效果越好CR 2 的值越大,残差的平方和越小,拟合效果越好D以上说法都不正确2如果散点图的所有点都在一条直线上,则残差均为_,残差平方和为_,相关指数为_答案:1.C 2.0 0 1【拓展练习】3某种书每册的成本费 Y 元与印刷册数 x(千册)有关,经统计得到数据如下:x 1 2 3 5 10 20 30 50 100 200Y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15检验每册书的成本费 Y 元与印刷册数的
17、倒数 之间是否有线性相关关系,如有,求出1xY 对 的回归方程1x解:把 置换为 z,则 z ,从而 z 与 Y 的数据为:1x 1xz 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005Y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15根据数据可得 r0.999 80.75,故 z 与 Y 具有很强的线性相关关系所以 8.976, 1.120,从而 8.976z1.120.b a y 又 z ,所以 1.120.1x y 8.976x设 计 说 明本课时内容教材中只安排了一道关于“红铃虫”的例题,
18、但是它却代表了一种“回归分析”的类型如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法首先展示“红铃虫” 的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果培养学生观察、类比联想以及分析问题的能力在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函
19、数和指数函数模型在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径在运算过程中,如求“相关指数”引导学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能备 课 资 料1回归分析与相关分析的区别(1)相关分析中,变量 x、变量 y 处于平等的地位;回归分析中,变量 y 称为预报变量,处在被解释的地位,x 称为解释变量,用于预测因变量的变化(2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,预报变量 y 是随机变量,解释变量 x 可以是随机变量,也可以是非随机的确定变量(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制2常见的非线性回归向线性回归的转化手段:曲线方程 变换公式 变换后的线性方程 a1y bxy ,x1y 1xya bxyax b ylny,xlnx ya bxya blnx yy,xlnx ya bxyae bx ylny ,xx ya bx(设计者:杨雪峰)