1、3.1回归分析的基本思想及其初步应用(一)临清二中赵孝金,高二数学 选修2-3,学习目标画散点图了解最小二乘法的思想求回归直线方程 ybxa用回归直线方程解决应用问题,2018/6/28,郑平正 制作,问题1:正方体的体积y与正方体的边长x之间 的函数关系是,y = x3,问题2:某学生学习的态度与学习成绩之间是否 有一个确定性的关系?,例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:,前置测评 变量之间的两种关系,10 20 30 40 50,500450400350300,施化肥量,水稻产量,自变量取值一定时,因变量的取值带有一定随机
2、性的两个变量之间的关系叫做相关关系。,1、定义:,1):相关关系是一种不确定性关系;,注,现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等,探索:水稻产量y与施肥量x之间大致有何规律?,10 20 30 40 50,500450400350300,发现:图中各点,大致分布在某条直线附近。,探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?,散点图,施化肥量,水稻产量,10 20 30 40 50,500450400350300,施化肥量,水稻产量,探究,对于一组具有线性相关关系的数据,我们知道
3、其回归方程的截距和斜率的最小二乘估计公式分别为:,称为样本点的中心。,你能推导出这个公式吗?,其中,a,b是待定参数。当变量x取 时 它与实际收集到的 之间的偏差是,易知,截距 和斜率 分别是使取最小值时 的值。由于,这正是我们所要推导的公式。,在上式中,后两项和 无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0,即有,1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。,2、对两个变量进行的线性分析叫做线性回归分析。,1、回归直线方程,最小二乘法:,称为样本点的中心。,思考:回归直线方程一定过点 吗?,2、求回归直线方程的步骤:,(3)代入公式,例1、观察两相关
4、量得如下数据:,求两变量间的回归方程.,解:列表:,所求回归直线方程为,例2:已知10只狗的血球体积及血球的测量值如下:,x(血球体积,mm), y(血球数,百万)(1)画出上表的散点图;(2)求出回归直线并且画出图形;(3)回归直线必经过的一点是哪一点?,3、利用回归直线方程对总体进行线性相关性的检验,例3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:,(1)y与x是否具有线性相关关系;(2)如果具有线性相关关系,求回归直线方程;
5、(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?,(1)列出下表,并计算,所以回归直线的方程为 =1.267x-30.51,(3)当x=160时, 1.267.160-30.51=172,(2)设所求的回归方程为,例题4 从某大学中随机选出8名女大学生,其身高和体重数据如下表:,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172的女大学生的体重。,分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量,2.回归方程:,1. 散点图;,相关系数,正相关;负相关通常,r0.75,认为两个变量有很强的相关性,本例中,由上面公式r=0.7980.75,探究?,身高为172的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么?,如何描述两个变量之间线性相关关系的强弱?,在数学3中,我们学习了用相关系数r来衡量两个变量之间线性相关关系的方法。,相关系数r,相关关系的测度(相关系数取值及其意义),r,