1、第三章统计案例,第三章统计案例,31回归分析的基本思想及其初步应用,第三章统计案例,学习导航,1线性回归模型(1)线性回归模型y_,其中a和b是模型的未知参数,e称为_.自变量x又称为解释变量,因变量y又称为_,bxae,随机误差,预报变量,想一想在线性回归模型中,预报变量y由解释变量x唯一确定吗?提示:不唯一y值由x和随机误差e共同确定,即自变量x只能解释部分y的变化,做一做答案:58.5,2刻画回归效果的方式,残差,样本编号,身高数据,体重估计值,越小,解释,预报,题型一求线性回归方程,对于x与y有如下观测数据:(1)作出散点图;(2)求出y关于x的回归直线方程,【解】(1)作出散点图,如
2、图所示:,跟踪训练1有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化下面是试验所得数据:(1)作出散点图;(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程,解:(1)散点图如图所示,已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏,题型二线性回归分析,【名师点评】在进行线性回归分析时,要按线性回归分析步骤进行在求R2时,通常采用分步计算的方法,R2越大,模型的拟合效果越好,跟踪训练2关于x与y有如下数据:,下表为收集到的一组数据:(1)作出x
3、与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值,题型三非线性回归分析,【解】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1、c2为待定的参数,(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa(aln c1,bc2)的周围,这样就可以利用线性回归模型来建立非线性回归方程了,数据可以转化为:,残差(3)当x40时,ye0.272403.8491 131.【名师点评】非线性回归问题
4、有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决,跟踪训练3.某地区不同身高的未成年男性的体重平均值如下表:试建立y与x之间的回归方程解:由已知数据,作出散点图如图:,由散点图可以看出,样本点分布在某条指数函数曲线yc1ec2x的周围,于是令zln y,则所给表变换后如下:作出散点图如图所示从图中可以看出,变换后的样本点分布在某条直线的附近,因此可用线性回归方程来拟合,回归模型的拟定 炼钢厂出钢时盛钢水的钢包在使用过程中受钢水和炉渣侵蚀,其容积不断增大下表是钢包使用不同次数时钢包容积(由于容积不便测量,故以钢包盛满水质量表示)的一组实测数据钢包使用次数与容积实测数据,名师解题,试求出y关于x的回归方程,【解】先建立坐标系,画出散点图,如图:从图中我们可以发现,这一系列的点并不是均匀分布在一条直线附近,这些点开始时y值增加很快,随后逐渐减慢趋于平缓据此,我们可以用双曲线来拟合这些数据,从而达到较好的吻合程度,跟踪训练4x、y满足如下表的关系:则x、y之间符合的函数模型为_解析:通过数据发现y的值与x的平方值比较接近,所以x、y之间的函数模型为yx2.答案:yx2,