1、1.1 回归分析的基本思想及其初步应用,第一章 统计案例,学习目标 1.了解回归分析的必要性及其一般步骤. 2.了解随机误差的概念. 3.会作散点图,并会求线性回归方程. 4.利用残差分析来判断线性回归模型的拟合效果. 5.掌握建立回归模型的基本步骤,并通过实例进一步学习回归分析的基本思想及其初步应用.,问题导学,达标检测,题型探究,内容索引,问题导学,知识点一 回归分析的相关概念,思考1 相关关系是确定性关系吗?函数关系呢?,答案 相关关系是一种非确定性关系,而函数关系是一种确定性关系.,思考2 请问产生随机误差的主要原因有哪些?,答案 (1)所选用的模型不恰当; (2)忽略了某些因素的影响
2、; (3)存在测量误差.,梳理 (1)回归分析是对具有 的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为_.,相关关系,线性,回归分析,(3)样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数ybxa来描述它们之间的关系,而是用线性回归模型_来表示,其中 为模型的未知参数, 称为随机误差,自变量x称为 变量,因变量y称为 变量. 预报变量y的值由解释变量x和随机误差e共同确定,即解释变量x只能解释部分预报变量y的变化.,ybx,ae,a和b,e,解释,预报,知识点二 回归模型的模拟效果,思考 如何评价回归模型拟合效果的优劣?,答案 计
3、算相关指数R2的值,R2越接近于1,效果就越好.,梳理,残差,样本编号,解释变量,的数值,越窄,越小,解释,预报,1.回归方程 的变化量.( ) 2.R2越大,残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.( ) 3.散点图是判断两个变量是否有相关关系的工具之一.( ) 4.在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有点(xi,yi)(i1,2,n)都在直线y 1上,则这组样本数据的样本相关系数为1.( ) 5.回归直线 ( ),思考辨析 判断正误,题型探究,例1 现有某高新技术企业年研
4、发费用投入x(百万元)与企业年利润y(百万元)之间具有线性相关关系,近5年的年科研费用和年利润具体数据如下表:,类型一 线性回归方程的求解,(1)画出散点图;,解答,解 散点图如下图所示:,(2)求y对x的线性回归方程.,解答,引申探究 在例1基础上,试估计当x10时,企业所获利润为多少?,故估计企业所获利润为11.7百万元.,解答,反思与感悟 (1)求线性回归方程的基本步骤 列出散点图,从直观上分析数据间是否存在线性相关关系.,写出线性回归方程并对实际问题作出估计. (2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.,跟踪训练1 假设关于
5、某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据:,由此资料可知y对x呈线性相关关系.,(1)求线性回归方程;,解答,解 由上表中的数据可得,(2)求使用年限为10年时,该设备的维修费用为多少?,解答,即使用年限为10年时,该设备的维修费用为12.38万元.,例2 某运动员训练次数与运动员成绩之间的数据关系如下:,类型二 回归模型的效果,(1)作出散点图;,解答,解 该运动员训练次数(x)与成绩(y)之间的散点图如图所示.,(2)求出线性回归方程;,解答,(3)作出残差图,并说明模型的拟合效果;,解答,解 作残差图如图所示,,由图可知,残差点比较均匀地分布在水平的带状区域中
6、,说明选用的模型比较合适.,(4)计算R2,并说明其含义.,解答,反思与感悟 (1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析. (2)刻画回归效果的三种方法 残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.,则_同学的试验结果体现拟合A,B两变量间关系的模型的拟合效果最好.,丁,答案,解析,解析 残差平方和越小,模型的拟合效果越好,因丁对应的残差平方和最小,故丁所对应的模型拟合效果最好.,解答,(2)
7、关于x与y有如下数据:,(1)的拟合效果好于(2)的拟合效果.,达标检测,1,2,3,4,1.设回归方程为 73x,当变量x增加两个单位时 A.y平均增加3个单位 B.y平均减少3个单位 C.y平均增加6个单位 D.y平均减少6个单位,答案,5,解析 因为两个相关变量为负相关关系.,解析,2.已知x与y之间的一组数据:,解析 过样本点中心.,解析,答案,1,2,3,4,5,3.在回归分析中,相关指数R2的值越大,说明残差平方和 A.越大 B.越小 C.可能大也可能小 D.以上均不正确,解析,答案,1,2,3,4,5,即残差平方和越小,故选B.,4.某学生课外活动兴趣小组对两个相关变量收集到5组
8、数据如表:,1,2,3,4,5,答案,由最小二乘法求得回归方程为 0.67x54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为_.,68,解析,设要求的数据为t,,1,2,3,4,5,1,2,3,4,5,0.29,答案,解析,回归分析的步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程); (4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.,规律与方法,本课结束,