1、1高中数学 第一章 统计案例 1.1 回归分析的基本思想及其初步应用预习导航 新人教 A 版选修 1-2课程目标 学习脉络1了解回归分析的必要性及其一般步骤2了解随机误差的概念3会作散点图,会求回归直线方程4会用残差分析判断线性回归模型的拟合效果5掌握建立回归模型的基本步骤,体会回归分析的实际价值和基本思想1线性回归模型(1)线性回归模型 y bx a e,其中 a 和 b 为模型的未知参数, e 称为随机误差自变量 x 称为解释变量,因变量 y 称为预报变量(2)在线性回归方程 x 中, , ,其中 y a b b 12niiiiixya y b x x, ,( , )称为样本点的中心,回归
2、直线过样本点的中心1nixy 1nix y思考 1 线性回归模型与一次函数模型的区别在哪里?提示:线性回归模型与一次函数模型的不同之处是增加了随机误差项 e,在线性回归模型 y bx a e 中,因变量 y 的值由自变量 x 和随机误差 e 共同确定,即自变量 x 只能解释部分 y 的变化在实际问题中,线性回归模型适用的范围要比一次函数模型适用的范围大得多,当随机变量 e 恒等于 0 时,线性回归模型就变成了一次函数模型,因此一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式思考 2 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值,
3、利用线性回归方程求出的值,只是个预报值,例如人的体重与身高存在一定的线性关系,但体重除了受身高影响外,还受其他因素影响,如饮食等2刻画回归效果的方式残差 把随机误差的估计值 称为相应于点( xi, yi)的残差ei 2残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和 残差平方和为 (yi )2,残差平方和越小,模型的拟合效果越好 n i 1 yi R2R21 , R2表示解释变量对预报变量变化的贡献率, R2越接A1()iiniiy近于 1,表示回归的效果越好思考 3 在回归分析中, R2的值越大,则残差平方和越大还是越小?提示: R2的值越大,说明回归模型拟合的效果越好,残差平方和越小,反之,亦成立思考 4 怎样理解散点图和 R2的关系?提示:散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算 R2来描述两个变量之间的密切程度