1、1.1 回归分析的基本思想及其初步应用一、知识清单1.总偏差平方和:在数学上,把每个效应(观测值减去总的平均值) 的平方和加起来,即用_表示总的效应,成为总偏差平方和,它代表了解释变量和随机误差的组合效应.2.残差与残差平方和:数据点和它在回归直线上相应位置的差异 是随机误差的效)(iiy应,称 为_.将所有数据对应的残差平方后加起来,用数学符号表示为iiiye,称为_,它代表了随机误差的效应,总偏差平方和与残差平方和niii12)(的差称为_.它是解释变量的效应.3.相关指数:用相关指数 来刻画回归的效果. 越大,模型的拟合效果niiiiyR122)(2R_, 越小,模型的拟合效果_,在实际
2、应用中应该尽量选择 _的模型.2 2二、典型例题题型一:线性回归分析例 1.在一段时间内,分 5 次测得某种商品的价格 (万元)和需求量 之间的一组数据为:x)(ty1 2 3 4 5价格 x1.4 1.6 1.8 2 2.2需求量 y12 10 7 5 3已知 ,6.,25151iii(1)画出散点图;(2) 求出 对 的回归方程;(3) 若价格定为 1.9 万元,预测需求量大约是多x少?(精确到 0.01 )t题型二:残差分析例 2.假定小麦基本苗数 与成熟期有效穗 之间存在相关关系,今测得 5 组数据如下:xyx15.0 25.8 30.0 36.6 44.4y39.4 42.9 42.
3、9 43.1 49.2(1)以 为解释变量, 为预测变量,作出散点图;(2)求 与 之间的回归方程,对于基本苗数x56.7 预报有效穗;(3)计算各组参差,并计算残差平方和; (4)求相关指数 ,并说明残差变量2R对有效穗的影响占百分之几?题型三:非线性回归分析例 3.如下表所示,某地区一段时间内,观察到的大于或等于某震级 的地震数为 ,试建立回xN归方程表述二者之间的关系. x3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0N28381 20380 14795 10695 7641 5502 3842 2698 1919 1356 9735.2 5.4
4、5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0746 604 435 274 206 148 98 57 41 25三、课后巩固1.有下列说法:(1)线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; (2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;(3)通过回归方程及其回归系数,可以估计和观测变量的取值和变化趋势;(4)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )A.1 B.2 C.3 D.42.如图所示,图中有 5 组数据,去掉_(填字母代号) 组数据后 ,剩下的 4 组
5、数据的线性相关性最大.3.若回归直线方程为 则变量 每增加 1 个单位时,变量 ( ),2xyyA.平均增加 1 个单位 B.平均减少 1 个单位C.平均增加 2 个单位 D.平均减少 2 个单位4.由一组数据( ),( ),( )得到的回归直线方程 则下列说法不1,yx2,nyx, ,axby正确的是( )A.直线 必过点 B.直线 的斜率为axby),(yxaxbyniiixy12C.直线 至少经过点 ( ),( ),( )中的一个点1,2,n,D.直线 和各点( ),( ),( )的偏差是该坐标平面上所有直线与axbyyx2nyx这些点的偏差中最小的直线5.下表是 和 之间的一组数据,则
6、 关于 的线性回归方程必过点( )1 2 3 4y1 3 5 7A.(2,3) B.(1.5,4) C.(2.5,4) D.(2.5,5)6.在判断两个变量是否相关时,选择了 4 个不同的模型,它们的相关指数 分别为模型一:2R0.98,模型二:0.80,模型三:0.50,模型四:0.25,其中拟合效果最好的是( )A.模型一 B.模型二 C.模型三 D.模型四7.某个服装店经营某种服装,在某周内获利 (元), 与该周每天销售这种服装件数 之间的一yx组数据如下表: x3 4 5 6 7 8 9y66 69 73 81 89 90 91已知 ,4309,280,87712171 iiii yx(1)求 ;(2)画出散点图;(3) 求纯利 与每天销售件数 之间的回归直线方程.yx, x8.为了研究某种细菌随时间 变化繁殖的个数 收集数据如下:x,y天数 /天x1 2 3 4 5 6繁殖个数 /个y6 12 25 49 95 190(1)作出这些数据的散点图;(2)从图上你认为选择什么样的回归模型比较符合我们所得到的样本数据?(3)借助于计算器求其指数型和二次多项式型回归曲线方程; (4)如何评价上面两种函数模型拟合的效果?9.在一次抽样调查中测得样本的 5 个样本点,数值如下表:x0.25 0.5 1 2 4y16 12 5 2 1建立 与 之间的回归方程.