ImageVerifierCode 换一换
格式:DOC , 页数:4 ,大小:220KB ,
资源ID:515437      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-515437.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《回归分析》素材2(新人教b版选修2-3).doc)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

《回归分析》素材2(新人教b版选修2-3).doc

1、回归分析的基本思想及其初步应用知识梳理一线性回归方程的确定如果一组具有相关关系的数据 12(,),(),nxyxyA 作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为 yba那么如何求得参数 a和 使得各点与此直线的距离的平方和为最小,即如何求得线性回归方程呢? 在所求回归直线方程 yx中,当 取 ix时, iiybxa与实际收集到的数据 iy之间的偏差为 ()iiiiyba,偏差的平方为 22()()iiii(如图 1).即 21niiiQx来刻画出 n个点与回归直线在整体上的偏差的平方和,显然 Q 取最小值时的

2、,ab的值就是我们所求的 :12()niiiiixy12niixyaybx其中 (,)i为样本数据, 1,nniixy为样本平均数, (,)xy称为样本点中心,且所求线性回归直线经过样本点中心(如图 2 所示) 当回归直线斜率 0b时,为线性正相关, 0b时为线性负相关.应注意,这个最小距离不是通常所指的各数据的点 (,)ixy到直线的距离,而是各数据点 ()ixy沿平行 y 轴方向到直线的距离(如图 1 所示) 对于上面参数 ab和 的求法原理及方法是简单的,但是运算量较大,需要将AoAybxay x图 2bxaAiy ixxAiy2iio图 121()niiiQybxa展开,再合并,然后配

3、方整理,从而求得 ,ab. 例如,当 ,mn取怎样实数时, 22()()nmk的值为最小,显然当ab时最小值为 k,像这样配方求最值的方法是经常用到的, 线性回归方程yx中的参数 a就是这样求出的 .教材中用了添项法较为简捷的求出了截距 a和斜率 b分别是使21(,)()niiiQyx取最小值时 ,的值求得 12()niiiiiyx, yx的值,请同学们体会其解法线性回归方程的确定是进行回归分析的基础二回归分析:是对具有相关关系的两个变量进行统计分析的一种常用方法线性相关关系的强弱两个变量之间线性相关关系的样本相关系数 1221()()niiiniiiixyr衡量线性相性关系的强弱,由于分子与

4、斜率 b的分子一样,因此,当 0r时,两个变量正相关;当0r时两个变量负相关当 r的绝对值接近,表明两个变量的线性相关性很强;当 r的绝对值接近,表明两个变量之间几乎不存在线性相关关系规定当 .75r时,我们认为两个变量有很强的线性相关关系解释变量与随机误差对预报精度的影响以及残差分析(1)有关概念线性回归模型 2()0,()ybxaeED其中 a和 为模型的未知参数;x称为解释变量, y称为预报变量;e是 y与 bx之间的误差,叫随机误差。随机误差的估计值为 iiiiieyxa图 3AixoAy ybxaAi xiyiiieie称为相应于样本点 (,)ixy的残差(如图) (2)随机误差的方

5、差估计值 A2衡量回归方程的预报精度由于随机误差的均值 1()niEe0,因此,可以用随机误差的方差估计值 A221nie (,)Qab (其中2n,残差平方和为 21(,)()niiiQaby)衡量回归方程的预报精度,显然A越小,预报精度越高。(3)通过残差分析判断模型拟合效果由 iiiiieybxa计算出残差 1e, 2, ne,然后选取横坐标为编号、或解释变量或预报变量,纵坐标为残差作出残差图通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄,说明模型拟合效果,反映回归方程的预报精度3相关指数 2R反应模型的拟合效果22

6、12()niiiiiiy2211()()nni ii ii iiiiyy(1)变量理解:21()niiiy为总偏差平方和,表示解释变量和随机误差产生的总的效应;21()niiiy为残差平方和,表示了随机误差效应; 2211()()nni ii ii iy,表示了解释变量效应()模型拟合效果 21()niiiiiiy,反映了随机误差对预报变量(总效应)的贡献率;2212()niiiiiiyR反映了解释变量对预报变量(总效应)的贡献率;因此, 2越接近(即21()niiiiiiy越接近 0) ,表示回归的效果越好,即解释变量和预报变量的线性相关性越强三非线性回归的问题转化为线性回归问题(1)作散点

7、图确定曲线模型根据收集的数据作散点图(如图) ,可见两个变量不呈线性相关关系而是分布在某一条指数函数曲线 21cxye的周围,也可以认为样本点集中在某二次曲线 234ycx的附近(2)非线性转化为线性这时通过对数变换把指数关系 21cxye变为线性关系 21lnzcx;通过换元把二次函数 234ycx关系变换为线性关系 34yt 在这两种情况下就可以利用线性回归模型,建立 y和x之间的非线性回归方程了(3)比较两种模型的拟合效果对于给定的样本点 12(,),(),nxyxyA可以通过转换后的对应数表作散点图来确定线性回归的拟合情况,判断选用哪一种曲线模型较为合适;可以通过原始数据及 和 之间的非线性回归方程列出残差对比分析表,一般通过残差平方和比较两种模型的拟合效果,显然残差平方和较小的拟合效果较好;还可以用 2R来比较两个模型的拟合效果, 2R越大(越接近) ,拟合效果越好。o图 4AAAA

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报