收藏 分享(赏)

直线回归PPT课件.ppt

上传人:微传9988 文档编号:3357185 上传时间:2018-10-17 格式:PPT 页数:34 大小:816.50KB
下载 相关 举报
直线回归PPT课件.ppt_第1页
第1页 / 共34页
直线回归PPT课件.ppt_第2页
第2页 / 共34页
直线回归PPT课件.ppt_第3页
第3页 / 共34页
直线回归PPT课件.ppt_第4页
第4页 / 共34页
直线回归PPT课件.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、简单线性回归,概述,多个变量之间关系研究: 例:某人群年龄、BMI与收缩压的关系;儿童身高、胸围与肺活量的关系;在此,介绍两个变量间线性的数量依存关系,即线性回归。,“回归”的由来,Regression 释义,大多数高个子父代的子一代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平;大多数矮个子父代的子一代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于人群平均水平的现象称之为“回归”。,Regression 释义,Galton数据散点图(英寸),直线回归的概念,回归 F.Galton和Karl Pearson发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:

2、,一. “回归”(regression)一词的由来,人们借用“回归”这个词来描述通过自变量(independent variable) 的数值预测反应变量(response variable)的平均水平。为了通过可测或易测变量对未知或难测或不可测量的状态进行估计,可以借助于回归分析(regression analysis)。例如:可以用身高体重活量估计心室输出量,体循环总血量。尿雌三醇含量估计胎儿的体重。,标准差相等 EQUAL STANDARD DEVIATION 对于任何X值,随机变量Y的标准差 Y|X相等,独立 INDEPENDENCE 每一观察值之间彼此独立,y|X = + x,直线回

3、归模型的四个假定,线性 LINEARITY 反应变量均数 与X间呈直线关系 Y|X= a + X,正态 NORMALITY 对于任何给定的 X, Y 服从正态分布,均数为 Y|X,标准差为 Y|X,直线回归的一般表达,直线回归的概念,a:常数,截距(intercept)当X取值为0时相应Y的均数估计; b:斜率(slope),回归系数(cofficient of regession)当X变化一个单位时Y的平均改变的估计值。,直线回归方程的求法,最小二乘法(least square method)原理,最小二乘法原则 (least square method):使各实际散点(Y)到直线( )的纵

4、向距离的平方和最小。即使 最小。,最小二乘 (Least squares)法图解,寻找使S(残差i)2 最小的直线,直线回归方程的求法,根据数学上的最小二乘法(least square method)原理,可导出a、b的算式如下:,因为直线一定经过 “均数”点,直线回归中的统计推断,回归系数的假设检验总体回归系数 的可信区间,回归系数的假设检验,直线回归中的统计推断,b0原因: 总体回归系数=0,由于抽样误差引起 b0 总体回归系数 0,存在回归关系 因此需作是否为零的假设检验。方法:方差分析t检验,X,方差分析方法 基本思想需要对应变量Y的 离均差平方和作分解。,应变量Y的平方和划分示意图:

5、,Y的离均差平方和的分解,统计量F 的计算公式为:分别称为回归均方与剩余均方。统计量F服从自由 度为 的F分布。求F值后,查F界值表,得P值,按所取检验水准作出推断结论。,直线回归中的统计推断,t检验方法,直线回归中的统计推断,Syx为y的剩余标准差- 扣除x对Y的线性影响后y对回归线的离散程度。,回归方程的评价,假设检验 Root MSE (剩余标准差) R-Square (决定系数) Adj R-Sq (校正决定系数),R-Square:回归平方和在Y的总离均差平方和中所占比重R-Square=SS回归/SS总=1-SS剩余/SS总0R-Square 1当回归系数=0, 则R-Square

6、=0当所有的观测值正好落在拟和的回归线上时, 则R-Square=1R-Square越接近1,说明回归模型对资料的拟合优度越佳,故R-Square作为衡量模型优劣的测度。,使用R-Square评价模型时需注意:,较大的R-Square并不一定意味着拟合模型是有用的,可能是因为:只取得自变量很少几个水平的观察值,此时,尽管R-Square很大,甚至趋于1,但它不能作为衡量模型优劣的测度统计量;,Adj R-Sq :校正决定系数可见,校正决定系数是相对SS残与SS总的自由度进行的加权调整。,总体回归系数的可信区间的1-双侧可信区间为:,直线回归中的统计推断,Sb为回归系数的标准误,描述 预报 控制

7、,直线回归的应用,描述两变量的依存关系通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归来描述两变量的依存关系。,直线回归方程的应用,利用回归方程进行预测(forecast)把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。,直线回归方程的应用,利用回归方程进行统计控制(statistical control)利用回归方程进行逆估计,如要求应变量Y在一定范围内波动,可以通过自变量X的取值来实现。,直线回归方程的应用,总体均数 的可信区间给定X=X0 时,总体均数 的可信区间其中,直线回归的应用,直线回归中的统计推断,个体 Y值的预测区间给定X=X0 时,对应的个体Y值也存在一个波动范围。其标准差SY0按如下公式计算:给定X=X0时个体Y值的1-预测区间为:,置信区间、预测区间、回归方程,回归分析注意的问题,有实际意义 数据须符合模型假设条件 须对回归系数进行假设检验 在X的取值范围内应用,例12-1,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 医学治疗 > 基础医学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报