收藏 分享(赏)

SPSS回归分析(精彩).pdf

上传人:weiwoduzun 文档编号:5660775 上传时间:2019-03-11 格式:PDF 页数:74 大小:949.98KB
下载 相关 举报
SPSS回归分析(精彩).pdf_第1页
第1页 / 共74页
SPSS回归分析(精彩).pdf_第2页
第2页 / 共74页
SPSS回归分析(精彩).pdf_第3页
第3页 / 共74页
SPSS回归分析(精彩).pdf_第4页
第4页 / 共74页
SPSS回归分析(精彩).pdf_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、SPSS回归分析回归分析简介 探察变量之间的数量变化规律,并通过一定的数学表达式来描述这种关系,进而确定一个或几个变量的变化对另一个变量的影响程度 回归分析是研究变量间统计关系的方法。侧重考察回归分析的类型 因变量与自变量都是定量变量的回归分析 回归分析 因变量是定量变量,自变量中有定性变量的回归分析 含有哑变量的回归分析 因变量是定性变量的回归分析Logistic回归分析 Logistic回归分析一元线性回归分析 一元线性回归(简单线性回归):研究两个变量间的统计关系。 应用例子 某高档消费品的销量与城镇居民收入 储蓄额与居民收入。 工业产值与用电量。 某只股票的收益率和大盘指数的收益率 企

2、业的利润率和资产 商品的销量和广告投入一元线性回归分析 一元线性回归模型 通过一定数量的样本观测值,用最小二乘法求解出回归方程 但是只有当满足一定的假设条件下,样本数据的最小二乘估计才是总体参数的最佳无偏估计。一元线性回归分析 回归模型的进一步说明 又称偏回归系数partial re gression coefficient,简称回归系数。表示其它变量不变,x变化时所预测y的平均变化率一元线性回归分析 回归方程的假定条件 正态性假定 零均值假定 等方差假定 独立性假定以上假定条件全部满足时,回归方程才有意义一元线性回归分析 正态性假设: 要求总体误差项服从正态分布。如果违反这一假设则最小二乘估

3、计不再是最佳无偏估计,不能进行区间估计。(如果不涉及假设检验和区间估计,则此假定可以忽略) 零均值性: 即在自变量取一定值的条件下,其总体各误差项的条件平均值为零。如果违反这一假设则由最小二乘估计得到的估计不再是无偏估计 等方差性: 即在自变量取一定值的条件下,其总体各误差项的条件方差为一常数。如果违反这一假设则最小二乘估计不再是有效估计,不能进行区间估计 独立性假设 : 误差项之间相互独立(不相关),误差项与自变量之间应相互独立如果违反这一假设则误差项之间可能出现序列相关,最小二乘估计不再是有效估计。回归分析 AnalyzeRegression 可实现: 线性回归: 简单线性回归和多元线性回

4、归,由Linear过程实现 分类变量为因变量的回归 二项Logistic回归 多项Logistic回归 Ordinal回归 Probit回归 非线性回归 曲线估计 非线性估计 权重估计 两阶最小二乘 最优尺度回归分析 分析步骤 做出散点图 观察变量间的趋势。多个变量则做出散点图矩阵、重叠散点图和三维散点图 考察数据的分布,做必要的预处理分析变量的正态性和方差齐等问题 。 进行直线回归分析 残差分析,检查残差的独立性和正态性 强影响点的诊断和多重共线性问题的判断回归分析 常用指标 偏回归系数:反映相应一个自变量上升一个单位时,应变量取值的变动情况 决定系数R2即相应的相关系数的平方,用 R2表示

5、。反映应变量y的全部变异中能够通过回归关系被自变量解释的比例。 R2越接近1越好。 多元回归时,决定系数缺乏可靠性,此时可参考调整的决定系数 R2回归分析 回归直线意义的F检验 统计量F=平均回归平方和/平均残差平方和。若F值过小说明自变量对因变量的解释力度很差,拟合的回归直线没有意义,相反若概率值(SPSS中以sig表示,越小越好) 残差的独立性检验 Durbin-Watson检验的参数D的取值范围是0Linear Dependent:人均食品支出,Independent(s):人均收入 设置Statistics ,Plot选项回归分析SPSS实现 部分输出结果 常数项的检验结果是其影响不显

6、著的,所以需要进一步改善模型,考虑建立不含常数项的回归方程回归分析SPSS实现 不含常数项的回归模型的部分输出结果回归诊断 诊断模型:残差分析 残差分析用于判断你对模型的假定是否符合: 线性关系; 误差项等方差; 误差项相互独立; 误差项正态分布; 还可以检测出异常值和有影响的点回归分析SPSS实现 残差分析结果回归分析SPSS实现回归诊断 异常值探查 SPSS中设定和检测异常值 Regression-Linear-Statistics ResidualsCase diagnostics :设定超过几倍标准差的观测作为异常值(Outliers outside n standard deviat

7、ions) 残差散点图回归诊断 异常值探查 以数据 ”人均食品支出.sav “,为例,进行异常点检 Regression-Linear-Statistics Residuals-case diagnostics ,并选中outlier outside .,填入2 Plots: Scatter: ZRESID-Y, ZPRED-X ,做残差与预测值的散点图回归分析异常值探查 输出结果线性模型意味什么? 因变量和自变量?事实上,只要系数之间是线性组合的,并可通过变换可转换为线性方程的,都可尝试用线性模型进行拟合一般线性模型的假设 一般线性模型潜在的一些假设 回归方程具有特定的形式。例如,因变量表示

8、为截距、自变量的线性组合,及残差的和。不满足这一假设,可能原因 忽略了重要的自变量 包含了不相关的自变量 非线性因变量和自变量之间的关系是非线性的 变动的参数数据收集期间,方程中参数不是常数 非可加性自变量中某个给定变量的影响是附随着其它变量的 残差为零均值。违反该假设,易导致截距的有偏估计一般线性模型的假设 残差不是自相关的 所有自变量都是非随机的 观测数大于未知系数 在解释变量之间不存在确切的线性关系练习 数据:world95.sav 目的:利用生育率(fertility)预测妇女的平均预期寿命(lifeexpf) 要求: 探索性分析两个变量,探察两个变量中是否存在异常点?您获得的对两个变

9、量的哪些认识? 做两个变量的散点图,建立两个变量的线性回归模型,是否合理呢? 利用生育率来预测妇女的预期寿命。并设置相关选项,以进一步检验关于线性回归的一些假定此数据满足吗?并进行回归诊断,对模型的系数进行解释。从输出结果,您是否可以得出如果妇女多要一个小孩对她的寿命有多大影响吗?练习 数据:waste.sav 要求: 提出有意义的问题有时比解决问题更重要 利用学过的统计方法,看看您能够进行哪些分析,从各种分析中,您能够得出哪些有意义的结论多元线性回归分析多元回归分析 研究多个变量间的关系,因变量如何受到多个自变量的影响,用多个自变量预测因变量的值 多元线性回归是研究多个变量间因果关系的常用方

10、法之一 多个变量中有一个是因变量。其它的变量都是自变量,个数在两个以上 每个自变量和因变量之间的关系都是线性的 例: 超市中商品的价格、摆放位置、促销手段如何影响销售量; 如何用客户的个人资料(职业、收入、家庭成员人数、婚姻状况、是否有抵押等)进行信用预测; 连锁旅店的利润主要受哪些因素影响; 宏观经济指标预测多元线性回归分析 多元线性回归的方程 为偏回归系数 表示在其它变量保持不变的情况下,自变量 变动一个单位所引起的因变量y的平均变动。 回归方程的显著性检验(模型拟合效果的检验) 自变量的筛选 多重共线性问题 影响点的探察 12p、i多元线性回归分析 方程的检验 认识 总变差的分解: 判定系数: 多重相关系数R 调整(修正)的判定系数:= 22111(1 )nnpAdj R R=2/R SSR SST2R= +SSTSSRSSE

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报