收藏 分享(赏)

统计方法简介.ppt

上传人:无敌 文档编号:1448771 上传时间:2018-07-18 格式:PPT 页数:109 大小:3.06MB
下载 相关 举报
统计方法简介.ppt_第1页
第1页 / 共109页
统计方法简介.ppt_第2页
第2页 / 共109页
统计方法简介.ppt_第3页
第3页 / 共109页
统计方法简介.ppt_第4页
第4页 / 共109页
统计方法简介.ppt_第5页
第5页 / 共109页
点击查看更多>>
资源描述

1、统计方法简介,哈工大管理学院葛 虹,主要内容,第一讲 数据处理方法 1. 数据是否来自于正态总体检验与变换 2. 数据中异常值的检验方法 3. 指标间的相关性检验或独立性检验 4. 多维数据的有效简化方式降维法 5. 对某一主要研究指标的影响因素分析 方差分析,主要内容,第二讲 线性模型建立的过程及SPSS实现 1. 一元回归分析与有效性诊断 2. 多元回归分析与有效性诊断 3. 曲线回归与诊断第三讲 统计分类与模式识别及SPSS实现 1. 聚类分析 2. 判别分析 3. 因子分析,参考书,应用统计 陆璇 编著 清华大学出版社多元统计分析何晓群 编著 中国人民大学出版社,数据是否来自于正态总体

2、检验,问题的提出 有n个数据,问是否他们 来自某一个正态总体?检验方案一:正态概率纸(Q-Q图)顺序统计量、秩与经验分布函数经验分位数与理论分位数利用经验分位数与理论分位数检验数据的正态性,Q-Q图的SPSS实现,检验方案二:皮尔逊卡方检验 零假设: 检验统计量检验统计量的渐进分布检验准则:拒绝域,正态化变换Box-Cox变换,当检验发现数据不具有正态性时,为将来进一步处理数据或建立模型上的方便,可以对数据进行Box-Cox变换,使之具有正态性。这个变换是: 其中, 是一个合适的实数。,数据中异常值的检验方法,准则 若数据来自于正态总体 ,则区间 以外的点为疑似异常点。在实际判别时:,指标间的

3、相关性检验,Pearson相关系数检验(有正态性)零假设: (X与Y无线性关系)检验统计量: 其中检验统计量的分布: 检验准则:拒绝域,Spearman 秩相关检验(无正态性)零假设:检验统计量: 其中检验统计量的分布: 检验准则:拒绝域,相关性检验的SPSS实现,Pearson相关系数检验结果,Spearman相关检验结果,多维数据的简化方式降维法,方法一:独立性检验正态总体的情形: Pearson相关系数检验总体分布未知的情形: Spearman 秩相关检验,方法二:主成分分析主成分法的基本原理目标1 消除变量间的相关性目标2 降维以使问题简化主成分分析数学模型,主成分的获取方法 计算样本

4、的相关系数阵 求相关系数阵的特征值和特征向量 特征值为新组合变量的方差(信息) 特征向量为新组合变量的组合系数保留主成分法则 (1) 累积贡献率法 (2)特征值的阀值1法,样本相关系数阵,与 的样本相关系数,与 的样本相关系数,主成分分析在SPSS中的实现,主成分分析的应用分类:利用第一和第二主成分排序:利用第一主成分 1)系数大于零 2)贡献率足够大 主成分回归: 消除变量间的共线性,散点图(scatter plot),排序(Sort),影响因素分析方差分析,单因素方差分析模型 1) 2)零假设,数据表,平方和分解,总平方和,组间平方和,组内平方和,检验统计量 其中 是组间平方和 是组内平方

5、和统计量的分布,拒绝域方差分析表 source df SS MS F prF Model Error Total,单因素方差分析得SPSS实现,双因素方差分析数据表,模型1)2),假设检验:1)因子A没有显著效应2)因子B没有显著效应3)因子A与B没有显著的交互效应,平方和分解,总平方和,因子A平方和,交互效应平方和,误差平方和,因子B平方和,检验统计量及其分布,方差分析表,双因素方差分析的SPSS实现,一元回归模型的建立过程,观察因变量与自变量的散点图确立要拟合的线性模型 其中 模型误差的假设条件: 独立性 等方差性 正态性,由最小二乘法估计模型中的系数 残差(误差)平方和,对模型进行显著性

6、检验决定系数法1)平方和分解: 2)决定系数,总平方和,回归平方和,误差平方和,方差分析表( ),利用残差对模型的假设进行检验 残差的定义由残差检验误差的独立性和等方差性由残差检验误差的正态性(QQ图),一元回归分析的SPSS实现,曲线回归,可以进行曲线回归的函数类型 双曲函数 幂函数 指数函数 对数函数 S型曲线,多元线性模型的建立过程,模型1,模型2,模型参数的估计(最小二乘估计)参数估计的性质1)2)3),残差平方和平方和分解,回归平方和,残差平方和,总平方和,越小拟合越好,是一定量,对模型进行显著性检验决定系数法 决定系数 调整的决定系数 方差分析法 检验 检验统计量及分布,方差分析表

7、,回归系数的显著性检验零假设检验统计量及其分布拒绝域,残差分析1)利用残差图检验: 误差的独立性 等方差型2)利用Q-Q图(正态概率纸) 检验误差的正态性,多元回归的SPSS实现,违背模型假设的处理方法,异方差性(截面数据)检验方法:图示法解决方案:加权最小二乘法,自相关(时间序列数据)检验方法:图示法 解决方案:广义最小二乘法(差分最小二乘法),多重共线性检验方法: 1)查看相关系数阵 2)作一个自变量与其自变 量的回归观察拟合优度 (方差膨胀系数VIF),第一类解决方案1)增加样本观测值2) 略去不重要的自变量3) 用因变量的滞后值代替 自变量的 滞后值4) 变换模型的形式5) 对数据进行

8、中心化处理,第二类解决方案 1) 主成分回归 2) 岭回归 3) 逐步回归,聚类分析,P维空间中样本点间的距离明氏距离 缺点:与量纲有关;没有考虑相关性马氏距离(总体 ) 优点:克服了明氏距离的缺点,两点之距,一点到总体之距,问题的提出 若有n个样本点,要将他们分成m类. 分类方法: 系统聚类法 逐步聚类法,系统聚类和逐步聚类法流程图系统聚类法流程图,初始分类:,若 与 距离最小,合并为一类,输出分类结果,no,如何计算类与类之间的距离,逐步聚类法流程图,寻找m个凝聚点:,若 则 ;得,计算各类的重心:,若 则 ;得,计算各类的重心:,重心改变,输出分类结果,yes,五种系统聚类方法 1)最短

9、距离法(method=single) 2)最长距离法(method=complete) 3)重心法(method=centroid),4)类平均法(method=average) 5)离差平方和法(Ward法) 其中,系统聚类在SPSS中的实现,判别分析,问题的提出 已知有m个类,现又得到一个新的样本,问这个样本属于哪一类?于是从m类的样本中提取各类典型信息,建立判别公式或判别准则,然后利用判别准则将新样本归属于一个特定的类的过程就是判别分析。方法包括距离判别法、Bayes判别法、Fisher判别法以及逐步判别法等。,距离判别法 基本原理1)问题: 与 是两个不同的P维总体, 是一个P维样本,问它属于哪个总体?2)解决方案:,两类线性判别函数 前提假设: 1) 2)线性判别函数: 判别准则:,两类二次判别函数前提假设: 1) 2)二次判别函数: 判别准则:,Bayes判别法 基本原理 1)已知 与 的先验分布( ) 和各自总体的分布密度函数( ) 2)由Bayes公式计算后验概率: 和 3)判别准则:,两个正态总体的Bayes判别准则 1) 与 的先验概率:2) 与 的密度函数:3)判别法则:,判别分析在SPSS中的实现,Thank you for your attention,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报