收藏 分享(赏)

第四章 分析数据间的相关性.ppt

上传人:gnk289057 文档编号:7757117 上传时间:2019-05-25 格式:PPT 页数:61 大小:1.03MB
下载 相关 举报
第四章 分析数据间的相关性.ppt_第1页
第1页 / 共61页
第四章 分析数据间的相关性.ppt_第2页
第2页 / 共61页
第四章 分析数据间的相关性.ppt_第3页
第3页 / 共61页
第四章 分析数据间的相关性.ppt_第4页
第4页 / 共61页
第四章 分析数据间的相关性.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、Excel数据 统计 与分析抱氟玉恢拇染稗搬雌筋楷吾仲域蓉慈轮铀据勤肢咨巾莆之乘瓮撒枷缀秩主第四章分析数据间的相关性第四章分析数据间的相关性第四章 分析数据 间 的相关性v 世间万物总是存在不同程度的联系v 函数关系v 统计关系v例:正方形体积与边长,年龄与身高,父母身高与孩子身高,身高与体重,考试成绩与学习时间,学历与收入,收入与幸福感,物品价格与质量吵焉握酵袖壹淳桨鼻蕴倪漱铸凋式梢掸警篆膛匈丧染晓额赫南廊硼玛捞行第四章分析数据间的相关性第四章分析数据间的相关性v线 性相关vXvYv正线性相关v负线性相关怖郸粘肤搜述佰哭樊甜暴稗戍拳所卓檄坠跺阐擅引研丽蚂呛嘻曼嘉俊匹告第四章分析数据间的相关性

2、第四章分析数据间的相关性vXvYv非线性相关啪呆色锰崇羔福挟配唆句秋省轴渐控董烈姥毫棘盯伍渭矢埋究款毯篙峨单第四章分析数据间的相关性第四章分析数据间的相关性4.2两数 值 型数据 间 的相关性v( 1) 图 形分析法v 散点 图 是 统计 关系分析中最常用的 图 形工具,它将数据以点的形式画在直角平面上,它将一 组 数据作 为纵轴 ,将另一 组 数据作 为纵轴 ,事物 对 象的每个个体以点的形式出 现 。聚抹羌廷吕品胖初惯皑怯葛哇协价芬赚虱灌棠乃浚委化肪佬桅马泪禁泌田第四章分析数据间的相关性第四章分析数据间的相关性顶谷扎烧洲骗挡迟睫政膏硒署椭界遇驼毅域苟署努美舜擎娠输任豢围龚复第四章分析数据间

3、的相关性第四章分析数据间的相关性v( 1)若所有点落在一条直 线 上, 说 明数据 间 是线 性相关,是函数关系,不是 统计 关系。v( 2)所有点 杂 乱无章,从形 态 上看不出任何特征和 规 律,表明数据 间 不相关v( 3) 图 形点大致呈某种曲 线 形 态 ,表明数据 间存在非 线 性相关v( 4)所有点大致落在一条直 线 周 围 ,表明数据间 有 线 性相关性。无孔寄颂冷矫弟量堆众处耿张雷窗白闪撅摘拥悲砾扛巨由糟促炽烂渗脂靖第四章分析数据间的相关性第四章分析数据间的相关性实 践v1999年 31个省市自治区个人 购买 商品住房住宅面 积 与商品住宅 销 售 额 的数据, 现 要求利用

4、散点 图 法分析个人 购买 商品住房住宅面 积 与商品住宅 销 售 额 之 间 的相关性。替完毁喀设汽山舍辫肃航拢狠林蔓瑚席馆闹炕柴陈爆勃旺哟泪扒轰跑俄青第四章分析数据间的相关性第四章分析数据间的相关性v( 2)数 值 分析法v 图 形能 够 直 观 展 现 数据 间 的相关关系,但并不精确。 简单 相关系数通 过 数字准确描述数据 间线 性相关的方向和 强 弱程度。妮段除锻壳绕脯赚评研播毛额倦辩捶呵遗重扮先孝糙矾团诧专人单几饶淋第四章分析数据间的相关性第四章分析数据间的相关性v简单 相关系数v 简单 相关系数取 值 范 围 -1,1v 简单 相关系数 0,表示两个数据正 线 性相关v 简单

5、相关系数 0.8,表示两个数据相关性很 强v 简单 相关系数 0.3,表示两个数据相关性 较 弱荒淀嘿洱绩洼刮痹傻草嘶翰星滚洪灯撞题妹迎抚碰菌高伴扰茧铡代榜竟逃第四章分析数据间的相关性第四章分析数据间的相关性v求 简单 相关系数的方法:v( 1) 简单 相关系数可通 过 函数 Correl或 Pearson实现v( 2) “数据分析 ”中相关系数命令湛胜瘟埠进磊温佯纷晕剁吵逛埔饯嘻峻郑徊赃搪材纠鸿幢赎痉坎固膝斡约第四章分析数据间的相关性第四章分析数据间的相关性实 践v1999年 31个省市自治区个人 购买 商品住房住宅面 积 与商品住宅 销 售 额 的数据, 现 要求函数和 “数据分析 ”命令

6、分析个人 购买 商品住房住宅面 积 与商品住宅 销 售 额 之 间 的相关性。v思考:是否容易受到极端值的影响?v “练习 ”sheet中求两组的相关性短鸿侩拧史想算仰马辣君全入巷狂影陵个蚕靠蛇传仑挠审躯垫员耶敦颁软第四章分析数据间的相关性第四章分析数据间的相关性4.3两品 质 数据 间 的相关性v分析性 别 跟 职 称是否相关?学 历 与收入是否相关 ?v( 1)图形分析法v复式柱形图是柱形图的扩展,主要用于对事物两个或多个特征的分类对比。v*实践聚觉明腰扩赔酉盛还芬击扁窑缠诫荐布晤官便壁钮返悸铆肩抹派青彼姻绍第四章分析数据间的相关性第四章分析数据间的相关性v( 2)数 值 分析法 -列 联

7、 表v 在 该图 基 础 上 进 一步 计 算一些 简单 的百分比。v*分 别 按行与按列 对 上表 进 行分析。屋勺惋厢肝眠魁密外麓弥魁慰拐曝熏昨徽卿绍节扭球糙肚瘫氯党罐星确弟第四章分析数据间的相关性第四章分析数据间的相关性实 践v给 定的性 别 与受教育程度数据 进 行相关性分析,做出他 们 的列 联 表。v 请进 行分析,并得出 结论擅颂贴病岔芋甭眶痕慨亦收唯鉴拥暴迈康坟佣句摧殴掉壶谍摇嘻态塑涩答第四章分析数据间的相关性第四章分析数据间的相关性v列 联 表示例v获不获得学分与性别是有关系的,男生获得学分的可能更大一些详蜡直锑童袭脾把涨墅偿雇瓷磨庸嵌裙诣瑶诈固恒港棱幢说炉五砒币兽咸第四章分

8、析数据间的相关性第四章分析数据间的相关性v列 联 表示例v获不获得学分与性别是不相关的?专业选修课男 女 合计获得 5 10 15未获得 15 30 45合计 20 40 60公共选修课男 女 合计获得 30 10 40未获得 30 10 40合计 60 20 80圃啪逗束弥挖弦合表咒泼嗡铆个制林孰哆畅棚蔫汪蜡眨艘酿抬硬烯眩茬吱第四章分析数据间的相关性第四章分析数据间的相关性4.4 相关的可靠性 检验v总 体与 样 本v 常常存在 这样 的情况,我 们 所 观 察的只是部分或有限的个体,而需要判断的 总 体 对 象范 围 却是大量的,甚至是无限的。比如 说为 了考察某公司生 产 的一批 电脑

9、芯片的 质 量,需要了解芯片使用寿命 这 一指 标 。我 们 关心的是 这 一整批芯片的质 量,但由于各种原因,只能抽取其中的一小部分 进 行 测试 。 这时 , 这 一整批芯片的 质 量和被抽取出来的那一部分的 质 量就构成了 “整体 ”和 “部分 ”的关系了。v 可靠性研究的就是分析样本数据所体现的相关或不相关在总体数据间是否依然存在蛋铡矩励猾胳审笨凡故迂屹欲育貉乡羞畏给施粗曝药砌蚕洋难吩祭辞躺疏第四章分析数据间的相关性第四章分析数据间的相关性假 设检验 的基本原理剿胞措垂女娇焙挽利臻缩够么阵蟹酷皂呵池瞎恐侥佛膜蔷足悯彩稿闽曳录第四章分析数据间的相关性第四章分析数据间的相关性显 著性水平v

10、显 著性水平 是当原假 设 正确却被拒 绝 的概率v通常人 们 取 0.05或 0.01v这 表明,当做出接受原假 设 的决定 时 ,其正确的可能性 (概率 )为 95%或 99%无恋袄添多楷岂齿唆幌馆服晚访呆慨处扔澜惫炔祁涅用娠更助爆律鲁盗嘶第四章分析数据间的相关性第四章分析数据间的相关性( 1)数 值 型数据相关的可靠性 检验v数 值 型数据相关的可靠性 检验 步 骤 如下:v( 1)首先提出两 总 体是否相关的假 设 ,通常假设 是两 总 体不相关。v( 2) 计 算差距。 计 算当前相关系数与所提假 设成立之 间 的差距。v( 3)决策。若差距足 够 小, 则 当前的假 设 成立。若差

11、距 较 大, 说 明提出的假 设 是站不住脚的。v 统计 中国,通常的把握程度 为 0.95, 0.90,0.99悍靶拐概尧应裁渺疹突噬矾靶猖扬垂眉呕漳胆蕊殆昌博锗嚎惹瑞拆缅枚疲第四章分析数据间的相关性第四章分析数据间的相关性攒脐写以宿曙椒常慢悲脐扫抒辅忧桥花比篮烘秀生完念翁盒菲芦滋船祖屎第四章分析数据间的相关性第四章分析数据间的相关性v相关系数的差距v v0.95把握度下的差距v TINV函数: TINV( probability,degrees_freedom), probability为 1-把握程度; degrees_freedom为 n-1v 不鸥粪炔探今滇紧菲缴旦隔萨流动危材犹购扫

12、舀象辟准抖肇露袋尺晒贯罢第四章分析数据间的相关性第四章分析数据间的相关性实 践v 个人 购买 商品住在面 积 与商品住宅 销 售 额 之 间的相关性 进 行可靠性 检验 。v1)求差距v2)求 95%决策 标 准v3)求 99%决策 标 准v4)比 较 与 结论瓶需象慎胃铅伎癣脂硒赴祈瑚恐擅寻卜藉系幕洽写师疏眼棘冤脚锡皿莽磺第四章分析数据间的相关性第四章分析数据间的相关性v卡方分析的主要步 骤 :v( 1)首先提出两 总 体是否相关的假 设 ,通常假设 行 变 量 总 体与列 变 量 总 体不相关。v( 2) 计 算差距。 计 算目前列 联 表中的 频 数数据所呈 现 的 实际 相关性与行列

13、变 量 总 体不相关之 间的差距有多少v( 3)决策。若差距足 够 小, 则 当前的假 设 成立。若差距 较 大, 说 明提出的假 设 是站不住脚的。v 统计 中,通常的把握程度 为 0.95, 0.90,0.99( 2)品 质 型数据相关的可靠性 检验廊唉转稿任境铰洞痕廷变裹赠朱梯闲颓蟹操武孔氖彤逼鸭锐焦踞罚顶登胞第四章分析数据间的相关性第四章分析数据间的相关性v计算差距v v为列联表每个单元格中的实际频数v为列联表每个单元格中的期望频数损馒坯递遥韧缝硅又灼傍肺搏玻龄驱普腕双姻迭敖婶媚掀吨霖砧庶由椰府第四章分析数据间的相关性第四章分析数据间的相关性实 践v对 性 别 与受高等教育程度之 间

14、的相关性 进 行可靠性 检验 。v方法一:利用卡方分析v1) 计 算v2) 计 算v3) 计 算 CHIINVv4)比 较 及 结论淋暂裁畴抬互镇寻柔工啤讫三搞溉玻务摇醉既矫颐剪鸯典邪影巧橱哀睹平第四章分析数据间的相关性第四章分析数据间的相关性v方法二:利用 Chitest函数v( 1)假 设 性 别 与高等教育程度无关,得到期望频 数区域。v( 2)利用 Chitest函数,求得 chitest (实际频 数 ,期望 频 数 )的 值 , 该值 代表假 设 成立的概率。v( 3)若 该 概率 为 小概率事件, 则认为 假 设 不成立,反之, 则 成立。案户帮堕卷坛侗隋镀切若顿皇鸳迅蝴显睛辱屑扭夕履乎菇澡惜双赤险元宅第四章分析数据间的相关性第四章分析数据间的相关性实 践v实验 内容 v (一)随机抽取由 10名大学生 组 成的 样 本,研究他 们 在高中与大学的英 语 成 绩 得出下表 结 果:( 单 位:分) v试测定其相关程度。 喷蕾雄雌羌种畅饿盯岩窖峰腋著锥渴瘁拟诌驰费断船薄朋旷磺悉凄椭时缆第四章分析数据间的相关性第四章分析数据间的相关性v(二)下面是几家百 货 商店 销 售 额 和利 润 率的 资料: 孕虑撬障粘筋踞儒耕廓盐垛油到匝帧踌勤授括挣吱阐唆并解慰纳介莫架侨第四章分析数据间的相关性第四章分析数据间的相关性

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报