ImageVerifierCode 换一换
格式:PPT , 页数:31 ,大小:631KB ,
资源ID:3340898      下载积分:20 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-3340898.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(练习1聚类与判别分析 ppt课件.ppt)为本站会员(微传9988)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

练习1聚类与判别分析 ppt课件.ppt

1、,1,练习1 聚类分析,在spss中输入多元统计分析教材88页例1中数据,将文件保存为“全国人口普查文化程度人口比例的聚类分析.sav”。,2,用spss定义四个变量:变量“地区”是字符串变量,其他3个变量是数值型变量定义(原数据表中的“序号”不需输入)。 单击菜单“开始” “程序” SPSS13.0”或者双击桌面上的“spss for windows 13.0”图标,打开SPSS程序。,3,单击程序左下角的Variable View(变量视图)选项卡,在变量视图工作界面中,Name下方输入第一个变量的名称“地区”,单击Type右侧的按钮,在弹出的Variable Type对话框中,单击Str

2、ing单选钮,Characters文本框中后的8是SPSS默认的字符型变量的长度,单击OK按钮,设置第一个变量类型为字符串变量,其长度为默认的8个字节。,4,变量属性说明,5,接下来输入第二个变量名“DXBZ”,变量类型Type为默认的Numeric,设置它为整数型数值变量,单击label下方的方框,输入该变量的标签(变量的详细说明)“大学以上文化程度比例”。,6,采用类似方式,定义另外2个变量。,7,单击程序左下角的Data View(数据视图),进入数据视图工作界面,输入教材88页中数据。,8,1.1 基本操作,单击菜单AnalyzeClassifyHierarchial cluster,

3、弹出系统聚类分析对话框。 从左侧的变量列表框中选择DXBZ、CZBZ和 WMBZ,移入Vairbale下方的方框中;选择“地区”,移入Label Cases by方框中。,9,单击Statistics按钮,进入统计量分析对话框。单击Cluster Membership下方的Single solution,在Number of cluster后方的文本框中输入4,将所有的地区划分为4类。 单击Continue按钮,返回到系统聚类分析对话框。,10,单击Plots按钮,进入图形设置对话框。勾选Dendrogram,在输出结果中显示聚类树形图。 单击Continue按钮,返回到系统聚类分析对话框。

4、单击OK按钮,输出系统聚类分析结果。,11,1.2 结果分析,1.个案处理综述表 显示有效(valid)个案数及其比例、 缺失(missing)个案个数及其比例以及全部(total)个案数及其比例。 本例中没有缺失数据,因此有效个案数和全部个案数是相同的。,12,2.聚结表 第1列(stage)显示聚类阶段。 第2、3列显示在某阶段中合并的个案编号。 第4列的系数显示两个个案之间的距离,该列中的系数是按照从小到大的顺序排列的,也就是距离越近的个案首先合并。 第5列显示首先个案首次聚类的阶段。如果这两列的数值都是0,表明两个个案的聚类;如果一个为1或大于1的值,一个为0,表明一个类和一个个案的聚

5、类;如果两列数值是0以外的数值,表明两个类的聚类。 第6列显示新类下一步聚类的阶段。,13,聚结表显示第11号个案和第26号个案的距离最小,因此它们首先聚为一类,这个新类将在第7步和第15号个案聚类。 聚类过程的第2步是第3号和第5号个案,它们聚为一类,在第11步,这个新类将和第10号个案聚类。 聚类分析中其它步骤依次类推。最后可以把29个个案聚为4个类型:G1=1,2,4,6,7,8,9,G2=3,5,10,11,13,14,15,16,17,18,19,20,21,22,26,30,G3=12,23,24,27,28,29,G4=25。,14,3.冰柱图 冰柱图和聚结表的作用类似,都是显示

6、个案聚类情况的。从图中可以看出第1步聚类的第11号个案和第16号个案之间全部都用x填充,第2步聚类的第3号和第5号个案之间填充的x少了一个,第3步聚类的27号和28号个案之间填充的x又少了一个,依次类推,填充的x构成阴影条形就像倒挂的冰凌一样,因此该图称为冰柱图。,15,4.树形图 树形图显示系统聚类步骤,各个个案合并情况及其距离系数值。 图中显示浙江、陕西、山东、河北、内蒙、江苏、河南、湖北、四川、海南、福建、江西、湖南、广东、新疆和广西聚为一类,即前面的G2;黑龙江、山西、吉林、天津、上海、辽宁和北京聚为一类,即G1;安徽、宁夏、青海、贵州和云南聚为一类,即G3,西藏单独归为一类,即G4。

7、,16,练习2 判别分析,在spss中输入多元统计分析教材128页例1中数据,将文件保存为“人文发展指数的判别分析.sav”。输入数据时增加一个变量“类别”,前5个国家的数值为1,后5个国家为2,最后4个待判国家不要输入数值。,17,2.1 基本操作,单击菜单AnalyzeClassifyDiscriminant,弹出判别分析对话框。,18,在判别分析对话框中,从左侧的变量列表框中选择x1、x2和x3,单击向右的箭头,将它们移入Independents方框中; 选择变量“类别”,将它移入Grouping Variable方框中,单击其下方的Define Range按钮,在弹出的对话框中,Min

8、imum文本框中输入1,Maximum文本框中输入2,单击Continue按钮,返回判别分析对话框。,19,单击Statistics按钮,弹出统计量对话框。在Descriptive(描述性统计量)核选框中勾选Means、Univariate ANOVAs和Boxs M,在输出结果中显示样本数据的均值、标准差、单变量的方差分析表以及Boxs M统计量。 在Function Coefficients(函数系数)核选框中勾选Fishers和Unstandardized,在输出结果中显示Fisher和非标准化判别函数的系数。 在Matrics核选框中勾选Within-groups correlatio

9、n,在输出结果中显示组内相关系数矩阵。 单击Continue按钮,返回到判别分析对话框。,20,单击Save按钮,在保存对话框中,勾选Predicted group membership和Discriminant scores,单击Continue按钮,返回到判别分析对话框。 单击OK按钮,输出判别分析结果。,21,2.2 结果分析,1.个案处理综述表 表中显示有效(valid)个案数(也就是事先设定好所属类型的个案)为10个,占所有个案数的71.4,剔除(exclued)个案数(没有设定所属类型的个案)为4个,占所有个案数的28.6%。,22,2. 分组统计量表,表中显示第1类和第2类个案以

10、及它们合计的均值、标准差以及有效的个案数。可参考教材109页的计算结果。,23,3.组内均值检验表 该表检验变量在各组的均值是否存在显著差别,结果显示x1和x3的F统计量对应的伴随概率都小于0.05,通过显著性检验,这两个变量的组内均值存在差异,因此可以进行判别分析。,24,4.合并组内相关系数矩阵 表中显示将前10个个案合并后3个变量的相关系数矩阵。,25,5.判别函数特征值 显示判别函数的特征值(eigenvalue)为6.34,典型相关系数(canonical correlation)为0.929。,6.判别函数显著性检验表 表中的统计量为0.136,对应的2为12.997,伴随概率Si

11、g=0.0000.05,因此判别函数有效。,26,7.标准化典型判别函数系数表 根据表中结果可以写出标准化判别函数表达式:,27,8.结构矩阵 结构矩阵显示判别变量和标准化判别函数中间的组内相关系数,变量按照相关系数的大小进行排列,也就是说排在最上面的变量在判别函数中的作用是最大的,从表中可以看出变量x3的作用最大,其次是x1,变量x2的作用最小。,28,9.典型判别函数非标准化系数表 根据该表中数据可以写出非标准化判别函数的表达式:,29,10.质心表 该表显示利用非标准化判别函数计算出来的各类均值的判别的分数,第1类个案的函数质心为2.252,第2类个案的函数质心为-2.252。,30,11.分类函数系数表 该表显示两个类型个案对应的Fishers线性判别函数系数。,31,返回到数据视图界面,可以看到原数据中增加了两个变量dis_1和dis1_1。 变量dis_1显示每个个案所属的类别,可以看到待判的中国和罗马利亚输入第2类国家,希腊和哥伦比亚属于第1类国家。 变量dis1_1显示每个个案对应的判别得分,这个判别得分是利用标准化判别函数计算出来的。,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报