收藏 分享(赏)

练习1聚类与判别分析 ppt课件.ppt

上传人:微传9988 文档编号:3340898 上传时间:2018-10-15 格式:PPT 页数:31 大小:631KB
下载 相关 举报
练习1聚类与判别分析 ppt课件.ppt_第1页
第1页 / 共31页
练习1聚类与判别分析 ppt课件.ppt_第2页
第2页 / 共31页
练习1聚类与判别分析 ppt课件.ppt_第3页
第3页 / 共31页
练习1聚类与判别分析 ppt课件.ppt_第4页
第4页 / 共31页
练习1聚类与判别分析 ppt课件.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、,1,练习1 聚类分析,在spss中输入多元统计分析教材88页例1中数据,将文件保存为“全国人口普查文化程度人口比例的聚类分析.sav”。,2,用spss定义四个变量:变量“地区”是字符串变量,其他3个变量是数值型变量定义(原数据表中的“序号”不需输入)。 单击菜单“开始” “程序” SPSS13.0”或者双击桌面上的“spss for windows 13.0”图标,打开SPSS程序。,3,单击程序左下角的Variable View(变量视图)选项卡,在变量视图工作界面中,Name下方输入第一个变量的名称“地区”,单击Type右侧的按钮,在弹出的Variable Type对话框中,单击Str

2、ing单选钮,Characters文本框中后的8是SPSS默认的字符型变量的长度,单击OK按钮,设置第一个变量类型为字符串变量,其长度为默认的8个字节。,4,变量属性说明,5,接下来输入第二个变量名“DXBZ”,变量类型Type为默认的Numeric,设置它为整数型数值变量,单击label下方的方框,输入该变量的标签(变量的详细说明)“大学以上文化程度比例”。,6,采用类似方式,定义另外2个变量。,7,单击程序左下角的Data View(数据视图),进入数据视图工作界面,输入教材88页中数据。,8,1.1 基本操作,单击菜单AnalyzeClassifyHierarchial cluster,

3、弹出系统聚类分析对话框。 从左侧的变量列表框中选择DXBZ、CZBZ和 WMBZ,移入Vairbale下方的方框中;选择“地区”,移入Label Cases by方框中。,9,单击Statistics按钮,进入统计量分析对话框。单击Cluster Membership下方的Single solution,在Number of cluster后方的文本框中输入4,将所有的地区划分为4类。 单击Continue按钮,返回到系统聚类分析对话框。,10,单击Plots按钮,进入图形设置对话框。勾选Dendrogram,在输出结果中显示聚类树形图。 单击Continue按钮,返回到系统聚类分析对话框。

4、单击OK按钮,输出系统聚类分析结果。,11,1.2 结果分析,1.个案处理综述表 显示有效(valid)个案数及其比例、 缺失(missing)个案个数及其比例以及全部(total)个案数及其比例。 本例中没有缺失数据,因此有效个案数和全部个案数是相同的。,12,2.聚结表 第1列(stage)显示聚类阶段。 第2、3列显示在某阶段中合并的个案编号。 第4列的系数显示两个个案之间的距离,该列中的系数是按照从小到大的顺序排列的,也就是距离越近的个案首先合并。 第5列显示首先个案首次聚类的阶段。如果这两列的数值都是0,表明两个个案的聚类;如果一个为1或大于1的值,一个为0,表明一个类和一个个案的聚

5、类;如果两列数值是0以外的数值,表明两个类的聚类。 第6列显示新类下一步聚类的阶段。,13,聚结表显示第11号个案和第26号个案的距离最小,因此它们首先聚为一类,这个新类将在第7步和第15号个案聚类。 聚类过程的第2步是第3号和第5号个案,它们聚为一类,在第11步,这个新类将和第10号个案聚类。 聚类分析中其它步骤依次类推。最后可以把29个个案聚为4个类型:G1=1,2,4,6,7,8,9,G2=3,5,10,11,13,14,15,16,17,18,19,20,21,22,26,30,G3=12,23,24,27,28,29,G4=25。,14,3.冰柱图 冰柱图和聚结表的作用类似,都是显示

6、个案聚类情况的。从图中可以看出第1步聚类的第11号个案和第16号个案之间全部都用x填充,第2步聚类的第3号和第5号个案之间填充的x少了一个,第3步聚类的27号和28号个案之间填充的x又少了一个,依次类推,填充的x构成阴影条形就像倒挂的冰凌一样,因此该图称为冰柱图。,15,4.树形图 树形图显示系统聚类步骤,各个个案合并情况及其距离系数值。 图中显示浙江、陕西、山东、河北、内蒙、江苏、河南、湖北、四川、海南、福建、江西、湖南、广东、新疆和广西聚为一类,即前面的G2;黑龙江、山西、吉林、天津、上海、辽宁和北京聚为一类,即G1;安徽、宁夏、青海、贵州和云南聚为一类,即G3,西藏单独归为一类,即G4。

7、,16,练习2 判别分析,在spss中输入多元统计分析教材128页例1中数据,将文件保存为“人文发展指数的判别分析.sav”。输入数据时增加一个变量“类别”,前5个国家的数值为1,后5个国家为2,最后4个待判国家不要输入数值。,17,2.1 基本操作,单击菜单AnalyzeClassifyDiscriminant,弹出判别分析对话框。,18,在判别分析对话框中,从左侧的变量列表框中选择x1、x2和x3,单击向右的箭头,将它们移入Independents方框中; 选择变量“类别”,将它移入Grouping Variable方框中,单击其下方的Define Range按钮,在弹出的对话框中,Min

8、imum文本框中输入1,Maximum文本框中输入2,单击Continue按钮,返回判别分析对话框。,19,单击Statistics按钮,弹出统计量对话框。在Descriptive(描述性统计量)核选框中勾选Means、Univariate ANOVAs和Boxs M,在输出结果中显示样本数据的均值、标准差、单变量的方差分析表以及Boxs M统计量。 在Function Coefficients(函数系数)核选框中勾选Fishers和Unstandardized,在输出结果中显示Fisher和非标准化判别函数的系数。 在Matrics核选框中勾选Within-groups correlatio

9、n,在输出结果中显示组内相关系数矩阵。 单击Continue按钮,返回到判别分析对话框。,20,单击Save按钮,在保存对话框中,勾选Predicted group membership和Discriminant scores,单击Continue按钮,返回到判别分析对话框。 单击OK按钮,输出判别分析结果。,21,2.2 结果分析,1.个案处理综述表 表中显示有效(valid)个案数(也就是事先设定好所属类型的个案)为10个,占所有个案数的71.4,剔除(exclued)个案数(没有设定所属类型的个案)为4个,占所有个案数的28.6%。,22,2. 分组统计量表,表中显示第1类和第2类个案以

10、及它们合计的均值、标准差以及有效的个案数。可参考教材109页的计算结果。,23,3.组内均值检验表 该表检验变量在各组的均值是否存在显著差别,结果显示x1和x3的F统计量对应的伴随概率都小于0.05,通过显著性检验,这两个变量的组内均值存在差异,因此可以进行判别分析。,24,4.合并组内相关系数矩阵 表中显示将前10个个案合并后3个变量的相关系数矩阵。,25,5.判别函数特征值 显示判别函数的特征值(eigenvalue)为6.34,典型相关系数(canonical correlation)为0.929。,6.判别函数显著性检验表 表中的统计量为0.136,对应的2为12.997,伴随概率Si

11、g=0.0000.05,因此判别函数有效。,26,7.标准化典型判别函数系数表 根据表中结果可以写出标准化判别函数表达式:,27,8.结构矩阵 结构矩阵显示判别变量和标准化判别函数中间的组内相关系数,变量按照相关系数的大小进行排列,也就是说排在最上面的变量在判别函数中的作用是最大的,从表中可以看出变量x3的作用最大,其次是x1,变量x2的作用最小。,28,9.典型判别函数非标准化系数表 根据该表中数据可以写出非标准化判别函数的表达式:,29,10.质心表 该表显示利用非标准化判别函数计算出来的各类均值的判别的分数,第1类个案的函数质心为2.252,第2类个案的函数质心为-2.252。,30,11.分类函数系数表 该表显示两个类型个案对应的Fishers线性判别函数系数。,31,返回到数据视图界面,可以看到原数据中增加了两个变量dis_1和dis1_1。 变量dis_1显示每个个案所属的类别,可以看到待判的中国和罗马利亚输入第2类国家,希腊和哥伦比亚属于第1类国家。 变量dis1_1显示每个个案对应的判别得分,这个判别得分是利用标准化判别函数计算出来的。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医学治疗 > 基础医学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报