收藏 分享(赏)

毕业论文-多维标度法及其应用.doc

上传人:cjc2202537 文档编号:4715270 上传时间:2019-01-08 格式:DOC 页数:26 大小:910KB
下载 相关 举报
毕业论文-多维标度法及其应用.doc_第1页
第1页 / 共26页
毕业论文-多维标度法及其应用.doc_第2页
第2页 / 共26页
毕业论文-多维标度法及其应用.doc_第3页
第3页 / 共26页
毕业论文-多维标度法及其应用.doc_第4页
第4页 / 共26页
毕业论文-多维标度法及其应用.doc_第5页
第5页 / 共26页
点击查看更多>>
资源描述

1、青岛农业大学毕 业 论 文(设计)题 目: 多维标度法及其应用 姓 名: 张 晖 学 院: 理学与信息科学学院 专 业: 信息与计算科学 班 级: 0801 学 号: 20084062 指导教师: 王敏会 2012 年 6 月 5 日目 录摘要 .1Abstract .2引 言 31多维标度法的基本理论 41.1度量多维标度法的古典解 41.1.1多维标度法各数学量的意义 41.1.2求多维标度法古典解的步骤 51.1.3多维标度法的注意事项 62两种不同的多维标度法 62.1非度量 MDS分析方法 62.2权重多维标度(WMDS) 73用多维标度法分析实例的常见的两种情况 83.1已知距离矩

2、阵的 CMDS计算 .83.2已知相似矩阵的 CMDS计算 .84实例分析与计算实现 94.1评价指标体系和拟合空间的建立 94.1.1评价指标选择的原则 94.1.2指标选择的内容 94.1.3拟合构造空间维数的确定 .104.2用 SPSS进行多维标度分析 114.2.1操作步骤 .114.2.2确定空间维数的含义 .124.2.3结果分析 .144.3案例进一步分析 .164.3.1确定拟合构造空间的维数 .174.3.2用 SPSS进行多维标度分析 175总结 .19致谢 20参考文献 21附录 22多维标度法及其应用信息与计算科学 张晖指导教师 王敏会摘要:多维标度法是一种多指标的综

3、台评价方法,它具有直观、量化的特点,是一种降维统计方法。本文介绍了多维标度分析的理论基础、古典解、多维标度分析的步骤等,并简单介绍了几种多维标度法。不同问题可以采用不同的多维标度法。本文通过多维标度法分析山东省 17个城市人们的受教育程度,首先根据特征值的变化确定拟合空间的维数,并通过因子载荷矩阵得出每一维所表示的意义,然后用 SPSS进行多维标度分析,得出经济水平与受教育程度成正相关、以及男生普遍比女生受教育程度要高的结论。关键词:多维标度分析 古典解 压力值 SPSSMultidimensional scaling method and its applicationInformation

4、 and Computing Science Zhang HuiTutor Wang MinhuiAbstract:Multidimensional scaling method is a kind of multiple index comprehensive evaluation method. It has intuitive, quantitative characteristics and it is a dimension reduction statistical method. This paper introduces the theoretical basis of mul

5、tidimensional scaling analysis, classical solution, multidimensional scaling analysis steps, and simply introduces several kinds of multidimensional scaling method. According to the specific problems, we can adopt different multidimensional scaling method. we analyse 17city peoples educational level

6、 of Shandong province through multidimensional scaling in article .First of all, we determine fitting of the space dimension according to the change of the characteristic value , and we obtain each dimension the meaning of that through the factor loading matrix. Then we use the SPSS multidimensional

7、 scaling analysis, we obtained the economic level and education degree a positive correlation, and we get that boys generally is higher than girls in terms of education.Key words: Multidimensional scaling analysis The classical solution Stress SPSS 引 言 在实际的应用中我们经常会遇到这样的问题,给你一组城市,你总能从地图上查出任何一对城市之间的距离

8、。但若是给你若干城市的距离,不根据地图你能否确定这些城市之间的相对位置呢?假定你知道只是哪两个城市最近,哪两个城市次近等等,你是否还能确定他们之间的相对位置呢?多维标度法(Multidimensional Scaling)就是解决这类问题的一种方法,它就是一种在低维空间展示“距离”数据结构的多元数据分析技术。多维标度分析(Multidimensional Scaling,MDS)是1950 年代发展起来的一种多变量统计分析方法,它利用客体间的相似性或相异性数据去揭示它们之间的空间关系。当n个对象中的各对对象之间的相似性给定时,确定这些对象在低维空间中的表示,并使其尽可能与原先的相似性“大体匹配

9、” ,使得降维所引起的任何变形达到最小,在多维空间中排列的每一个点代表一个对象,因此点间的距离与对象间的相似性高度相关。揭水平曾在探索人员心理素质结构过程中,运用多维标度分析,对拟合空间中的点进行分类,揭示素质项目之间的语义关系,达到发现素质结构的目的 。近年来,MDS 在国内外很多领域被广泛采用。自2003 年以来国内心理学界就不断有运用MDS进行有关概念结构研究的文献报道:如张卫东等关于都市人智慧隐含理论的调查 ,张积家等关于汉语亲属词的概念结构 、 纳西族亲属词的概念结构 等,都在研究过程中运用了MDS,并得到了相应的研究结果。 本文通过研究多维标度分析的基本思想、基本理论及其在SPSS

10、中的实现对其进行了较深入的探讨,以山东省各城市的受教育程度为例,利用SPSS软件处理结果并分析,得出较合理的结果。全文分成五个部分:引言,第一部分给出了多维标度分法的基本论;第二部分和第三部分分别介绍了两种不同的多维标度法;第四部分和第五部分讲解实际进行多维标度分析的两种情况,通过实例来说明多维标度法的应用,最后给出结论。1 多维标度法的基本理论多维标度法内容丰富、方法较多。按相似性矩阵的个数和MDS(Multidimensional Scaling)模型的性质MDS可分为:重复多维标度(RMDS)、古典多维标度(CMDS)、权重多维标度(WMDS)。按相似性(距离)数据测量尺度的不同MDS可

11、分为:度量多维标度法和非度量多维标度法。当利用原始相似性的实际数值为间隔尺度和比率尺度时称为度量MDS,当利用原始相似性的等级顺序而非实际数值时称为非度量MDS。 多维标度法是在一个确定维数的空间中估计一组样品的坐标,它的数据是配对样品间的距离。有很多模型可以用来计算距离和使距离与实际数据相关联。多维标度模型有两因子和三因子的度量和非度量的多维标度模型。多维标度过程的数据包括样品间的一个或者多个对称或者不对称方阵。1.1 度量多维标度法的古典解1.1.1 多维标度法各数学量的意义(1)相似数据和不相似数据:如果用较大的数据表示非常相似,用较小的数据表示非常不相似,则数据为相似数据。反之,较小的

12、数值表示非常相似,如果用较大的数值表示非常不相似,则数据为不相似数据,也称距离数据。(2)距离阵 广义距离阵:一个n n阶的矩阵D=(d ) ,如果满足条件:ijn D njidiij ,321,0,则矩阵 为广义距离阵, 称为第 点与第 点间的距离。ij j欧氏距离阵:对于一个 的距离阵 ,如果存在某个正整数 和 中的n nnij rrR个点 , , 使得1X2n2()(),12,ijijijdXij则称 为欧氏距离阵。D(3)相似系数阵定义:一个 阶的矩阵 ,如果满足条件:nnijcC Cicij ,321,则矩阵 为相似系数阵, 称为第 点与第 点间的相似系数。Cijcij(4)设 维空

13、间中的 个点表示为 , ,用矩阵表示为 =( , ,rn1X2nX12) nX在多维标度法中,我们称这样的 为距离阵 的一个拟合构图,求的 n个点之间的D距离阵为 , 称为 的拟合距离阵, 和 最大程度接近。如果 ,则称D DX为 的一个构图。(5)定理:我们假设有 个样品对应欧氏空间的 个点,其距离阵为 , 为它们所对nnr应的空间的维数,第 个样品对应的点记为 ,则 的坐标记 。i iXi inii X212222111( )nnnijijijij ijibddd其中 为第 样品与第 样品之间的距离。设 那么,如果 是一个2ijdij nijbB0B 的距离阵 是欧氏距离阵的充要条件。nD

14、1.1.2 求多维标度法古典解的步骤 (1)根据距离阵数据,按照下面公式计算出 ;ijb2222111( )nnnijijijij ijibddd(2)根据 构造出内积矩阵 ;ij B(3)计算内积矩阵B的特征值 和 个最大特征值12n r对应的单位特征向量。其中, 的确定有两种方法:一是事先120r确定 ;二是通过计算前 个大于零的特征值占全体特征值的比例确定。3或,r120rn为预先给定的变差贡献比例。0k记 为 的正特征根, 对应的单位特征向量为 ,r21Bn,21 re,21是单位特征向量为列组成的矩阵,则 ,),(21re ),(21reeX矩阵中每一行对应空间中的一个点,第 行即为

15、 。令 ,Xii ndiag那么,根据 式计算,得到r维拟合构图(简称古典解) 。需要注意的是,21如果 中有负值,表明 是非欧氏型的。iD1.1.3 多维标度法的注意事项在实际应用中,即使 为欧氏型的,一般也只求r =2或3的低维拟合构图。值得注意的是,由于多维标度法求解的n个点仅仅要求它们的相对欧氏距离与 相近,也就是D说,只与相对位置相近而与绝对位置无关,根据欧氏距离在正交变换和平移变换下的不变性,显然所求的解并不唯一。 在进行多维标度分析时,如果数据是多个分析变量的原始数据,则要根据聚类分析中介绍的方法,计算分析对象间的相似测度;如果数据不是广义距离阵,要通过一定的方法将其转换成广义距

16、离阵才能进行多维标度分析。2 两种不同的多维标度法2.1 非度量 MDS 分析方法并非所有的距离阵都存在一个r维的欧氏空间和n个点,使得n个点之间的距离等于D。因而,并不是所有的距离阵都是欧氏距离阵,还存在非欧氏距离阵。当距离阵为欧氏时,可求得一个D的构图X,当距离阵不是欧氏时,只能求得D的拟合构图。例如:在实际问题中,我们涉及更多的是不易量化的相似性测度,如两种样品的相似性,虽然我们可以用1表示非常相似,10表示非常不相似,但是这里的数字只表示样品之间的相似或不相似程度,并不表示实际的数值大小,因而是定序尺度,这时是由两两样品间的不相似数据 形成 “距离”矩阵。对于非度量的不相似性矩阵,我们

17、如何进行多维标度分析呢 ij?(1)假定有一个n个对象的不相似矩阵( ) ,要寻找n个对象的一个r维拟合构造点ij的过程如下:X为了寻找一个较好的拟合构造点,我们可以先将n个对象随意放置在r维空间,形成一个感知图,即从某一个拟合构造点开始,用 表示i对象在r维空间nii X21的坐标,在r维空间中,对象i与j在的距离为:2221()()()ijijijirjdXXX然后微调 个对象在空间的位置,改进空间距离 与不相似数据 间的匹配程度,直到n ijdij匹配性无法改进为止。显然, 与定量测度 间的匹配性是问题的难点。对于定序尺度ijij来说,如何量化它与 间的对应程度是解决问题的关键。Krus

18、kal曾提出了用最小平ijijd方单调回归的方法,确定 的单调转换 。然后, 又提出用以测度偏离完美匹配程度ijijd的量度STRESS,称之为压力。定义为22()ijijiji iSTREdd(1) 与 之间差异越大,STRESS值越大,表明匹配性越差。非度量多维标度法就是要采ijdij用迭代方法,找到使STRESS尽可能地小的 维空间中 个对象的坐标。rn 另一种测量偏离完美匹配的量度是由塔卡杨等人提出,已成为一个更受欢迎的准则。对给定维数 ,将这个量度记为 ,其定义为r压 力S压 力 1224()ijijijdd(2)也就是说, 是将上式中的 和 用它们的平方代表后所得到的量度。 的值介

19、压 力Sijdij 压 力S于0和1之间。典型的情况是:此值小于0.1意味着感知图是n个对象的一个较好的几何表示。(2)在非度量MDS分析过程中,另一个需要解决的问题是感知图空间维数r的确定。我们可以制作压力-r图确定感知图的维数r。从前述可知,对每一个r,可以找到使压力达到最小的点结构。随着r的增加,最小压力将在运算误差的范围内逐渐下降,且当r =n-1时达到零。从r1开始,对r作图。这些点随r的增加而呈下降排列。若找到一个r,使得曲线下降趋势到某一点开始接近水平状态,形成一个“肘”形曲线, “肘”点对应的r便是“最佳”维数 。非度量MDS虽然是基于非度量尺度数据的分析方法,但是,当定量尺度

20、的距离阵中的数据不可靠,而距离大小的顺序可靠时,采用非度量多维标度分析比度量多维标度分析得到的结果更接近实际情况。2.2 权重多维标度(WMDS)上面我们的讨论都是以单个“距离”阵数据出发进行的,但在实际生活中,我们往往要确定多个距离阵数据的感知图,比如由10个人分别对5种产品进行两两相似评测,结果得到10个相似性矩阵,如何根据这10个人的评测结构得出5种饮料的相似性感知图呢?显然,如果按照古典多维的方法,我们只能是每一个相似性矩阵确定一个感知图,10个人分别确定10个感知图。但是,日常生活中我们想要得到的是这10个人共同的一个感知图而非是10个。基础权重多维标度法也称权重个体差异欧氏距离模型

21、。 设由 个个体对 个对象进行比较评测,得到 个 不相似(相似)矩阵,然后mnmn将其转换为距离阵。每个距离阵都有自己的拟合构造空间,权重个体差异欧氏距离模型通过给予不同个体不同的权重综合得到 个个体的公共拟合构造空间。设 表示 对象itX在公共拟合构造空间的 维坐标,则对于 对象第 个个体在公共拟合构造空间的 维坐tik标为 , ,其中 为第 个个体在 维的权重。对于第 个个体,对象kitY1/2kittiwX1/2kt tk和 的欧氏距离为:j()()21rkkijitjttdY将 式代入上式可得 其中1/2kittiYwX 221()()kijkijkrijrwXwX是个体间唯一不同的参

22、数,而分析对象在公共感知图中的坐标则所12(,)kkkr有个体都相同。在此基础上可依据古典MDS求中心化内积公式得到如下公式:22221111( )nnnkijkijkijkij kijijijrktijttbdddwXCarroll和Chang采用非线性迭代最小平方法求得X的最优解,得到公共拟合构造点。3 用多维标度法分析实例的常见的两种情况3.1 已知距离矩阵的 CMDS 计算根据上述度量古典CMDS的计算方法,首先由距离矩阵可求得内积矩阵 ,求出B的特征值,根据特征值大小确定维数r ,然后再r维空间表示各个对象的关系。B3.2 已知相似矩阵的 CMDS 计算如果已知的数据不是 个对象之间

23、的某种距离,而是 个对象间的某种相似性测度,nn只需将相似系数阵 转换为广义距离阵 ,其他计算与上述方法相同。令CD12()ijijijdc显见 , ,故 为距离阵。根据数学定理易知,当 时,20ijijc,iijji 0C由 式定义的距离阵为欧氏距离阵。12()ijijijdc4 实例分析与计算实现这几年山东省的经济发展迅速,人们受教育程度也普遍提高。为了衡量各个城市的人们的受教育程度,我们不仅要看某一阶段的读书情况,而应该从各个阶段(小学、中学、大学读书人数等)的读书情况 8来综合的评价分析。我在此利用 SPSS来对 2010 年山东省 17个城市人们受教育程度进行分析,选取了以下反映城市

24、人们受教育程度的 16个指标,用 SPSS进行多维标度分析。4.1 评价指标体系和拟合空间的建立4.1.1 评价指标选择的原则可比性原则, 即指标必须具有各城市之间的横向可比性。简洁性原则, 要求选取一些代表信息量大且能够反映事物本质特征的指标。易于获取性原则,即指标的数据应该容易获得, 并且来源可靠, 科学客观。综合全面性原则, 即指标内容必须涵盖我省各城市人们受教育程度的各个层次。4.1.2 指标选择的内容按照上述指标体系,选择了山东省 17个城市的相关数据。指标都是正指标,无需归一化。SPSS 软件将会自动对原始数据进行标准化处理。(各地区分别为济南(VAR1)、青岛(VAR2)、淄博(

25、VAR3)、枣庄(VAR4)、东营(VAR5)、烟台(VAR6)、潍坊(VAR7)、济宁(VAR8)、泰安(VAR9)、威海(VAR10)、日照(VAR11)、莱芜(VAR12)、临沂(VAR13)、德州(VAR14)、聊城(VAR15)、滨州(VAR16)、菏泽(VAR17)为读小学的男生数 为读小学的女生数1X2X为读初中的男生数 为读初中的女生数3 4为读高中的男生数 为读高中的女生数 5 6为读中专的男生数 为读中专的女生数 7 8为读大学专科的男生数 为读大学专科的女生数9 10为读大学本科的男生数 为读大学本科的女生数1X12X为读研究生的男生数 为读研究生的女生数3 4为男生文盲

26、率(%) 为女生文盲率(%) 5 64.1.3 拟合构造空间维数的确定 9多维标度法利用聚类分析的过程是利用主成分分析的思想求出样品点的距离阵D并确立拟和构造点的维数具体步骤如下: 首先将17个城市的受教育程度的数据经标准差标准化求其距离阵 ,如下)(ijdD 12 3 45 6 78 9 10 23 14 56 17.068 79 .4.5D0316 . 2 .28.8439 .07 .719 6.524 .10.35 .302 9.6812 . 48.13 7.9.67 4. 3 .0 .2084 .6115 3.51 .5894 .6.92 .621 2.7 0748 .39 .5617

27、9. 根据公式 求出中心化内积矩阵 如2222111( )nnnijijijij ijibdddnijbB)( 3.07 269.45- .096- .307.81-20.9-8 .7145-0.3- .17 78l4 63569 286 12 45 . . -. - 4 93 013501 02134017 .94.8-3.6-5.-6. .2- 27 8 5.94-9-. 380 21 017562.3-7.4 .-5830. 12 17 65 143 21 09 87 6 4B求的 B的特征根为 , , , , ,45, , , , , ,.6.7.8.9.10.11.12, , ,01

28、13040,15,167作图观察特征值的变化情况,以确定所需的维数如图 1所示:图1特征值的变化曲线图从图中可以看出:当三维时,特征值曲线形成转折;三维以后,特征根很小且变化平缓。因特征根愈大,其包含的信息量就愈多,故此处选取三维构图就能很理想的反映山东省 17个城市人们的受教育程度。4.2 用 SPSS 进行多维标度分析4.2.1 操作步骤(1)在 SPSS首窗口,点击文件数据打开根据条件选择数据,将数据导入。(2) 主菜单中选择分析度量多维尺度。就进入多维标度法的对话框,将以下变量:X1、 X2、X3、X4、X5、X6、X7、X8、X9、X10、X11、X12、X13、X14、X15、X1

29、6 导入。由于原始数据不是距离阵,因此需要在下方距离单选项中选择从数据创造距离,这时模型子对话框被激活,默认计算欧氏距离。 (3)点击进入度量子对话框,对距离阵进行设定。由于我们的变量都是连续数值型的,所以应在度量单选项中选择区间 。并在其下方的标准化中选择变量 Z得分 ,表示对变量进行正态标准化。然后在创造距离矩阵单选项中选择个案 ,表示计算样品之间的距离阵。设置完毕后,点击继续回到主对话框。 (4)在主对话框中点击进入模型子对话框。在度量水平中选择区间 ,即连续取值的数值型变量。其他设置无需改变,点击继续返回主对话框。 (5)点击进入选择子对话框。显示栏中默认不输出任何图表。选择组图项可得

30、到多维标度图,这里图表的维度由模型中的维度决定,在最小维度和最大维度都填入 3;选择 数据矩阵项可得到距离阵和拟合构造点的坐标;而模型和个案摘要是显示出多维标度法中的参数设置,计算方法等,然后点击继续返回主对话框,再点击确定 。 4.2.2 确定空间维数的含义为明确第、维的含义,先求出各指标在每一维上的因子负荷量表1 因子负荷量1 2 3X8 .987 -.031 -.034X9 .981 -.056 .086X7 .971 .134 -.030X10 .970 -.212 .060X6 .937 -.029 -.221X5 .917 .324 -.180X11 .905 -.390 .152

31、X12 .876 -.428 .168X4 .791 .545 -.256X13 .765 -.510 .371X14 .735 -.500 .408X3 .704 .694 -.088X2 .503 .839 .063X1 .548 .815 .022X15 -.338 .736 .480X16 -.292 .558 .668从表中可以看出每一维上各指标的因子负荷量绝对值较相近。致使对未旋转的各维的实际意义不好作出明确的解释,故可对坐标轴进行正交旋转。此处采用最大方差旋转,得到旋转后个维的因子负荷量结果如下:表2 坐标轴旋转后的因子负荷量 1 2 3X13 .986 .007 -.101X1

32、4 .976 -.014 -.058X12 .937 .191 -.256X11 .933 .241 -.257X10 .855 .436 -.261X9 .802 .551 -.165X8 .738 .605 -.255X3 .159 .973 .115X4 .216 .963 -.118X1 .035 .935 .301X2 .010 .912 .357X5 .451 .860 -.190X7 .651 .715 -.168X6 .613 .625 -.402X16 -.172 .048 .901X15 -.378 .200 .839由表 2可知,第一维主要代表人们读中专( )、专科( 、

33、 )、本科( ,8X910X1)、研究生( 、 )的情况,即第一维主要表示人们高等教育的程度;第二维1X13X4代表人们小学( 、 )、初中( 、 )、高中( , )的受教育情况受,23456即第二维主要表示人们受初、中等教育的程度;第三维主要表示人们的文盲程度( 、 )。15X64.2.3 结果分析结果输出标题为“Alscal” ,随后方框中显示的 SPSS在默认条件下,三维空间的迭代记录。S-tress 依据塔卡杨等人提出的压力计算公式(2)计算的结果,根据 S-tress的变化值可以检测是否达到收敛标准,从表中可以看出,SPSS 迭代三次后 S-tress值得变化为 0.00014,小于

34、默认的 0.001,达到收敛标准。 表 3 三维空间的迭代记录Iteration history for the 3 dimensional solution (in squared distances)Youngs S-stress formula 1 is used.Iteration S-stress Improvement1 .019112 .01692 .002193 .01678 .00014Iterations stopped becauseS-stress improvement is less than .001000下面方框中是统计量Stress和RSQ的具体解释和计算结果

35、。RSQ即决定系数,表示总变异中能够被拟合构造空间距离所解释的比例,RSQ 值越接近1 越好,一般在0.60 以上。RSQ=0.98764已经非常接近于1是非常理想的。Stress值是依据克鲁斯卡尔提出的压力公式(1)计算的结果。克鲁斯卡尔给出了一种经验的评价Stress优劣的尺度:若Stress 2.5%,为很好,这里Stress值为0.02247 2.5%,这些都说明模型拟合效果很好 10。 表4 统计量Stress和RSQ的具体解释和计算结果Stress and squared correlation (RSQ) in distancesRSQ values are the propor

36、tion of variance of the scaled data (disparities)in the partition (row, matrix, or entire data) whichis accounted for by their corresponding distances.Stress values are Kruskals stress formula 1.For matrixStress = .02247 RSQ = .99764(3)由于我们在进行多维标度分析的维数选择的是三维,所以输出的是欧氏距离下的17个城市的三维拟合构图以及 17个城市在三维坐标中的坐标

37、值。图 2 三维拟合构造图表 5 拟合构造点的坐标值Configuration derived in 3 dimensionsStimulus Coordinate DimensionStimulus Stimulus 1 2 3Number Name1 VAR1 3.0116 -1.7254 -.86652 VAR2 2.6270 -.4103 .02713 VAR3 .1201 -.5332 .22484 VAR4 -1.1127 -.0873 -.08835 VAR5 -1.3836 -.8539 -.31486 VAR6 1.3265 -.1452 .73937 VAR7 1.4673

38、 .5677 1.07818 VAR8 .5546 1.0727 -.48659 VAR9 -.0251 .0349 .038510 VAR10 -1.0077 -.8420 .577911 VAR11 -1.6477 -.1702 -.340912 VAR12 -1.9905 -.9735 .252013 VAR13 .7029 1.8981 -.239614 VAR14 -.6271 .3118 .354815 VAR15 -.6029 .4672 -.209816 VAR16 -1.2523 -.0126 -.381617 VAR17 -.1605 1.4011 -.3647从 I维来看

39、,数值愈大,人们受高等教育程度越高,人们受高等教育越多。从图中看出济南(VAR1)在第一维的数值最大,其次是青岛(VAR2),再次之是烟台(VAR6)和潍坊(VAR7),这几个地区是山东省城市发展的引领城市,经济较发达,教育随之也比较好。济南是山东省拥有院校最多的城市,且青岛、潍坊、烟台都有海大、青大、潍坊学院、烟台大学等多所重点高校,还有许多高等院校、高职等,所以这些地区受高等教育的人们较多,人们受教育程度较高。从维来,数值越低,人们文盲率越低,从图中可以看出,济南(VAR1) 、东营 (VAR5) 等地区文盲率较低,与这些城市经济较发达有着密切的关系。从维(纵轴) 来看,数值愈大, 表示受

40、初中等教育程度愈高。图中可见,济宁(VAR8)、临沂(VAR13)、菏泽(VAR17)等地区的大多数人们的教育程度处于初中等教育阶段。图 3 线性拟合的散点图图 3表示的欧氏距离模型线性拟合散点图,提供的是原始数据的不一致程度和线性模型计算出来的欧氏距离间的散点图。如果模型的拟合程度好,则所有点应当在一条直线上,从图中可以看出几乎所有的点基本在一条直线上,没有明显的离散点,这说明模型的拟合效果是比较理想的。4.3 案例进一步分析随着经济不断的增长,人们思想越来越开放,但是在部分地区仍会存在一定的封建思想。为了看看男生和女生在受教育程度方面的差异,我们仍然用上述数据,用 SPSS进行多维标度分析

41、,其中奇变量表示男生在不同阶段的受教育人数,偶变量表示女生在不同阶段的受教育人数。 VAR1(读小学的男生数) VAR2(读初小学的女生数)VAR3(读初中学的男生数) VAR4(读初中学的女生数)VAR5(读高中学的男生数) VAR6(读高中学的女生数)VAR7(读中专的男生数) VAR8(读中专的女生数)VAR9(读专科的男生数) VAR10(读专科的女生数)VAR11(读本科的男生数) VAR12(读本科的女生数)VAR13(读研究生的男生数) VAR14(读研究生的女生数)VAR15(男生文盲率) VAR16(女生文盲率)4.3.1 确定拟合构造空间的维数我们首先利用特征值变化曲线情况

42、确定拟合构造空间的维数,具体操作步骤和上题一样。我们做出特征值变化曲线图,从图中可以看出前一个特征值较大,其余的特征值都较小且变化趋势接近于水平状态。特征根愈大,其包含的信息量就愈多,故此处选取一维构图就能基本反映男生和女生受教育程度。图 4 特征值的变化曲线图4.3.2 用 SPSS进行多维标度分析(1) 用 SPSS对不同阶段的男女受教育程度进行多维标度分析,具体操作步骤与上题一样,只是第(5)步中,拟合空间的维数填 1即可。最后得到拟合构造点的一维拟合构造图以及在一维空间中的坐标值,还有线性拟合散点图。图 5 一维拟合构造图表 6 一维点的坐标图Configuration derived

43、 in 1 dimensions Stimulus Coordinates DimensionStimulus Stimulus 1Number Name1 VAR1 1.33362 VAR2 1.68243 VAR3 2.19774 VAR4 1.51535 VAR5 -.04346 VAR6 -.32227 VAR7 -.46618 VAR8 -.48119 VAR9 -.530410 VAR10 -.608011 VAR11 -.633312 VAR12 -.689713 VAR13 -.735514 VAR14 -.738515 VAR15 -.740416 VAR16 -.7404从

44、上图和表中可以看出除了 VAR1、VAR2 外,其余的 VAR3、 VAR5、 VAR7、 VAR9 、VAR11、 VAR13大部分奇变量比 VAR4、 VAR6 、 VAR8、 VAR10 、VAR12、 VAR14大,上述现象说明在山东省多数地区人们还存在一定的重男轻女思想,男生受教育程度普遍比女生高。从图中我们还可以看出随着受教育程度越高,男生和女生之间的差距越小(点和点之间越紧密) ,说明女生和男生在智力方面差不多的,所以我们都要对自己充满信心。图 6 线性拟合散点图图 6表示的欧氏距离模型线性拟合散点图,提供的是原始数据的不一致程度和线性模型计算出来的欧氏距离间的散点图。如果模型的

45、拟合程度好,则所有点应当在一条直线上,从图中可以看出个点基本在一条直线上,说明模型的拟合效果非常好。5 总结通过用 SPSS进行分析,可知多维标度法是一种多指标的综台评价方法,它具有直观、量化的特点,是一种降维统计方法。利用多维标度法解决实际问题时,首先确定空间维数,在低维空间内以图形的形式表现出来,有几个潜在综合指标变量,图形就是几维的,然后将各个样本在潜在的空间图中的点表示,每个事物都占一个点,点与点之间的距离越近,表明事物在维度特征上越相似,距离越远,表明事物在维度特征上差异越大。通过实例分析可见,多维标度法对于定量、定性数据都适用,本文实例采用的数据为定量数据,因此运用样品间的距离作为

46、运算的基础。如果资料为定性数据,则可用两样品的匹配系数等 11求资料的多维标度。在某些情况下,当所研究资料的各项指标无法测得或不能精确测定时,只要知道各样品问差异的顺序也可以运用多维标度法加以解决 12 。因此,该法的应用范围较广。但在某些情况下,当资料的指标数较多时,样品间的关系就显得较为复杂,所求得的多维标度的维数也可能较多,不便于清晰地观察。对此,可先对原始指标进行整理,得出综合指标,以求得满意的结果。致谢我很高兴能有机会对曾经帮助我的人表示感谢。首先,衷心感谢王敏会老师对我细致入微的关心、帮助、指导。本论文从选题、开题到论文撰写等各个环节都倾注着王老师的汗水和心血,在这期间得到老师悉心

47、的指导和热情的鼓励,对文章内容和框架结构的修改提出参考性的建议。王老师以她渊博的学识、坦荡的胸襟、开明的学术思想和严谨的治学态度言传身教使我受益终生.导师锲而不舍的工作精神和孜孜不倦的工作热情更将永远地激励我脚踏实地去努力奋斗。在此,我对导师的培育之恩和谆谆教导表示最衷心的感谢!其次,感谢学院领导的关怀以及周围同学们的帮助。感谢所有帮助过我的同学,他们在我最艰难的时刻给与了我很多关怀。最后,至此毕业之际,向在大学期间给予我支持、鼓励和教导的老师表示衷心的感谢和良好祝愿。正是在大家的关心与支持下,才有了本文的形成。在此,谨以本文献给所有支持并帮助过我的朋友们。参考文献 揭水平.多维标度分析及其在探索心理素质结构中的应用J 理论与技术,2011(6):4-7. 张卫东,董海涛.都市人智慧隐含理论的初步调查J. 心理科学,2003(3):419-421. 韩劢,张积家.汉语亲属词概念结构的实验研究J.广州大学学报, 2003(9):55-62. 张积家,和秀梅.纳西族亲属词的概念结构J.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 论文指导/设计

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报