1、综合评价方法,南京财经大学统计学系 白先春 15312415893 2014年9月南京,1、多指标综合评价方法的系统分析邱东,中国统计出版社,1991; 2、综合评价方法胡永宏等,科学出版社,2000; 3、综合评价理论与方法郭亚军,科学出版社,2007.,主要参考书目,问题研讨,选取自己感兴趣的问题(如:人口素质、城市化质量),进行下列问题讨论: 1、综合评价指标体系的选择方法. 基于所研究的问题,选用合适的方法,建立综合评价指标体系. 2、评价指标一致化与无量纲化方法,进行优缺点的比较分析. 针对所研究的问题及设计的综合评价指标,进行指标的一致化及无量纲化处理. 3、评价指标权数确定的方
2、法,进行优缺点的比较分析. 针对所研究的问题及设计的综合评价指标,进行各指标的赋权. 4、综合评价方法(模型)的选择,进行优缺点的比较分析. 针对所研究的问题进行综合评价. 5、综合评价报告撰写中存在的问题及解决方法.,内容安排,第一章 综合评价概述 第二章 综合评价指标体系的构建 第三章 综合评价指标的处理 第四章 评价指标权重的确定 第五章 评价模型的选择 第六章 数据的搜集与处理 第七章 综合评价的其他方法 第八章 综合评价报告的撰写,第一章 综合评价概述,一、综合评价的意义 二、综合评价的一般步骤 三、综合评价的局限性,一、综合评价的意义,1、评价的意义 评价,是最初步、最基本的统计分
3、析。可见,从统计分析意义上讲,评价是指从总体上展示分析对象的规模大小、水平高低、速度快慢,各种关系是否协调合理等的分析研究方法及其结果。它是从“度”上来反映研究对象所处的状态,表现的是一种数量上的比较。 数量比较是一种传统的统计评价方法。古典统计学的创始人之一威廉配第(William Petty英)在政治算术中,对英国、法国、荷兰的国情国力进行分析时,就采用了这样的方法。由于这种方法适应范围广,约束条件少,并且可以简明地对研究对象进行评价,因此,在今天的统计分析活动中,仍然是一种被统计工作者广泛采用的了解情况、发现问题、揭示矛盾的基本方法。,2、评价标准的选择 对任何事物进行评价都不能孤立地进
4、行,都必须要与其他有联系的现象进行对比来实现,并且还应当在质的分析研究的基础上给予一定的量的标准,来作为判断的依据。我们说某个国家是发达国家或发展中国家,是与其他国家在一定的时间条件下相比较而言的,说某个企业经济效益好,或者经济效益差,也是用一定的标准来衡量才能做出判断。统计评价虽然进行的是数量比较,但也包含同样的道理。 在统计评价中,选择合适的评价标准都是一个十分关键的步骤。评价标准选择的合适,进行比较后,才能客观做出评价,选择的不合适,不仅不能正确反映研究对象的真实性和客观性,反而还有可能得出错误的结论。在实际的统计评价分析中,评价标准主要有以下几种选择:,时间评价标准即选择不同时间的指标
5、数值作为评价标准。通常应用的是与前一时期进行比较,如:2012年与2011年进行比较;今年下半年与今年上半年进行比较;本年的某季度、月份与去年或者以前的某年同期进行比较;与历史上达到的最好水平的年份或者时期进行比较;与历史上的一些关键年份、代表年份的比较分析,等等。 空间评价标准即选择不同空间的指标数值进行比较。有:,(1)与相似的空间比较,如与本地区或单位在空间条件上有相似的国家、地区、省、市、县、单位等进行比较。其“相似”既可能是土地面积、人口规模、地理条件、资源条件等的相似,也可能是生产规模、市场化条件、产品种类、技术水平等方面的相似,需要根据具体的研究目的来进行具体的选择。 (2)与先
6、进(或最优)空间的比较,如西部地区某省(市、地区、县)与沿海经济发达的省(市、地区、县)进行比较分析;中国某省(市、区)与中国最好的省(市、区)进行的比较分析;我国与世界上经济最发达的国家进行的比较分析,等等。(3)与扩大的空间标准进行比较,如某省(市、区、县)的水平与全国或者全世界的平均水平、最好水平进行的比较,我国与全世界的平均水平、最好水平进行比较,等等。,经验或理论标准经验标准是指通过对大量历史资料的归纳总结而得出的标准。如:衡量生活质量的恩格尔系数,企业技术开发经费与产品销售收入的比例的经验系数,不同经济发展阶段的R&D经费占GDP的比重,不同经济发展阶段三次产业的结构,等等。理论标
7、准是指通过已知的理论知识经过推理分析得到的依据。如:财政收入的增长不能低于国民经济的增长水平,工资水平的增长不能低于劳动生产率的增长水平,等等。在对社会经济现象进行分析研究时,可作为评价标准的经验标准和作为评价标准的理论标准是各种各样的。标准的确定取决于人们的理论水平和实际经验的丰富程度。实际应用中,应当将这两种标准结合起来应用。,计划或目标标准计划标准是指计划制定部门和业务主管部门提出的标准。如:计划数、达标数、定额数,等等。它是计划制定部门或业务主管部门指导或控制执行单位或部门的数量标准。对于引导部门或行业的发展方向和发展步骤具有重要作用。计划标准在计划经济体制条件下,是统计分析中最为广泛
8、的标准,不管在宏观或者微观都有重要意义。在市场经济体制条件下,宏观经济中的计划成分极少,因此,在宏观经济分析中,计划评价标准及其评价相对来说要少一些。而对于微观经济分析来说,仍然具有重要意义和广泛的应用。 链接:税收预测报告,3、传统评价分析的局限性传统的评价分析仅表现为简单的数量比较,是一种单项评价。虽然这种方法表现为:灵活、简单、约束条件少、适用范围广等优点,但也存在着较大的局限性。因为对研究对象进行评价分析、可以采取各种各样的方法,而传统的评价方法是对总体某一方面特征的单个指标,在不同时间、不同空间上进行对比。即通过相对指标来说明分析对象在一定时间、地点、条件下的状况,存在着如下的局限性
9、:(1)在进行评价时,各个指标的变动方向和变动程度是不同的,经常会出现不同指标所说明的状态相互发生矛盾的情况,如在两地区的经济效益的比较分析时,从劳动生产率上看甲地区比乙地区好,而增加值率乙地区比甲地区好,在这种情况下就很难评价出两地区之间的优劣。,(2)传统评价只限于两个或三个单位且较少的指标的评价分析,在进行多指标、多单位的相互评价时,将会出现较大的难度,且几乎不可能。往往会出现判断不清到底那个单位好,那个单位差的极其混乱的情况。综合评价方法近年来,随着统计分析活动的开展,评价对象范围不断扩大,评价内容越来越复杂。人们在实践中总结出一套比较系统的,规范的对于多个指标、多个单位同时进行评价的
10、方法,即多变量综合评价方法,简称综合评价。 4、综合评价的涵义综合评价(comprehensive evaluation,CE)是指对被评价对象所进行的客观、公正、合理的全面评价。通常的综合评价问题都是有若干个同类的被评价对象(或系统),每个被评价对象往往都涉及到多个属性(或指标)。,5、综合评价问题的广泛性 一个国家的经济发展水平不仅表现为人均国内生产总值的高低,还表现为产业结构、居民福利、资源利用等多方面; 一个城市的生态环境状况不仅表现为空气污染指数的高低,还表现为水域污染、噪音污染、城市绿化水平、工业三废的治理和生活垃圾的处理、清洁能源的利用等; 一个企业的经济效益不仅表现为劳动生产率
11、的高低,还表现在产品销售率、资金利税率、成本利税率、增加值率、资金周转速度等方面; 体操、歌手比赛的评分,也要综合考虑各方面的因素并将其归纳为单一的结果。,6、单项评价与综合评价的比较 常常需要依据统计指标的实际水平对有关的经济活动或经济状况进行评价。统计评价有时很简单,有时则比较复杂。 单项评价只依据一项指标,通过适当对比就可以从某一侧面作出判断。 综合评价根据多项指标、从多个不同侧面对有关现象进行全面的综合判断。 综合评价方法(技术)通过对特定现象(主要是社会经济现象)的多个方面数量表现进行高度抽象综合,进而以定量形式确定现象综合优劣水平与次序的一种新兴统计分析方法。,7、综合评价方法的特
12、点(1)评价过程不是一个指标接一个指标顺次完成,而是通过一些特殊的方法将多个指标的评价同时完成。(2)在综合评价过程中,要根据指标的重要性进行加权处理,使评价结果更具有科学性。(3)评价的结果为根据综合分值的单位的排序,并据此得到结论。由以上特点可见,综合评价可以避免一般评价方法局限性,使得运用多个指标对多个单位进行的评价成为可能。这种方法从计算及其需要考虑的问题上看都比较复杂,但由于其显著的特点综合性和系统性,使得综合评价方法得到人们的认可。并在实践中广泛应用,如:工业经济效益综合评价,小康生活水平综合评价,科技进步的综合评价,国家(地区)的综合实力评价等。,8、综合评价所涉及的问题分类综合
13、评价一般表现为以下几类问题: 分类对所研究对象的全部个体进行分类,但不同于复合分组(重叠分组),如依据经济发展状况对我国各地区分类; 比较、排序直接对全部评价单位排序,或在分类基础上对各小类按优劣排序,如对我国各地区按经济状况分类后再进一步明确,为宏观经济管理提供信息; 考察某一综合目标的整体实现程度对某一事物作出整体评价,如小康目标的实现程度、现代化的实现程度。当然必须有参考系,否则无法评价。通过综合评价和比较,可以找到自身的差距,便于及时采取措施,对症下药。,9、综合评价的目的根据系统的属性判断确定这些系统的运行(或发展)状况哪个优,哪个劣,即按优劣对各被评价对象进排序或分类。这类问题又称
14、为多属性(或多指标)的综合评价问题。 10、综合评价的应用研究多目标决策问题的前提,因此研究解决这类问题在实际中是很有意义的,特别是在政治、经济、社会及军事管理、工程技术及科学决策等领域都有重要的应用价值。(参看:综合评价理论与方法,郭亚军,科学出版社,2007,P1-6.),。,二、综合评价的一般步骤1、综合评价问题的要素构成一般地,一个综合评价问题由5个要素组成:被评价对象、评价指标、权重系数、综合评价模型及评价者。 被评价对象被评价对象就是综合评价问题中所研究的对象,或称为系统。通常情况下,在一个问题中被评价对象是属于同一类的,且个数要大于1,不妨假设一个综合评价问题中有 个被评价对象(
15、或系统),分别记为,评价指标评价指标是反映被评价对象(或系统)的运行(或发展)状况的基本要素。通常的问题都是有多项指标构成,每一项指标都是从不同的侧面刻画系统所具有某种特征大小的一个度量。 一个综合评价问题的评价指标一般可用一个向量表示,其中每一个分量就是从一个侧面反映系统的状态,即称为综合评价的指标体系。 不妨设系统有 个评价指标(或属性),分别记为,即评价指标向量为,权重系数每一综合评价的问题都有相应的评价目的,针对某种评价目的,各评价指标之间的相对重要性是不同的,评价指标之间的这种相对重要性的大小可以用权重系数来刻画。如果用 来表示评价指标 的权重系数,则应有 ,且注意:当各被评价对象和
16、评价指标值都确定以后,问题的综合评价结果就完全依赖于权重系数的取值了,即权重系数确定的合理与否,直接关系到综合评价结果的可信度,甚至影响到最后决策的正确性。,综合评价模型对于多指标(或多因素)的综合评价问题,就是要通过建立合适的综合评价数学模型将多个评价指标综合成为一个整体的综合评价指标,作为综合评价的依据,从而得到相应的评价结果。,评价者:可以是某个人或某团体。评价目的的确定、评价指标的建立、评价模型的选择、权重系数的确定都与评价者有关。2、综合评价的逻辑框图,3、综合评价的一般步骤 确定综合评价的目的 确定评价指标和评价指标体系 (1)使所有的指标都从同一角度说明总体,这就提出了如何使指标
17、同向化的问题;(2)所有的指标可以相加,这就提出了如何消除指标之间不同计量单位(不同度量)对指标数值大小的影响和不能加总(综合)的问题,即对指标进行无量纲化处理计算单项评价值。 确定各个评价指标的权重 选择或构造综合评价模型 计算各系统的综合评价值,并给出综合评价结果,三、综合评价的局限性,综合评价方法很多,各种方法得出的结果不可能完全相同,并且都带有一定的相对性和局限性。 (1)将若干个指标数值综合成一个数值,损失了原有指标带来的大量信息,结果较抽象,难释其经济意义; (2)主观性很强,选择什么指标、选择多少指标,权数的分配都很主观; (3)评价的结果不具有惟一性。选择不同的方法,可能有不同
18、的结果,即使采用同样的方法,由于各指标的赋值不同、权重不同等,也有可能使评价结果不同。,第二章 综合评价指标体系的构建,一、综合评价指标的选择原则 二、综合评价指标的选择方法,一、综合评价指标的选择原则,目的性原则 客观性原则 全面性原则 敏感性原则 相互独立性原则 可比性原则 可操作性原则,二、评价指标的选择方法,选择评价指标的方法有两种:定性方法和定量方法。 1、定性方法常用的定性方法有:综合法和分析法。综合法是指通过研讨会或征询专家意见的方式,集中专家 们的意见,以确定评价指标。这种方法是借助专家的智力优势 和经验以选择评价指标的。根据专家意见的集中和分散情况, 可以采取一次或多次的形式
19、选择确定。分析法是将评价的对象划分为若干组成部分或不同的侧 面,明确各个部分或侧面所要评价问题的内涵和外延,在此基 础上,对每一侧面分别选用一个或若干个指标以反映评价对象 的特征。,社会科学课题评价指标体系,2、定量方法 试算法试算法是通过历史资料的试算来判断指标的有效性。 例如,要评价全国各地区2014年可持续发展战略的实施绩 效,可以2012年和2013年的数据进行试算,通过试算结果判 断所选指标的合适性,然后对相关指标进行科学比较,把那些 代表性强的指标纳入指标体系的构建之中,然后反复修正指标 体系直至满意为止。,对于 个取定的被评价对象, 每个被评价对象都可用 个指标的观测值 来表示。
20、,如果 个被评价对象关于某项评价指标的取值都差不多,那么尽管这个评价指标是非常重要的,但对于这 个被评价对象的评价结果来说,它并不起什么作用。因此,为了减少计算量就可以删除这个评价指标。这就是最小均方差的筛选原则:,最小均方差法,极小极大离差法,聚类分析法聚类分析在选择指标方面的基本思路是:如果有若干个指标,首先将每一个指标看成一类,然后根据指标间的相似程度,通过比较类间距离进行并类。每次将距离最近的两类加以合并,余下N-1类。再选择这N-1类中距离最近的两类加以合并,余下N-2类。依次类推。这样,每合并一次,就减少一类,继续这一过程,直至将所有指标合并成为一类为止,形成由小到大的分类系统,即
21、谱系。最后整个分类结果画在一张图上,称为聚类图或谱系图,以此直观地反映各指标间的亲疏关系。,聚类分析法的具体实施步骤:选择度量指标间相似程度的方法。常用的方法是相关系数法。各指标两两之间都可以计算相关系数,从而形成一个相关系数矩阵。选择度量指标类间距离的方法。常用的方法有最长距离法、最短距离法、重心法、类平均法、离差平方和法。由于一般利用相关系数表示指标(类)间的相似程度,所以多采用相关系数量大法进行聚类。根据聚类结果绘制聚类图。根据聚类结果确定指标体系,必须以相关程度作为划分标准。至于分类时用的阈值为多少,要视对指标的简约性要求不同而定。若对指标体系的简约性要求不高,可选择较高的相关系数作为
22、阈值,反之亦然。根据最后划分的类别确定指标体系。由于同一类中指标的相似程度相高,即信息重复较多,可以选择其中之一作为代表,从而达到简化指标的目的。,例假定我们初步选择了某事物各个不同侧面特征的指标共8个,记为X1, X2, X8。已知各指标之间的相关系数矩阵见表1。,表1 指标相关系数矩阵,第一步,在矩阵中找到相关系数最大的两个指标,由知,相似程度最高,故聚为一类。留下 为代表,将有关X3的信息从表1中去掉,即划掉第三行、第三列。由此得到新的相关矩阵(见表2)。,表2 指标相关系数矩阵,第三步,表3中最大的相关系数为 ,所以 与 聚成一类,由于 已与 聚成一类了,所以该步实际上是将 聚为一类。
23、重复这一过程,直至将所有指标聚为一类为止。由于有8个指标,所以需要七步(第四步至第七步聚类过程从略)。最终形成聚类图(谱系图)如图1所示。,第三章 综合评价指标的处理,一、评价指标的一致化 二、评价指标的无量纲化,一、评价指标的一致化,评价指标的取值类型 (1)“极大型”指标 (2)“极小型”指标 (3)“居中型”指标 (4)“区间型”指标 评价指标一致化的必要性若评价指标体系中含有多种类型的指标,但在计算综合评价结果之前并没有对评价指标进行指标类型的一致化处理,那么经过综合评价函数计算得到的综合评价数值是越大越好、或是越小越好、或是越居中越好就没有评判的标准。因此,在进行综合评价之前,需对评
24、价指标作类型的一致化处理。,评价指标一致化的方法,通常采用评价指标类型的一致化方法是将极小型指标、居中型指标、区间型指标转化为极大型指标。(1)对于极小型指标 ,令 或式中, 为指标 的一个允许上界。,(2)对于居中型指标 ,令式中, 为指标 的一个允许下界, 为指标 的一个允许上界。,(3)对于区间型指标 ,令式中, 为指标 的最佳稳定区间, 、 分别为指标 的上、下界。,链接:研究报告,评价指标无量纲化的意义指标无量纲化也叫做指标数据的标准化、规范化,是通过数学变换来消除原始指标量纲影响的方法。为了尽可能地反映实际情况,排除由于各项指标的量纲不同以及其数值数量级间的悬殊差别所带来的影响,避
25、免不合理现象的发生,需要对评价指标作无量纲化处理。,二、评价指标的无量纲化,指标的无量纲化是综合评价的前提,无量纲化过程实际上就建立(单项评价指标的)评价函数的过程,即是把指标实际值转化为评价值的过程。单项评价值是个相对数,它表明:从某项评价指标来看,被评价对象(在总体中)的相对地位,即被评价对象相对于总体某一对比标准(最高、最低、平均或其它水平)的相对地位。,评价指标无量纲化的方法,若无特殊说明,以下所考虑的指标 为极大型指标,其观测值为 。,评价指标无量纲化方法的分类 从几何角度可归纳为三大类: (1)直线型(2)折线型(3)曲线型具体内容请参看综合评价方法,胡永宏,2000,科学出版社P
26、22-39。,(1)标准化处理方法式中, 、 分别为第 项指标观测值的(样本)平均值和(样本)标准差, 为标准观测值。 特点:样本平均值为0,方差为1;区间不确定,处理后各指标的最大值、最小值不相同;对于指标值恒定的情况不适用;对于要求指标值 的评价方法(如几何加权平均法)不适用。,(2)极值处理方法式中, 特点: ,最大值为1,最小值为0; 对于指标值恒定的情况不适用(分母为0)。,(3)归一化处理法特点:可看成是线性比例法的一种特例,要求 。 当 时, ,无固定的最大值、最小值,。,(4)线性比例法为一特殊点,一般可取为 、 或 。特点:(1)要求 。(2)当 时, ,有最小值1,无固定的
27、最大值;(3)当 时, ,有最大值1,无固定的最小值;(4)当 时, ,取值范围不固定,。,(5)向量规范法特点:当 时, ,无固定的最大值、最小值, 。,(6)功效系数法式中, 、 分别为指标 的满意值和不容许值; 、 均为已知正常数, 的作用是对变换后的值进行“平移”, 的作用是对变换后的值进行“放大”或“缩小”。特点:可看成是更普遍意义下的一种极值处理法。取值范围取值,最大值为 ,最小值为 。,例假设有三个地区,经济效益指标如表4所示。,表4 三个地区经济效益系列指标表,若要对其用功效系数法进行处理,需要有五个经济效益指标的阈值。上、下限的确定一般要根据该领域(行业)的有关规定进行。,以
28、甲产品销售率为例,各地区的功效系数的计算如下:甲地区产品销售率功效系数=乙地区产品销售率功效系数=丙地区产品销售率功效系数=,无量纲化方法(模型)的选择 需要(准确反映客观实际)与可能结合。实际中大多用直线代替曲线,因为:(1)简单易行;(2)评价是对事物发展水平的相对意义上的描述,而不是绝对的刻画,如A比B好,而不是评价A比B好的数量有多少,所以在不影响被评价对象相对地位的情况下,就用简单的近似的描述;(3)不是任何情况下曲线就最精确,曲线还有模型形式和参数的选取问题,若选取不当,曲线评价的结果就不是最精确的。(4)经济分析管理追求的是相对意义上的满意解,不象数学追求绝对意义上的最优解。,讨
29、论与思考,链接:研究报告.doc,()对于相对数是否需要经过无量纲化处理?无量纲化处理这不仅适合于绝对数、平均数,也适合于相对数,因为相对数不能直接加总,各自对比标准不同,数据的变化范围不同,也需要无量纲化。 ()考试成绩有必要进行无量纲化吗?成绩是一种分数,本身没有单位,而且都是百分制。但由于不同科目试题的难易程度、分量都不一定相同,其分数的“含金量”并不相同,因而不能相加。无量纲化后,各科分数都以60分为中心而分布,具有了可比性,因而可相加。,第四章 评价指标权重的确定,一、权重的含义及其分类 二、权重的确定方法,一、权重含义及其分类1、权重:在综合评价的过程中,对各评价指标起权衡轻重作用
30、的数值即权重,也称权数。2、权数的主要分类(1)按权数的表现形式划分,可分为绝对数形式权数和相对数形式权数(或称比重权数),相对数权数能较直观地显示权数在评价中的作用。(2)按权数形成的方式划分,可分为自然权数和人工权数。由于变换统计资料的表现形式与统计指标合成方式而得到的权数即自然权数,这种权数也被称为客观权数。人工权数是指根据研究目的和评价指标的内涵,人为地构造出反映各个评价指标重要程度的权数,这种权数也被称为主观权数。,二、权重的确定方法,1、主观赋权法主观赋权法是根据人们主观上对各评价指标的重视程度来确定其权重系数的一类方法。 德尔菲法(专家法)实际上各个专家可以根据自己的理解选择不同
31、的方法 相邻指标比较法先按重要性将全部评价指标排序,再将相邻指标的重要性进行比较 层次分析法()互反式两两比较构权法 德尔菲法德尔菲法又称为专家法,其特点在于集中专家的经验与意见,确定各指标的权数,并在不断的反馈和修改中得到比较满意的结果。基本步骤如下:,(1)选择专家。一般,选本专业领域中既有实际工作经验又有较深理论修养的专家10-30人左右,并征得专家本人的同意; (2)将待定权数的p个指标和有关资料以及统一的确定权数的规则发给选定的各位专家,请他们独立地给出各指标的权数值; (3)回收结果并计算各指标权数的均值与标准差; (4)将计算结果及补充资料返还给各位专家,要求所有的专家在新的基础
32、上重新确定权数; (5)重复第(3)、(4)步,直至各指标权数与其均值的离差不超过预先给定的标准为止,也就是各专家的意见基本趋于一致。此时各指标权数的均值作为该指标的权数。,例 选定6个专家对4个评价指标进行权重评估,得分如下:,分析:若不考虑专家权威程度,则各评价指标权重比例为 A:B:C:D=75:57:33:18 (归一化) A:B:C:D=0.41:0.31:0.18:0.10,相邻指标比较法这一方法往往与德尔菲法结合使用。 先将所选指标按一定考虑排好顺序: 然后让专家填一张表:,把x2与x1相比,x3与x2相比, xk与xk-1相比,相比的重要性的值列在第三列。 是从第三列的值可以算
33、出,它表示各个指标与x1相比的重要性。由于xi总是与上一个xi-1相比,因此gi表示xi与xi-1相比的重要性。只是将 归一化,注意 ;相邻指标相比,一是为了方便;二是为了求 方便。,层次分析法,层次分析法(Analytic Hierarchy Process,简称AHP):由美国科学家T.L.Saaty于20世纪70年代提出,是用系统分析的方法,对评价对象依评价目的所确定的总评价目标进行连续性分解,得到各级(各层)评价目标,并以最下层指标作为衡量目标达到程度的评价指标;然后依据这些指标计算出一综合评分指数对评价对象的总评价目标进行评价,依其大小来确定评价对象的优劣等级。1、核心:通过两两比较
34、,得判断矩阵。2、基本假设:层次之间存在递进结构,即从高到低或从低到高递进。3、基本方法:建立层次结构模型。4、基本步骤:,根据所建立的医院工作质量综合指标,采用层次分析法对各指标进行赋权。 建立层次结构模型:对总评价目标进行连续性分解以得到不同层次的评价目标,将各层评价目标用图有机地标示出来,即建立目标树图,见图1。,构造判断矩阵:设Wi表示反映第i个指标对于某个最低层目标的优越性或某层第i个目标对于上层某一目标的重要性的权重,以每两个指标(或子目标)的相对重要性为元素的矩阵A称为判断矩阵。,计算判断矩阵A的特征值及特征向量(权重):计算矩阵 的特征向量有三种方法:幂法、方根法、和积法。幂法
35、可以求得任意精度的特征向量,但是对于层次分析法中的求解,并不需要很高的精度,因为判断矩阵本身就存在相当的误差范围,所以可以采用更为简便的近似求解法,方根法和和积法都是此类近似求解法,以下采用方根法求解。,按公式 计算初始权重系数 得按公式 计算归一化权重系数 得用同样方法可获得其他分层中各项目指标的权重系数,现以医疗工作一项为例说明,见表3。,计算各个评价指标的组合权重系数:当评价指标可分层时,即某项或某几项评价指标可再分为次级评价指标时,则次级评价指标的权重既应考虑其本身在所有次级评价指标中的权重分配,又要考虑其高层评价指标在所有评价指标中的权重分配。组合权重有两种求法:代数和法;乘积法 。
36、本例采用乘积法计算各个评价指标的组合权重系数,见图2。,图2 乘积法求各层次评价指标的组合权重,对于19阶判断矩阵,RI值见表4。,当CR0.10时,即认为判断矩阵具有满意的一致性,否则就需要调整判断矩阵,并使之具有满意的一致性。以本例第一层为例:,认为第一层子目标各项权重判断无逻辑错误。依此类推,运用此法逐步检测每一层子目标权重系数,判断它们是否都合乎逻辑。,软件应用,主观赋权法的特性 重要性权数是一种重要性程度的量化值,表示对合成值的影响程度大小。重要性本身是个综合的概念,表现在多个方面,如可以是“价值判断取向”上的重要性,也可以是合成时“分辨能力(信息含量)高低”的重要性,或“可靠度大小
37、”的重要性。 模糊性重要性本身就是个模糊的概念;习惯取点值。 人工性没有绝对的正确错误标准;只能尽可能选择相对科学合理的权数。 主观性受评权者主观意识的影响,具有一定的主观随意性。,2、客观赋权法由主观赋权法确定出的权重真实与否,在很大程度上取决于专家的知识、经验及其偏好。为了避免在确定权重系数时受人为地干扰,可采取另一类确定权重的方法客观赋权法。其赋权的基本思想:权重应当是各个指标在指标总体中的变异程度和对其他指标影响程度的度量,赋权的原始信息应当直接来源于客观环境,可根据各指标所提供的信息量的大小来决定相应指标的权重。 基本观点:指标的区分度越高,对排序的影响就越大。 均方差法 极差法 熵
38、值法,均方差法式中,链接:研究报告,极差法式中,链接:研究报告,熵值法熵值法(entropy method)也是一种根据各项指标观测者所提供的信息量的大小来确定指标权重的方法。设 为第i个系统中的第j项指标的观测数据。对于给定的j, 的差异越大,该项指标对系统的比较作用就越大,亦即该项指标包含和传输的信息越多。信息的增加意味着熵的减少,熵可以用来度量这种信息量的大小。其确定权数的步骤如下:(1)计算第j项指标下,第i个系统的特征比重,链接:风景名胜区规划方案的层次分析法与熵技术评价,均方差法、极差法及熵值法应用时局限性:上述方法确定权重时,其出发点是根据某同一指标观察值之间的差异程度来反映其重
39、要程度的,如果各系统的某项指标的数据差异不大,则反映该指标对评价系统所起的作用不大,用均方差法、极差法及熵值法计算出来的权重系数也不大。 文献阅读:“突出整体差异的赋权法”郭亚军,综合评价理论与方法,科学出版社,P51-56。,客观赋权法的特征: (1)不具有任何主观色彩; (2)具有评价过程的透明性、再现性; (3)确定的权数 将不具有继承性、保序性。,主观赋权法的不足之处:该方法虽然反映了评价值(或决策者)的主观判断或直觉,但在综合评价结果或排序中可能产生一定的主观随意性,即可能受到评价者(或决策者)的知识或经验缺乏的影响。 客观赋权法的不足之处:该方法虽然通常利用比较完善的数学理论与方法
40、,但也存在一些不足,如对同一指标体系的两组不同样本,即使用同一种方法来确定各指标的权重系数,结果也可能会有差异;再则,有时用客观赋权法得出的评价结果或排序结果可能与决策者的主观愿望相反,而使决策者感到困惑。,3、集成赋权法集成赋权法是将主观与客观赋权法有机结合起来,使所确定的权重同时体现主观信息和客观信息。 “加法”集成法 “乘法”集成法 “加法”集成法设 分别是基于客观赋权法和主观赋权法生成的指标 的权重,则称, 是同时具有体现主客观信息集成特征的权重。,链接:风景名胜区规划方案的层次分析法与熵技术评价,第五章 评价模型的选择,一、加法合成模型 二、乘法合成模型 三、加乘混合合成模型 四、理
41、想点法,一、 加法合成模型,其中 ,当 就是通常的算术平均。 适用条件:各评价指标之间相互独立。对于不完全独立的情况采用该方法,其结果将导致各指标间信息的重复,使得评价结果不能客观地反映实际。,主要特点(突出局部优势或“互补性”很强的评价模型) (1)对于数据的要求最宽松,用于合成的某一指标数值可以为0、为负; (2)各指标可以相互补偿(等量补偿),即此升彼降,总的评价值不变; (3)突出了评价分数较大、权数较大者的作用,适用于主因素突出性的评价(对较大数值的变动更为敏感)。 案例分析 构建和谐社会统计监测指标体系研究 经济系统对资源环境影响的评价指标体系研究,二、 乘法合成模型,其中 ,当
42、就是通常的几何平均。 适用条件:非线性加权综合法适用于各指标间(或系统间)有较强关联的情况。,主要特点(消弱局部优势或“不求有功,但求无过”的评价模型) (1)对数据要求较高,指标数值不能为0、负数, (2)鼓励被评价对象在各方面全面发展,任一方也不能偏废。此合成方法督促“全面发展”,而不是靠重点倾斜的方法取胜; (3)乘法合成模型容易拉开评价档次,对较小数值的变动更敏感。 案例分析,和谐城市化的测度理论与方法研究部分,模型的变形对于某一指标 的值越大越不好(极小型指标),如文盲率、婴儿死亡率等,可以将 作为综合的对象,于是非线性综合评价模型变形为:为极大型指标(正向指标), 为极小型指标(逆
43、向指标)。如美国社会卫生组织(American Social Health Association)评价经济发展基本需要程度时,所使用的ASHA指标:,三、加乘混合合成模型,加乘混合合成模型:将评价指标分成几类,或是将评价系统分成若干子系统,先对类内(或子系统内)各指标作乘法处理,再将各类(或各子系统)的积作加法处理。式中: 表示评价指标小类(或子系统)的个数,表示 小类(或子系统)的权数, 表示 小类(或子系统)所含的指标个数, 表示第 小类(或子系统)中、第 个指标 的权数, 。,另一种形式通常类内(或子系统内)指标间相关关系较紧密,而类间(或子系统间)指标间相关关系则不那么紧密,因而根据
44、乘法和加法合成的适用范围,应先在类内作乘法处理,再在类间作加法处理,即第一公式较为合适。混合模型的适用范围比加法和乘法模型更广一些,但是在计算操作上,显然混合模型更加复杂一些。 案例分析 城市发展质量的综合评价以江苏省13个省辖市为例,合成模型的选择原则实际应用中,应从指标评价者之间数据差异大小和评价指标重要程度的差别大小两个角度,选择合适的合成模型: (1)当各评价指标间重要程度差异较大,且各指标评价值间差异不大时,以采用加法合成模型比较适宜。 (2)当各评价指标间重要程度差异不大,而各指标评价值差异较大时,以采用乘法合成模型为宜。 (3)当各评价指标间重要程度差异较大,且各指标评价值间差异
45、也较大时,一采用加乘混合模型为宜。 (4)当各评价指标间重要程度差异较小,各指标评价值差异也不大时,三种合成模型均可,此时以简便易行为选取准则。,第六章 数据的搜集与处理,一、数据的搜集 二、数据的处理 三、基于模糊语言的综合评价,一、数据的搜集,数据搜集:根据综合评价目的和研究任务,运用科学的调查方法与手段,有计划、有组织地搜集反映客观现实的统计资料的过程。数据搜集是综合评价工作过程的基础阶段。 搜集方式:一种是直接向评价对象搜集反映评价单位的统计数据(或称原始数据);另一种是搜集已经加工、整理过的、说明评价对象的数据(一般称为二手资料)。 搜集方法:直接观察法、报告法(通讯法)、采访法、登
46、记法。此外,随着现代信息技术的发展,计算机、网络、光电技术、卫星遥感、地理信息系统等高新技术已经或正在被广泛地引入统计数据搜集的领域中。,数据分类:数据按其取值分为以下四种类型: 计量数据:如人的身高、体重,产品的长度、直径、重量,股票的价格、市盈率等。它们可在某个区间内取任意一实数。 计数数据:如企业职工人数、成交股票股数等。它们在整数范围内取值,大部分还仅在非负整数范围内取值。 名义数据:如:人的性别、婚姻状况,物体的颜色、形状等,它们表示的事物的属性,我们常用数来表示属性的分类,但这些数只起一个名义的作用,只是一个代码,没有大小关系。 有序数据:如人的文化程度由低到高可分为文盲、小学、初
47、中、高中、中专和大专、大学等5类,顾客对某商场营业员服务态度的评价分为满意、一般、不满意三类等。它们虽然也是表示事物属性,但有一个顺序关系。,文献链接:大学生综合素质评价指标体系及其数据采集的研究,二、数据的处理,定量数据的处理:如前所述 文献连接:教师授课质量综合评价模型和数据处理量化指标的数据处理及在护理质量评价中的应用 定性数据的处理:名义数据只是一种分类的表示,这类数据只是一个代码,无法真正量化。顺序数据,如优、良、中、差等,这类数据可以量化。方法如下(胡永宏,综合评价方法,科学出版社,2000:36):若有 类评价结果 , 最差, 比 好, ,依次递升, 最好, 类各占的比例和累计的
48、比例:,类: 各类比例: 累计(由 开始)的比例:于是, 对应的 应有性质:用 的 分位数 来表示,得:,示例:一个班上优、良、中、差四级学生人数如下表所示:假定未观测到的成绩 ,有:,查正态分布表,就得到:0.02对应的 =-2.055,0.14对应的=-1.080,0.52对应的 =0.052,0.90对应的 =1.283。 这样就把等级的成绩改为“标准分”的成绩。,第七章 综合评价的其他方法,一. Topsis法 二. 综合指数法 三. 灰色关联分析法 四. 模糊综合评价法 五. 动态加权综合评价法,一. Topsis法 1、方法简介:Topsis法(Technique for order preference by similarity to ideal solution) 是有限方案多目标决策分析的一种常用方法,可用于效益评价、卫生决策和卫生事业管理等多个领域。其方法对资料无特殊要求,使用灵活简便,应用广泛。 2、基本思想:基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案(分别用最优向量和最劣向量表示),然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。 3、基本步骤: 设有n个评价对象,m个评价指标,原有数据形式为:,