1、91,第九章 综合评价方法,第一节 综合评价概述 第二节 指标同向化转换和无量纲化 第三节 常用的综合评价方法,9-2,多指标综合评价方法的系统分析邱东,中国统计出版社综合评价方法胡永宏等,科学出版社,2000.10,本章参考文献:,93,第一节 综合评价概述,一、综合评价的意义 二、综合评价的一般步骤 三、综合评价的局限性,9-4,一、 综合评价的意义,评价常常需要按照一定的标准(客观/主观、明确/模糊、定性/定量),对特定事物、行为、认识、态度等等评价客体的价值或优劣好坏进行评判比较的一种认知过程,同时也是一种决策过程。 统计评价依据统计指标(数据)的实际水平对事物进行定量描述与评判。统计
2、评价与其它评价活动的最大区别就在于其数量性。,9-5,一、 综合评价的意义(续),描述、评价与分析的关系 描述只是如实反映客观实际情况; 评价涉及对事物价值取向的判断或选择,要求说明所研究事物“是好是坏”; 分析要求从影响因素角度来考察分析,说明“为什么”。评价是前提、基础,分析是评价的细致化和进一步发展,对于同一对象,评价和分析的结论也必然一致。一定意义上说,评价就是分析。,9-6,单项评价与综合评价,常常需要依据统计指标的实际水平对有关的经济活动或经济状况进行评价。统计评价有时很简单,有时则比较复杂。 单项评价只依据一项指标,通过适当对比就可以从某一侧面作出判断。 综合评价根据多项指标、从
3、多个不同侧面对有关现象进行全面的综合判断。 统计综合评价方法(技术)通过对特定现象(主要是社会经济现象)的多个方面数量表现进行高度抽象综合,进而以定量形式确定现象综合优劣水平与次序的一种新兴统计分析方法。,9-7,综合评价问题的广泛性,从个人素质(能力)、企业经营业绩到综合国力。 一个国家的经济发展水平不仅表现为人均国内生产总值的高低,还表现为产业结构、居民福利、资源利用等多方面 一个城市的生态环境状况不仅表现为空气污染指数的高低,还表现为水域污染、噪音污染、城市绿化水平、工业三废的治理和生活垃圾的处理、清洁能源的利用等; 一个企业的经济效益不仅表现为劳动生产率的高低,还表现在产品销售率、资金
4、利税率、成本利税率、增加值率、资金周转速度等方面。 体操、歌手比赛的评分,也要综合考虑各方面的因素并将其归纳为单一的结果。,9-8,一、综合评价的意义(续),综合评价一般表现为以下几类问题: 。分类对所研究对象的全部个体进行分类,但不同于复合分组(重叠分组); 。比较、排序(直接对全部评价单位排序,或在分类基础上对各小类按优劣排序); 。考察某一综合目标的整体实现程度(对某一事物作出整体评价)。如小康目标的实现程度、现代化的实现程度。当然必须有参考系。,9-9,二、综合评价的一般步骤,1确定综合评价的目的 2确定评价指标和评价指标体系 3确定评价指标的同向化和同度量化方法 在综合评价时,必须做
5、到两点: (1)使所有的指标都从同一角度说明总体,这就提出了如何使指标同向化的问题; (2)所有的指标可以相加,这就提出了如何消除指标之间不同计量单位(不同度量)对指标数值大小的影响和不能加总(综合)的问题,即对指标进行无量纲化处理计算单项评价值。无量纲化处理过程也就是计算单项指标评价值的过程。4确定各个评价指标的权重 5求综合评价值将单项评价值综合而成。,910,第二节 指标同向化转换 和无量纲化,一、指标同向化转换 二、指标同向化转换和无量纲化 三、指标权数的确定方法 四、层次分析法,9-11,一、同向化处理,将逆指标转换为正指标的方法通常有: 转换为对应的正指标,如中间消耗率增加值率;
6、倒数法:X1/X 对于适度指标,通常根据实际值与适度值(K)的差距的倒数1(1|X-K|)。 多数场合下,同向化处理过程与无量纲化过程是同时进行的。,9-12,二、无量纲化方法,指标的无量纲化就是把不同计量单位的指标数值,改造成可以直接加总的同量纲数值,常常也称为数据的规格化(意即使之成为同一规格)。即通过数学变换,消除计量单位对原数据的影响。 指标的无量纲化是综合评价的前提,无量纲化过程实际上就建立(单项评价指标的)评价函数的过程,即是把指标实际值转化为评价值的过程。单项评价值是个相对数,它表明:从某项评价指标来看,被评价对象(在总体中)的相对地位,即被评价对象相对于总体某一对比标准(最高、
7、最低、平均或其它水平)的相对地位。,9-13,二、无量纲化方法(续),从几何角度可归纳为三大类: 1直线型指标评价值与实际值之间是一种线性关系,评价值随实际值等比例变化 ; 2折线型现象小于某点时,对综合水平影响大,评价值变化大;大于某点时,对综合水平影响小,评价值变化小(现象发展呈阶段性、指标值在不同阶段对事物总体水平的影响不相同就是分段处理)。 难点:必须找出事物发展过程中转折点的指标值并确定其评价值。 3、曲线型有些事物发展的阶段性的分界点不很明显,而前中后各期发展情况又截然不同,即指标值变化对事物总体水平的影响是逐渐变化的,而非突变的。,9-14,二、无量纲化方法(续),A阈值法阈值即
8、临界值,是衡量事物发展变化的一些特殊指标值,如极大值、极小值(此时又称极值法)、满意值、不允许值、标准值(如平均数)等。 阈值法的优点: 指标个数及指标的分布无要求; (转换后的数据单项评价值)相对数的性质很明显; 数据转换需要的信息量不多。事实上阈值法只利用了极大值或极小值等阈值。 但是这种方法丢失了大量的原始信息(?),因为评价值只参考了阈值。,9-15,二、无量纲化方法(续),B. 平均数比率法(均值化)、比重法 从数学角度看,二者无实质区别。 在实际工作中,常常把比率称为“指数”,把对各个比率综合成总评价值的方法称为“指数法”。 特点:意义直观、明确;对比标准利用了所有的原始数据。,9
9、-16,二、无量纲化方法(续),C. 标准化法 在运用多元统计方法进行综合评价,用得最多的无量纲化方法就是标准化法。 特点: 与总体的全部数据都有关,需要的信息量大(因为用到平均数); 标准化法得到的评价值在0的上下,一般按照3倍标准差的分布原则,一般在(-3,3)之内。 在评价对象个数较多时才用,即要求样本数据较多(数据多时作为对比标准的平均数更具有稳定性); 原始数据大体呈正态分布时,转换结果才比较可靠。,9-17,怎样选择无量纲化方法(模型)呢?,需要(准确反映客观实际)与可能结合。实际中大多用直线代替曲线,因为: 简单易行; 评价是对事物发展水平的相对意义上的描述,而不是绝对的刻画,如
10、A比B好,而不是评价A比B好的数量有多少,所以在不影响被评价对象相对地位的情况下,就用简单的近似的描述; 不是任何情况下曲线就最精确,曲线还有模型形式和参数的选取问题,若选取不当,曲线评价的结果就不是最精确的。 经济分析管理追求的是相对意义上的满意解,不象数学追求绝对意义上的最优解。,9-18,讨论与思考,问题: ()对于相对数是否需要经过无量纲化处理? 无量纲化处理这不仅适合于绝对数、平均数,也适合于相对数,因为相对数不能直接加总,各自对比标准不同,数据的变化范围不同,也需要无量纲化。 ()考试成绩有必要进行无量纲化吗? 成绩是一种分数,本身没有单位,而且都是百分制。但由于不同科目试题的难易
11、程度、分量都不一定相同,其分数的“含金量”并不相同,因而不能相加。无量纲化后,各科分数都以60分为中心而分布,具有了可比性,因而可相加。,9-19,三、权数的确定方法,按权数的表现形式分为: 绝对数权数; 比重权数。通常采用比重权数归一化权数。按确定权数的方法分为: 主观赋权法; 客观赋权法。,9-20,三、权数的确定方法(续),按权数的性质(影响因素)分,有: 实质性权数如标志值次数、指数的同度量因素,它们与被加权的因素的乘积是有实质性意义的社会经济统计指标,权数是构成这个指标的一个实质性因素。 估价权数从评价者的角度认定各评价指标(项目)的重要性程度大小而确定的。 信息量权数根据评价指标所
12、包含的对评价对象分辨信息量的多少(区分度、或相似度W)来确定,如标准差或相关系数加权。 系统效应权数从评价指标与被评价事物总水平的关系来确定。有正负之分。,9-21,三、权数的确定方法(续),主观赋权法 德尔菲法(专家法)实际上各个专家可以根据自己的理解选择不同的方法 相邻指标比较法;(先按重要性将全部评价指标排序,再将相邻指标的重要性进行比较 层次分析法()互反式两两比较构权法。,9-22,三、权数的确定方法(续),权数的特性(指主观权数、人工权数)重要性权数是一种重要性程度的量化值。指对合成值的影响程度大小。重要性本身是个综合的概念,表现在多个方面,如可以是“价值判断取向”上的重要性,也可
13、以是合成时“分辨能力(信息含量)高低”的重要性,或“可靠度大小”的重要性。 模糊性重要性本身就是个模糊的概念;习惯取点值。人工性没有绝对的正确错误标准;只能尽可能选择相对科学合理的权数。 主观性受评权者主观意识的影响,9-23,三、权数的确定方法(续),客观赋权法从指标的统计性质来考虑,它是由客观数据决定。 常见的客观赋权的统计方法还有:变异信息构权、相关信息构权、熵信息构权。,9-24,三、权数的确定方法(续),1. 变异信息构权(离散/方差信息构权) 指标的区分度越高,对排序的影响就越大。基于这种观点,以区分度(方差)信息量为权重。目前,主要有两种方法: a)根据标准差大小来确定权数直接将
14、各评价指标的标准差(系数)向量进行归一化处理而得。 b)主成分分析法(PC构权法)根据方差矩阵计算特征根及特征向量,并以特征向量为权重。但事实上这种权数与原始变量的方差并不成正比,所以,严格地说,它反映的是变量之间的相关信息,而非方差信息。 方差信息构权最主要的问题方差信息是否真正全面反映了综合评价的价值。因此,有人提出,应该将方差信息权与重要性权结合起来。,9-25,三、权数的确定方法(续),2. 相关信息构权 复相关系数法每个被选指标,根据其余指标对它的复相关系数来确定权数。 复相关系数大,权数是应该取大还是取小? 相关系数总和法对其它指标的相关系数的总和,再作倒数处理并归一化(但对负相关
15、的处理也有争议) 。 3. 熵信息构权 熵有不同定义,相应有不同评价方法。它本质上仍然是离散程度大熵值小权大。只是定义了一个新的测度变异情况的指标(1熵值)。由此,任一相对变异指标都可用来定权。,9-26,【补充】四、合成方法,合成方法由单项评价值计算综合评价值的方法。 1、算术平均法(加法合成、加减法合成) 2、几何平均法(乘法合成、乘除法合成) 3. 混合合成法,9-27,【补充】四、合成方法(续),1、 加权算术平均法的主要特点 (1)对于数据的要求最宽松,用于合成的某一指标数值可以为0、为负; (2)各指标可以相互补偿(等量补偿),即此升彼降,总的评价值不变; (3)突出了评价分数较大
16、、权数较大者的作用,适用于主因素突出性的评价;(对较大数值的变动更为敏感)。,9-28,【补充】四、合成方法(续),2、几何平均法的主要特点 (1)对数据要求较高,指标数值不能为0、负数, (2) 鼓励被评价对象在各方面全面发展,任一方也不能偏废。此合成方法督促“全面发展”,而不是靠重点倾斜的方法取胜; (3) 乘除法容易拉开评价档次,对较小数值的变动更敏感。,9-29,五、综合评价的局限性,综合评价方法很多,各种方法得出的结果不可能完全相同,并且都带有一定的相对性和局限性。 (1)将若干个指标数值综合成一个数值,损失了原有指标带来的大量信息,结果较抽象,难释其经济意义; (2)主观性很强,选
17、择什么指标、选择多少指标,权数的分配都很主观; (3)评价的结果不具有惟一性。选择不同的方法,可能有不同的结果,即使采用同样的方法,由于各指标的赋值不同、权重不同等,也有可能使评价结果不同。,930,第三节 几种常用方法,一、计分法 综合计分法 排队计分法 二、指数法 三、功效系数法 四、最优值距离法 【补充】其它(多元统计方法等),9-31,一、计分法(综合计分法),具体做法: 按各个评价指标的经济重要性确定标准得分全部指标的标准得分的总和=100 ,单项指标的标准得分就是该指标的最高分(满分,也就相当于权数) ; 确定各指标的对比标准 ; 按三档记分改善得满分,持平得一半的分,下降得零分。
18、 加总各评价指标的实际得分 特点:简便易行,过于粗糙。,9-32,2、 排队计分法,将评价单位的各项评价指标依优劣秩序排队,再将名次(位置)转化为单项评价值,最后由单项评价值计算各单位的综合评价值(总分)。,9-33,排队计分法的优缺点,优点: 简便易行, 勿须另寻比较标准; 各单项评价值有统一的值域; 适用范围广泛(可用于定序以上层次的数据) 缺点: 原始数据信息的损失较大。,9-34,二、加权指数法,Ki为单项评价指数:综合评价指数公式为:,评价指数可以为正指标,也可以为逆指标。但必须同向化。一般是把逆指标转化为正指标采用倒数法,此时,综合评价指数才是越大越好。,9-35,二、加权指数法【
19、实例】,试比较三个地区的综合经济效益。,9-36,二、加权指数法【实例】,三个地区的综合经济效益指数分别为:,110.31,116.67,99.11,9-37,加权指数法的优缺点,主要优点:意义直观明晰; 主要缺点:各单项评价值没有统一的值域,影响评价指标的评价值之间的可比性。,9-38,2.最优值距离法,单项评价值采用“实际值与最优值的相对距离”:综合评价值:,9-39,最优值距离法的特点,综合评价值为逆指标越小越好(与最优值越接近); 各单项评价指标的值域统一在(0,100)之间。 评价结果容易受极端值影响。,9-40,(三)改进功效系数法,依据多目标规划原理提出 单项评价得分:综合评价得
20、分: 几何平均法 算术平均法,9-41,改进功效系数法的优缺点,优点: 能够充分反映评价指标的原始信息; 各单项指标的值域基本上在(60,100)之间; 评价结果受极端值影响的程度比指数法和最优值距离法都较弱。 缺点: 必须事先确定两个参照系(对比标准满意值和不容许值)。,9-42,【补充】其它综合评价方法 的应用,多元统计方法主成分分析法、因子分析法、聚类分析法 模糊数学方法模糊综合评价(评判) 神经网络方法 灰色系统分析方法 还可以是多种方法的结合如:模糊神经网络方法、模糊聚类方法 多种方法的评价结果再综合,或者选择与其它评价结果相关程度最高的结果为最终选定的评价结果。,9-43,【补充】
21、因子分析法,将反映不同侧面的许多指标综合成为少数几个主因子,最后计算出综合得分。 基本思想:根据变量之间的相关性大小把变量分组,使得同一组内变量之间的相关程度较高,不同组的变量之间相关性较低,每组变量代表一个基本结构(这个基本结构称为主因子或公共因子)。从具有错综复杂的关系的众多经济现象中找出几个主因子,每一个因子代表经济变量之间相互依赖的一种经济作用,抓住这些主因子就可以帮助我们对复杂的经济问题进行分析和解释。,9-44,【补充】主成分分析法,通过研究指标体系的内部结构关系从而将多个指标转化为互不相关的、包含原来指标的大部分信息的少数几个综合指标(主成分),以各主成分的方差贡献率对它们进行加
22、权,计算出综合评价得分。 它实质上是一种同度量化值的加权算术平均值,主成分中的系数就是其权数。 主成分方法的优点: 1)消除变量之间的相关性; 2)减少工作量(评价方法模式化、降维的简化作用) 3)权数的非人为性(非随意性)。,9-45,讨论与思考,值得思考和研究的问题: 取一个还是多个主成分?多少个? 是否充分反映了客观信息? 如何解释“负权”(指正指标)?权数正负可能与经济意义(理论分析)不符合。 其权数的导出完全是根据样本资料计算的,是否能够保证样本符合总体的情况?,9-46,【补充】应用主成分方法必须注意几点,样本容量要足够大(只对少数单位或时间进行评价就不能用); 若样本出现不正常现
23、象或异常点(应该将之删除),也不适用; 评价单位的多少及增减,都可能改变权数,从而影响评价结论。,9-47,【补充】注意几点(续),属于一种相对评价,而非绝对评价。 评价标准与样本有关;评价结果是一个相对优劣顺序。如进行经济效益评价,它的评价结果不能说明经济效益的水平的具体差异大小。 它是原始变量的一种线性关系,没有考虑非线性情况。 只适合于定量变量,不适合于包含定性变量的情况; 常见的误解: 把几个主成分的累计方差贡献率当作评价的把我程度/ 反映实际情况的程度。,9-48,【补充】灰色系统理论的关联分析,确定比较系列(评价指标体系)和参考系列(最优最劣两组); 计算被评价对象与参考系列的关联
24、度和从属度关联度被评价对象与参考系列在各指标点的关联度的加权平均数,从属度综合反映了评价对象远离最差系列的程度和接近最优系列的程度。 根据关联度和从属度进行排序。 特点:点关联度是建立在评价数据极差的基础上,既考虑了评价对象和整体的关系,又考虑了各评价对象之间的相互关系。,9-49,【补充】模糊神经网络,神经网络起源于对人脑的功能和结构的模拟,是由大量简单的处理单元广泛连接组成的复杂网络,对于需要同时考虑诸多因素和研究模糊信息问题特别适用。 BP网络单向传播的多层网络由输入层、输出层和中间隐含层三个神经层次构成的模型。先要提出一组训练样本(每个样本由输入样本和理想输出组成),训练过程技术通过计算输出值于期望值的误差,通过修改权值(权数),直至理想输出与实际输出一致为止。,本章案例和参考文献,本章案例和阅读材料链接: 经济效益比较 衡量城市居民生活质量指标体系的探讨,阅读材料链接: 现代化进程综合评价,51,THE END,