1、发展经济学论文1基尼系数的计算方法及数学推导2001 金融三班 袁源摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分 组计算法和分解法,并进行了数学推导和证明。在此基 础上,文章比较了各种算法优缺点,分析了误差可能产生的环节。关键词:洛伦茨曲线 基尼系数一、洛伦茨曲线和基尼系数1905 年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高的顺序平均分为 10 个等级组,每个等级组均占 10的人口,再计算每个组的收入占总收入的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入分配差距状况的曲线,即为洛伦茨曲线。O XY E CAB图
2、一为了用指数来更好的反映社会收入分配的平等状况,1912 年,意大利经济学家基尼根据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G) 。在上图中,基尼系数定义为:G= SA SA+B 式(1)当 A 为 0 时,基尼系数为 0,表示收入分配绝对平等;当 B 为 0 时,基尼系数为 1,表示收入分配绝对不平等。基尼系数在 01 之间,系数越大,表示越不均等,系数越小,表示越均等。二、基尼系数的计算方法式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。为了寻求具有可操作性的估算方法,自基尼提出基尼比率以来,许多经济学家和统计学家都进行了这方面的探索。在已有的研究
3、成果中,主要有四种有代表性的估算方法,结合自己的计算,笔者将它们归纳为直接计算法、拟合曲线法、分组计算法和分解法。1、直接计算法直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度。定义 n n j=1 i=1 YjY i/n 2, 02u 式(2)发展经济学论文2式中,是基尼平均差,Y jY i是任何一对收入样本差的绝对值,n 是样本容量,u 是收入均值。定义G=/2u, 0G1 式(3)可以证明:G=/2u2S A(证明过程见附录一) ,而由式( 1)G= SA/ SA+B,S A+B=1/2,G=2S A,因此,式
4、(2)中定义的 G 即为基尼系数,综合式(2) 、 (3) ,基尼系数的计算方法为:G= 1 2n2 u n n j=1 i=1YjY i 式(4)直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存在来源于样本数据方面的误差,就不存在产生误差的环节。实际上,在附录一证明过程当中将看到,直接计算法依然采用了以直代曲法计算面积,只不过这个过程在样本数据范围内达到了最小近似,其精确度直接取决于样本数据本身。因此,可以认为它不带任何误差的计算了样本数据的基尼系数值。2、拟合曲线法拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数表达式,然后用积分法求出
5、B 的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程,用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数:I=P 式(5)根据选定的样本数据,用回归法求出洛伦茨曲线,例如,m,=n.求积分SB= 01 mpndp= m n+1 式(6)计算G= SA SA+B = SA+BS B SA+B 1 2m n+1 式(7)拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。3、分组计算法这种方法的思路有点类似用几何定义计算积分的方法,在 X 轴上寻找 n 个分点,将洛伦茨曲线下方的区域
6、分成 n 部分,每部分用以直代曲的方法计算面积,然后加总求出面积。分点越多,就越准确,当分点达到无穷大时,则为精确计算。O XY E CABP假设分为 n 组,每组的收入为 Yi,则每个部分 P 的面积为:SP= 1 i-1Y i i Yi 2n nY i 式(8)图二发展经济学论文3加总得到:G= SA SA+B = SA+BS B SA+B 12lim k n 1 i-1Yi i Y i 2n nY i 式(9)这是精确计算基尼系数的表达式,当分点 n 个数有限时,定义:yi= Yi nY i 式(10)得到近似表达式:G=2SA= 2 n (y 1+2y2+ny n)( n+1 n )
7、式(11)(证明过程见附录二)分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加分点的个数可以减少这种误差。4、分解法上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中还能够获得分解部分内部的基尼系数值。另外,分解法求出基尼系数的过程一般都依赖于已有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重要的意义在于对基尼系数的分解,即定义的各个不同基尼系数值之间的相互关系。伦敦经济学院收入分配方法论专家 Cowell 教授提出,基尼系数在不同人
8、群组之间无法完全分解于尽。总体基尼系数除了包括各个组内差距之外,还应包括组间差距和相互作用项。公式为:G = kW iGi+Ib+(f i) 式(12)式中,G 是总体基尼系数,G i是第 i 组内部的基尼系数(i=1,2,,n) ,W i是 Gi的权数,I b是组间的差距指数,(f i)是相互作用项。(f i)是各个组之间收入分布的重叠程度。特别地,当各个组之间收入分布完全不重叠时,(f i)0。式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没有给出 Wi、I b和 (f i)的具体计算方法,还不能用于基尼系数的计算。经济学家 Sundrum(1990)在他的欠
9、发达国家的收入分配一书中介绍了一种对一国或地区基尼系数进行分解的方法,其数学公式为:G=P12 u1 u G1+ P22 u2 u G2+P1P2 u1u 2 u 式(13)式中,G 表示总体基尼系数, G1 和 G2 分别表示农村和城镇的基尼系数,P 1、P 2 分别表示农村人口和城镇人口占总人口的比重,u 1、u 2、u 分别表示农村、城镇和总体的人均收入。对比式(12)和式(13) ,可以发现式(13)是式(12)的一种具体运用,P 12 u1 u G1和 P22 u2 u G2 可以作为以 P12 u1 u 和 P22 u2 u 为权重的 kW iGi,P 1P2 u1u 2 u 则为
10、组间差距指数 Ib。值得注意的是式中没有(f i)项,意味着 (f i)0 成立,因此这种算法隐含的假设条件是农村与城镇的收入分布完全不重叠。此外,采用这种计算方法还必须满足条件:在估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的。这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数 G1和 G2 时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠。发展经济学论文4附录一:证明:G= /2u 2S A第一步,分解 n n j=1 i=1Y jY i设将收入按从低到高排列 Y1、Y 2、Y n,则上式可以分解为矩阵 A:Y1 Y2 Yn1 YnY1Y2Yn
11、1Yn0 Y2Y 1 Yn1 Y 1 Yn Y1Y2Y 1 0 Yn1 Y 2 Yn Y2 Yn1 Y 1 Yn1 Y 2 0 Yn Yn1YnY 1 YnY 2 0将矩阵中各项加总得到:2(n1)Y n(n2)Y n1 Y 2(n1)Y 1(n2)Y2Y n1 2(n1)Y n(n3 )Y n1 (n5)Y n2 (1n)Y 2(n1)Y 1第二步,计算 1 2n2u 取样本均值 u= Y1Y 2Y n n = nY i n 1 2n2u 1 2n nY i 综上,第一步、第二步,得到G 1 n nY i (n1)Y n(n3)Y n1 (n5)Yn2 (1n)Y 2(n1)Y 1 式(14
12、)第三步,计算 SBO XY E CABPXnXi1 Xi图三 图四i1 iPA BC如图四,计算每一部分面积 SPSP 1 2 AB(ACBD) 1 i-1Y i i Yi 2n nY i D发展经济学论文5SB n 1 i-1Y i i Y i 2n nY i 第四步,计算 SASA=SAB S B 1 2 n 1 i-1Y i i Yi 2n nY i 1 2n n nY i n i-1Y i i Y i nY i 分解 n nY i n i-1Y i i Y i 得到矩阵 Bn nY i n i-1Y i i Y i n nY i n i-1Y i i Y iY1Y 2Y nY1Y 2
13、Y nY1Y 2Y nY1Y 2Y nY 1Y1Y 1Y 2Y1Y 2Y 1Y 2Y 3Y1Y 2Y n2 Y 1Y 2 Yn1Y1Y 2Y n1 Y 1Y 2 YnYnY n1 Y 2YnY n1 Y 3Y 1YnY n1 Y 4Y 1Y 2YnY 1Y 2Y n2Y 1Y 2Y n1加总最后一行,得到:n nY i n i-1Y i i Yi(n1)Y n(n2)Y n1 Y 2(n1)Y1(n2)Y 2Y n 1(n1)Y n(n3)Y n1 (n5)Yn2 (1n)Y 2(n1)Y 1SA= 1 2n n nY i n i-1Y i i Yi nY i 1 2n nY i(n1)Y n
14、(n3)Y n1 (n5)Y n2 (1n)Y2(n1)Y 1 式( 15)比较式(14)和式(15)可得 G=/2u 2S A。附录二:证明:当分点个数 n 有限时,G=2S A= 2 n (y 1+2y2+ny n)( n+1 n )定义:y i= Yi nY i SP 1 2 AB(ACBD) 1 i-1Y i i Yi 2n nY i 1 2n ( iYi nY i i-1Y i nY i )SB n 1 i-1Y i i Y i 2n nY i SA=SAB S B 1 2 n 1 i-1Y i i Yi 2n nY i 1 2n n nY i( n i-1Y i i Y i) nY
15、 i 1 2n n nY i n(2 i Yi Yi) nY i 1 2n n nY i n(2 i Y iY i) nY i 1 2n (2n2 n iy i2 ny i) n+1 2n 分解 n n iy i得到矩阵 C:n n iy i n n iy iy1y 2y ny1y 2y ny1y1y 2y1y 2y 3YnY n1 Y 2YnY n1 Y 3YnY n1 Y 4发展经济学论文6y1y 2y ny1y 2y ny1y 2y n1y1y 2y nYn0加总最后一列,得到n n iy i(n-1)y n+(n2)y n1 y 2SA1 2n (2n 2 n iy i2 ny i)
16、n+1 2n 1 n (y 1+2y2+ny n) n+1 2n G=2SA= 2 n (y 1+2y2+ny n)( n+1 n )参考资料:1、 Sundrum.R.M,1990,Incom Distribution in Less Developed Counties, London and New York:Routledge2、 Cowell.F.A,2000,Measurement of Inequality, in Handbook of Income Distribution, eds. By A.Atkirrson and F.Bourguignon, Northholland3、 熊俊:基尼系数估算方法的比较研究 ;财经问题研究2003 年 1 月第 1 期4、 王文森:基尼系数及推广应用 ;统计与预测 ;2003 年 1 月第 1 期