1、第五节 分布的偏度与峰度,分布的偏态测度 矩偏度系数 皮尔逊偏度系数 分布的尖锐度测度 峰度,当k=1时,就是算术平均数,即1阶原点矩就是算术平均数。,矩偏度系数(Coefficient of Skewness),矩也称为动差。以零为中心矩称为原点k阶矩,基本形式为:,两组资料虽然平均数与标准差皆相同,却可能由于各自不同的偏斜情况,使得次数分配的形状不相同。,当k=0时,零阶中心矩,当k=1时,一阶中心矩,当k=2时,二阶中心矩,也即方差。,如果将原点移至算术平均数得位置,可以得到以平均数为中心的k阶中心矩:,矩偏度是以变量的三阶中心动差除以标准差三次方,来衡量分布不对称程度,或偏斜程度的指标
2、。即三阶中心动差以为标准单位的系数。公式如下:,当频数分布为正态时,变量值得频数以平均数左右完全对称,三阶动差等于0,偏度也为0; 当0时,为正偏斜(即右偏,分布曲线右尾端较厚) 当0时,为负偏斜(即左偏,分布曲线左尾端较厚)。,样本的矩偏度系数计算公式:,皮尔逊偏度系数(Pearson ),Pearson偏态系数以平均值与中位数或众数之差与标准差之比来衡量偏斜的程度,用SK表示偏斜系数。这是根据众数、中位数与均值各自的性质,通过比较众数或中位数与均值来衡量偏斜度的。其计算公式为:,偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负偏。 偏态系数大于0,因为均值在众数之右,是一种
3、右偏的分布,又称为正偏。,峰度指标是以正态分布的峰度为比较标准(正态分布的峰度=0),来比较不同频数分布的尖峭程度。 当峰度0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数代表性更高; 当0时,表示频数分布比正态分布更分散,分布呈平坦峰,平均数代表性较低。,峰度( Kurtosis ),峰度是以变量的四阶中心动差除以标准差的四次方,并将结果再减去3,用来衡量频数分布的集中程度,也是衡量分布曲线尖峭程度的指标。公式为:,样本的峰度系数计算公式:,例 随着信息化时代的到来,越来越多的人选择在家办公,下面的样本资料是在家办公的人的年龄:,1、根据样本资料离散系数; 2、确定样本资料的偏度系数和峰度系数;,因此,样本数据均值为39.25岁,称右偏,比峰度较正态分布平坦。,