收藏 分享(赏)

管理统计课件.ppt

上传人:11xg27ws 文档编号:5435814 上传时间:2019-03-03 格式:PPT 页数:35 大小:286.50KB
下载 相关 举报
管理统计课件.ppt_第1页
第1页 / 共35页
管理统计课件.ppt_第2页
第2页 / 共35页
管理统计课件.ppt_第3页
第3页 / 共35页
管理统计课件.ppt_第4页
第4页 / 共35页
管理统计课件.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、表示统计资料的特征数有哪些? 几何平均数与调和平均数各适合于什么情况? 计算样本方差与总体方差公式有何区别?,3.1 表示集中位置的特征数,3.1.1 平均数,算术平均数(Arithmetic average),几何平均数(Geometric Mean),调和平均数,定义:一组n个观测值x1,x2 ,,xn的算术平均数,定义为,(1)算术平均数(Arithmetic average),如果资料已经分组,组数为k,用x1,x2 ,,xk 表示各组中点,f1,f2,fk 表示相应的频数,那么,(1)算术平均数(Arithmetic average),表3-1 某校125位大学一年级新生体重表,(1

2、)算术平均数(Arithmetic average),其平均体重:,=, 55.592,(1)算术平均数(Arithmetic average),(1)算术平均数(Arithmetic average),在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。,(2)几何平均数(Geometric Mean),表3-2 天津市工业总产值,(天津市2005统计年鉴),(2)几何平均数(Geometric Mean),定义: 一组n个数据的几何平均数定义为,(2)几何平均数(Geo

3、metric Mean),当数据是相对变化率,求平均数时,算术平均数也不恰当。例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。,(3)调和平均数,在上例中,,(公里/小时),定义:,一组n个数据的调和平均数H,由下式定义,(3)调和平均数,算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。,3.1.2众数(Mode),定义:对于有频数分布的变量,它的众数指频数最大的变

4、量的值,表3-3 频数分布表,对于已分组且等组距的频数分布,根据最大频数,可求得众数所在组。根据众数定义,可知众数不唯一。,3.1.2众数(Mode),算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。,3.1.3 中位数(Median),一组n个观测值按数值大小排列,处于中央位置的值称为中位数以 表示,,,当n为奇数,,当n为偶数,定义:,即,3.1.3 中位数(Median),第25百分位数又称第一个四分位数(First Quartile) ,用Q1 表示;第50百分位数又称第二个四分位数 (Second Q

5、uartile),用Q2表示;第75百分位数 又称第三个四分位数(Third Quartile),用Q3表示。,中位数是第50百分位数,一组n个观测值按数值大小排列如x1,x2,x3,x4 处于p%位置的值称第p百分位数。,定义:,3.1.4 百分位数( Percentile),如何计算百分位数,3.2 表示变异(分散)程度的特征数,定义 其中xmax和xmin分别为数据中的极大值和极小值。,3.2.1极差(或称全距 Range)R,对于已分组的频数分布(组数为k),定义,平均差M.D.是离差的绝对值的平均数,即,3.2.2 平均差(Mean Absolute Deviation),方差,样本

6、,对于已分组的频数分布(组数为k),总体,样本,总体,3.2.3 方差(Variance),标准差(Standard Deviation),标准差,样本标准差,总体标准差,样本标准差,总体标准差,对于已分组的频数分布(组数为k),标准差的单位与X的单位相同。,3.2.3 方差(Variance),标准差(Standard Deviation),定义 变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.2.4变异系数(Coefficient of V

7、ariation),定义 变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.3 表示偏倚情况或程度的特征数,3.3.1比较众数、中位数和算术平均数的相对位置,下图列举出了对称的、具有左偏态(负偏态)和右偏态(正偏态)的频数分布的例子。注意到它们的特点是:,对称的分布的众数、中位数和算术平均数相同;,具有偏倚性的分布,算术平均数突出在外,偏向分布的尾端,而中位数则介于众数与算术平均数之间。,偏倚性是表示各观测值分布不对称情况或程度的。,3.3 表示

8、偏倚情况或程度的特征数,图3-1,3.3.1比较众数、中位数和算术平均数的相对位置,MeMo,MeMo,=Me=Mo,可以看出,对于单峰的分布,,对称态:,左偏态:,右偏态:,3.3.1比较众数、中位数和算术平均数的相对位置,(1)Pearson偏倚系数,Pearson,分布对称,则k=0,左偏态,则k0,右偏态,则k0,3.3.2 定量地描述偏倚性,常用的两个公式,(2)用标准化的三阶矩阵g表示,3.3.2 定量地描述偏倚性,常用的两个公式,3.4 五数概括法,首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对12个月薪数据的样本,按照递增顺序排列如下:2210

9、2255 2350 | 2380 2380 2390 | 2420 2440 2450 | 2550 2630 2825Q12365 Q22405 Q32500上述起薪数据以五数概括为:2210,2365,2405,2500,2825。,3.4 五数概括法,盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQRQ3Q1 。盒形图的画法步骤如下:(1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据, Q12365, Q32500。这个方盒包含了中间的50的数据。 (2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。,3.5 盒形图,(3)利用四分位数间距IQR=Q3Q1,来设定界限。盒形图的界限定于低于Q1以下15个IQR和高于Q3以上15个IQR的位置。上、下限以外的数值作为异常值。(4)在图34中的横线叫做须线(whisker),须线从方盒的边线出发,直至在上、下限之内的最大值和最小值。(5)最后,任一异常值的位置以符号“”标出。,3.5 盒形图,盒形图例图,图3-2,3.5 盒形图,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 职业教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报