收藏 分享(赏)

tjxhs2 差异量数和集中量数.ppt

上传人:11xg27ws 文档编号:5865302 上传时间:2019-03-20 格式:PPT 页数:49 大小:307.50KB
下载 相关 举报
tjxhs2 差异量数和集中量数.ppt_第1页
第1页 / 共49页
tjxhs2 差异量数和集中量数.ppt_第2页
第2页 / 共49页
tjxhs2 差异量数和集中量数.ppt_第3页
第3页 / 共49页
tjxhs2 差异量数和集中量数.ppt_第4页
第4页 / 共49页
tjxhs2 差异量数和集中量数.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、第四单元 集中量数和差异量数 (measures of cenral tendency),集中量数学习目标: 各种集中量数的含义、性质和作用 各种集中量数的计算方法 各种集中量数的具体应用,两组学生某科的测验分数,甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84,什么是集中量数?,集中趋势与离中趋势:描述一组数据的全貌。 集中量数:描述数据集中程度的统计量。 算术平均数 中数 百分位数 众数 加权平均数 几何平均数 调和平均数,表1 80名小学二年级学生身高的次数分布表,一、 算术平均数 (均数, M, arithmetic average/mea

2、n),(一)计算方法 未归表的原始数据计算算术平均数:8、2、5、3、7 已归表的原始数据计算算术平均数,未归表已归表,两组学生某科的测验分数,甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84,(二)算术平均数的优缺点,优点: 反应灵敏; 严密确定; 计算简便; 适合代数运算; 不易受抽样变动影响。 缺点:易受极值影响。 算术平均数是总体平均数的做好估计值。,(三)计算和应用平均数的条件和原则,适用条件:所有数据同质、准确可靠且无极值影响。 同质数据:使用统一个观测手段,采用相同的观测标准,能反映某同一特质的数据。 平均数与个体数值相结合:要反映个

3、体数据的差异,包括分布形态。 平均数与标准差、方差相结合:配对使用。数据差异,二、中数,(一)中数( median,中点数、中位数、中值,Md/Mdn) 位于一组按大小顺序排列的数据中间位置上的数据。,(一)未归表的原始数据求中数的方法,数据个数为奇数与偶数的情形 3,5,7,8,9,11,14 17,15,14,12,11,10,9,6 数据个数为奇数与偶数时有重复数据的情形 11,11,11,11,13,13,13,17,17 11,11,11,11,13,13,13,17,17,18,求中数:当重复数目位于数列中间,个数为奇数时 11、11、11、11、13、13、13、17、17,12

4、.5,13.5,求中数:当重复数目位于数列中间,个数为偶数时 11、11、11、11、13、13、13、17、17、19,12.5,13.5,求中数:当重复数目位于数列中间(靠左),个数为偶数时 11、11、11、13、13、13、15、17、17、19,12.5,13.5,表1 80名小学二年级学生身高的次数分布表,(二)已归表的原始数据计算中数,129.5,132.5,内插法由小向大计算:,(三)中数的优缺点及应用,优点:计算简便;不易受极值影响 缺点: 反应不灵敏 受抽样变动影响比算术平均数大 不适合代数运算 适用情况: 一组数据有极值时 一组数据中个别数据不清楚时 资料属于等级性质时,

5、三、众数 (mode,范数、密集数、通常数,M0),一组数据中出现次数最多的那个数。 (一)计算方法: 用观察法寻找粗略众数未归表:2、4、3、6、4、5、4、6 已归表:频数最多那组的组中值,用公式计算众数的近似值(数理众数) 皮尔逊经验法:W.I.King插补法:,b,适用于偏态分布L 为众数所在组的下限fa 为上一组的次数fb 为下一组的次数,Mo=Lb+fa /(fa + fb).i 当fa =fb时, fa /(fa +fb) =1/2 当fa fb时, fa /(fa +fb) 1/2 当fafb时, fa /(fa+ fb)1/2,Mo=La-fb /(fa + fb).i 当f

6、a =fb时, fb /(fa +fb) =1/2 当fa fb时, fb/(fa +fb)1/2,金氏插补法求众数:,(二)众数的优缺点及应用,优点:简明易懂;不易受极值影响 缺点: 反应不灵敏 受抽样变动影响较大 不适合代数运算 适用情况: 需要快速而又粗略寻找一组数据的代表值时 当一组数据出现不同质时 当一组数据有极值时 分析一组数据的分布是否偏态及程度,平均数、中数与众数三者间的关系,M0 Md M M Md M0正偏态 负偏态,1、正偏态: MMdM0; 2、负偏态: MMd M0 3、三者关系:M0 = 3Md - 2M,四、其他集中量数,1、加权平均数(weighted mean

7、):不同比重数据(或平均数)的平均数。,2、几何平均数(geometric mean):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。,3 、调和平均数(harmonic mean): 也称倒数平均数,是一组数据倒数的算术平均数的倒数。 主要用于求学习速度。,1.单位时间的工作量,2.单位工作量所用时间,3.平均单位工作量所用时间,4.平均单位时间的工作量,两组学生某科的测验分数,甲组:54、63、72、74、82、88、99 乙组:67、71、73、76、79、82、84,差异量数 (measures of variation),理解差异量数的含义 认

8、识标准差的性质、作用 掌握标准差的计算方法 熟悉运用各种差异量数描述一组数据的特征及若干组数据的比较 掌握标准分数及其运用,主要的差异量数,一、全距(Range) 二、百分位距(Percent Rank) 三、四分位差(Quartile) 四、平均差(AD) 五、方差( Variance) 六、标准差(SD),一、全距(range,两极差,R ),全距计算:R=Xmax Xmin优点:概念清楚,意义明确。 缺点:,易受极值影响;不考虑中间数值,反应不灵敏是差异量的粗略指标,主要在统计分组时使用,二、百分位差(百分位距) (percentile deviation),(一)百分位数的计算 百分位

9、数:是位于依一定顺序排列的一组数据中某一百分位置的数值。Pp 计算方法:与归组表中数的计算方法类似。,百分位差:指两个百分位数之差。 常用的百分位差: P90 - P10 P93 - P7 百分位差的优点:,简明易懂,计算方便较少受极值影响缺点:忽略部分数据不适合代数运算,(二)百分等级的计算,百分等级:某一分数所在的百分位置。 计算方法:根据累加次数分布图进行估计 百分位数的逆运算,三、四分位差(quartile deviation),是在依一定顺序排列的一组数据中间50%的次数的距离的一半。 Q =(Q3 - Q1)/ 2,3,原始数据计算法 例:将16个原始数据从小到大排列好: 12、1

10、4、15、17、19、20、22、25、29、30、31、33、35、37、39、40,Q1=18,Q3=34,主要在有极值或个别数值不清楚、不确 切时使用。,四、平均差,(ADaverage deviation, or MDmedian deviation) 是每一个数据与该组数据平均数离差的绝对值的平均数。 计算方法 未归表数据求平均差:已归表数据求平均差:,平均差的优点:,意义明确计算容易反应灵敏缺点:不适合作进一步的代数运算,2,五、方差和标准差 (variance and standard deviation),方差:是离差平方的算术平均数。s2 ; 2 标准差:是方差的平方根。s

11、; 计算方法 未归表数据求方差和标准差,已归表数据求方差和标准差汇合标准差或总体标准差,方差和标准差的应用及其优缺点,优点: 严密确定 计算简单 反应灵敏 适合代数运算,缺点: 较费解 个别数值不清时,无法计算,第五单元 标准差的应用,一、差异系数(coefficient of variation,变异系数/相对标准差) 用于差异量的比较 单位不同的资料 平均数相差较大资料 计算方法,二、标准分数,标准分数(standard score,Z):以标准差为单位,标志某一分数离开团体均数的距离。 计算方法:标准分数的性质: =0Sz =1 为正值,则 xi x;为负值,则 xi x,标准分数的优点

12、及其应用,优点:Z分数的平均数为0,标准差为1,因此具有很强的可比性。 应用: 通过计算Z分数,判断和比较数值在团体中相对位置的高低 通过计算Z分数和查表,判断和比较数值在团体中的百分位置 通过计算不同质数值Z分数的总和,比较数值在团体中的位置 表示标准的测验分数:Z = aZ + b,附:正 态 分 布 表,Y,P,0 Z,三、异常值的取舍,如果原始分数属于正态分布或接近正态分布,则Z分数分数的范围大致在-3.00到+3.00之间(约占全体的99.73%)。,99.73,-3s,+3s,四、差异量数的选用,(一) 优良差异量数的标准1、根据客观数据获得的; 2、根据全部观测值计算得到的; 3

13、、意义明确、易理解; 4、计算方便、迅速; 5、较少受抽样变动的影响; 6、适合代数运算。,(二) 各种差异量数优缺点比较,差,较差,好,好,大,小,较小,较小,大,较小,小,小,不适合,不适合,不适合,适合,(三) 各种差异量数的关系,1、当样本数量相当大(N500)时:R 6s;小样本, R与s的比率要小一些。 2、当N值相当大时,且分布呈正态时: s 1.2533AD 1.4826Q AD 0.7979s 1.1829Q Q 0.6745s0.4853AD,(四) 如何选用差异量数,1、当样本是随机取样时,s、Q、R的可靠性依次降低; 2、当要求计算容易时,R、Q、s依次变得复杂; 3、当要求统计量进一步使用时,只有s适合; 4、在偏态分布中,Q比s更常用; 5、当分布是截尾分布时,只有Q能够正确指出分布的变异性。,差异量数和集中量数的关系及配对使用时的选择,要反映一组数据的全貌,必须同时使用集中量数和差异量数进行描述。 差异量数大,集中量数的代表性就小;反之则大。 配对使用的选择:平均数与标准差(方差);中数与Q或其他百分位差。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报