收藏 分享(赏)

二、计量资料的统计描述.ppt

上传人:scg750829 文档编号:10136858 上传时间:2019-10-13 格式:PPT 页数:58 大小:702.50KB
下载 相关 举报
二、计量资料的统计描述.ppt_第1页
第1页 / 共58页
二、计量资料的统计描述.ppt_第2页
第2页 / 共58页
二、计量资料的统计描述.ppt_第3页
第3页 / 共58页
二、计量资料的统计描述.ppt_第4页
第4页 / 共58页
二、计量资料的统计描述.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

1、2019/10/13,1,计量资料的统计描述,董 英,2019/10/13,2,例2-1 测得130名健康成年男子脉搏资料(次/分)如下,观察频数分布情况。,2019/10/13,3,计量资料的统计描述,第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述,2019/10/13,4,第一节 频数分布,一、频数分布表(frequency table)列出观察指标的可能取值区间,及在各区间出现的频数; 可较好地体现观察值的分布规律。,2019/10/13,5,例2-1 测得130名健康成年男子脉搏资料(次/分)如下,观察频数分布情况。,2019/10/13,6,1.确定组数研究目的和样

2、本含量n确定分组组数原则:较好地显示数据分布规律本例分为10组,频数表的编制步骤,2019/10/13,7,2.确定组距 (1)等距组距极差/组数,根据实际情况再作调整极差(range):即最大值与最小值之差,又称为全 距,记为R 本例:R84 57 =27(次/分)组距:27/10=2.7 3 (2)不等距,频数表的编制步骤,2019/10/13,8,3.列出各组段上下限频数分布包括整个资料范围的全部数据第一组段的下限略小于最小值,最后一个组段上限必须包含最大值各组段上下限不交叉。 4.划记统计各组段频数将所有数据归纳到各组段,得到各组段的频数、频率及累积频数、频率。,频数表的编制步骤,20

3、19/10/13,9,表2-1 130名健康成年男子脉搏(次/分)的频数分布表,二、频数分布图,直方高度表示频数, 以纵轴标度;直方宽度表示组距,以横轴标度。,三、频数表和频数分布图用途,1描述频数分布的类型:对称分布、偏态分布 (1)对称分布 :各组段的频数以频数最多组段为中心,左右两侧大致对称,如下图所示:,(2)偏态分布 :正偏态、负偏态分布1)正偏态分布(右偏态分布):高峰位于左侧,右侧的组段数多于左侧的组段数,频数向右侧拖尾。,2)负偏态分布(左偏态分布): 高峰位于右侧, 左侧的组段数多于右侧的组段数,频数向左侧拖尾。,2描述频数分布的特征:集中趋势和离散趋势,表21数据的频数分布

4、特征: (1)集中趋势:数据高低不等,但向中间集中,集中的组段在6873(次/分)之间,尤以组段71(次/分)的人数最多。且上下组段的频数分布基本对称。 (2)离散趋势:随着脉搏逐渐变大或变小,人数越来越少,即向两端分散。,3便于发现一些特大或特小的可疑值,4样本含量较大时,可将频率作为概率估计值 5便于进一步做统计分析和处理,2019/10/13,16,第二节 集中趋势的描述,平均数(average)是一类指标,用来描述数值变量资料的集中趋势(或平均水平),简明概括,便于比较。常用的平均数有:算术均数(均数)(mean)几何均数(geometric mean)中位数 (median),201

5、9/10/13,17,一、算术均数,算术均数:简称均数(mean) 总体均数,样本均数 适用于对称分布特别是正态分布资料,位于分布的中心,是频数分布最集中的位置 多数正常生理、生化指标都适宜用均数表达集中趋势。,计算方法,(一)直接计算法 公式 :,举例:试计算4,4,4,6,6,8,8,8,10的均数?,2019/10/13,19,例2-1 测得130健康成年男子脉搏资料(次/分)如下,2019/10/13,20,(二)加权法(利用频数表):,公式 :,k:频数表的组段数, :频数(权数), :组中值。,2019/10/13,21,表2-2 130名健康成年男子脉搏(次/分)的频数分布表,N

6、f,fX,fX2,2019/10/13,22,二、 几何均数(geometric mean),适用条件:原始数据分布不对称,数值按大小顺序排列后观察值间按倍数关系变化,经对数转换后呈对称分布的资料。如医学上的滴度资料。例如:抗体滴度、血清学凝集效价等。,2019/10/13,23,计算方法,几何均数:变量对数值的算术均数的反对数。,(一)直接法:,2019/10/13,24,例2-5 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。,平均抗体效价为: 1:57,2019/10/13,25,例2-6 69例类

7、风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,2019/10/13,26,三、 中位数与百分位数,11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,60,60 平均存活天数?(一)中位数(median)是将一组变量值从小到大排列,位置居于中间的那个变量值(n为奇)或位置居中的两个变量值的均数(n为偶),2019/10/13,27,中位数应用情况,适用于各种分布类型的资料,特别是:资料明显偏态资料一端或两端无确定数值(开口资料)资料分布情况不明,2019/10/13,28,中位数计算方法,1.直接计算公式:n为奇数

8、时 n为偶数时,2019/10/13,29,例2-3 9名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,求其中位数。,2019/10/13,30,2.加权计算,(1)编制频数表 (2)按所分组段由小到大计算累计频数和累计频率,找出中位数所在组段 (3)将中位数所在组段的下限,组距i,频数fx,和小于L的各组段累计频数 代入下式:,2019/10/13,31,例21频数表中位数的计算,中位数71+3 (13050%59)/2671.69,百分位数示意图,(二)百分位数(percentile),2019/10/13,33,1直接计算法,设有n个原始

9、数据从小到大排列,第X百分位数的计算公式为:当 为带有小数位时:当 为整数时:,2019/10/13,34,例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。,患 者: 住院天数:(1)n=120, ,为整数:,2019/10/13,35,(2) ,带有小数,故取整数为 118,,患 者: 住院天数:,2019/10/13,36,2加权法计算百分位数,公式:,2019/10/13,37,当 时,上式即为中位数的计算公式:,2019/10/13,38,例2-9 试分别求例21频数表的第25、第75百分位数。,P2565+3x(1

10、30x25%19)/1565.90(下四分位数QL) P7574+3x(130x75%85)/1974.66(上四分位数QU),2019/10/13,39,3中位数的应用,(1)优点: 中位数不受少数特大或特小值的影响 (2)缺点 资料呈对称分布时,均数较中位数稳定 中位数不便于统计运算,2019/10/13,40,4百分位数的应用,常结合使用,用来说明特定的问题缺点:样本量较少时,不能计算靠近两端的百分位数,设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数(万/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、

11、505、500、495、490,见下图2,三名医生的计数结果得到的均数均为500,5个数值之和均为2500。,第三节 离散趋势的描述,三名医生的结果有何不同?,2019/10/13,42,常用统计指标,极差 四分位数间距 方差和标准差 变异系数,2019/10/13,43,一、极差,极差,又称全距,用R表示。即一组变量值最大值与最小值之差。,简单,但仅利用了两端点值,稳定性差。不能反映其它数据的变异,当样本量较大时极差也较大不宜比较。,2019/10/13,44,二、四分位数间距,四分位数间距,用Q表示:Q= 下四分位数: 上四分位数:,四分位数间距通常用于描述偏态分布资料和开口资料的离散程度

12、,较极差稳定,但也不能全面反映资料的离散程度,其应用仍不够普遍,2019/10/13,45,三、离均差平方和、方差与标准差,1.平均偏差2. 离均差平方和(SS):,2019/10/13,46,三、离均差平方和、方差与标准差,3. 方差(variance):总体方差:样本方差:,2019/10/13,47,4.标准差总体标准差用 表示:样本标准差用 表示 , 直接计算公式:加权法计算公式:,方差和标准差用于对称分布资料。标准差度量单位与均数一致,所以最常用。,2019/10/13,48,例2-11 对例2-1的前10个数据: 75,76,72,69,66,72,57,68,71,72, 用直接

13、法计算标准差。,2019/10/13,49,例2-12 利用表2-2中的数据和频数表法计算标准差。,Nf,fX,fX2,2019/10/13,50,5.标准差的意义和用途,意义:说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差;标准差越小,说明观察值的离散程度越小,说明用均数反映平均水平的代表性越好。,2019/10/13,51,5.标准差的意义和用途,用途: 反映观察值的离散程度 用于计算变异系数 用于计算标准误(后续) 常与均数结合概况正态分布,并可估计参考值的范围(后续)。,2019/10/13,52,四、变异系数,变异系数(coefficient o

14、f variation,CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。,男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?,2019/10/13,54,小 结,频数表的制作,频数表(图)的用途 集中趋势指标:不同分布情况下,描述指标的选择 离散趋势指标:各个指标的应用和特点 如何从集中趋势和离散趋势两个角度对数据进行合理的描述,2019/10/13,55,练习题,1、描述一组偏态分布资料的变异度,以( )指标较好。 A.全距 B.标准差 C.变异系数 D.四分位间距 E.方差,2、对于对称分布,理论上

15、( )。A.中位数等于几何均数 B.均数等于标准差 C.均数等于中位数 D.均数等于几何均数,3、血清学滴度资料最常用来表示其平均水平的指标是( )。 A.算术均数 B.中位数 C.几何均数 D.变异系数 E.标准差,2019/10/13,56,练习题,4、各观察值均加一个不等于0的常数后( )。A.均数不变 B. 标准差不变C.中位数不变 D.几何均数不变,5、各观察值均乘一个不等于0的常数后( )。A.均数不变 B. 标准差不变C.中位数不变 D.变异系数不变,6、比较身高和体重两组数据变异度大小宜采用( )。 A.变异系数 B.方差 C.极差 D.标准差 E.四分位间距7、偏态分布宜用( )描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位间距 E.方差,2019/10/13,57,练习题,100名健康成年女子血清总蛋白含量(g/L)如下表,试对资料进行描述。表1 100名成年健康女子血清总蛋白含量,2019/10/13,58,练习题,某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。 求平均抗体滴度。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报