收藏 分享(赏)

医学统计学(医学检验检验总复习) 1.ppt

上传人:yjrm16270 文档编号:7230370 上传时间:2019-05-10 格式:PPT 页数:64 大小:393KB
下载 相关 举报
医学统计学(医学检验检验总复习) 1.ppt_第1页
第1页 / 共64页
医学统计学(医学检验检验总复习) 1.ppt_第2页
第2页 / 共64页
医学统计学(医学检验检验总复习) 1.ppt_第3页
第3页 / 共64页
医学统计学(医学检验检验总复习) 1.ppt_第4页
第4页 / 共64页
医学统计学(医学检验检验总复习) 1.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

1、,医学统计学,总复习,绪 论,医学统计学是统计学的一门分支学科,它应用概率论和数理统计的原理和方法,研究医学领域数据资料的收集,整理分析和推断。它是进行医学科学研究所必需的主要手段。,医学统计学的主要内容有:统计描述参数估计假设检验医学科研设计,统计学基本步骤,设计,资料搜集,整理,分析,调查设计 实验设计,资料来源 质量控制,审核 合理分组,统计描述 统计推断,统计工作的步骤 设计医学科研设计,调查设计,临床实验设计, 搜集资料统计报表统计资料 医疗卫生工作记录(经常性工作记录)专题调查或实验(一时性工作记录), 整理资料,分组汇总资料,核对检查原始数据,整理资料,统计描述 统计指标、统计

2、图、表 统计分析 参数估计统计推断假设检验, 分析资料, 计量资料 观察单位某项指标测定值的集合。亦称变量值,是定量的指标,一般有单位。,统计资料的类型, 计数资料 按性质和类别进行分组所得的资料。其变量值是定性的,可分二项分类和多项分类。 等级资料按某项指标的不同程度进行分组的资料。各组之间有量的差别亦为半定量的资料。,根据分析的需要各类资料可以互相转化。,三类数据间的关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压8 正常血压 12 轻度高血压15 中度高血压17 重度高血压,定量数据,等级数据,定性数据,一、 变量与变异 变 量: 被观察

3、单位的特征(即观察指标)。观察指标的测定结果则称变量值。 变 异: 同质个体间测定结果的差异。,医学统计学的几个基本概念,二、总体和样本 总 体 (population): 根据研究目的而确定的同质的观察单位某项指标测定值的集合。,有限总体,无限总体,总 体,样 本 (sample):从总体中随机抽取部分观察单位组成 为使样本对总体具有代表性要求:抽样必须遵循随机的原则保证足够的样本含量,三、 抽样 从总体中抽样必须遵循科学原则 样本应具有: 代表性、随机性、可靠性、可比性,常用随机抽样方法:,机械抽样、分层抽样、随机数字表,完全随机设计:(两组或多组比较) 配对设计:(同源或异源两两配对)

4、随机区组设计:(两个以上受试对象组成一个配伍组),四、 设计类型,五、 误差 (error)系统误差、随机测量误差、抽样误差 (smapling error):指样本统计量与总体参数之差,由抽样所造成,是不可避免的,但可以控制。,抽样误差产生的原因:,1、个体之间存在变异; 2、样本是总体中的一部分。,是描述随机事件发生可能性大小的数值,用P表示。0 P1 必然事件的概率为1(100%) 不可能发生事件的概率为0 随机事件的概率在01之间,六、 概率 (probability),总体参数: , ,统计学基本概念,样本统计量:,同质,变异,误差,变量,测量,P(A | B) = P(A and

5、B) P(B),频率,概率,计量资料的分析,一、计量资料的统计描述 编制频数表, 频数分布的特征集中趋势 变量值集中分布的位 置离散趋势 变量值围绕集中位置 的分布情况 频数分布的类型对称分布,某地区130名正常成年男子红细胞数(1012/L)的频数分布红细胞数 划 记 频 数(1) (2) (3)3.70 | | 2 3.90 | | | | 44.10 正 | | | | 94.30 正正正 | 164.50 正正正正 | | 224.70 正正正正正 254.90 正正正正 | 215.10 正正正 | | 175.30 正 | | | | 95.50 | | | | 45.705.90

6、 | 1合 计 130,偏态分布正偏态分布 238名正常人发汞值(g/g) 的中位数和百分位数的频数表计算 发 汞 值 频 数 累计频数 累计频率(%)(1) (2) (3) (4)=(3)/2380.3 20 20 8.40.7 66 86 36.11.1 60 146 61.31.5 48 194 81.51.9 18 212 89.12.3 16 228 95.82.7 6 234 98.33.1 1 235 98.73.5 0 235 98.73.94.3 3 238 100.0,负偏态分布 某地某年恶性肿瘤死亡率的年龄分布年龄组 恶性肿瘤死亡率(1/10万)0 0.510 1220

7、1530 7640 18950 23460 38670 286,二、集中趋势(Central tendency) 的描述平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。均数 ( )常用平均数 几何均数(G)中位数(M),常用平均数: 均数 (算术均数) (mean) 表示符号 总体均数 ()样本均数 () 应 用 对称分布资料,尤其是正态分布资料计算方法 1+ 2+ n 直接法= = n nf 1 1+f 2 2+f kk f 加权法= =f 1 +f 2+f k n,常用平均数: 几何均数 (geometric mean) 表示符号 (G)

8、 应 用 变量值呈倍数关系,对数正态分布资料 计算方法 直接法 G = n x1 x2 xnlgx1+lgx2+lgxn lgx 加权法 G = lg1 = lg1 n nf1lgx1+f2lgx2+fklgxk f lgxG = lg1 = lg1 n n,常用平均数 中位数 (median) 表示符号 (M)偏态分布资料 应 用 变量值分布一端或两端无确定数值分布不明资料 计算方法直接用变量值计算 M = X n+1 (n为奇数时)21 或 M= X n + X n+1 (n为偶数时)2 2 2,i n 用频数表计算 M = L + ( fL )fx 2附:百分位数 ( Percentil

9、e,Px )描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。iPx = L + (n x% fL )fx,三、离散趋势 (fendency of dispersion)描述变量值的离散趋势用变异指标全距( R )常用变异指标 标准差( S )变异系数( CV)四分位数间距( Q),常用变异指标 全距 (range, 简记为R)反映变量值的变异范围 R = 最大值 最小值各种类型资料都可应用,但只作 参考资料,常用变异指标 四分位数间距 ( quartile, 简记为Q)四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距Q = Qu QL Qu =

10、P75 (上四分位数)QL = P25(下四分位数)用途:用于表示偏态分布资料的变异程度,常与中位数配合使用,常用变异指标 方差 (variance) 和 标准差(standard deviation)定义公式( ) 2 ( ) 22 = = N N( ) 2 ( ) 2S2 = S = n 1 n 1,应用公式2 ( ) 2 / n 直接法 S = n 1f2 ( f ) 2 / n 加权法 S = n 1, 方差和标准差用 途1. 表示变量值的离散程度,用于两组 变量值比较时,要求其性质相同, 均数相差不大2. 与均数结合,表示均数的代表性(s),常用变异指标 变异系数 (coeffici

11、ent of variation, 简记为CV)定义:CV = s / 100% 用途:比较两组或多组单位不同 或均数相差较大资料的变 异程度,描述性统计小结:,正态分布及其应用 正态分布的概念和特征正态分布是以均数为中心呈对称的钟型分布正态分布的特征有:1) 正态分布曲线在均数处最高2) 正态分布以均数为中心,左右对称且逐渐减少3) 正态分布曲线的两个参数和,记作N (,)4) 正态曲线下的面积为1 (或100%),正态曲线下的面积分布规律:1 占正态曲线下面积的68.27%1.96 占正态曲线下面积的95.00%2.58 占正态曲线下面积的99.00%若样本含量较大(n100),则上式可用

12、代替, 用s代替。 则上式可写为:1S 占正态曲线下面积的68.27%1.96S 占正态曲线下面积的95.00%2.58S 占正态曲线下面积的99.00%,正态分布、标准正态分布,曲线的高度(概率密度) 面积(概率密度函数积分) 正态分布的特点: 曲线下面积规律:,正态分布N(,2),标准正态分布 N(0,1), 标准正态分布标准正态分布为服从均数为0,标准差为1,即N(0,1)的正态分布其转换公式为:u = -/ 标准正态曲线的面积分布规律:-1 u +1 占总面积的68.27%-1.96 u +1.96 占总面积的95.00%-2.58 u +2.58 占总面积的99.00%, 正态分布的

13、应用与临床参考值的确定正态曲线面积分布规律可用于估计医学临床参考值与质量控制临床参考值的确定方法 1) 正态分布法:用于正态分布的资料双侧参考值 uS 单侧参考值 - uS 或 + uS,2) 百分位数法:,用于偏态分布资料双侧参考值(= 0.05) P2.5 P97.5单侧参考值(= 0.05) P5 或 P95,医学参考值估计:,基本步骤,抽样 样本含量,“正常人”,测量/控制误差,分组确定?,单or双侧?,分布类型,百分界限,估计方法,正态分布法,对数正态分布法,百分位数法,用样本信息推断总体特征,称统计推断(statistical inference) 统计推断包括总体均数估计和假设检

14、验 样本的统计指标和总体指标是有差别的,四、计量资料的统计推断, 均数的抽样误差和标准误 概念:由于抽样造成的样本均数与总体均数之差别(-) 抽样误差是不可避免的,但可以控制。 表示方法:标准误(standard error)标准误为样本均数的标准差,是说明样本均数抽样误差的大小的指标。,计算公式 = : 总体标准误nSS = S :样本标准误,n 为的估计值, t分布 概念从正态总体N(,)中进行无数次样本含量为n的随机抽样,每次均可得到一个和一个s,通过 式转换,可得无数个t值,t值的分布即 为含量为n的t值的总体或称t分布。, t分布 特征 以0为中心,左右对称t分布曲线的形状与自由度有

15、关t分布曲线下面积为1 t分布曲线下面积分布可由t值表中查出:双侧 P( t -t ) +P( t t) = 单侧 P( t -t ) = 或 P( t t) = , 总体均数的估计 点估计(point estimation)用样本均数估计总体均数 区间估计(interval estimation)按一定的概率(可信度,1 -)估计总体均数所在范围,亦称总体均数的可信区间,区间估计的方法: 1) 当未知时,2) 当已知或未知但n足够大时, 假设检验 (hypothesis testing) 假设检验的基本思想先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应

16、当拒绝或不拒绝。, 假设检验 (hypothesis testing),两组比较,资料呈正态分布方差齐性,t检验,是,否,非参数统计,样本与总体比较 配对资料比较,资料呈正态分布,否,是,两样本t检验,统计分 分析目的 可采用的指标统计和方法 析类型 统计 了解变量值的平均水平或集中趋势 均数 几何均数 中位数 描述 了解变量值的变异情况或离散趋势 极差 标准差 方差 变 异系数了解客观事物或现象间相互关系的密切程度与方向 相关分析了解某一变量随其他变量的变化而变化的数量关系 回归分析 统计 估计总体均数的大小 点估计 区间估计 推断 样本均数与总体均数的比较 t检验 u检验两个样本均数的比较

17、 t检验u检验(秩和检验,t检验)配对样本均数的比较 配对t检验(秩和检验),计量资料常用的统计分析方法,计数资料的分析,一、计数资料的统计描述 相对数,率、构成比、 相对比 (率的标准化),二、计数资料的统计推断,总体率的估计,假设检验,分类变量资料统计分析小结,统计描述,统计推断,总体率的估计 各类卡方检验,有序分类,秩和检验,率、 构成比、 相对比 (率的标准化),无序分类,统计分 分析目的 可采用的统计 析类型 指标和方法 统计 反映某种随机事件发生的频率程度 率 描述 反映某个指标上另一个指标的多少倍 相对比反映某一事件内部各组成部分的比重 构成比由样本率推断总体率 点估计 区间估计

18、 统计 推断 两个样本率或构成比的比较 四格表X2检验(精确概率法) 配对样本比较 配对X2检验多个样本率或构成比的比较 行 列表X2检验,计数资料常用的统计分析方法,非参数检验方法:,适用于以下资料:,1)分布为偏态或分布形式未知的定量资料(数值变量),尤其在n30的情况下; 2)等级资料(有序分类变量); 3)个别数据偏大或数据的某一端无确定的数值。如“0.01mg”、“150mg”等,只有一个下限或上限而没有具体数值; 4)各组离散程度相差悬殊,即各总体方差不齐;,秩和检验的统计量、P值及统计推断,类型 统计量 P值 统计结论 配对比较 T在T0.05 内 P0.05 不拒绝H0,差异无

19、统计学意义T在T0.05外 P0 .05 拒绝H0, 差异有统计学意义两样本 T在T0.05 内 P0.05 不拒绝H0,差异无统计学意义 比较 T在T0.05外 P0 .05 拒绝H0, 差异有统计学意义多样本 H X20.05 P0.05 不拒绝H0,差异无统计学意义 比较 H X20.05 P0.05 拒绝H0, 差异有统计学意义,统计分 分析目的 可采用的统计 析类型 指标和方法 统计 反映各等级所占比重 构成比 描述 反映某一等级的数量是其余等级的多少倍或百分之几 相对比统计 推断 比较单向等级资料的内部构成 行列X2检验有无差别 等级资料的两个样本的比较 两样本比较的秩和检验等级资

20、料的多个样本的比较 多个样本比较的秩和检验配对样本比较 配对符号秩和检验,等级资料常用的统计分析方法,双变量资料(线性关系),资料呈正态分布方差齐性,是,否,线性相关与回归,等级相关,统计表 与统计图,1、统计表的结构和制作要求 2、统计图的制作要求 3、图型的选择,资料,资料,类型,计量资料,正态,非正态,X,G,S,参考值范围, 统计图表等,线性相关与回归,统计推断,r 计算与检验,Y=a+bX,均数可信区间估计,假设检验:t与u检验,M,QUQL, 参考值范围,统计图表等,秩和检验,等级资料,计数资料,二项分布,率,相对比,构成比,假设检验,两组率比较:卡方检验,多组率和两组或多组构成比比较:卡方检验,配对两分类资料卡方检验,参数估计,正态近似法,直接查表法,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报