收藏 分享(赏)

医学统计学基础.ppt

上传人:微传9988 文档编号:2509616 上传时间:2018-09-20 格式:PPT 页数:68 大小:613KB
下载 相关 举报
医学统计学基础.ppt_第1页
第1页 / 共68页
医学统计学基础.ppt_第2页
第2页 / 共68页
医学统计学基础.ppt_第3页
第3页 / 共68页
医学统计学基础.ppt_第4页
第4页 / 共68页
医学统计学基础.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

1、医 学 统 计 学 基 础,延安市人民医院消化内科 左 文 革,60年代到80年代,国外医学杂志调查表明:20%72%的论文有统计错误。1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果为:相对数误用占 11.2%,抽样方法误用占15.9%,统计图表误用占11.7%1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2001年中华预防医学杂志:中华医学会系列杂志误用约54%(1995)。,1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为76%。医学论文中统计运用错误,除了影

2、响论文的科学性,还可能导致严重的伦理学问题。,医学统计学基本名词,医学统计学(medical statistics) -是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。统计学方法的特点: 用数量反映质量,医学统计学基本名词,概率(probability):是描述随机事件发生可能性大小的量值。用英文大写字母P来表示。概率的取值范围在01之间。当P0时,称为不可能事件;当P1时,称为必然事件。小概率事件:统计学上一般把P0.05或P0.01的事件称为小概率事件。 小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资

3、料进行假设检验。,医学统计学基本名词,总体(population):是根据研究目的确定的同质研究单位的全体。更确切地说是同质研究单位某种变量值的集合。 样本(sample):是从总体中随机抽取的有代表性的部分观察单位变量值的集合。样本的例数称为样本含量(sample size)。注意: 1。总体是相对的,总体的大小是根据研究目的而确定的。 2。样本应有代表性,即应该随机抽样并有足够的样本含量。,图示:总体与样本,population,sample2,sample1,sample3,sample4,sample5,医学统计学基本名词,参数(parameter):由总体计算或得到的统计指标称为参数

4、。总体参数具有很重要的参考价值。如总体均数,总体标准差等。 统计量(statistic):由样本计算的指标称为统计量。如样本均数,样本标准差s等。抽样误差(sample error): 由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差。,医学统计学基本名词,计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或

5、类别分组,所得的观察单位数称为计数资料(count data)。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。,医学统计学基本名词,等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、+、+等。 等级资料与计数资料不同:属性分组有程度差

6、别,各组按大小顺序排列。,医学统计学基本名词,正态分布:概率论中最重要的一种分布,也是自然界最常见的一种分布。该分布由两个参数平均值和方差决定。概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。,正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。 高峰在均数处; 均数两侧完全对称。 正态曲线下的面积分布有一定的规律。,正态曲线下的面积分布规律1 占正态曲线下面积的 68.27%1.96 占正态曲线下面积的 95.00%2.58 占正态曲线下面积的 99.00% 若n100,则可用 X 代替,用 s 代替。,-,-2.58 -1.96 -1 +1

7、 +1.96 +2.58,2.5%,1.0%,医学统计学基本名词,直线相关:又称线性相关,是指两列变量中的一列变量在增加(或减少)时,而另一列变量随之而增加(或减少),或这一列变量在增加时,而另一列变量则相应地减少。它们之间存在一种直线关系。直线相关可用直线拟合。,医学统计学基本方法,多元线性回归:在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。1. 应变量Y为正态分布数值变量多重线性回归 2. 应变量Y为二分类(或多分类)定性变量或等级变量lo

8、gistic回归 3. 应变量Y为二分类结局变量和生存时间Cox回归,案例 抛硬币:连续抛一枚硬币次,记录出现正面的次数下表列出了历史上一些科学家试验的结果:,证实:当试验次数逐渐增大时,频率值越来越稳定地接近于某一固定值。,医学统计学基本方法,定量资料的描述,集中趋势:算术均数几何均数中位数百分位数离散趋势:极差四分位数间距标准差、方差变异系数,=129.2,1:129,医学统计学基本方法,百分位数描述观察序列在百分位置的水平,是分布的百分界值,可用于确定医学参考值范围,适用于任何分布。描述一组资料在某百分位置上的水平; 用于确定正常值范围; 计算四分位数间距。,5人收缩血压测定结果(mmH

9、g):162 145 178 142 186,X = 813,X2 = 133317,=19.49 mmHg,=0.38,标准差用途:1. 表示同质变量值的离散程度, 用于两组 变量值比较时,要求其性质相同,均数相差不大.2. 与均数结合,表示均数的代表性(xs),同时描述正态分布特征3. 与均数结合, 计算变异系数4. 与样本含量(n)结合,计算标准误,例1:比较7岁男孩身高与体重的变异程度,身高:X1= 123.10 cm S1= 4.71cm 体重:X2=22.29 kg S2 = 2.26kg,CV1= 4.71/123.10 100% =3.83%,CV2= 2.26/22.29 1

10、00% = 10.14%,用频数表法计算,L 中位数所在组组段的下限 iM 中位数所在组组段的组距 fM 中位数所在组的频数 fL 中位数所在组前一组的累计频数,= 70+30/167(630/2-196) = 91.4 /dl,附:百分位数 Percentile,Px描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。,L Px 所在组组段的下限 ix Px 所在组组段的组距 fx Px 所在组的频数 fL Px 所在组前一组的累计频数,4. 四分位数间距 ( Quartile, Q)四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距Q = Qu Q

11、L, Qu = P75 (上四分位数)QL = P25(下四分位数),用途:用于表示偏态分布资料的变异程度,常与中位数配合使用,P25,P75,A,B,常用平均数的对比名称 意 义 应 用 场 合均数 平均数量水平 应用甚广,适用于对称 分布,尤其是正态分布几何均数 平均增(减)倍数 等比资料;对数正态分布中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值。,三、离散趋势 (tendency of dispersion),描述变量值的离散趋势用变异指标,全距(极差)四分位数间距常用变异指标 方差标准差变异系数,百分位数法,离均差法,4.标准误的意义,标准差与标准误的区别,t检验

12、的应用条件,n较小时(如n50),理论上要求样本取自正态总体 两小样本均数比较时,要求两总体方差相等,表4.4 新药组与安慰剂组血清总胆固醇含量(mmol/L),以|t|=|-1.542|=1.542,查附表2,t界值表的双尾概率0.10P0.20。按=0.05水准,不拒绝H0,无统计学意义。还不能认为该新药对女性血清胆固醇含量有影响。,经配对t检验,t=1.542, 0.10P0.20。还不能认为该新药对女性血清胆固醇含量有影响。,医学统计学基本方法,两独立样本t检验 完全随机设计: 分别从两个研究总体中随机抽取样本,然后比较两组的平均效应; 随机抽取实验对象,将其随机分成两组,分别接受两种

13、不同处理,然后比较两组的平均效应。 应用条件 两小样本均数比较(n1,n2均小于50)时,理论上要求样本取自正态总体,两总体方差相等。,医学统计学基本方法,2. 选定检验方法,计算检验统计量,联合方差,联合标准误,医学统计学基本方法,该检验也称为独立样本u检验(independent sample u-test),适用于两样本含量较大(如n150且n250)时,u值可按下式计算:,两样本均数比较的u检验,医学统计学基本方法,标准化率(standardized rate)亦称调整率(adjusted rate)。 常用的计算方法按已知条件有: 直接法:间接法:不讲。反推法:不讲。 2。选择标准人

14、口的方法: 1)选择两地数据之一的人口数或构成比; 2)选择两地数据之和的人口数或构成比; 3)选择当地或全国的人口数或构成比; 4)国际间比较选用世界通用标准。,医学统计学基本方法,检验目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:应用:计数资料,A 实际值 T 理论值, = (行-1)(列-1)=(R-1)(C-1),3. 2检验的种类( 1) 四格表资料的 2检验( 2 test for fourfold table)目的:用于两个样本率或构成比的比较,推断两个样本所代表的总体率(或

15、总体构成比)是否相等。,专用公式:,( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d),基本公式:,(A - T) 2 2 = T, = 1,(a),(b),(c),(d),(a+b),(c+d),(a+c),(b+d),(n),( ad - bc) 2 n 2 = (a + b)(c + d)(a + c)(b + d),P 0.05,医学统计学基本方法,T 1,或 n 40 时,需用确切概率法计算。,确切概率计算法(a + b)! (c + d)! (a + c)! (b + d)!P = a! b! c! d! n!,(3) 配对资料的四格表

16、2 检验 ( 2 test of paired comparision of enumeration data ) 用于配对设计的计数资料。,配对的方法:1)同源配对:是通过两种不同的处理方法对同一样品进行处理,从而推断两种处理方法的结果有无差别。,2)异源配对:以一定的条件把观察对象配成对子,研究某种因素的作用或影响。,a :甲乙b :甲乙C :甲乙d :甲乙,甲法阳性率:35/50 70,乙法阳性率:30/50 60,公式:,(a),(b),(c),(d),( | b - c | - 1) 2 2 = , = 1 b + c,医学统计学基本方法,秩转换的非参数检验先将数值变量从小到大,或等

17、级从弱到强转换成秩后,再计算检验统计量应用范围对于计量资料: 1. 不满足正态和方差齐性条件的小样本资料; 2. 分布不明的小样本资料; 3. 一端或二端是不确定数值(如0.5、5.0等)的资料(必选); 对于等级资料: 若选行列表资料的检验,只能推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。,医学统计学基本方法,注意:如果已知其计量资料满足(或近似满足) 检验或 检验条件,当然选 检验或 检验,因为这时若选秩转换的非参数检验,会降低检验效能。,医学统计学基本方法,医学统计学基本方法,单个样本中位数和总体中位数比较 两个独立样本比较的Wilcoxon秩和检验,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,医学统计学基本方法,频数表资料和等级资料的两样本比较例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?,表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较,计算u值,统计表统计图,统计表统计图,统计表统计图,统计表统计图,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医学治疗 > 医学现状与发展

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报