收藏 分享(赏)

临床统计学介绍.ppt

上传人:Facebook 文档编号:3504800 上传时间:2018-11-07 格式:PPT 页数:41 大小:155KB
下载 相关 举报
临床统计学介绍.ppt_第1页
第1页 / 共41页
临床统计学介绍.ppt_第2页
第2页 / 共41页
临床统计学介绍.ppt_第3页
第3页 / 共41页
临床统计学介绍.ppt_第4页
第4页 / 共41页
临床统计学介绍.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、临床统计学介绍,张博恒 MD, PhD 复旦大学循证医学中心 国际临床流行病学上海培训中心 ,20046,2,为什么要做统计分析?,统计分析的目的是应用样本 资料的信息,作出有关研究总体的有效推测。 应用概要性指标描述样本资料来实现。 这些概要性指标保留了足够的信息 去估计研究总体的特征。,20046,3,关于总体的临床研究问题,在发展中国家,人工喂养相比母乳喂养能否增加母亲为HIV阳性的婴儿生存率? 如何建立一个心脏搭桥手术后生存率模型?病人的特征能否预测术后生存率?相比内科治疗,搭桥手术后1,3,5年的生存率能否改善? 局部治疗小肝癌能否代替外科手术切除? 根治术后应用大剂量的干扰素能否降

2、低肝癌复发率?,20046,4,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,5,总体,样本和个体,“Aristotle maintained that women have fewer teeth than men; although he was twice married, it never occurred to him to verify this statement by examining his

3、 wives mouths.” - Sir Bertrand Russell, The Impact of Science on Society, 1952. “It is a capital mistake to theorize before you have data.” - Sir Arthur Conan Doyle, Scandal in Bohemia.,20046,6,总体,样本和个体,And, for another viewpoint: “If your experiment needs statistics, you ought to have done a better

4、 experiment.” Ernest Rutherford. The bench science perspective: you can control all the variables! Clinicians, however, know better human variation is large, and often inexplicable. Statistics help us describe it and generalize at least enough to improve our ability to practice medicine.,20046,7,总体,

5、样本和个体,Aristotle 推测了一个女性总体 (比较男性总体). 他实际上手头就有一个包含2个女人的样本 ,他能对这个样本中的2个个体进行数牙。 The population is the collection of all people about whom you would like to ask a research question. This might be a fairly clear-cut easily defined set of people:“What proportion of people 65 or older in the US today have A

6、lzheimers disease?” Or it might be a more hypothetical group:“How much of a reduction in symptomatic days could a person expect if treated with a new antiviral for flu?”,20046,8,总体,样本和个体,实际上,我们不可能去研究总体中的每一个对象。 所以,我们研究一个样本, 并将其推广到整个人群。 样本量 是样本中个体 的数目 (而不是对每个研究对象的测量指标数目!)好的研究设计能帮助我们得到一个 代表性好的样本。 好的统计分

7、析能帮助我们获得关于总体问题的答案。,20046,9,例子:HCC的裸鼠转移模型,* 2个水平:裸鼠 细胞,20046,10,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,11,数据类型,计量资料 Quantitative: “how much ?” 连续的变量: 年龄, 体重, 身高, 血压 实际数值: 家庭的子女数, 住院天数 分类资料 Categorical: “what type ?” 等级变量: 肿瘤

8、分期 (I,II,III) ; 好 中 差 名义变量:男/女; 健康/生病; ABO血型,20046,12,数据类型数据类型的转换,计量数据可转换成分类数据:normal (value) vs. abnormal;“young, middle-aged, old”将连续变量转换成等级变量减少了资料的信息量,从而造成统计学检验的敏感度或把握度下降,20046,13,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,1

9、4,Notes: vertical axis can be count or percent in the above example, counts do not add to 74 individuals can have multiple risk factors tabular presentation may be more parsimonious for such data,N = 74,分类资料的统计描述,计数 百分比,20046,15,分类数据的统计描述,构成比 率 比例 vs 率标化,20046,16,下面是一组年龄数据(11例) 21, 32, 34, 34, 42, 4

10、4, 46, 48, 52, 56, 64 年龄是一个计量的变量,所以如果用条图就不合适。我们更感兴趣的是年龄分布的一些特征:年龄分别的中心点在哪里?如平均数年龄的变异又是如何?是不是有些数据跟绝大部分数据差得很多(outliers) 借助视觉工具帮助我们回答这些问题.,定量数据的统计描述,20046,17,计量数据的统计描述,图表 1. Stem and Leaf plot 2. Histogram 3. Boxplot数字 1. Location - mean, median, mode. 2. Spread - range, variance, standard deviation,pe

11、rcentile 3. Shape- skewness*例外:生存资料的描述,20046,18,We could group the data and tally the frequencies:But why “hide” the details? Instead, well use the 10s place as stems and the units as leaves:,20: X 30: XXX 40: XXXX 50: XX 60: X,2* | 1 3* | 244 4* | 2468 5* | 26 6* | 4,Stem and Leaf Diagram,stem & le

12、af plot For small datasets,20046,19,Examples,平均数 方差,中位数 百分位数,outlier,20046,20,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,21,集中趋势,算术平均数: 几何平均数 中位数,20046,22,平均数和中位数比较,Mean is sensitive to a few very large (or small) values - “out

13、liers” Median is “resistant” to outliers Mean is attractive mathematically 50% of sample is above the median, 50% of sample is below the median.,20046,23,离散趋势,Variation is important!,20046,24,离散趋势,方差标准差 百分位数: IQR = Q.75- Q.25,20046,25,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测

14、量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,26,标准误和95% 可信区间,描述样本:平均数,标准差 ?总体: 为了估计总体的平均数,需要计算标准误 标准误标准差/ 样本量 总体均数的95CI: 样本的平均数1.96*标准误,论文中常用,20046,27,标准差 vs均数的标准误 ( when do you use one, but not the other ? ),标准差用于描述:量化样本均数周围的变异. 当确定两个样本是否来自于同一总体时,标准差是一个重要的统计量。 Central limit theorem; “同一总体中的样本

15、均数呈正态分布” 样本均数的标准误用于样本均数估计总体的均数。 标准误是一个重要的统计量,用于计算样本均数的可信度,取决于标准差和样本量。但实际上两者并不独立,当样本量增加时,标准差往往减少。,20046,28,正态分布 ( basis of statistical inference for many populations ),Mean = median = mode. all = same value in the distribution remember: 68.3% of data is between - 1.00 s.d. and + 1.00 s.d. 95.0% “ “ “

16、 “ “ “ “ - 1.96 s.d. and + 1.96 s.d. 95.5% “ “ “ “ “ “ “ - 2.00 s.d. and + 2.00 s.d. 99.7% “ “ “ “ “ “ “ - 3.00 s.d. and + 3.00 s.d.,20046,29,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,30,推断性统计,推广结论:样本 总体 评价证据的强度 比较 预测,20046,31

17、,计量资料的统计方法,20046,32,列联表分析,列,* 四格表是全一致,20046,33,Make predictions: 回归分析,应变量: 一般定量变量 线性分析 等级或名义变量Logistic 回归 时间变量 Cox回归,20046,34,Descriptive epidemiology : pattern of occurrence Prevalence of HIV+ and community Mosquito index,r = .83 r - squared = .92 * p .001 p .001 * * * * * * * * * *,20151050,0 2 4

18、6 8 10 12 14 16 18 20 22,Index of community mosquito infestation,HIV+,20046,35,今天的主题,总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价,20046,36,诊断试验评价,试验的设计,20046,37,诊断试验的设计,20046,38,诊断试验的评价,敏感度a/a+c 特异度d/b+d 阳性预测值a/a+b 阴性预测值d/c+d,阳性拟然比敏感度/1特异度 阴

19、性拟然比1敏感度/特异度,20046,39,医学论文中通常报道哪些?,大多数研究报道平均数(正态)或中位数(非正态) 有些研究报道标准差和/或标准误。Be careful!有时会看到图中有一个error bar,could be either. 如果资料非正态 (偏态,多峰,尾巴很长或很短等), 往往报道中位数和百分位数,而不是均数和标准差. 写文章时一定有根主线研究所要回答的问题: Do you want to ask about the average or typical person? Or do you want to figure out how unusual your pati

20、ent might be?,20046,40,通常的流行病学(科学的)途径,1. 确定一个问题 : clinical suspicion ; case series ; review of medical literature 2. 组织一个假设 ( asking the right question ) ; good hypotheses are: Specific, Measurable, and Plausible 3. 检验假设 ( assumptions vs. type of data ) 4. 再验证 always Question the VALIDITY of the res

21、ult(s) : Chance ; Bias ; and Causality,20046,41,结论的准确性,Chance : role of random error in outcome measure(s) ( p - value ; power of the study and the confidence interval ) - largely determined by sample sizeBias : role of systematic error in outcome measure(s) Selection bias - subjects not representativ Information bias - error(s) in subject data / classification Confounding - 3rd variable (causal) assoc. w/ both X and Y,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报