收藏 分享(赏)

统计学基本概念及应用.ppt

上传人:精品资料 文档编号:11282775 上传时间:2020-03-10 格式:PPT 页数:56 大小:167KB
下载 相关 举报
统计学基本概念及应用.ppt_第1页
第1页 / 共56页
统计学基本概念及应用.ppt_第2页
第2页 / 共56页
统计学基本概念及应用.ppt_第3页
第3页 / 共56页
统计学基本概念及应用.ppt_第4页
第4页 / 共56页
统计学基本概念及应用.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、1,卫生统计学基本概念及应用,中国中医研究院 胡镜清 2002/03/20,2,Y=36-1.28e2x,3.16, 0.13,36.78., 36.8,0.32,0.28, ,3,总体,统计描述和推断,样本,抽样,4,一、卫生统计学基本模块统计的步骤 设计(design) 资料收集(collection of data) 资料整理(sorting data) 统计分析(analysis of data),5,卫生统计学基本模块 统计研究研究设计 统计资料的收集、整理、表达与描述 定量和定性资料的统计分析 相关与回归分析 生存分析 其他多元统计分析,6,二、统计学基本概念 样本与总体 总体(p

2、opulation)是指性质相同的研究对象中所有观察单位某种变量值的集合 从总体中随机抽取部分观察单位,某变量的实测值构成样本(sample),7,变量(variable)及其分类 数值性变量:又称连续性变量、计量资料如身高:158.2cm 165cm 178.0cm. 体重:54.0kg 62kg 75.2kg.,8,分类变量:计数资料 无序分类 二项分类 阴性/阳性; 存活/死亡多项分类,9,年龄 39岁 治疗组 5 24 56 2 对照组 6 13 54 11,10,有序分类 又称等级资料如: -、+、+、+; 无效、有效、显效、痊愈,11,参数(parameter)和统计量(stati

3、stic) 总体参数 希腊字母表示 样本统计量 拉丁字母表示,12,抽样误差(sampling error) 由于个体间的差异,随机抽样后,样本所测得的指标(统计量)往往与总体指标(参数)之间存在差异,这种由于随机抽样所造成的样本统计量和总体参数的差异,即为抽样误差。,13,表1 疗效比较 组别 例数有效 无效 合计 有效率 X2 P 甲试验 (%)对照组 15 5 20 75治疗组 19 1 20 95 1.765 0.05 乙试验对照组 30 10 40 75治疗组 38 2 40 95 6.275 0.05 丙试验对照组 45 15 60 75治疗组 57 3 60 95 9.412 0

4、.01,14,型错误(type error)和型错误(type error)的水平 型错误:统计推断拒绝了实际上成立的无效假设(H0),即假阳性。I型错误的概率用表示,故又称错误。,15,型错误:统计推断不拒绝实际上是不成立的无效假设(H0),即假阴性。II型错误的概率用表示,故又称错误。,16,概率(probability) 事件发生的可能性大小。用p表示,取值范围在0-1之间。0为不可能发生,1为必然发生。 习惯将P0.05的事件称为小概率事件,可以认为在一次抽样中不会发生,17,三、统计分析的基本作用 1、统计描述(descriptive statistics) 对资料的数量特征及其分布

5、规律进行测定和描述。 统计学指标 统计表 统计图 数学模型,18,19,2、统计推断(inferential statistics) 如何抽样,以及如何由样本信息推断总体特征问题 参数估计(parameter estimation) 假设检验(hypothesis test) 先确定无效假设(H0),如果能拒绝,再接受备择假设( H1 ),20,-2.58 -1.96 +1.96 +2.58,0.5%,2.5%,21,三、计量资料的统计描述 集中趋势的统计描述 均数(average) 算术均数 几何均数 加权均数 中位数(median)和百分位数(percentile),22,离散程度的统计描

6、述 全距(range, 极差) 四分位数间距(quartile),23,例如: 2,6,7,10,36 Range = 34 Q=QU-QL= 4,24,方差 离均差:每一观察值与总体均数的差值 (X-)为离均差,由于( X- )=0,故不能反映数据的变异。例如,2,6,7,10,36 均数=12.2离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2) =,25,离均差平方和: ( X- )2 则能反映数据变异的大小离均差平方的和=(2-12.2)2+(6-12.2)2+(7-12.2)2+(10-12.2)2+(36-12.2)2 =740

7、.8,26,离均差平方的均数,总体方差(2)( X- )2n样本方差(S2)( X X )2n-1,27,标准差(standard deviation):将方差开方后即得总体标准差( )和样本标准差(s)( X- )2 =n,28,( X - X )2 s =n-1标准差越大,反映数据的离散程度越大。即数据离平均数越远,29,30,变异系数(coefficient of variation, CV) 可用于度量不同单位资料之间的变异度s CV= 100%X 例如,某地20岁男子100人,身高平均166.06cm,标准差为4.95cm,体重均数为53.7kg,标准差为4.96kg,问身高和体重的

8、变异度相似吗?,31,四、计量资料的假设检验 t 检验 又称student t 检验其基本思路是均值之差与抽样误差之比,32,33,样本均数与总体均数比较的 t 检验 配对差值比较的 t 检验 成组设计比较的 t 检验,34,u 检验 成组设计的大样本均数比较 n虽小而总体标准差已知的均数比较,35,t 检验和u 检验的应用条件 样本的总体正态分布 两样本的总体方差相等,36,方差分析(F 检验) 又称变异分析,其指标为均方MS(mean square),由组间离均差平方的和SS除以自由度 v 而得,37,基本思想 先求出组间均方(MS组间)与组内均方(MS组内) 组间均方(MS组间)与组内均

9、方(MS组内)之比作为统计量(F值),与临界值比较 所有数据的变异分解为组间变异和组内变异两部分,当几种治疗方案作用相同时,F值约为1;作用不同时,F值大于1MS组间 F =MS组内,38,例如:例题见倪宗瓒编医学统计学第82-83页 21例儿童接受三种不同的疗法,1月后观察其血红蛋白的总量,问三组的治疗效果有无差异。,39,计算结果SS总=2271.81 SS组间=1523.81 SS组内= SS总- SS组间=748.00 组间=-1=3-1=2, 组内=n- =21-3=18 MS组间=SS组间/ 组间= 1523.81/2=761.91 MS组内=SS组内/ 组内= 748/18=41

10、.56 F= MS组间/ SS组内=761.91/41.56=18.33,40,表2 方差分析表来源 SS v MS F P 组间 1526.81 2 761.91 18.33 0.05 组内 748.00 18 41.56 总 2271.81 20,41,多样本均数的两两比较 q 检验(Student-Newman-Keuls multiple range test,SNK) 用于几个样本均数的两两比较 Dunnett t 检验 几个处理组的样本均数与一个对照组的样本均数的比较,42,五、计数资料的统计描述 常用相对数 比(ratio) 是两个指标的相对比,说明A为B的若干倍或百分之几 构成

11、比(proportion) 说明一事物内部各组成部分所占的比重或分布,常以百分数表示,43,率 又称频率指标,它说明某现象发生的频率或强度。常以百分率(%)、千分率()等表示发生某现象的观察单位数 率= 100%可能发生某现象的观察单位总数,44,应用相对数时注意事项 计算相对数的分母不宜过小 分析时不能以构成比代替率 对观察单位数不等的几个率,不能直接相加求其平均率 资料的对比应注意可比性 对样本率(或构成比)的比较应遵循随机抽样,要进行假设检验,45,例如,某工厂医务室1979年门诊病人的统计汇总表心血管疾病 326 7.8% 呼吸系统疾病 2580 61.9%消化道疾病 417 10.0

12、% 其他 845 20.3% 合计 4168 100%,46,结论:本厂呼吸系统疾病患病率较高。他们的结论对吗?为什么?,47,48,六、计数资料的假设检验 2 检验 秩和检验,49,2 检验 基本原理 假设样本组间的率没有差别,计算其理论频数 实际频数(A)与理论频数(T)吻合的程度用2 值表示 2 值越大,P值越小,当P(检验水准),拒绝假设,50,四格表资料的2 检验(两样本率的比较) 校正2 检验:1 40 确切概率计算法: T 0 or n 4 0行列表资料的2 检验(多个样本率或构成比的比较) 不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1,51,秩和检验 配对组间的符号秩和检验(Wilcoxon配对法) 成组设计两样本比较的秩和检验(Wilcoxon两样本比较法) 成组设计多个样本比较的秩和检验(Kruskal-Wallis法) 多个样本两两比较的秩和检验(Nemenyi法),52,七、直线回归与相关 直线回归 建立两变量间依存关系的直线回归方程 由直线回归方差通过已知变量估计未知变量 如: Y=47.78-10.32X,53,直线相关 了解两变量是否有相关关系存在,密切程度如何,是正相关,还是负相关。相关系数r及其显著性检验,54,八、多元统计分析 多元回归与相关分析 因子分析,55,聚类分析 判别分析,56,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报