1、统 计1 统计工作步骤:研究设计、收集资料、整理资料、分析资料。2 定量资料:以定量值表达每个观察单位的某项观察指标,如血脂、心率等,各观察值间只有量的差别,有连续性。3 定性资料:以定性方式表达每个观察单位的某项观察指标,如血型、性别等,各观察值间有质的区别,无连续性。4 等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效等级,各观察值间有质的区别,无数值大小5 总体:是指按照研究目的所确定的研究对象中所有观察单位某项指标取值的集合。分为有限和无限两种。6 样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。7 同质性:同一总体或其样本的观察单位在取值方面必须有
2、相同的性质,称为同质性。8 描述某总体特征的指标称为参数;描述样本特征的指标称为统计量。9 概率:是指随机事件发生的可能性的大小的一个度量,常用 P 表示,其小于等于0.05 时称为小概率事件。10 变异:是以具有统治性的观察单位为载体,某项观察指标在其观察单位之间现实的差别。包括同质事物间的、不同观察单位间的、同一单位不同阶段的差别。11 整理数据最有效的形式是频数分布,根据频数分布可以初步判断指标分布的特征是集中趋势还是离散趋势,发现某些特大或特小的可疑值,揭示资料分布类型,便于资料进一步分析。12 频数分布分为对称分布和非对称分布,非对称分布又称为偏态分布,包括正偏态(大小)和负偏态(小
3、大) 。13 集中趋势指标:1)算术均数(Xbar) ,最适合单峰对称资料;2)几何均数(G) ,如抗体滴度、细菌计数,应用于等比数列、对数数列;3)中位数(M)和百分位数,适用于偏态分布、开口资料、分布不明资料。14 离散趋势指标:1)全距( R),又称极差,极差大说明变异度大;2)四分位间距;3)方差和标准差(s) ,标准差大离散程度大,及波动明显;4)变异系数 CV=标准差/均数,可应用于单位不同的两组资料或均数相差悬殊的两组资料。15 数据集中,变异度小则均数代表性好;否则反之。常用均数和标准差描述正态分布资料;用中位数和四分位间距描述偏态分布资料。16 相对数作用:1)表示事物出现的
4、频率; 2)便于比较。常用的相对数有:率、构成比、相对比。17 率和构成比的区别和联系:率 构成比概念 发生的强度或频率 各组成部分所占的比重强调点 随机发生的事件 各部分的构成资料获得 较难 容易特点 不一定 合计为 118 正态分布:以均数为中心,成对称钟形分布,均数是位置参数,均数越大向右移;标准差是形态参数,标准差越大越矮胖。用于定量资料。19 标准正态分布:N(0,1)20 二项分布用于定性资料,当给定样本含量 n 时,形态取决于 ,当 =0.5 时分布不对称,0.5 呈负偏态,0.5 时呈正偏态分布。21 抽样误差:由于抽样引起的样本统计量和总体参数之间的差异。22 中心极限定理:
5、1)正态分布总体样本均数仍为正态分布;2)非正态分布的总体,只要样本足够大,均数仍近似服从正态分布。用途:1)衡量样本均数的可靠性;2)估计总体均数的可信区间;3)用于均数的假设检验。公式:23 T 分布:单峰曲线;以 0 为中心,左右对称,形态与自由度有关,自由度无穷大,T 分布就是标准正态分布。24 可信区间的两个要素:可靠性和精确性。25 可信区间与参数范围的区别联系:可信区间 参数范围用途 估计总体参数 判断变量是否正常个数 只有 1 个 变量值多个基于 T 分布 正态分布公式26 标准差与标准误的区别联系:27 假设检验:针对抽样误差,分辨两个样本是否属于两个总体,并对总体做出适当结
6、论。28 假设检验步骤:1)建立假设检验,H0 ,H1 ;2)确定检验水准 =0.05 (或 0.01) ;3)计算检验统计量求 P 值;4)当 P,不拒绝 H0,差异无统计学意义。29 第一类错误():H0 真实时被拒绝,又称假阳性;第二类错误():H0 不真实时不拒绝,又称假阴性。增大 n,会同时降低 、。30 T 检验的应用条件:1)资料有代表性和可比性;2)资料独立性、正态性、方差齐性;3)样本较大(n50) 。31 定量资料均数分析:用 T 检验和方差检验。32 定性资料样本率分析:u 检验和卡方检验。33 等级资料分析:秩和检验(非参数) 。34 非参数检验的适用情况:1)总体分布
7、形式未知或分布类型不同;2)偏态分布资料;3)等级资料;4)方差不齐的资料;5)一端或两端开口资料。35 相关关系:是表达两变量间线性相关的程度和方向的一个统计指标。相关系数(r)绝对值越接近于 1,表示两变量相关程度越密切,越接近于 0,表明越不密切。36 相关分析的正确应用:相关关系是一种共变关系不一定是因果关系,充分利用散点图,识别离群值并舍弃,排除资料的间杂性。37 相关分析的应用条件:x 和 y 线性关系;n 个个体的观察资料间必须独立;给定 x标准误 Sx 标准差 s意义 抽样误差(均数变异) 个体变异用途 估计可信区间 估计正常值与 n 的关系 n 越大,Sx 越接近 0 n 越
8、大,s 趋向于稳定联系 1)两者都是变异指数;2)n 一定,s 变大,Sx 也增大后,y 值为正态分布;不同的 x 值,y 方差不变。38 直线回归 y=a+bx,x 为自变量,y 为应变量。39 直线回归步骤:1)绘制散点图;2)计算回归系数 b 与截距 a;3)列出回归方程;4)做出回归直线;5)假设检验。注意:1)直线通过点(x,y) ;2)实际意义:是从专业角度对两变量有一定的认识,不能把毫无联系的两变量勉强做回归分析;使用条件为 y 值服从正态分布;回归方程范围以 x 为界限,不能偏离太远;回归系数 b的意义表示自变量增加一个单位时,应变量的平均改变量。40 研究社设计的五大要素:1)研究因素和混杂因素;2)对照组及均衡性;3)指标及其选择;4)研究对象的随机化;5)样本含量及其估计。