收藏 分享(赏)

spss数据分析的统计方法选择小结 0 E.doc

上传人:dzzj200808 文档编号:2637655 上传时间:2018-09-24 格式:DOC 页数:22 大小:114KB
下载 相关 举报
spss数据分析的统计方法选择小结 0 E.doc_第1页
第1页 / 共22页
spss数据分析的统计方法选择小结 0 E.doc_第2页
第2页 / 共22页
spss数据分析的统计方法选择小结 0 E.doc_第3页
第3页 / 共22页
spss数据分析的统计方法选择小结 0 E.doc_第4页
第4页 / 共22页
spss数据分析的统计方法选择小结 0 E.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、数据分析的统计方法选择小结 0 E / , h9 p3 F$ + G1 A3 : f; _7 _ l0 f2 w) S完全随机分组设计的资料一、 两组或多组计量资料的比较1.两组资料:* c; U, j* r- w! M1)大样本资料或服从正态分布的小样本资料 2 w1 t u8 9 y8 P$ v3 J. I7 s P2 N5 s R6 X% C2)小样本偏态分布资料,则用成组的 Wilcoxon 秩和检验2.多组资料:4 h3 m! f5 ) ?# y) ?1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合

2、适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。, C Z2 q# c8 g1.单样本资料与总体比较! F A9 Y7 x1)二分类资料:3 N! X 4 w: Q. (1)小样本时:用二项分布进行确切概率法检验; I) G1 U( s9 J9 Co* k! B2 d5 (2)大样本时:用 U 检验。! r* J8 r4 Y F 6 Z- T- m, 7 7 a% ) C% # 0 y9 f; S6 b6 g2)多分类资料:用 Pearson c2 检验(又称拟合优度检验) 。( I, + W7 m- + e( U5 y2. 四格表资料1)n40 并且所以理论数大于 5

3、,则用 Pearson c2 Z2 i4 L3 R( ) _2)n40 并且所以理论数大于 1 并且至少存在一个理论数40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用 Fishers 确切概率法检验1 A S/ 0 A. G# m* A3 Z1 h4. RC 表资料的统计分析* V“ E( c1 k1 9 x: R2 Z1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则 CMH c2 或 Kruskal Wallis 的秩和检验/ t) o0 _ u2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作 none zero correlation

4、 analysis 的 CMH c2$ u: y% % A% L/ v5 k U. f4 _. 6 g/ S( G: 1)观察值较小时:用确切概率法进行检验。6 X) F, n% y8 G“ f2)观察值较大时:用正态近似的 U 检验。2.两个样本比较:用正态近似的 U 检验。+ 7 Q4 N“ d5 E6 O配对设计或随机区组设计 8 c7 H. f0 j/ p四、 两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对 t 检验- _1 , # R* F$ s/ ?0 2)小样本并且差值呈偏态分布资料,则用 Wilcoxon 的符号配对秩检验/ R;

5、 a! u0 R$ n1 l$ o8 7 k; g0 C# V( l! n2.多组资料:# P9 j9 M8 H% L( Y) Q. N, K( W1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作 Fredman 的统计检验。如果 Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用 Wilcoxon 的符号配对秩检验,但用 Bonferroni 方法

6、校正 P 值等)进行两两比较。( d5 i9 C( M$ R7 y5 V3 u% 五、 分类资料的统计分析6 g6 A# f7 p: f . % Q2.CC 表资料:0 U* S* X N D, 0 4 . U z5 m$ P“ v1)配对比较:用 McNemar 配对 c2 检验或配对边际 c2 检验2)一致性问题(Agreement):用 Kap 检验 1 ? S6 p7 r4 H( w变量之间的关联性分析六、 两个变量之间的关联性分析; D# % r( E t9 |/ X% 6 0 I2 X e* N1)小样本并且两个变量服从双正态分布,则用 Pearson 相关系数做统计分析* g6

7、) o1 F9 F# f3 6 b. L7 Y9 D+ D; l: |, 6 x2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析 ! F! d0 a2 f2.两个变量均为有序分类变量,可以用 Spearman 相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析 5 s. P! Z5 s6 2 Q d. A8 Y七、 回归分析$ 1 : / l6 k# e5 d1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简

8、单回归) ,否则应作适当的变换,使其满足上述条件。“ W5 u3 U9 ?! H# D2.多重线性回归:应变量(Y)为连续型变量(即计量资料) ,自变量(X1,X2, ,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,可以作多重线性回归。- X W F“ H9 Z+ l# f0 c2 1 C(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件 Logistic 回归 5 j7 , q5 p* x7 % - 6

9、Q- T7 (1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素9 r. 7 J7 U( q; A: z( c% R(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X1,X2, ,Xp)可以为连续型变量、有序分类变量或二分类变量。“ : ( U* ; 8 X. N r9 7 d1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量

10、,以校正这些混杂因素对结果的混杂作用 2 N; a! Z% E: H9 c% ) T, F+ % z“ K7 D# j. z5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X1,X2, ,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间), S# i) _4 e/ v; N1.用 Kaplan-Meie

11、r 方法估计生存曲线 2 o$ p# m$ V T4 , g* 0 x- p6 H, k) k) b- L2.大样本时,可以寿命表方法估计3.单因素可以用 Logrank 比较两条或多条生存曲线( d1 d; _) K1 n- T4.多个因素时,可以作多重的 Cox 回归9 + q# K! I) G! k4 K, E+ b) m1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素+ d% ; O3 A4 E S2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用各种检验的方法的应用前提(1)正态性检验:大样本用

12、 K-S 检验,小样本用 Shapiro-Wilk 检验。具体方法有两种,一种是使用Explore ,一种是使用 1 d6 T: Q( R* l: F$ d: X4 B! h1 Sample K-S Test3 i/ H9 k( R# d* x4 J(2)标准化处理(去量纲):即将原有的一组数据转为符合 N(0 ,1)分布的数据,从而达到去单位的效果。具体做法是在Descriptive 下勾选 Save standardized values as variables,即可得到相应的标准化数据。$ s% A7 Q% R2 R Y! x. D3模型的选择对于有重复观测值的多因素方差分析,首先分析

13、各个因素是否存在交互效应,如果不存在交互效应,则把交互效应并为误差效应,仅分析各因素的独立效应或主效应。(4.5)实际应用中对方差分析适应条件的把握* d0 n8 g8 h9 L1 P0 # S# U“ * H9 T1单因素方差分析:在单因素方差分析中,如果各组的重复观测数相同或总体呈正态分布,则方差分析模型对方差不齐有一定的承受力,只有最大方差与最小方差之比小于 3,结果是稳定的。2单元格内无重复的多因素方差分析:不考虑正态性和方差齐性问题,这是因为正态性和方差齐性是以单元格为基本单位的,每个单元格只有一个数据,因此无法分析。3单元格有重复数据的多因素方差分析:一般数据量较小,因此正态性检验

14、和方差齐性检验无实际意义。“ v, V! x, B7 T(5)简单相关分析% * W( p t$ H1参数方法(Pearson 方法). f7 y7 V3 n) S! Z: w) y8 要求所有变量均服从正态分布2非参数方法(Spearman 方法)适用于不服从正态分布的变量ps:偏相关分析和复相关分析均要求服从正态分布(Pearson 方法)(6)线性回归分析的前提条件1自变量之间相互独立% B) G. l; R% T1 F检验方法:多重共线性检验,检验指标为容许度(Tolerance )和方差膨胀因子(VIF)2残差独立且服从正态分布检验方法:一是作图法,二是 DW(Durbin-Wats

15、on)检验,三是 Runs 检验 9 g9 x3 |) 7 F* z0 8 U! x3自变量和因变量之间的关系是线性的! L% u0 * k! w1 c检验方法:一是作图法,二是 t 检验,三是 F 检验与可决系数 1 “ D# w s5 6 f4 s8 d8 _(7)各种 t 检验的用途1单样本 t 检验(One Sample T Test)对一组样本,检验相应总体均值是否等于某个值2相互独立样本 t 检验(Independent-Sample T Test)样本 x1,x2, ,xn 与样本 y1,y2 , , yn 可以颠倒顺序而对结果不会产生影响3配对样本 t 检验样本 x1,x2,

16、,xn 与样本 y1,y2 , , yn 的顺序不可以颠倒。数据分析的统计方法选择小结完全随机分组设计的资料一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组 t 检验(2)若方差不齐,则作 t检验或用成组的 Wilcoxon 秩和检验2)小样本偏态分布资料,则用成组的 Wilcoxon 秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验, Bonferroni 检验等)进行两两比较。2)如果小样本的偏态

17、分布资料或方差不齐,则作 Kruskal Wallis 的统计检验。如果Kruskal Wallis 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的 Wilcoxon 秩和检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。二、 分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用 U 检验。2)多分类资料:用 Pearson 2 检验(又称拟合优度检验) 。2. 四格表资料1)n40 并且所以理论数大于 5,则用 Pearson 22)n40 并且所以理论数大于 1 并且至少存在

18、一个理论数40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用 Fishers 确切概率法检验4. RC 表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则 CMH 2 或Kruskal Wallis 的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作 none zero correlation analysis 的 CMH 23)列变量和行变量均为有序多分类变量,可以作 Spearman 相关分析4)列变量和行变量均为无序多分类变量,(1)n40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用 Fishe

19、rs 确切概率法检验三、 Poisson 分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的 U 检验。2.两个样本比较:用正态近似的 U 检验。配对设计或随机区组设计四、 两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对 t 检验2)小样本并且差值呈偏态分布资料,则用 Wilcoxon 的符号配对秩检验2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验, Bonfer

20、roni 检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作 Fredman 的统计检验。如果Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用 Wilcoxon 的符号配对秩检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。五、 分类资料的统计分析1.四格表资料1)b+c40,则用 McNemar 配对 2 检验或配对边际 2 检验2)b+c40,则用二项分布确切概率法检验2.CC 表资料:1)配对比较:用 McNemar 配对 2 检验或配对边际 2 检验2)一致性问题(Agreement ):用 Kap 检验变量

21、之间的关联性分析六、 两个变量之间的关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用 Pearson 相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析2.两个变量均为有序分类变量,可以用 Spearman 相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析七、 回归分析1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归) ,否则应作适当的变换,使其满足上述

22、条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料) ,自变量(X 1,X 2,X p)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3.二分类的 Logistic 回归:应变量为二分类变量,自变量(X 1,X 2,X p)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件 Log

23、istic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X 1,X 2,X p)可以为连续型变量、有序分类变量或二分类变量。1)观察

24、性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X 1,X 2,X p)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1.用

25、Kaplan-Meier 方法估计生存曲线2.大样本时,可以寿命表方法估计3.单因素可以用 Logrank 比较两条或多条生存曲线4.多个因素时,可以作多重的 Cox 回归1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用数据分析的统计方法选择小结完全随机分组设计的资料一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组 t 检验(2)若方差不齐,则作 t检验或用成组的 Wilcoxon 秩和检验2)

26、小样本偏态分布资料,则用成组的 Wilcoxon 秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作 Kruskal Wallis 的统计检验。如果 Kruskal Wallis 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的 Wilcoxon 秩和检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。二、 分类资料的统计分析1.单样

27、本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用 U 检验。2)多分类资料:用 Pearson c2 检验(又称拟合优度检验) 。2. 四格表资料1)n40 并且所以理论数大于 5,则用 Pearson c22)n40 并且所以理论数大于 1 并且至少存在一个理论数40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用 Fishers 确切概率法检验4. RC 表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则 CMH c2 或 Kruskal Wallis 的秩和检验2)列变量为效应指标,并且为无序多分

28、类变量,行变量为有序多分类变量,作 none zero correlation analysis 的 CMH c23)列变量和行变量均为有序多分类变量,可以作 Spearman 相关分析4)列变量和行变量均为无序多分类变量,(1)n40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用 Fishers 确切概率法检验三、 Poisson 分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的 U 检验。2.两个样本比较:用正态近似的 U 检验。配对设计或随机区组设计四、 两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值

29、服从正态分布的小样本资料,作配对 t 检验2)小样本并且差值呈偏态分布资料,则用 Wilcoxon 的符号配对秩检验2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作 Fredman 的统计检验。如果Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon 的符号配对秩检验,但用 Bonferroni 方法校正 P 值等)进行两

30、两比较。五、 分类资料的统计分析1.四格表资料1)b+c40,则用 McNemar 配对 c2 检验或配对边际 c2 检验2)b+c40 ,则用二项分布确切概率法检验2.CC 表资料:1)配对比较:用 McNemar 配对 c2 检验或配对边际 c2 检验2)一致性问题(Agreement ):用 Kap 检验变量之间的关联性分析六、 两个变量之间的关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用 Pearson 相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析2.两个变量均为有序分类变量,可以用 Spearma

31、n 相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析七、 回归分析1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归) ,否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料) ,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性) ,残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主

32、要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3.二分类的 Logistic 回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(

33、拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类

34、变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1.用 Kaplan-Meier 方法估计生存曲线2.大样本时,可以寿命表方法估计3.单因素可以用 Logrank 比较两条或多条生存曲线4.多个因素时,可以作多重的 Cox 回归1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可

35、能的混杂因素变量,以校正这些混杂因素对结果的混杂作用1.连续性资料1.1 两组独立样本比较1.1.1 资料符合正态分布,且两组方差齐性,直接采用 t 检验。1.1.2 资料不符合正态分布(1 )可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用 t 检验;(2 )采用非参数检验,如 Wilcoxon 检验。1.1.3 资料方差不齐(1 )采用 Satterthwate 的 t检验;(2 )采用非参数检验,如 Wilcoxon 检验。1.2 两组配对样本的比较1.2.1 两组差值服从正态分布,采用配对 t 检验。1.2.2 两组差值不服从正态分布,采用 wilcoxon 的符

36、号配对秩和检验。1.3 多组完全随机样本比较1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 KruscalWallis 法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P 值,然后用成组的 Wilcoxon 检验。1.4 多组随机区组样本比较1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的

37、方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 Fridman 检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P 值,然后用符号配对的 Wilcoxon 检验。需要注意的问题:(1 )一般来说,如果是大样本,比如各组例数大于 50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。(2 ) 当进行多组比较时,

38、最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。绝不能对其中的两组直接采用 t 检验,这样即使得出结果也未必正确。(3 ) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。2分类资料2.1 四格表资料2.1.1 例数大于 40,且

39、所有理论数大于 5,则用普通的 Pearson 检验。2.1.2 例数大于 40,所有理论数大于 1,且至少一个理论数小于 5,则用校正的检验或Fishers 确切概率法检验。2.1.3 例数小于 40,或有理论数小于 2,则用 Fishers 确切概率法检验。2.2 2C 表或 R2 表资料的统计分析2.2.1 列变量行变量均为无序分类变量,则(1 )例数大于 40,且理论数小于 5 的格子数目总格子数目的 25,则用 Fishers 确切概率法检验。2.2.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行

40、平均分差检验或成组的 Wilcoxon 秩和检验。2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3 RC 表资料的统计分析2.2.1 列变量行变量均为无序分类变量,则(1 )例数大于 40,且理论数小于 5 的格子数目总格子数目的 25,则用 Fishers 确切概率法检验。(3 )如果要作相关性分析,可采用 Pearson 相关系数。2.2.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson

41、 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的 Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.2.4 列变量行变量均为有序多分类变量(1 )如要做组间差别分析,则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2 )如果要做两变

42、量之间的相关性,可采用 Spearson 相关分析。2.4 配对分类资料的统计分析2.4.1 四格表配对资料(1 ) bc40,则用 McNemar 配对检验。(2 ) bc40,则用校正的配对检验。2.4.1 CC 资料(1 )配对比较:用 McNemar 配对检验。(2 )一致性检验,用 Kappa 检验。本文来源于 响石潭 http:/chinadoctor.org连续因变量 分类因变量连续自变量 回归分析 Logistic 回归分类自变量 方差分析(ANOVA) 表格检验(比如卡方检验)在研究设计时, 统计方法的选择需考虑以下 6 个方面的问题: (1)看反应变量是单变量、 双变量还是

43、多变量; (2)看单变量资料属于 3 种资料类型(计量、 计数及等级资料)中的哪一种; (3)看影响因素是单因素还是多因素; (4)看单样本、 两样本或多样本 ; (5)看是否是配对或配伍设计; (6)看是否满足检验方法所需的前提条件, 必要时可进行变量变换, 应用参数方法进行假设检验往往要求数据满足某些前提条件, 如两个独立样本比较 t 检验或多个独立样本比较的方差分析, 均要求方差齐性, 因此需要做方差齐性检验。如果要用正态分布法估计参考值范围, 首先要检验资料是否服从正态分布。在建立各种多重回归方程时, 常需检验变量间的多重共线性和残差分布的正态性。不同的统计分析方法都有其各自的应用条件

44、和适用范围。实际应用时, 必须根据研究目的、 资料的性质以及所要分析的具体内容等选择适当的统计分析方法, 切忌只关心 p 值的大小(是否0.05), 而忽略统计分析方法的应用条件和适用范围。一、两个变量之间的关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用 Pearson 相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析2.两个变量均为有序分类变量,可以用 Spearman 相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析二、回归分析1.直线回

45、归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3.二分类的

46、 Logistic 回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.

47、有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可

48、能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。一 统计方法抉择的条件在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法抉择时,应考虑下列因素:1分析目的对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法达到研究者的什么目的。一般来说,统计方法可分为描述与推断两类方法。一是统计描述(descriptive statistics),二是统计推断(inferential statistics)。统计描述,即利用统计指标、统计图或统计表,对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、全面地了解数据资料所包涵的信息,以便做出科学的推断。统计表,如频数表、四格表、列联表等;统计图,如直方图、饼图,散点图等;统计指标,如均数、标准差、率及构成比等。统计推断,即利用样本所提供的信息对总体进行推断(估计或比较) ,其中包括参数估计和假设检验,如可信区间、t 检验、方差分析

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报