1、1常用医学统计方法上机实习题选目 录前 言 3均数与标准差 4统计描述 5总体均数估计 5总体率估计 6样本均数与总体均数的比较 6配对设计的两样本均数的比较 6两个样本均数比较(成组设计) 7多个样本均数比较(成组设计) 8配伍组设计多个样本均数比较 9样本率与总体率的比较 10完全随机设计两个样本率的比较(四格表资料) 11多个样本率的比较 11单向有序分类资料的假设检验 12相关分析 13回归分析 13生存分析 14根据统计量计算 P 值 15广州中医药大学试卷(B 卷) .18前 言卫生统计学实习的目的是让研究生在边学边实践的过程中,轻松掌握统计分析的基本内容。掌握了这些基本内容,就可
2、以有能力进行目前常用的统计分析工作。方便进一步的学习。数据的统计分析,常见资料的各种统计分析,包括:统计描述(均数、标准差、中位数、百分位数,二项分布的概率);参数估计(总体均数的可信区间估计、二项分布总体率的可信区间估计);假设检验(成组和配对 t 检验、 z 检验、成组设计多个样本均数比较的方差分析及两两比较、配伍组设计的方差分析及两两比较、两组 Wilcoxon 秩和检验或多组秩和检验及两两2比较、配对秩和检验、配伍组秩和检验及两两比较、Ridit 分析、四格表资料卡方检验,RC 表卡方检验、列联表卡方检验及列联系数计算、等级资料假设检验、双向有序资料的等级相关分析);相关回归(积差相关
3、系数的计算及假设检验、等级相关系数的计算及假设检验、直线回归方程的计算及假设检验,利用回归方程进行统计预测和统计控制)。均数与标准差1. 例 某省的高考分数经过标准化以后,最低分为 100 分,最高分为 900 分,平均分为500 分,标准差为 100 分。用计算机模拟从该总体中随机抽取 20 名考生的分数见下表。试计算考生分数的均数与标准差。考生号 分数bh x1 4562 5943 6114 3365 2986 3947 4648 3369 51310 55311 54112 47813 30614 51615 45616 45217 43118 53119 435320 552. sum
4、 x答:均数:462.65 标准差:92.40829软件计算过程及结果如下:. sum xVariable | Obs Mean Std. Dev. Min Max-+-x | 20 462.65 92.40829 298 611统计描述2. 例 从幼儿园大班随机抽取 12 名 6 周岁女童,测得身高(cm)。试进行统计描述。编号 身高(cm)1 125.22 135.33 122.94 131.65 121.16 141.57 132.18 112.89 104.610 131.211 125.912 126.1bh x1 125.22 135.33 122.94 131.65 121.16
5、 141.57 132.18 112.89 104.6410 131.211 125.912 126.1. clear. sum x答:样本含量:12 中位数:125.8583 标准差:9.947998 最小值:104.6 最大值:141.5软件计算过程及结果如下:. sum xVariable | Obs Mean Std. Dev. Min Max-+-x | 12 125.8583 9.947998 104.6 141.5总体均数估计3. 例 某县 1998 年抽样调查了 500 户农民家庭的年化纤布消费量,得到均数为 3.55 米,标准差为 1.03 米。试估计该县 1998 年农民家
6、庭年化纤布消费量的总体均数。. cii 500 3.55 1.03答:总体均数的点估计:3.55 95%双侧置信区间:( 3.459499,3.640501)m软件计算过程及结果如下:. cii 500 3.55 1.03Variable | Obs Mean Std. Err. 95% Conf. Interval-+-| 500 3.55 .046063 3.459499 3.6405015总体率估计4. 例 为了解某地新生儿畸形的发生率,某单位调查了该地 3009 名活产新生儿,诊断出畸形者 29 名,占 0.96%。试估计该地活产新生儿的畸形率。. cii 3009 29答:该地活产新
7、生儿的畸形率的 95%双侧置信区间:(0.64638%,1.3812%)软件计算过程及结果如下:cii 3009 29- Binomial Exact -Variable | Obs Mean Std. Err. 95% Conf. Interval-+-| 3009 .0096378 .001781 .0064638 .0138123样本均数与总体均数的比较5. 例 据大量调查知,健康成年男子脉搏的均数为 72 次/分,某医生在山区随机调查了 25 名健康成年男子,其脉搏均数为 75.5 次/分,标准差为 6.5 次/分,能否认为该山区成年男子的脉搏高于一般人群?. ttesti 25 75
8、.5 6.5 72答:该题样本含量小于 50,运用 t 检验,按 =0.0500 水准,t=2.6923,P= 0.0127 ,P 72Pr(T |t|) = 0.0127 Pr(T t) = 0.0064.医学研究中常将受试对象配成对子,对每对中的两个受试对象分别给予两种不同的处理,观察两种处理的结果是否一致,称为配对(设计)研究。有时以同一个受试对象先后给予两种不同的处理,观察两种处理的结果是否相同,这种配对称为自身配对。配对设计的优点是能消除或部分消除个体间的差异,使比较的结果更能真实地反映处理的效应。配对t 检验首先计算每对结果之差值,再将差值均数与0 作比较。如两种处理的效应相同,则
9、差值与0 的差别无统计学意义。检验假设H0 为:两种处理的效应相同,或总体差值均数为0。配对设计的两样本均数的比较6. 例 欲研究某药物对血红蛋白含量是否有影响,观察了 9 例患者治疗前后血红蛋白的变化,数据如下表。试问,该药物治疗前后血红蛋白含量有无变化?编号 1 2 3 4 5 6 7 8 9治疗前 122 113 141 123 105 124 144 115 117治疗后 145 128 156 122 121 105 123 101 127. ttest x1=x2答:该题选择两样本均数 t 检验,按 =0.0500 水准,t= -0.4749,P=0.6475,P 0.05,不拒绝
10、假设检验 H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。软件计算过程及结果如下:. ttest x1=x2Paired t test-Variable | Obs Mean Std. Err. Std. Dev. 95% Conf. Interval-+-x1 | 9 122.6667 4.232808 12.69843 112.9058 132.4275x2 | 9 125.3333 5.74698 17.24094 112.0808 138.5859-+-diff | 9 -2.666667 5.61496 16.84488 -15.61479 10.28145-mean(di
11、ff) = mean(x1 - x2) t = -0.4749Ho: mean(diff) = 0 degrees of freedom = 87Ha: mean(diff) 0Pr(T |t|) = 0.6475 Pr(T t) = 0.6762数据录入格式编号 治疗前 治疗后两个样本均数比较(成组设计)7. 例 欲研究某药物对血红蛋白含量是否有影响,把 18 例患者随机分为实验组(用该药物治疗)和对照组(用对血红蛋白无影响的标准药物治疗),每组各 9 例,治疗后两组患者血红蛋白含量如下表。试问,该药物是否影响血红蛋白含量?实验组 122 113 141 123 105 124 144 11
12、5 117对照组 148 129 156 122 121 105 123 100 126答:该题选用两样本均数 t 检验,按 =0.0500 水准,t= -0.3952,P=0.6979,P 0.05,不拒绝假设检验 H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。. ttest x,by(g)数据录入格式编号 分组 测量值bh g x1 1 1222 1 1133 1 1414 1 1235 1 1056 1 1247 1 1448 1 115bh x1 x21 122 1452 113 1283 141 1564 123 1225 105 1216 124 1057 144 12
13、38 115 1019 117 12789 1 1171 2 1482 2 1293 2 1564 2 1225 2 1216 2 1057 2 1238 2 1009 2 126答:该题选用两样本均数 t 检验,按 =0.0500 水准,t= -0.3952,P=0.6979,P 0.05,不拒绝假设检验 H0,差异无统计学意义,尚不能认为该药物影响血红蛋白含量。软件计算过程及结果如下:. ttest x,by(g)Two-sample t test with equal variances-Group | Obs Mean Std. Err. Std. Dev. 95% Conf. Int
14、erval-+-1 | 9 122.6667 4.232808 12.69843 112.9058 132.42752 | 9 125.5556 5.960777 17.88233 111.81 139.3011-+-combined | 18 124.1111 3.563512 15.1187 116.5928 131.6295-+-diff | -2.888889 7.310782 -18.38705 12.60928-diff = mean(1) - mean(2) t = -0.3952Ho: diff = 0 degrees of freedom = 16Ha: diff 0Pr(T
15、 |t|) = 0.6979 Pr(T t) = 0.6510多个样本均数比较(成组设计)8. 例 欲研究药物 A、B 对血红蛋白含量是否有影响,把 15 例患者随机分为 A药组(用 A 药物治疗)、B 药组(用 B 药物治疗)和对照组(用安慰剂治疗),每组各 5 例,治疗后各组患者血红蛋白含量如下表。试问,药物 A、B 是否影响血红蛋白含量?9A 药组 122 113 141 123 105B 药组 144 126 156 122 121对照组 101 111 113 100 101数据录入格式编号 组别 测量值. one x g,t bbh gr x1 1 1222 1 1133 1 14
16、14 1 1235 1 1051 2 1442 2 1263 2 1564 2 1225 2 1211 3 1012 3 1113 3 1134 3 1005 3 101答:该例题运用方差分析(F 检验),按 =0.0500 水准,经方差分析, P= 0.0112,P 0.05,不拒绝假设检验 H0,差异无统计学意义;组次 2 与 3 (即 B 药物和安慰剂)比较,P= 0.010,P F10-Between groups 2050.53333 2 1025.26667 6.68 0.0112Within groups 1842.4 12 153.533333-Total 3892.93333
17、 14 278.066667Bartletts test for equal variances: chi2(2) = 2.7072 Probchi2 = 0.258Comparison of x by gr(Bonferroni)Row Mean-|Col Mean | 1 2-+-2 | 13| 0.369|3 | -15.6 -28.6| 0.209 0.010配伍组设计多个样本均数比较9. 例 为研究药物 A、B 对血红蛋白含量是否有影响,把 15 例患者根据性别、年龄、文化程度等因素分为 5 个区组,即每个区组的 3 个人性别相同、年龄和文化程度相近,再把每个区组的 3 个人随机分配
18、到 A 药组(用 A 药物治疗)、B 药组(用 B 药物治疗)和对照组(用安慰剂治疗)中。治疗后各组患者血红蛋白含量如下表。试问,药物 A、B 是否影响血红蛋白含量?区组号 1 2 3 4 5A 药组 1 122 113 141 123 105B 药组 2 144 126 156 122 121对照组 3 103 110 115 100 101数据录入方法区组 组别 血红蛋白含量. anova x pw gr. regpw gr x1 1 1221 2 1441 3 103112 1 1132 2 1262 3 1103 1 1413 2 1563 3 1154 1 1234 2 1224 3
19、 1005 1 1055 2 1215 3 101答:该题选用方差分析(F 检验),按 =0.0500 水准,经方差分析, F=17.61,P= 0.0012,P F-+-Model | 3369.73333 6 561.622222 10.07 0.0023|pw | 1406.4 4 351.6 6.31 0.0136gr | 1963.33333 2 981.666667 17.61 0.0012|Residual | 446 8 55.75 -+-Total | 3815.73333 14 272.552381 regSource | SS df MS Number of obs =
20、15-+- F( 6, 8) = 10.07Model | 3369.73333 6 561.622222 Prob F = 0.0023Residual | 446 8 55.75 R-squared = 0.8831-+- Adj R-squared = 0.7955Total | 3815.73333 14 272.552381 Root MSE = 7.4666-x | Coef. Std. Err. t P|t| 95% Conf. Interval-+-pw |2 | -6.666667 6.096447 -1.09 0.306 -20.7251 7.3917653 | 14.33
21、333 6.096447 2.35 0.047 .2749012 28.391774 | -8 6.096447 -1.31 0.226 -22.05843 6.0584325 | -14 6.096447 -2.30 0.051 -28.05843 .0584321|gr |2 | 13 4.722288 2.75 0.025 2.110385 23.889613 | -15 4.722288 -3.18 0.013 -25.88961 -4.110385|_cons | 123.6667 5.100654 24.25 0.000 111.9045 135.4288-13样本率与总体率的比较
22、10. 例 据大量调查知,一般溃疡病患者中有 20%发生胃出血症状,某医生观察245 例 70 岁以上溃疡病人,其中 75 例发生出血症状,问老年患者与一般患者胃出血发生率是否不同?答:经正态近似法检验,得 P=0.0000,按 =0.0500 水准拒绝 H0,可认为 0.2000,故老年患者与一般患者胃出血发生率不同。软件计算过程及结果如下:样本率与总体率比较的假设检验:正态近似法(不校正)Ho:=0.2000H1:0.2000=0.0500(双侧)已知:样本阳性数 X 为 75,样本含量 n 为 245。u=4.1527P(Left) =0.99998347P(Right) =0.0000
23、1653P(2-Tailed)=0.00003306说明:P(Left) 左 单 侧:表示从 0 到 X 的累计概率P(Right) 右 单 侧:表示从 X 到 n 的累计概率结论:经检验,得 P=0.0000,按 =0.0500 水准拒绝 H0,可认为 0.2000提示:此资料满足正态近似法的应用条件,可选择正态近似法。. bitesti 245 75 0.2,d完全随机设计两个样本率的比较(四格表资料)11. 例 为研究甲乙两种药物对胃溃疡的治疗效果,选择了 128 名病例,随机分为两组,治疗结果结果如表 1。问甲乙两种药物对胃溃疡的疗效有无差别?表 1 甲乙两种药物对胃溃疡的疗效治疗结果
24、组别痊愈 无效 合计A 药物 60 4 64B 药物 48 16 6414合计 108 20 128. tabi 60 448 16,chi2 r 答:本题采用卡方检验,按 =0.0500 水准, 2=8.5333,自由度=1,P=0.003,P |z| = 0.000014. 例 某研究得资料如表 2,问病型与患者痰液中 SB 的含量是否有关系?表 2 病型与患者痰液中 SB 含量的关系SB 含量病型- + + + 合计A 型 12 22 34 22 90B 型 11 12 32 2 57C 型 10 34 23 1 68D 型 5 2 23 3 33合计 38 70 112 28 248.
25、 cleargroup y pop1 1 121 2 22171 3 341 4 222 1 112 2 122 3 322 4 23 1 103 2 343 3 233 4 14 1 54 2 24 3 234 4 3. expand pop. kwallis y,by(group)答:经秩和检验,P=0.0005,P F = 0.0006Residual | 39.7701607 6 6.62836011 R-squared = 0.8757-+- Adj R-squared = 0.8550Total | 320 7 45.7142857 Root MSE = 2.5746-y | Co
26、ef. Std. Err. t P|t| 95% Conf. Interval-+-x | 2.878581 .442715 6.50 0.001 1.795296 3.961865_cons | 117.0605 4.016983 29.14 0.000 107.2313 126.889722-生存分析生存资料的效应变量有两个,一个是生存时间,一个是结局(是否死亡,是否复发)。如第一个数据 200,表示两层含义:该患者的结局是复发了,时间是 200 天。生存资料存在截尾数据。截尾数据一般在数据后加一个“+”号,以便与完全数据(即观察到要研究的结局的数据)相区别。生存率的计算有两种方法:一种是
27、乘积极限法(Product-limit method),又称 Kaplan-Meier 法;另一种是寿命表法(life table method),仅用于大样本生存资料。生存率的假设检验常用 log-rank 检验,也称时序检验。17. 例 分别用两种化疗方案治疗晚期胃癌患者,治疗后随访观察缓解时间(天),直到复发。结果见表 1,比较两种方案的疗效。A 方案 200 155+ 300+ 166 215 312+ 213 166 222B 方案 135 139+ 143 150 155 141+ 140 137数据录入格式 y=0,死亡;y=1,截尾数据组别 gr 编号 bh 生存时间 t 结局
28、 y. cleargr bh t y1 1 200 01 2 155 11 3 300 11 4 166 01 5 215 01 6 312 11 7 213 01 8 166 01 9 222 02 1 135 02 2 139 12 3 143 02 4 150 02 5 155 02 6 141 1232 7 140 02 8 137 0. stset t,f(y=0). sts test gr, logrank答:该例题选 log-rank 检验,经时序检验,按 =0.0500 水准,经分析知2=15.35,P =0.0001,P chi2 = 0.000124根据统计量计算 P 值这
29、是统计软件的一个辅助功能,用于根据统计量计算 P 值,或者根据 P 值计算统计量。. help function18. 例 根据统计量计算 P 值t=1.47,自由度 =87 时的单侧概率值ttail(df,t) Description: the reverse cumulative (upper tail or survivor) Students t distribution; the probability T t. di ttail(87,1.47).07258451答:P= 0.07258451t=1.47,自由度 =87 时的双侧概率值. di 2*ttail(87,1.47).1
30、4516902答:P= 0.14516902z=3.3,单侧概率值. di normal(-3.3).00048342答:P= 0.00048342z=3.3,双侧概率值. di 2*normal(-3.3).00096685答:P= 0.00096685z=4,单侧概率值. di normal(-4)25.00003167答:P= 0.00003167z=4,双侧概率值. di 2*normal(-4).00006334答:P= 0.00006334z=4.5,单侧概率值. di normal(-4.5)3.398e-06答:P= 3.398e-06z=4.5,双侧概率值. di 2*nor
31、mal(-4.5)6.795e-06答:P= 6.795e-06卡方值4.66,自由度1 时单侧概率值 Pchi2tail(df,x)Description: the reverse cumulative (upper tail or survivor) chi-squared distribution with df degrees of freedom; 1 if x 0. di chi2tail(1,4.66).03087319答:P= 0.03087319卡方值6.66,自由度1 时单侧概率值 P. di chi2tail(1,6.66).00986009答:P= 0.00986009
32、19. 例 根据 P 值计算统计量当左侧概率值 P=0.05 时计算 Z 值invnormal(p)Description: the inverse cumulative standard normal distribution: if normal(z) = p, then invnormal(p) = z. di invnormal(0.05)-1.644853626答:Z= -1.6448536当左侧概率值 P=0.025 时计算 Z 值. di invnormal(0.025)-1.959964答:Z= -1.959964当左侧概率值 P=0.0228 时计算 Z 值. di invn
33、ormal(0.0228)-1.9990772答:Z= -1.9990772当左侧概率值 P=0.01 时计算 Z 值. di invnormal(0.01)-2.3263479答:Z= -2.3263479当左侧概率值 P=0.005 时计算 Z 值. di invnormal(0.005)-2.5758293答:Z= -2.5758293当左侧概率值 P=0.0013499 时计算 Z 值. di normal(-3).0013499. di invnormal(0.0013499)-2.9999996答:Z= -2.999999627广州中医药大学试卷(B 卷)课 程 名 称 : 医学统
34、计学 软件应用 考 试 时 间 : 2019-12-29班级: 学硕一班 学号 20161112621 姓名: 王晓歌 题号得分评分人按要求对以下各类统计表进行运算1.两组年龄(岁)比较表1 两组年龄(岁)比较两组年龄构成比较,经 2检验,结果提示差异 无 统计学意义。. clear. tabi 17 20 8 1118 13 16 6两组平均年龄比较,经 t检验,结果提示差异 有 统计学意义。. ttesti 56 17.2 1.8 53 20.2 1.6总的统计学结论两组年龄比较,差异 有 统计学意义。2. 两组性别比较表2 两组性别比较组 别 例数 男 女治疗组 27 20 7对照组 2
35、4 22 2确切概率Fishers exact P0.147两组性别比较,差异 无 统计学意义。组 别 例数 15-17 18-19 20-21 22-36 xs治疗组 56 17 20 8 11 17.21.8对照组 53 18 13 16 6 20.21.625.5723 P0.134 t= -9.1776 ,P= 0.0000 28. tabi 20 722 23. 两组治疗前胸闷比较表3 两组治疗前胸闷比较组 别 例数 无 轻 中 重治疗组 94 6 40 45 3对照组 77 5 35 29 8Wilcoxon秩和检验 z0.1105 P0.9120两组治疗前胸闷比较,差异 无 统计
36、学意义。cleartabi 6 40 45 35 35 29 8expand popranksum col, by( row)4. 两组治疗前咽痛、流涕、鼻塞、喷嚏、便干、尿黄比较表4 两组治疗前咽痛、流涕、鼻塞、喷嚏、便干、尿黄比较组 别 例数 咽痛 流涕 鼻塞 喷嚏 便干 尿黄治疗组 100 91 90 55 92 86 90对照组 100 74 80 49 79 61 822 10.0087 3.9216 0.7212 6.8159 16.0442 2.6578 P 0.002 0.048 0.396 0.009 0.000 0.103两组治疗前咽痛比较,差异 有 统计学意义。clear
37、tabi 91 9 74 26,ch两组治疗前流涕比较,差异 有 统计学意义。tabi 90 1080 20,ch两组治疗前鼻塞比较,差异 无 统计学意义。tabi 55 45 49 51,ch两组治疗前喷嚏比较,差异 有 统计学意义。tabi 92 8 79 21,ch两组治疗前便干比较,差异 有 统计学意义。tabi 86 14 61 39,ch两组治疗前尿黄比较,差异 无 统计学意义。Tabi 90 10 82 18,ch5. 两组治疗前舌苔比较表5 两组治疗前舌苔比较组 别 例数 薄 薄黄 黄厚 黄腻29治疗组 142 25 74 26 17对照组 126 35 43 22 262=1
38、1.1820 P= 0.011两组治疗前舌苔比较,差异 有 统计学意义。tabi 25 74 26 1735 43 22 266. 两组治疗前痰培养比较表6 两组治疗前痰培养比较组 别 例数 细菌培养阴性 细菌培养阳性治疗组 21 10 11对照组 14 10 4检验方法:确切概率Fishers exact P= 0.296统计判断:两组治疗前痰培养比较,差异 无 统计学意义。tabi 10 11 10 47. 总疗效比较表7 总疗效比较组 别 例数 近期临床痊愈(%) 显效(%) 有效(%) 无效(%)治疗组 110 65 24 16 5对照组 110 44 18 40 8Wilcoxon秩
39、和检验 z -3.451 P= 0.0006cleartabi 65 24 16 544 18 40 8,rexpand popranksum col, by( row)统计判断:两组总疗效比较,差异 有 统计学意义。治疗组近期临床痊愈率为 59% ,显效率为 22% ,有效率为 15% ,近期临床痊愈率及显效率为 81% ,总有效率为 95% ;对照组近期临床痊愈率为 40% ,显效率为 16% ,有效率为 36% ,近期临床痊愈率及显效率为 56% ,总有效率为 93% 。8. 咳嗽改善程度比较表8 咳嗽改善程度比较组 别 例数 加重 无改善 改善1级 改善2级 改善3级治疗组 130 3
40、 5 75 42 5对照组 106 4 6 66 28 230Wilcoxon秩和检验 z1.497 P= 0.1344 改善I级表示:症状治疗后第5天较治疗前降低1级改善2级表示:症状治疗后第5天较治疗前降低2级改善3级表示:症状治疗后第5天较治疗前降低3级下同。统计判断:两组咳嗽改善程度比较,差异 无 统计学意义。cleartabi 3 5 75 42 54 6 66 28 2expand popranksum col, by( row)9. 咯痰改善程度比较表9 咯痰改善程度比较组 别 例数 加重 无改善 改善1级 改善2级 改善3级治疗组 140 12 9 58 60 1对照组 119
41、 9 13 59 36 2Wilcoxon秩和检验 z1.635 P=0.1021统计判断:两组咯痰改善程度比较,差异 无 统计学意义。cleartabi 12 9 58 60 19 13 59 36 2expand popranksum col, by( row)10.治疗10天后临床症状消失率比较表10 治疗10天后临床症状消失率比较组别 症状 原有例数 消失例数 消失率% 2 P治疗组 咳嗽 100 79 79对照组 100 46 46 23.2320 0.000治疗组 咯痰 100 89 89对照组 100 67 67 14.1026 0.000治疗组 胸闷 100 90 90对照组 100 65 65 17.1186 0.000治疗组 发热 100 87 87对照组 100 69 69 9.4406 0.002治疗组 口渴 100 93 93对照组 100 78 78 9.0744 0.003