1、 医学统计学实验报告 杨 阳 200950406 1 Homework1: P426 1. 某研究组测得 120 名女大学生的收缩压( mmHg)并编制频数表如下: 组段 频数 f 频率 % 累计频数 累计频率 % 80 3 2.50 3 2.50 85 7 5.83 10 8.33 90 15 12.50 25 20.83 95 19 15.83 44 36.67 100 38 31.67 82 68.33 105 16 13.33 98 81.67 110 12 10.00 110 91.67 115 7 5.83 117 97.50 120125 3 2.50 120 100.00 合计
2、 120 100.00 要求:计算均数、标准差和变异系数;计算中位数和四分位数间距;试说明采用哪些指标描述其分布特征比较合适,并说明理由;估计该地健康女大学生的收缩压在90mmHg 以下者所占的比例;估计该地健康女大学生收缩压 95%参考值范围。 答:经 SPSS 处理得 Statistics 组中值 N Valid 120 Missing 0 Mean 102.1250 Median 101.9737a Std. Deviation 8.74865 Percentiles 2.5 84.0000b 25 96.1765 50 101.9737 75 107.5000 97.5 121.000
3、0 a. Calculated from grouped data. b. Percentiles are calculated from grouped data. : x =102.1250; S=8.74865; CV=xS =0.0857 : M=101.9737; QR=P75-P25=11.3235 医学统计学实验报告 杨 阳 200950406 2 : 中间组段人数最多 , 累计频率 50%也在中间组段 ,分布图也近似为正态分布,故可判断为正态分布。因此使用均数、标准差等集中趋势指标描述较合适。 : 计算 s xxxu =-1.3859,查附表 1 得曲线下面积为 0.0823,
4、即理论上该地健康女大学生的收缩压在 90mmHg 以下者所占的比例为 8.23%。 : 收缩压过高和过低均属异常,故制定双侧参考值范围。 x 1.96S,即该地 健康女大学生收缩压 95%参考值范围 为 84.9776119.2724。 2. 某地 10 人接种某种疫苗后,测定其抗体滴度如下: 1:2、 1:2、 1:4、 1:4、 1:4、 1:4、 1:8、1:8、 1:16、 1:32,求该疫苗接种后平均抗体滴度。 答: 经 SPSS 处理得 Report Geometric Mean 抗体滴度 5.66 该疫苗接种后平均抗体滴度 为 1:5.66。 3. 某地 220 例正常成年人血铅
5、含量( mol/L)的频数分布如下,试估计该地正常成年人血铅含量的 95%参考值范围。 血铅含量 0 0.24 0.48 0.72 0.96 1.20 1.44 1.68 1.92 2.16 2.40 2.64 频数 12 55 52 36 28 11 13 4 5 1 2 1 累计频数 12 67 119 155 183 194 207 211 216 217 219 220 医学统计学实验报告 杨 阳 200950406 3 答: 经 SPSS 处理得 One-Sample Kolmogorov-Smirnov Test 组中值 N 220 Normal Parametersa,b Mea
6、n .7964 Std. Deviation .49953 Most Extreme Differences Absolute .194 Positive .194 Negative -.137 Kolmogorov-Smirnov Z 2.874 Asymp. Sig. (2-tailed) .000 a. Test distribution is Normal. b. Calculated from data. 统计量 Kolmogorov-Smirnov Z 为 2.874, P 0.05,说明血铅含量组中值不服从近似正态分布,即非正态分布 。故 95%参考值范围使用百分位数法求解。 因
7、为血铅含量为单侧指标, )f%( Lxxxx nxfiLP 1.8=)207%95220(4 4.2086.195 P 所以, 该地正常成年人血铅含量的 95%参考值范围 为 1.8 mol/L。 Homework2: P430 1. 某市 1987 年调查得到 20 岁男大学生 160 人的脉搏数(次 /分),其均数为 76.1,标准差为 9.32,已知该资料服从正态分布,试估计 20 岁男大学生脉搏数的 95%置信区间。 答: 已知且 n 足够大,按正态分布原理,总体均数 可信区间为 n/2/ ux 本例 n=160,视为大样本,由式 n/2/ ux 计算: 54)(7 4 . 6 6 ,
8、 7 7 .=160 2.3996.11.76 该市 20 岁男大学生脉搏数的 95%置信区间 为 74.6677.54。 2. 某地调查了 4050 岁冠心病患者 500 名的血清胆固醇,其均数为 228.6mg/dl,标准差为46.8mg/dl;同时调查了 60 岁以上冠心病患者 30 名的血清胆固醇,其均数为 230.8mg/dl,标准差为 54.9mg/dl,试计算两个不同年龄组冠心病患者血清胆固醇 99%置信区间。 医学统计学实验报告 杨 阳 200950406 4 答: 已知且 n 足够大,按正态分布原理,总体均数 可信区间为 n/2/ ux 小样本用标准差 作为 的估计值,按 t
9、 分布原理,总体均数 的可信区间为n/,2/ Stx v 本例 4050 岁冠心病患者 500 名, n=500,视为大样本,由式 n/2/ ux 计算: .0)(2 2 3 . 2 , 2 3 4=500 8.4658.26.228 本例 60 岁以上冠心病患者 30 名, n=30,视为小样本,由式 n/,2/ Stx v 计算 自由度 =30 1=29,查附表得 vt ,2/ =2.756 .4)(2 0 3 . 2 , 2 5 8=30 9.54756.28.230 某地 4050 岁冠心病患者血清胆固醇 99%置信区间为 223.2234.0; 60 岁以上冠心病患者血清胆固醇 99
10、%置信区间为 203.2258.4。 3. 某临床医师欲了解代谢综合征病人体内脂联素水平,收集了正常人、代谢综合征病人脂联素水平各 15 例,两组人在年龄、性别等基本人口学特征方面均衡可比,试分析之。 正常人、代谢综合征病人脂联素( mg/L) 正常人脂联素 代谢综合征病人脂联素 11.9 6.7 11.4 6.4 10.6 7.0 11.7 5.0 11.6 6.2 10.1 5.7 10.8 4.1 10.2 6.2 10.4 6.3 11.6 7.9 10.4 7.5 11.8 5.6 11.2 5.4 10.7 6.3 10.3 6.7 答:经 SPSS 处理得 One-Sample
11、Kolmogorov-Smirnov Test 医学统计学实验报告 杨 阳 200950406 5 Group 脂联素 正常人 N 15 Normal Parametersa,b Mean 10.980 Std. Deviation .6439 Most Extreme Differences Absolute .166 Positive .149 Negative -.166 Kolmogorov-Smirnov Z .641 Asymp. Sig. (2-tailed) .806 代谢综合征病人 N 15 Normal Parametersa,b Mean 6.200 Std. Devia
12、tion .9592 Most Extreme Differences Absolute .167 Positive .101 Negative -.167 Kolmogorov-Smirnov Z .645 Asymp. Sig. (2-tailed) .799 a. Test distribution is Normal. b. Calculated from data. 经 Kolmogorov-Smirnov 正态性检验, Group1 的正态性检验 P=0.806, Group2 的正态性检验 P=0.799,都可认为近似正态分布。 Independent Samples Test
13、Levenes Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 脂联素 Equal variances assumed .428 .518 16.025 28 .000 4.7800 .2983 4.1690 5.3910 Equal variances not assumed 16.0
14、25 24.488 .000 4.7800 .2983 4.1650 5.3950 1) 建立检验假设和确定检验水准 H0: 1 2 H1: 1 2 =0.05 2) 计算检验统计量 F=0.428, P=0.518 0.05,故可认为方差具有齐性。 t=16.025 医学统计学实验报告 杨 阳 200950406 6 3) 确定 P 值、推断与结论 P 0.05。按 =0.05 水准,拒绝 H0,接受 H1, 该差异具有统计学意义,即正常人、代谢综合征病人在脂联素水平 方面存在差异,正常人脂联素水平高于代谢综合征病人脂联素水平。 4. 为建立一种检测水中硝酸盐氮的新方法(镉柱法),某实验室对
15、 10 份不同类型的水样,分别采用传统方法(二磺酸酚法)和新方法进行比较测定,结果见下表。问两种方法的测定结果( mg/L)是否有差别? 两法测定 10 份水样硝酸盐氮含量结果( mg/L) 水样 二磺酸酚法 镉柱法 河水 4.18 4.42 自来水 4.04 4.17 井水 1 4.36 3.14 井水 2 3.01 2.94 井水 3 1.66 1.20 井水 4 10.31 7.96 井水 5 5.92 9.80 井水 6 2.50 1.43 井水 7 5.98 3.97 井水 8 6.56 4.83 答:经 SPSS 处理得 One-Sample Kolmogorov-Smirnov
16、Test 二磺酸酚法 镉柱法 N 10 10 Normal Parametersa,b Mean 4.8520 4.3860 Std. Deviation 2.48522 2.68814 Most Extreme Differences Absolute .178 .234 Positive .178 .234 Negative -.100 -.118 Kolmogorov-Smirnov Z .564 .741 Asymp. Sig. (2-tailed) .908 .642 a. Test distribution is Normal. b. Calculated from data. 经
17、 Kolmogorov-Smirnov 正态性检验,“二磺酸酚法”、“镉柱法”的 P 值分别为 0.908 和0.642,可认为近似正态分布。 Paired Samples Test Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper 医学统计学实验报告 杨 阳 200950406 7 Pair 1 二磺酸酚法 - 镉柱法 .46600 1.77522 .56137 -.80392 1.7
18、3592 .830 9 .428 1) 建立检验假设和确定检验水准 H0: d 0 H1: d 0 =0.05 2) 计算检验统计量 t=0.830 3) 确定 P 值、推断与结论 P=0.428 0.05。按 =0.05 水准, 不拒绝 H0。 该差异 无 统计学意义 , 尚不能认为 采用传统方法(二磺酸酚法)和新方法(镉柱法)的测定结果( mg/L)有差别 。 5. 将 20 份钩端螺旋体病人血清分为两组,第一组 11 份,用标准株做凝溶实验;第二组 9份,用水生株做凝溶实验,结果如下,问两组的平均效价有无差别? 标准株 100 200 400 400 400 400 800 1600 1
19、600 1600 3200 水生株 100 100 100 200 200 200 200 400 400 答:经 SPSS 处理得 One-Sample Kolmogorov-Smirnov Test Group 效价 标准株 N 11 Normal Parametersa,b Mean 972.73 Std. Deviation 940.309 Most Extreme Differences Absolute .274 Positive .274 Negative -.177 Kolmogorov-Smirnov Z .909 Asymp. Sig. (2-tailed) .380 水生
20、株 N 9 Normal Parametersa,b Mean 211.11 Std. Deviation 116.667 Most Extreme Differences Absolute .316 Positive .316 Negative -.170 Kolmogorov-Smirnov Z .947 Asymp. Sig. (2-tailed) .331 a. Test distribution is Normal. b. Calculated from data 医学统计学实验报告 杨 阳 200950406 8 经 Kolmogorov-Smirnov 正态性检验,“标准株”、“
21、水生株”的 P 值分别为 0.380 和 0.331,可认为近似正态分布。 Independent Samples Test Levenes Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 效价 Equal variances assumed 14.262 .001 2.403 18 .
22、027 761.616 316.949 95.730 1427.502 Equal variances not assumed 2.661 10.375 .023 761.616 286.169 127.105 1396.128 1) 建立检验假设和确定检验水准 H0: 1 2 H1: 1 2 =0.05 2) 计算检验统计量 F=14.262, P=0.001 0.05,故可认为方差 不 具有齐性。 t=2.661 3) 确定 P 值、推断与结论 P=0.023 0.05。按 =0.05 水准,拒绝 H0,接受 H1,该差异具有统计学意义,即 钩端螺旋体病人血清用标准株 和 用水生株做凝溶实
23、验的平均效价有差别 ,标准株效价大于水生株效价。 Homework3: P439 3. 某医生用国产呋喃硝铵治疗十二指肠球部溃疡,以西咪 替丁作对照组,结果见下表。问两种方法治疗效果有无差异(两组性别、年龄、病程、病情等方面均衡可比)? 两种药物治疗十二指肠球部溃疡效果 处理 愈合 未愈 合计 愈合率( %) 呋喃硝铵组 54 8 62 87.10 西咪替丁组 44 20 64 68.75 合计 98 28 126 77.78 答:经 SPSS 处理得 Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Ex
24、act Sig. (1-sided) Pearson Chi-Square 6.133a 1 .013 医学统计学实验报告 杨 阳 200950406 9 Continuity Correctionb 5.118 1 .024 Likelihood Ratio 6.304 1 .012 Fishers Exact Test .018 .011 Linear-by-Linear Association 6.084 1 .014 N of Valid Cases 126 a. 0 cells (.0%) have expected count less than 5. The minimum ex
25、pected count is 13.78. b. Computed only for a 2x2 table 1) 建立检验假设和确定检验水准 H0:两组处理方法的总体愈合率相同,即 1 2 H1:两组处理方法的总体愈合率不同,即 1 2 =0.05 2) 计算检验统计量 Pearson Chi-Square=6.133 3) 确定 P 值、推断与结论 P=0.013 0.05。按 =0.05 水准,拒绝 H0,接受 H1,该差异具有统计学意义,即用呋喃硝铵和西咪替丁治疗 十二指肠球部溃疡愈合率有差异, 呋喃硝铵组治疗溃疡的愈合率高于西咪替丁组。 5. 100 例确诊糖尿病病例,用 A 试带
26、检测结果尿葡萄糖阳性 90 例,同时用 B 试带检测阳性 75 例,其中 A、 B 均阳性 70 例,问 A、 B 两种试带阳性率是否不同 ?请列出分析表格,并进行分析。 答:分析表如下 A 试带 B 试带 合计 70 20 90 5 5 10 合计 75 25 100 经 SPSS 处理得 Chi-Square Tests Value Exact Sig. (2-sided) McNemar Test .004a N of Valid Cases 100 a. Binomial distribution used. 1) 建立检验假设和确定检验水准 H0:两种试带的总体检出率相同,即 B C
27、 H1:两种试带的总体检出率相同,即 B C =0.05 2) 计算检验统计量 医学统计学实验报告 杨 阳 200950406 10 3) 确定 P 值、推断与结论 P=0.004 0.05。按 =0.05 水准,拒绝 H0,接受 H1,该差异具有统计学意义,即两种试带总体检出率不同, A 试带的检出率高于 B 试带检出率。 8. 为研究不同类型原发性肺癌的 nm23-H1 基因表达情况,整理资料如下。问不同类型原发性肺癌的 nm23-H1 基因表达率是否有差别? 不同类型原发性肺癌的 nm23-H1 基因表达资料 分型 表达 不表达 合计 表达率 鳞癌 95 40 135 70.4 腺癌 6
28、5 30 95 68.4 腺鳞癌 20 10 30 66.7 小细胞癌 10 10 20 50.0 合计 190 90 280 67.9 答: 经 SPSS 处理得 Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 3.348a 3 .341 Likelihood Ratio 3.159 3 .368 Linear-by-Linear Association 2.358 1 .125 N of Valid Cases 280 a. 0 cells (.0%) have expected count less t
29、han 5. The minimum expected count is 6.43. 1) 建立检验假设和确定检验水准 H0: 不同类型原发性肺癌的 nm23-H1 基因表达率无差别 H1: 不同类型原发性肺癌的 nm23-H1 基因表达率有差别 =0.05 2) 计算检验统计量 Pearson Chi-Square=3.348 3) 确定 P 值、推断与结论 P=0.341 0.05。按 =0.05 水准, 不拒绝 H0,该差异 无 统计学意义, 尚不能认为不同类型原发性肺癌的 nm23-H1 基因表达率有差别。 11. 某实验室观察局部温热治疗小鼠转移性肿瘤的疗效,以生存日数作为观察指标,
30、实验结果见下表。问局部温热是否有疗效? 实验组 10 12 15 15 16 17 18 20 23 90 对照组 2 3 4 5 6 7 8 9 10 11 12 13 医学统计学实验报告 杨 阳 200950406 11 答:经 SPSS 处理得 Ranks Group N Mean Rank Sum of Ranks Day 实验组 10 17.00 170.00 对照组 12 6.92 83.00 Total 22 Test Statisticsb Day Mann-Whitney U 5.000 Wilcoxon W 83.000 Z -3.630 Asymp. Sig. (2-ta
31、iled) .000 Exact Sig. 2*(1-tailed Sig.) .000a a. Not corrected for ties. b. Grouping Variable: Group 1) 建立检验假设和确定检验水准 H0:接受局部温热治疗与否的小鼠生存日的总体中位数相同 H1:接受局部温热治疗与否的小鼠生存日的总体中位数不同 =0.05 2) 计算检验统计量 3) 确定 P 值、推断与结论 P 0.05。按 =0.05 水准, 拒绝 H0,接受 H1,该差异具有统计学意义,由于实验组平均秩次 17对照组平均秩次 6.92,即接受局部温热治疗小鼠转移性肿瘤后,小鼠生存日长于不
32、接受局部温热治疗小鼠的生存日。 12. 某医生研究盐酸地尔硫唑缓释片治疗心绞痛的效果,观察结果见下表。试比较两组疗效有无差别? 盐酸地尔硫唑缓释片组与普通片组治疗心绞痛的疗效比较 组别 显效 有效 无效 加重 缓释片组 62 18 5 3 普通片组 35 31 14 4 答:经 SPSS 处理得 Ranks Group N Mean Rank Sum of Ranks Effect 缓释片组 88 74.10 6521.00 普通片组 84 99.49 8357.00 Total 172 医学统计学实验报告 杨 阳 200950406 12 Test Statisticsa Effect Ma
33、nn-Whitney U 2605.000 Wilcoxon W 6521.000 Z -3.746 Asymp. Sig. (2-tailed) .000 a. Grouping Variable: Group 1) 建立检验假设和确定检验水准 H0:两种片剂治疗心绞痛疗效的总体中位数相同 H1:两种片剂治疗心绞痛疗效的总体中位数不同 =0.05 2) 计算检验统计量 3) 确定 P 值、推断与结论 P 0.05。按 =0.05 水准,拒绝 H0,接受 H1,该差异具有统计学意义, 两组疗效有差别。 由于缓释片组平均秩次 74.1普通片组平均秩次 99.49,即普通片治疗心绞痛的疗效较缓释片
34、治疗心绞痛的疗效好。 Homework4: P447 1. 为研究大气中 NO 浓度是否受到车流量的影响,选择 12 个工业水平相近的城市的一个交通点,统计单位时间内的车流量。 要求:试用简单线性回归方程来描述空气中 NO 浓度与车流量之间的关系;对回归方程和回归系数分别进行假设检验;绘制回归直线图;根据以上的计算结果,进一步求其总 体回归系数的 95%置信区间;车流量为 1000 时,分别计算个体 Y 值的 95%容许区间和 95%的置信区间,并说明两者的意义。 12 个交通点的大气 NO 含量( 10-6)与车流量(辆) 车流量( X) 1756 1137 947 1352 1906 87
35、7 1038 935 1350 1804 1927 2133 NO( Y) 0.129 0.089 0.057 0.105 0.133 0.064 0.099 0.097 0.118 0.154 0.176 0.202 答:经 SPSS 处理得 One-Sample Kolmogorov-Smirnov Test 车流量 一氧化氮 N 12 12 Normal Parametersa,b Mean 1430.17 .11858 Std. Deviation 452.274 .043177 Most Extreme Differences Absolute .181 .123 Positive
36、.158 .123 Negative -.181 -.080 Kolmogorov-Smirnov Z .627 .428 医学统计学实验报告 杨 阳 200950406 13 Asymp. Sig. (2-tailed) .826 .993 a. Test distribution is Normal. b. Calculated from data. 经 Kolmogorov-Smirnov正态性检验,“车流量”、“一氧化氮”的 P值分别为 0.627和 0.428,可认为近似正态分布。 由图可见一氧化氮浓度与车流量呈直线趋势,故可进行直线回归分析。 Model Summaryb Mode
37、l R R Square Adjusted R Square Std. Error of the Estimate 1 .925a .856 .842 .017181 a. Predictors: (Constant), 车流量 b. Dependent Variable: 一氧化氮 ANOVAb Model Sum of Squares df Mean Square F Sig. 1 Regression .018 1 .018 59.470 .000a Residual .003 10 .000 Total .021 11 a. Predictors: (Constant), 车流量 b.
38、 Dependent Variable: 一氧化氮 Coefficientsa 医学统计学实验报告 杨 阳 200950406 14 Model Unstandardized Coefficients Standardized Coefficients t Sig. 95.0% Confidence Interval for B B Std. Error Beta Lower Bound Upper Bound 1 (Constant) -.008 .017 -.452 .661 -.046 .030 车流量 8.833E-5 .000 .925 7.712 .000 .000 .000 a.
39、 Dependent Variable: 一氧化氮 经 F 显著性检验, F=59.470, P=0.001,因此 该 回归模型 有统计学意义的,即回归方程成立。 1) 建立检验假设和确定检验水准 H0: 0 H1: 0 =0.05 2) 计算检验统计量 t=7.712 3) 确定 P 值、推断与结论 P 0.05。按 =0.05 水准,拒绝 H0,接受 H1,该差异具有统计学意义, 可认为车流量与一氧化氮浓度之间存在直线关系。直线回归方程为: Y= 0.008+8.833 10-5X 将 X=1000, Y=0.0803 输入 SPSS,求的 个体 Y 值的 95%容许区间为 0.0420.
40、119,即当 X=1000 时, Y 的 预测值 的 波动范围为0.0420.119 个体 Y 值的 95%置信区间为 0.0670.094,即当 X=1000 时, Y 的 总体均数 分布范围为0.0670.094 2. 某地 10 名一年级女大学生的胸围(厘米)与肺活量(升)数据如下表所示。 要求:分别计算:相关系数; 10 名一年级女大学生的胸围(厘米)与肺活量(升) 学生编号 1 2 3 4 5 6 7 8 9 10 胸围 X 72.5 83.9 78.3 88.4 77.1 81.7 78.3 74.8 73.7 79.4 肺活量 Y 2.51 3.11 1.91 3.28 2.83
41、 2.86 3.16 1.91 2.98 3.28 答:经 SPSS 处理得 医学统计学实验报告 杨 阳 200950406 15 由图可见 胸围 与 肺活量 呈直线趋势,故可进行直线回归分析。 Correlations 胸围 肺活量 胸围 Pearson Correlation 1 .504 Sig. (2-tailed) .138 N 10 10 肺活量 Pearson Correlation .504 1 Sig. (2-tailed) .138 N 10 10 相关系数 r=0.504 =0 的假设检验 1) 建立检验假设和确定检验水准 H0: 0 H1: 0 =0.05 2) 确定
42、P 值、推断与结论 查表得, r=0.504 时, P 0.05。按 =0.05 水准, 不拒绝 H0,该差异无统计学意义,故 可认为 胸围与肺活量无相关关系。 3. 两名放射科医师对 13 张肺部 X 片各自做出评定结果,评定方法是将 X 片按病情严重程度给出等级。问他们的等级评定结果是否相关。 两名放射科医师对 13 张肺部 X 片得评定结果 医学统计学实验报告 杨 阳 200950406 16 患者编号 1 2 3 4 5 6 7 8 9 10 11 12 13 甲医师 乙医师 答:经 SPSS 处理得 Correlations 甲医生 乙医生 Spearmans rho 甲医生 Cor
43、relation Coefficient 1.000 .808* Sig. (2-tailed) . .001 N 13 13 乙医生 Correlation Coefficient .808* 1.000 Sig. (2-tailed) .001 . N 13 13 *. Correlation is significant at the 0.01 level (2-tailed). 相关系数 r=0.808 =0 的假设检验 1) 建立检验假设和确定检验水准 H0: s 0 H1: s 0 =0.05 2) 确定 P 值、推断与结论 r=0.808 时, P=0.001 0.05。按 =0.05 水准, 拒绝 H0,拒绝 H1,该差异 具有 统计学意义, 故 可认为 甲医师与乙医师的评定结果有相关。