1、统计分析结果在论文中的正确表达,医学论文中的结构主要由摘要、前言、材料与方法(资料与方法、或对象与方法)、结果、讨论五个部分组成。据统计,在医学期刊发表的研究论著中,三分之二以上涉及统计结果的表达与解释问题。而重要的统计表达与解释主要集中在论文的“材料与方法”、“结果”和“讨论”三部分。,一、“材料与方法”的统计表达,1、“材料与方法”中应具体地描述研究对象的来源和选择方法,包括观察对象的基本情况、无随机分组(随机抽样)、样本含量估计的依据等。,一、“材料与方法”的统计表达,2、若进行了随机化分组,应说明具体的随机方法。对于非随机化分组的观察性研究(含调查研究),除要明确说明观察对象的选择方法
2、外(是否配对、随机抽样),还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。,一、“材料与方法”的统计表达,3、对于临床试验,还特别需要说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、有无失访及失访比例、有无“知情同意”、评价疗效有无遮蔽(“单盲”、“双盲”或“多盲”)等,以使读者确认论文中所有统计分析结果的可靠性和研究结论的合理性。,一、“材料与方法”的统计表达,4、论文中采用的统计分析方法和统计计算的软件名称也要在“材料与方法”中说明。一般的常用统计方法简单说明即可,如X2检验、t检验、单变量方差分析(ANOVA)等,对一些特殊的统计方法,如多元回归分析、Logistic回归
3、分析、因子分析、生存分析、重复测量资料方差分析等,要同时给出相应的参考文献。统计计算软件一般给出名称即可,如EXCEL、SPSS、SAS等,但对于一些特殊的计算,要给出软件的过程名,如重复测量资料方差分析采用SPSSGLM,曲线回归拟合采用SPSS/Nonlinear.,一、“材料与方法”的统计表达,5、 “材料与方法”统计表达常见的问题(1)对研究对象的来源和选择方法不做任何说明或只做非常简单的说明。例如,动物实验只说明经随机化分组,未说明具体的随机化分组方法(如完全随机、配对或分层随机分组等),一、“材料与方法”的统计表达,5、 “材料与方法”统计表达常见的问题 (2)观察对比的研究只说明
4、组间均衡,未给出反映均衡的统计学指标。 (3)临床试验的疗效评价只说明采用了“盲法”,未说明是受试者遮蔽还是评价者遮蔽。 (4)对统计分析方法不做任何说明,尤其对一些特殊的统计方法。 (5)实验或试验选取的样本量很小,如每组2例,却不说明任何理由。,“材料与方法”关于组间均衡的比较,如因素比较多可用统计表的形式给出。,外展服务干预前后女性从业人员的人口学社会学特征比较,二、“结果”的统计表达,1、统计图表的应用(另述),2、数据的精确度: (1)计量资料的统计指标( 、S、中位数等)要保留的小数位数,应与原始数据记录的小数位数相同。 (2)计数资料的百分比保留一位小数,一般不超过两位小数。 (
5、3)检验统计量,如X2值、t值一般保留两位或三位小数。,二、“结果”的统计表达,3、选择正确的统计描述指标 (1)计量资料常用 描述研究结果的数据特征,但必须注意前提是要求数据近似服从正态分布。如数据明显偏态,应采用中位数和四分位数间距描述数据特征。 (2)分类资料常用的统计描述指标有率和构成比。医学文献中率与构成比应用主要问题:分母太小。分母太小时,率(构成比)的可靠性差,此时宜用绝对数描述而不宜计算率(构成比); 将构成比误用为率来说明事物发生的强度。,二、“结果”的统计表达,4、假设检验结果的表达 (1)假设检验统计结论的表述,宜用“差异无统计学意义”或“差异有统计学意义”,避免过去采用
6、的“差异无显著性”或“差异有显著性”表述方式。因为有些研究者常将“差异”与“显著性”关联起来!这是不妥的。“显著性是统计学概念,只是说明假设检验结果的 P值有无统计学意义,不是说明“差异”有无实际意义。假设检验结果的实际意义要依靠专业知识判定。另外,不能仅仅给出P值,还应给出检验统计量的实际值,如u值、t值、X2值等,二、“结果”的统计表达,4、假设检验结果的表达 (2)P值的表达要逐渐改变把P0.05记为“NS”;P0.05记为“” ;P0.01记为“”的传统P值的表达方式,提倡报告P的具体数值,如P=0.023或P=0.437等。主要理由有3个:选定0.05和0.01这两个界值,是由于没有
7、使用计算机以前,手工计算P值很困难,需要通过查界值表估计P值。现在用统计软件处理数据,软件会自动给出P值大小。研究者不能不顾具体情况只用一个固定的界值判断问题,应该根据自己对问题的认识程度,具体问题具体分析。例如P二0.051与P=0.049都是小概率,不能简单地断定P=0.051无统计学意义,P=0.049有统计学意义。P值是循证医学最重要的“证据”之一,一些meta分析方法必须根据P的实际值对同类研究结果进行综合。,三、“讨论”中假设检验结果的解释,在论文的“讨论”部分,通常要引用P值,并对假设检验结果做出专业上的解释。P值是指在“无效假设” (如施加干预以前,组间无差别,或观察对象来自同
8、一总体)正确的前提下,说明实际观察结果与“无效假设”吻合的概率。P值小则怀疑“无效假设”的正确性, “有统计学意义,显著”;P值大则不能拒绝“无效假设”,“无统计学意义,不显著”。所以, P值大小只能说明统计学意义的“显著”,不说明实际效果的“显著”。,三、“讨论”中假设检验结果的解释,当样本含量(观察例数)足够答,抽样误差趋于0。因此无论组间相差多少,都能得到足够小的P值,从而“显著,有统计学意义。以临床试验为例,临床疗效“不显著”的干预(如新药比对照药有效率仅提高了0.1),当观察例数很大时,P值可能很小(统计“显著”);反之,临床疗效“显著”的处理(如新药的有效率比对照药提高了10),当观察例数很少时,P值可能很大(统计“不显著”)。所以,统计学意义的所谓”显著“,不一定是实际意义上的”显著“。因此,对假设检验结果的实际意义(临床意义)的判断,一定要结合专业知识。当专业上和统计学上都具有“显著性”时,试验结果才有实用价值。,2007-11 冯启明,谢谢!,