1、药物流行病学中的几个方法学问题,毛宗福 刘 晴 武汉大学公共卫生学院,多重线性回归应用及局限,多重线性回归被广泛应用,但其前提条件,要求结局变量是连续变量,自变量与因变量间具有线性关系。医学研究的诸多结局指标通常是分类变量,例如,服用药品后“发生不良反应与未发生不良反应”,并且自变量与其联系,更多的是非线性关系。对于这类问题,应用线性回归缺乏合理性。,适合结局(因变量)为二分类(包括无序和有序多分类)问题的统计分析 自变量(研究因素)可以为定量变量,也可以是定性变量 只要求结局事件发生与否相互独立,例如传染性较强的疾病发病因素的研究不适合。并且,事件发生概率较小时,可以估计相对危险度指标RR,
2、所以特别适合安全性再评价,Logistic回归适用范围,根据研究设计类型,logistic回归划分为条件与非条件logistic回归 按照自变量个数划分为单变量logistic回归与多变量logistic回归 按照结局变量类别及性质,划分为二分类logistic回归,无序多分类和有序多分类logistic回归,Logistic回归分类,Logistic回归函数曲线,几种logistic回归方程,非甾体抗炎药品上市前研究中,已知可能引起上消化道出血症状。1980年Strom等开展了大样本上市后安全性再评价。回顾性跟踪调查的47 136例服用该药物的患者中,有155例上消化道出血;同期没有服用该药
3、物的44 634例对照中,有96例上消化道出血。,Logistic回归应用(队列资料),22队列资料,出血例数(,未出血例数(,服用该药物(,未用该药物(,上消化道出血症状与非甾体抗炎药物的关系,患者是否服用非甾体抗炎药品为处理因素,共2水平(服用与未服用该药品),X1表示服用该药品,X0表示未服用该药品;上消化道是否出血为结局指标,以Y=1表示发生出血症状,Y=0表示没有发生出血症状;为患者发生上消化道出血症状的概率。,22回顾性队列资料,22队列资料,或,OR的95%置信区间为1.1861.975,下限大于1,因此服用非甾体抗炎药品是上消化道出血症状的危险因素。,22病例对照资料,妇女使用
4、雌激素与患子宫内膜癌的病例-对照,有混杂时的logistic回归,按年龄分层的心肌梗死与近期口服避孕药的关系,logistic回归结果,. xi : logistic y x i.age fw=fi.age _Iage_1-5 (naturally coded; _Iage_1 omitted)Logit estimates Number of obs = 1976LR chi2(5) = 151.47Prob chi2 = 0.0000 Log likelihood = -643.06749 Pseudo R2 = 0.1054-y | Odds Ratio Std. Err. z P|z|
5、 95% CI -+-x | 3.995528 1.001009 5.53 0.000 2.445236 6.528714_Iage_2 | 3.121652 1.48894 2.39 0.017 1.225703 7.950304_Iage_3 | 6.919897 3.171998 4.22 0.000 2.817857 16.9934_Iage_4 | 14.12659 6.353765 5.89 0.000 5.850452 34.11027_Iage_5 | 24.39291 10.91662 7.14 0.000 10.14666 58.64136 -,哑变量及回归系数的解释,多分
6、类变量:哑变量(dummy variable) x1时:D10, D20, D30, D40 表示25-29岁 x2时:D11, D20, D30, D40表示30-34岁 x3时:D10, D21, D30, D40表示35-39岁 x4时:D10, D20, D31, D40表示40-44岁 x5时:D10, D20, D30, D41表示45-49岁exp(1) 表示30-34岁组与25-29岁组比较的OR; exp( 2) 表示35-39岁组与25-29岁组比较的OR; exp( 3) 表示40-44岁组与25-29岁组比较的OR; exp( 4) 表示40-44岁组与25-29岁组比
7、较的OR,条件logistic回归,双黄连注射剂不良反应可能因素有:患者因素(性别、年龄、过敏史),医疗行为因素(医疗机构、滴注速度、合并用药、剂量),药物因素(厂家、批次)等。重点希望探讨药物剂量、用药时间和合并用药种类是否为不良反应的影响因素。以某三甲医院儿科病房2000-2002年病房收治的、符合双黄连注射剂用药要求的,发生不良反应的40例患儿为病例,选择该院儿科病房使用同批次药物,同一病房,入院日期最接近,没有发生不良反应的同性别儿童为对照。,为了提高研究效率,采用1:2匹配设计。,条件logistic回归,向前逐步回归1:2配对资料参数估计结果,结果解释,合并用药数量是发生不良反应事
8、件的危险因素;用药时间是“保护因素”的解释,似乎难以理解,但是结合临床用药实际,不难知道,一旦发生药物不良反应,首先就是停止用药,凡没有发生不良反应者,一般会遵照医嘱继续用药,因此,统计分析结果用药时间为“保护因素”(优势比小于1)是合理的。,方法学应用缺陷(1),评析,由表2知,解脲支原体耐药率P,与2002年相关药物成人剂型的消耗量X1的线性回归方程 P7.231+0.000252X1 不合理性:P取值超出1,方法学应用缺陷(2),方法学应用缺陷(3),文章没有见到logistic分析的痕迹,结果报告不规范、不完整,同时不像是多元logistic回归分析,方法学应用缺陷(4),方法学应用缺陷(5),评析:信息不完整,75岁?,方法学应用规范(6),方法学应用缺陷(7),方法学应用缺陷(8),评析:预测准确率79.8%,几乎没有意义,