1、99 99 99 基础理论与方法99 回归模型中交互作用的分析及评价 邱宏余德新 王晓蓉付振明 谢立亚 【导读】流行病学病因学研究常运用回归模型分析影响因素的作用,并利用纳入乘积项 的方法分析因素间交互作用,如有统计学意义表示两因素间存在相乘交互作用,但乘积项若元统计学 意义并不表示两因素间相加交互作用或生物学交互作用的有无。文中介绍提出的针对 或回归模型的三个评价相加交互作用的指标及其可信区间的计算,并以 软件 应用实例分析得出回归模型的参数估计值和协方差矩阵,引入等编制的计算 表,计算相加交瓦作用指标及其可信区间,用于评价因素间的相加交互作用,为研究人员分析生物学 交互作用提供依据。该方法
2、方便快捷,且计算表可在线免费下载。 【关键词】回归模型;相加交互作用指标;女性肺癌 ,奄一 , , , , 。 , :死一 ,: 【】 , 舾 , 。 【 】 ; ; ” 多元统计分析中,交互作用是指某因素的作用 随其他因素水平的不同而不同,两因素同时存在时 的作用不等于两因素单独作用之和(相加交互作用) 或之积(相乘交互作用)。目前多采用在回归方程中 纳入因素乘积项的方法进行分析。一般认为,线性 回归模型为相加模型,乘积项反映因素间是否有相 加交互作用,而回归或回归模型为相乘 模型,乘积项反映因素间是否有相乘交互作用。 若回归模型的乘积项系数不等于零且有统 计学意义,表示两因素存在相乘交互作
3、用,但若乘积 作者单位:香港中文大学公共卫生学院社区及家庭医学系 通讯作者:余德新,: 项无统计学意义,并不表示两因素无相加交互作用, 也不表示两因素对某疾病的发生无生物学交互作 用 旧,和指出 或回归模型中乘积项分析的不足,从理 论上系统探讨了交互作用分析指标的构造和算法。 向惠云等曾介绍反映相加交互作用的三个指标和 可信区间的计算方法,因其计算过程复杂未得到推 广使用。本研究拟以回归分析为例,介绍利 用软件的分析结果进一步计算交互作用的评 价指标,并引入等哺编制的计算表 估计可信区间,以期为病因学研究中评价因素间的 相加交互作用提供简便快捷的方法,亦为研究人员 万方数据 PDF Water
4、mark Remover DEMO : Purchase from www.PDFWatermarkR to remove the watermark 分析生物学交互作用提供依据。 基本原理 以最简单的两因素两水平为例。假设两暴露因 子分别为、,表示因素存在,表示因素不存在, 因变量为疾病的发生与否,其他混杂因素暂不考虑。 回归模型得到的值作为相对危险度 ()的估计值。表示、都不存在时发病 的值,分析时以此为基准,因此; 表示仅存在、不存在时发病的值;。表 示不存在、仅存在时发病的值;。,表示 、共同存在时发病的值。 和用于评价相加交互作用的 三个指标,即相对超危险度比( ,) ;归因比( ,
5、);交互作用指数 ( ,)(一)(一) (。一)。如果两因素无相加交互作用,则 和的可信区间应包含,的可信区间应 包含。 用于评价相乘交互作用的指标是: 。(。),如果两因素无相乘交互作用, 则该指标的可信区间应该包含。容易证明,此相 乘交互作用指标即回归模型中乘积项的 值。这也进一步说明回归模型中乘积 项反映的是相乘交互作用。 交互作用指标的点估计:回归模型估 计,。、。和。可通过以下两种方法得到,代入交互作用指标的计算公式即可得该指标的点估 计值。()用两因素、及乘积项构建模型。 (南)。风卢屉 ()(糍)(,)() 岛一岛岛净净四 ()(糍)()一() 岛一岛岛净净如 ()(糍)()一(
6、) 岛风 岛一艮区慝岛净净 如吩 99 99 评价相乘交互作用的指标是:,。(。 )如邑(99 屯)屯,说明模型中乘 积项的值即反映相乘交互作用。 ()构造新变量并以三个哑变量的形式纳 入,构建模型(表)。 表 根据两分类变量、构造新变量和三个哑变量 值 【丁当 艮 融 ,。 ,屯, 可见,模型中的。、分别等同于模型中的。、 ,而口,等于模型中的。岛。交互作用指标的区间估计:运用和 【介绍的方法估计可信区间,计算 所需的因素间方差和协方差项可由的 过程选中“ ”得到 的协方差矩阵代入计算。本研究引用 等编制的计算表,输入模型的。、 (融 融)或模型的,、,以及因素、间 的方差和协方差,可以方便
7、快捷地得到、 和的估计值及其,进而评价因素间是否具 有相加交互作用。 软件的 过程用于无序 多分类反应变量的回归建模,当因变量为两 分类时,过程与 过程得到 的参数估计值结果一致,但前者可以给出因素间的 协方差矩阵。 实例分析 以香港女性肺癌的病例对照研究资料为例,分 析吸烟和癌症家族史在女性肺癌发生过程中有无交 互作用(表)。为简化计算,暂不考虑其他因素的 作用和混杂因素的影响。 构造乘积项,利用软件的 过程得到模型的参数估计值(表 )。或构造新变量 ,以哑变量形式纳入 得到模型的参数估计值(表)。 用软件的过程,因变量选择 万方数据 PDF Watermark Remover DEMO :
8、 Purchase from www.PDFWatermarkR to remove the watermark 99 99 以作为参照,对自变量重新编 码,定义和都不存在的水平为最高水 平(因 软件中默认以自变量 的最高水平为参照),并选中 估计的方差、协方差矩阵(表)。 表 香港女性肺癌病例对照研究的癌症家族史 和吸烟资料 注:资料为调查所得,表内数据为实际样本量放大倍 表 模型的回归结果 表 模型的回归结果 项目 将上述模型的,、 、(。,)或模型 的岛、 、 以及因素间的方差和协方差输入 计算表(表),可得到、和的点估计、 及交互作用示意图(图)。 本例模型乘积项无统计学意 义(),说
9、明两因素无相乘交互作用,癌症 家族史和吸烟对香港女性肺癌的发生没有相乘交互 作用;计算表显示、的可信区间大于 ,的可信区间大于,图直观显示癌症家族史 与吸烟交互作用值的大小,说明癌症家族史和 吸烟对香港女性肺癌的发生有相加交互作用(此为 协同作用)。和意义相同,表示全部病 例中可归因于两因素交互作用的病例所占的比例, 本例,说明全部女性肺癌病例中归因于 癌症家族史和吸烟的交互作用所引起的病例占 。但因本研究分析未考虑其他因素的作用及 混杂因素的影响,且分析时为了缩窄可信区间用了 实际观察的倍样本量分析,所得结论不一定代表 真实情况。 表 相加交互作用指标计算表 恤 宙 口皿 黝 囹囫 注:为不
10、吸烟且无癌症家族史的类别。殳为对照组, 圈 癌症家族史与吸烟交互作用示意图 讨论分析交互作用,首先应该清楚统计学交互作用 和生物学交互作用的区别川。统计学交互作用是 关于多风险因素的统计模型和参数的定量概念,指 在统计模型中纳入乘积项的意义,即随选用模型的 不同而不同:线性模型是加法模型,乘积项表示有无 相加交互作用,而对于或等乘法模型, 乘积项表示有无相乘交互作用。生物学交互作用是 关于多风险因素在发病的生物机制上的定性概念, 指两因素皆为病因的前提下是否具有在发病的生物 机制上的相互联系,包括协同作用和拮抗作用。生 物学交互作用的评价不能等同于统计模型中乘积项 的分析。 【认为,生物学交互
11、作用的评价应该 酣坦考 心舻 万方数据 PDF Watermark Remover DEMO : Purchase from www.PDFWatermarkR to remove the watermark 基于相加尺度而非相乘尺度,因此对、回 归等相乘模型构建了本文介绍的三项指标,用于评 价因素间是否有区别于相乘交互作用的相加交互作 用。实际应用中可以用软件计算的模型参数 估计值和因素间的协方差矩阵,代入 等哺编制的计算表,方便快捷地得出三个相 加交互作用指标的点估计和可信区间,为流行病学 研究人员分析生物学交互作用提供参考依据。但是 相加交互作用是否即表示生物学交互作用,笔者认 为还值得
12、商榷,可能是两因素均为病因前提下的相 加交互作用可以解释为生物学交互作用。 本研究给出了一个没有相乘交互作用但有相加 交互作用的例子,实际分析中还可能碰到有相乘交 互作用但不一定有相加交互作用的情况。因为相乘 交互作用有统计学意义有两种情况:负相乘 ()和正相乘(),有负相乘交互但无相 加交互的情况在我们的资料分析中常常可见,也有 相关文献为证埔;而有正相乘交互时,对应的相加交 互作用应该也有统计意义,这是从相乘、相加交互的 概念上来推论的,还有待证实。 本法适用于两因素两水平时的相加交互作用的 评价,当两因素或其中之一为保护因素时,因素变量 的编码应以高风险的一类作为暴露,以避免解释上 的混
13、乱口。例如注射疫苗是某病的保护因素,在分 析其与环境因素的交互作用时,将注射疫苗编码为 ,而不注射编码为。实例分析多有混杂因素存 在,可在拟合回归模型时加入混杂因素分 析,然后将得到的参数估计值和协方差矩阵代入 计算表。当因素变量为多分类或连续变量时, 三个交互作用指标仍可应用,等对此有详细 阐述。但对于可信区间的估计方法,本研究引入的 计算表不再适用,掣引提出 法优于和介绍的法:99 99 法在原始数据中做重复千次、万次的模拟 随机抽样,估计的可信区间更稳定可靠;且当因素为 连续变量时,每改变个单位或个单位将导致 ,和及其可信区间的非线性变化,对此 法能做出准确估计而法不能。因此 用回归模型
14、分析两个连续自变量或连续变 量与分类变量间的交互作用时,其相加交互作用指 标可信区间的估计建议使用方法。 参考文献 】 , , 。 ,(): 【 , : : 】 : : ,: 】 , ,: 【向惠云,余松林,孙奕,等疾病资料多元分析中交互作用指标 及可信区间的估计中国卫生统计,: , , , ,: , : ¥ ,: 】 , , , : 、 , ,(): 】 ,口 , , ,:99 (收稿日期:) (本文编辑:张林东) 万方数据 PDF Watermark Remover DEMO : Purchase from www.PDFWatermarkR to remove the watermark