1、转载logistic 回归模型 总结logistic 回归模型是最成熟也是 应用最广泛的分类模型,通过学习和实践拟通过从入门、进阶到高级的过程对其进行总结,以便加深自己的理解也为对此有兴趣者提供学习的便利。一、有关 logistic 的基本概念logistic 回归主要用来预测离散因变量与一组解释变量之间的关系最常用的是二值型 logistic。即因变量的取值只包含两个类别例如:好、坏 ;发生、不发生;常用 Y=1 或 Y=0 表示 X 表示解释变量则P(Y=1|X)表示在 X 的条件下 Y=1 的概率,logistic 回归的数学表达式为:log(p/1-p)=A+BX 其中 p/1-p 称
2、为优势 比() 即发生与不发生的概率之比可以根据上式反求出 P(Y=1|X)/(-L )根据样本资料可以通过最大似然估计计算出模型的参数然后根据求出的模型进行预测下面介绍 logistic 回 归在中的实现以及输出结果的解释二、logistic 回归模型初步中回归输出结果主要包括预测模型的评价以及模型的参数预测模型的评价与多元线性回归模型的评价类似主要从以下几个层次进行()模型的整体拟合优度主要评价预测值与观测值之间的总体一致性。可以通过以下两个指标来进行检验、osmer-Lemeshowz 指标HL 统计量的原假设 Ho 是预测值和观测值之间无显著差异,因此 HL 指标的 P-Value 的
3、值越大,越不能拒绝原假设,即说明模型很好的拟合了数据。在中这个指标可以用 LACKFIT 选项进 行调用、AIC 和 SC 指标 即池雷准则和施瓦茨准则与线性回归类似 AIC 和 SC 越小说明模型拟合的越好(2)从整体上看解释变量对因变量有无解释作用相当于多元回归中的 F 检验 在 logistic 回归中可以通过似然比(likelihood ratiotest)进行检验(3)解释变量解释在多大程度上解释了因变量与线性回归中的 R2 作用类似在 logistic 回归中可以通 过 Rsquare 和 C 统计量进行度量在 SAS 中通 过 RSQ 来调用 Rsquare,C 统计量自动输出(4)模型评价指标汇总统计 量趋势拟合作用SAS调用命令备注 AIC、SC越小越好类似与多元回归中的残差平方和模型自动输出似然比卡方越大越好类似与多元回归中的回归平方和自动输出P值越小越好 RSQUARE越大越好类似与多元回归中的 R2用 RSQ选项调用C统计量越大越好度量观测值和条件预测的相对一致性自动输出HL统计量越小越好度量观测值和预测值总体的一致性用 LACKFIT选项调用P值越大越好