收藏 分享(赏)

各种回归模型适用条件_logistic回归.ppt

上传人:weiwoduzun 文档编号:5677675 上传时间:2019-03-12 格式:PPT 页数:40 大小:167.50KB
下载 相关 举报
各种回归模型适用条件_logistic回归.ppt_第1页
第1页 / 共40页
各种回归模型适用条件_logistic回归.ppt_第2页
第2页 / 共40页
各种回归模型适用条件_logistic回归.ppt_第3页
第3页 / 共40页
各种回归模型适用条件_logistic回归.ppt_第4页
第4页 / 共40页
各种回归模型适用条件_logistic回归.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、LOGISTIC 回归,线性模型一般线性模型,线性模型广义线性模型,线性模型的条件,LINEL LinearI IndependenceN Normal distribution E Equal variance,LOGISTIC 模型,二值变量(0,1)资料的logit变换设P为事件发生的概率,事件发生的优势odds和样本率的关系,图 1 事件发生的优势odds和样本率的关系,图 2 logit 函数图,图 2 logit 函数图,图 3 logistic曲线,例1. 饮酒与高血压,Data a; Input y drink a1 a2 a3 a4 a5 count; Cards; 1 1

2、0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 4 1 0 1 0 0 0 0 5 1 1 0 1 0 0 0 25 1 0 0 1 0 0 0 21 1 1 0 0 1 0 0 42 1 0 0 0 1 0 0 34 1 1 0 0 0 1 0 19 1 0 0 0 0 1 0 36 1 1 0 0 0 0 1 5 1 0 0 0 0 0 1 8 0 1 0 0 0 0 0 9 0 0 0 0 0 0 0 106 0 1 1 0 0 0 0 26 0 0 1 0 0 0 0 164 0 1 0 1 0 0 0 29 0 0 0 1 0 0 0 138 0

3、1 0 0 1 0 0 27 0 0 0 0 1 0 0 138 0 1 0 0 0 1 0 18 0 0 0 0 0 1 0 88 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 31 ; proc logistic descending; freq count; model y=a1 a2 a3 a4 a5 drink; run;,SAS 程序1,例1 SAS结果解释-变量赋值,Response ProfileOrdered TotalValue y Frequency1 1 2002 0 774Probability modeled is y=1.,模型中假(哑)变量的定义问

4、题,模型中假变量的向量表示,或,参数估计及模型检验,最大似然法:使似然函数L达到最大。 拟合优度检验:H0:模型拟合观察资料;H1:模型不拟合观察资料。拟合优度检验统计量: -2ln(L) 在大样本条件下近似服从=N-m-1的2分布,变量筛选,似然比检验(最常用)记分检验:统计量:SCORE (公式略)Wald检验,例1 模型检验统计量,Model Fit StatisticsInterceptIntercept andCriterion Only CovariatesAIC 991.029 802.456SC 995.910 836.626-2 Log L 989.029 788.456,例

5、1 模型检验结果,Testing Global Null Hypothesis: BETA=0Test Chi-Square DF Pr ChiSqLikelihood Ratio 200.5731 6 .0001Score 183.5523 6 .0001Wald 125.0228 6 .0001,例1 模型吻合情况,Association of Predicted Probabilities and Observed ResponsesPercent Concordant 75.1 Somers D 0.594 Percent Discordant 15.7 Gamma 0.654Perc

6、ent Tied 9.1 Tau-a 0.194Pairs 154800 c 0.797,例1 结果参数估计,Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 -5.0534 1.0094 25.0637 .0001a1 1 1.5426 1.0659 2.0944 0.1478a2 1 3.1990 1.0231 9.7763 0.0018a3 1 3.7182 1.0185 13.3264 0.0003a4 1 3.9667 1.0230 15.0337 0.0001a5 1 3.9616 1

7、.0650 13.8375 0.0002drink 1 1.6671 0.1896 77.2908 .0001,例1结果优势比,Odds Ratio EstimatesPoint 95% Wald Effect Estimate Confidence Limits a1 4.677 0.579 37.774 a2 24.508 3.299 182.048 a3 41.190 5.595 303.229 a4 52.810 7.110 392.225 a5 52.543 6.516 423.683drink 5.297 3.653 7.681,参数的意义,优势 / 对数优势优势比,常数项与预测和

8、判别的关系,病例对照研究中,常数项不代表各 变量取值为零时人群患病OR估计值的对数。不可用于预测和判别!,条件logistic模型,匹配资料的问题根据Bayes公式 推出,例2:1:1配对设计,胃癌与三种生活因素,每个病例按年龄 、性别和居住地取健康对照,调查3种生活因素 X1:不良饮食习惯 X2:爱吃卤、腌制品 X3:精神状态,data a; input no y x1 x2 x3;cards;1 0 2 4 0 1 1 3 1 02 0 3 2 1 2 1 0 1 03 0 3 0 0 3 1 2 0 1 (略) 49 0 1 2 1 49 1 0 0 1 50 0 2 0 1 50 1

9、0 3 1 ;proc phreg;model y=x1 x2 x3/selection=stepwise slentry=0.05;strata no;run;,SAS 程序2,例2 条件logistic sas结果参数估计,Analysis of Maximum Likelihood EstimatesParameter Standard Hazard Var DF Estimate Error Chi-Sq Pr ChiSq Ratiox1 1 0.78547 0.25686 9.3513 0.0022 2.193 x2 1 0.81411 0.30679 7.0420 0.0080 2

10、.257,例2 条件logistic sas结果变量筛选,Testing Global Null Hypothesis: BETA=0Test Chi-Square DF Pr ChiSqLikelihood Ratio 22.0017 2 .0001Score 17.9046 2 0.0001Wald 12.4144 2 0.0020NOTE: No (additional) variables met the 0.05 level for entry into the model.,例2 条件logistic sas结果变量全部入选,Analysis of Maximum Likeliho

11、od EstimatesParameter Standard Hazard Var DF Estimate Error Chi-Sq Pr ChiSq Ratio x1 1 0.82351 0.26700 9.5130 0.0020 2.278 x2 1 0.82561 0.31141 7.0290 0.0080 2.283 x3 1 0.49890 0.51744 0.9296 0.3350 1.647,有序多分类logistic模型,累积logistic模型:设结果变量y有c个等级,如 1显效;2有效;3无效则用c-1个方程描述y与x的关系,累积模型 程序3,data a; input y

12、 x1 x2 count; cards; 1 1 1 16 1 0 1 5 2 1 1 5 2 0 1 2 3 1 1 6 3 0 1 7 1 1 0 6 1 0 0 1 2 1 0 7 2 0 0 0 3 1 0 19 3 0 0 10 ; proc logistic; freq count; model y= x1 x2/scale=none aggregate; run;,X1 性别 x2 方法 y 疗效: 1 显效 2 有效 3无效,有序多分类变量赋值,Response ProfileOrdered Total Value y Frequency1 1 28 2 2 14 3 3 42

13、,累积logistic模型参数估计例,Analysis of Maximum Likelihood EstimatesStandard Wald Parameter DF Estimate Error Chi-Sq Pr ChiSqIntercept 1 1 -2.6671 0.5997 19.7800 .0001 Intercept 2 1 -1.8127 0.5566 10.6064 0.0011x1 1 1.3187 0.5292 6.2096 0.0127x2 1 1.7973 0.4728 14.4493 0.0001,X1 性别 x2 方法 y 疗效: 1 显效 2 有效 3无效,

14、两个方程,LogitP(Y=1|x=-2.667+1.318x1+1.797x2 LogitP(Y=2|x=-1.813+1.318x1+1.797x2问一女性病人使用新疗法的预期疗效?将x1=1 x2=1代入方程 得 LogitP(Y=1|x)=0.448 LogitP(Y=2|x)=1.302P(Y=1|x)=0.61 P(Y=2|x)=0.79 结果:此人显效0.61 有效0.18 无效0.21,无序多分类logistic模型,设结果变量y有c个等级,如 1鳞癌;2腺癌;3大细胞癌则用c-1个方程描述y与x的关系,分化程度、染色和组织类型,程序4无序分类模型,data a; do x1=

15、1 to 3;do x2=1 to 2;do y=1 to 3;input count; Output; end;end;end; cards;10 17 26 5 12 50 21 17 26 16 12 26 15 15 16 12 12 20 ;proc catmod order=data;direct x1 x2;weight count;model y=x1 x2;run;,无序多分类SAS结果例,Analysis of Maximum Likelihood Estimates Function Standard Chi- Para Number Estimate Error Sq

16、Pr ChiSq Intercept 1 -0.9826 0.5707 2.96 0.08512 -0.3461 0.5413 0.41 0.5226 x1 1 0.6281 0.1799 12.19 0.00052 0.3454 0.1728 4.00 0.0456 x2 1 -0.6494 0.2833 5.26 0.02192 -0.6352 0.2725 5.43 0.0197,Logistic 模型的应用和问题,应用 筛选危险因素 / 校正混杂因素 / 预测与判别 问题 1 样本量不能太小 2 不应单纯依赖程序筛选变量,注意变量的医学意义 3 自变量的类型和参数意义的解释问题 4 多数情况下,模型常数项没有意义 5 条件logistic模型不能用于预测,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报