收藏 分享(赏)

10多元线性回归.ppt

上传人:jinchen 文档编号:7293586 上传时间:2019-05-14 格式:PPT 页数:33 大小:388.50KB
下载 相关 举报
10多元线性回归.ppt_第1页
第1页 / 共33页
10多元线性回归.ppt_第2页
第2页 / 共33页
10多元线性回归.ppt_第3页
第3页 / 共33页
10多元线性回归.ppt_第4页
第4页 / 共33页
10多元线性回归.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、多元线性回归 (multiple linear regression),在医学实践中,常会遇到一个应变量与多个自变量数量关系的问题。如医院住院人数不仅与门诊人数有关, 而且可能与病床周转次数, 床位数等有关;儿童的身高不仅与遗传有关还与生活质量,性别,地区,国别等有关;人的体表面积与体重、身高等有关。需要进行多元统计分析。,割裂多指标易出现的问题,例1 引水氟化是否有致癌作用?1978年8月9号美国一著名报纸刊登了一条科技信息:某单位对美国20个城市做饮水氟化研究,10个城市的饮水氟化,而另10个城市未氟化作对照,结论是:“饮水氟化有致癌作用”。但过了一个时期,该报纸又刊登了相反的文章。,原来

2、前述论文发表后,受到美国癌肿协会和英国统计协会的怀疑,他们派人对该批数据重新做统计分析,其结论是:“饮水氟化没有发现有致癌作用,相反,却略有保护作用。两个结论差别如此之大,根源在于第一分析法完全用单因素分析法,而后一个结论则把两个城市中的种族、生活环境上的不同尽可能地扣除,再去比较两组城市的癌症患病率。,目前糖尿病在中国正处于爆发期,患者每天至少增加三千人,已经远远高于西方国家。 例2:糖尿病的致病原因的探讨。历史性肥胖;年龄;社会心理因素;遗传;饮食习惯;饮酒等喝咖啡量;下肢的大腿较长;等等。,例3携带火柴和发生肺癌间的关系的研究。人们观察发现那些携带火柴的人更有可能发生肺癌。难道这表明携带

3、火柴可能引起肺癌?!,这中间存在混杂因素-吸烟,客观事实,携带火柴不可能引起肺癌。,混杂因素的影响,携带火柴 ? 肺癌吸烟,多元线性回归(multiple linear regression),(1)概念,多元线性回归是研究多个自变量与一个因变量之间数量关系并用方程表示出来的一种统计方法。,设研究问题中含有p个指标变量x1, x2,xp及Y, n个观察对象,其数据结构见表3。表3 多元线性回归分析数据结构编号 X1 X2 XP y1 x11 x21 x1p y12 x12 x22 x2p y2 3 x13 x23 x3p y3 n x1n x2n xnp yp,(2)数 据 结 构,(3)多元

4、线性回归模型,通过实验测得含有p个自变量x1,x2,x3,xp及一个因变量y的n个观察对象值, 利用最小二乘法原理, 建立多元线性回归模型:其中b0为截距, b1 ,b2 bp称为偏回归系数. bi表示当将其它p-1个变量的作用加以固定后, Xi改变1个单位时Y将改变bi个单位.,(4)回归分析的具体任务,1) 采用最小二乘法原理确定方程中系数bi i=0,1,2,3p; 2) 采用F检验对回归方程整体进行假设检验; 3) 采用t检验对方程中的每个系数bi进行假设检验。 4) 结合专业给出合理的解释。,例2 测得10名女中学生体重x1(kg)、胸围x2(cm)、胸围呼吸差x3(cm)及肺活量y

5、(ml)的测量值列于下表。试建立体重、胸围、胸围呼吸差与肺活量的关系。,(5)一般多元线性回归,x1 x2 x3 y 1 35 69 0.7 1600 2 40 74 2.5 2600 3 40 64 2.0 2100 4 42 74 3.0 2650 5 37 72 1.1 2400 6 45 68 1.5 2200 7 43 78 4.3 2750 8 37 66 2.0 1600 9 44 70 3.2 2750 10 42 65 3.0 2500 ;,操作过程:Analyze-Regression-Linear-y选入Dependent-x1、x2、X3选入Independent-ok

6、,因此,所求的多元线性回归方程为:,(6)筛择变量的方法 主要有3种:,向前法(forward selection),开始方程中没有变量,自变量由少到多一个一个引入回归方程。按自变量对因变量的贡献(P值的大小)由大到小依次挑选,变量入选的条件是其P值大于规定进入方程P界值Entry, 缺省值为0.05,向前法优点:计算量小;容易找到单独效果好的变量。缺点: 只进不出;一次只能引入一个自变量, 若两个变量在一起时效果好, 单独一个却效果不好, 这样的变量便无机会被选中。,后退法 (backward selection),开始变量都在方程中,然后按自变量因变量的贡献(P值的大小)由小到大依次剔除,

7、变量剔除的条件是其P值小于规定的剔除标准Removal, 缺省值 为0.1。后退法优点:1次能引入多个自变量,若两个变量在一起时效果好容易被选中。缺点:只出不进。,后退法优点:1次能引入多个自变量, 若两个变量在一起时效果好容易被选中。 缺点:只出不进。,逐步回归法(stepwise selection),将前进和后退两种方法结合起来,既考虑引入变量又考虑剔除变量。有两个界值, Entry , Removal,调试法: Entry , Removal 常取0.5,0.1,0.05。一般实际用时,应多次选取调整。,SPSS实现逐步回归方法:,操作过程:Analyze-Regression-Lin

8、ear-y选入Dependent-x1、x2、X3选入Independent-Stepwise-options-ok,例 某医科大学的梁教授收集了北京博爱医院在1994年1月2002年7月期间收治的脑卒中患者462例的病历,选取了以下8个变量:年龄x1、性别x2、住院天数(LOS, Length of stay)x3、病变类型(梗塞或出血)x4、病变部位(左侧或右侧)x5、入院时的ADL值(ADL入院 )x6、发病到入院康复治疗的间隔时间x7、出院时的ADL值(ADL出院)Y。应用多元线性回归分析,探讨出院时的ADL值y与7个自变量x1-x7间的联系性。,日常生活活动(activities of daily living,ADL)是人在独立生活中反复进行的、最必要的基本活动。脑卒中后患者的ADL能力会受到不同程度的影响,给家庭和社会带来了巨大的负担。,操作过程:Analyze-Regression-Linear- ADL值y选入Dependent-x1-x7选入Independent-options-ok,专业结论:,出院时的ADL值主要由年龄x1、住院天数x3、入院时的ADL值x6、发病到入院康复治疗的间隔时间x7决定,结合具体资料可知:年龄较小、住院天数多、入院时功能状态好、尽早进行康复训练或治疗的患者,预期的结局越好。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报