1、1.多元线性回归分析解释为了了解和预测人体吸入氧气的效率,收集了 30 名中年男性的健康状况调查资料。共调查了 7 个指标,它们是:吸氧的效率(y),年龄(x1),体重(x2) ,跑 1.5 公里所需的时间(x3)- 以分钟计算,休息时的心跳次数(x4),跑步时的心跳率(x5) ,和最高心跳率(x6) ,数据列在表中。该问题中吸氧的效率(y) 是因变量,其余 6 个变量是自变量。试用多元回归分析建立预测人体吸氧效率的模型。 【专业结论】 从上述分析结果得知,吸氧效率( y )与年龄( x 1 )、跑 1.5 公里所需时间( x 3 )以及跑步时的心跳率( x 5 )的关系模型是: 模型说明,(
2、1) 在跑 1.5 公里所需时间和跑步时的心跳率相同的条件下,年龄每增加 1 岁,吸氧效率将会减少 0.269 个单位;(2) 在年龄和跑步时的心跳率相同的条件下,跑 1.5 公里所需时间每增加 1 分钟,吸氧效率将会减少 2.825 个单位;(3) 在年龄和跑 1.5 公里所需时间相同的条件下,跑步时的心跳率每增加 1 个单位,吸氧效率将会减少 0.135 个单位;(4) 性别和体重对吸氧效率的影响不显著;(5) 跑步时的最大心跳率与跑步时的心跳率很相似,但经过检验,它对吸氧效率的影响没有跑步时的心跳率对吸氧效率的影响强,因此,研究吸氧效率问题时可以不考虑最大心跳率这个指标。 2.多元 lo
3、gistic某大学医院外科采用两种不同的绷带(bandage-4-layer 和 convatee)和两种不同的包扎方式(Granuflex 和 Na)进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有效和痊愈。治疗方式和治疗效果列在表 7-6 中。试分析治疗方法对治疗效果的影响。设因变量 y 表示治疗效果,0=不愈、1= 有效、2=痊愈。设因变量 x 1 表示绷带种类,1=bandage-4-layer、2=convatee。自变量 x 2 表示包扎方式,1=Granuflex 、2=Na。 治疗效果 (y) 绷带 (x1) 包扎 (x2) 人数 (wt)0 0 0 191 0 0 42 0
4、0 20 1 0 91 1 0 82 1 0 60 0 1 211 0 1 32 0 1 20 1 1 101 1 1 102 1 1 5【结果解释】 显示因变量 y 的排列数序:2,1,0。因此输出的是 p(y=2)和 p(y=1)的概率模型。 多值 logistic 回归模型的平行性检验结果:p=0.6871,不能拒绝零假设,即模型的平行性成立。因此下面得到的回归模型具有解释意义。 模型的总体检验结果:p=0.0004,模型具有统计意义。 参数的检验结果:x1 (绷带种类)具有显著性统计意义(p=0.0001),x2 (包扎方式) 不具有显著性统计意义(p=0.6496)。3.COX 模型
5、某医师对一所医院 1988 年收治的 16 例鼻腔淋巴瘤患者随访了 13 年,数据见表 19-1,试作 Cox 模型分析4.因子分析V(Xi)=共性方差 Hi 2 剩余方差 Ci 2 显然 Hi 2 大则 Ci 2 必减少,故 Hi 2 的大小表明了 Xi 对于 f1,f2,fm 的共同依赖程度之大小,这是为什么我们称 Hi 2 为 Xi 的共同度的原因。在因子载荷阵 A 中,对 A 的各列元素求平方和,记为 gj2 。gj2 与 Hi 2 统计意义恰好相反。 gj2 表示的是第 j 个公因子 fj 对于(X1,X 2,XP )的总影响,即 gj2 是同一公因子 fj 对于所有变量 X 所提供的方差的总和。显然 gj2 是衡量公因子间相对重要性的关键指标。 gj2 愈大,表明第 j 个因子 fj 对 X 的“贡献”也愈大。若把因子载荷矩阵 A 的各列元素的平方和都计算出来,并按照计算结果的大小排序,即所有 m 个因子的相应的“贡献 ”满足 g12g22 gm2,则可以以此为依据,提炼出相对影响较大的一些公因子,这是在因子分析时确定因子个数 m 的立足点。确定了因子的个数,那么,与 g12 、g2、gm2 相应的公因子 f1,f2,fm 便称为第一公因子,第二公因子,第 m 公因子。