1、虚拟变量回归练习题1、请根据下表数据建立回归模型来分析食品支出与税后收入和性别的关系(1)请建立性别对食品支出影响的回归模型模型汇总 b模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson1 .435a .189 .108 570.84045 1.582a. 预测变量: (常量), 性别。b. 因变量: 食品支出Anovab模型 平方和 df 均方 F Sig.回归 759530.083 1 759530.083 2.331 .158a残差 3258588.167 10 325858.8171总计 4018118.250 11a. 预测变量: (常量), 性别。b. 因
2、变量: 食品支出系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 2170.500 521.104 4.165 .0021性别 503.167 329.575 .435 1.527 .158a. 因变量: 食品支出通过上述模型统计分析,我们可以得到如下结论:得到的P=0.1580.05 ,所以接受原假设,所以性别对食品支出无显著差异。(2)请建立考虑了税后收入和性别两个自变量对食品支出影响的回归模型,并进行解释。模型汇总 b模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson1 .964a .928 .913 178.76928 1.92
3、6a. 预测变量: (常量), 性别, 税后收入。b. 因变量: 食品支出v Anovab模型 平方和 df 均方 F Sig.回归 3730492.144 2 1865246.072 58.365 .000a残差 287626.106 9 31958.4561总计 4018118.250 11a. 预测变量: (常量), 性别, 税后收入。b. 因变量: 食品支出系数 a非标准化系数 标准系数模型 B 标准 误差 试用版 t Sig.(常量) 1048.271 200.448 5.230 .001税后收入 .059 .006 .892 9.642 .0001性别 228.987 107.05
4、8 .198 2.139 .061a. 因变量: 食品支出通过上述统计分析我们可以得到如下结论:在同时考虑税后收入和性别对食品支出的影响时,税后收入P=00.05,接受原假设,所以性别对食品支出无显著影响。2、考察 1990 年前后的中国居民的总储蓄-收入关系是否已发生变化。下表中给出了中国 19792001 年以城乡储蓄存款余额代表的居民储蓄以及以 GNP 代表的居民收入的数据。(1) 不考虑时间变量的影响建立回归模型。模型汇总模型 R R 方 调整 R 方 标准 估计的误差1 .986a .972 .970 5413.22314a. 预测变量: (常量), 储蓄。b.Anovaa模型 平方
5、和 df 均方 F Sig.回归 21027897021.581 121027897021.581 717.603 .000b残差 615362679.617 21 29302984.7441总计 21643259701.198 22a. 因变量: GNPb. 预测变量: (常量), 储蓄。系数 a非标准化系数 标准系数模型B 标准 误差 试用版t Sig.(常量) 8814.745 1467.565 6.006 .0001 储蓄 1.286 .048 .986 26.788 .000a. 因变量: GNP通过上述建立的回归模型统计分析,我们可以得到:F分布值P=0 0.05 , 说明模型能够
6、很好的拟合整体,不存在显著的差异。(2) 各自变量的显著性情况。不在方程中的变量得分 df Sig.X1 6.038 1 .014X2 2.946 1 .086变量X3(1) 5.073 1 .024步骤 0总统计量 10.414 3 .015模型系数的综合检验卡方 df Sig.步骤 12.703 3 .005块 12.703 3 .005步骤 1模型 12.703 3 .005分类表 a已预测上下班方式已观测主要骑自行车 主要乘坐公交汽车百分比校正主要骑自行车 13 2 86.7上下班方式主要乘坐公交汽车 3 10 76.9步骤 1总计百分比 82.1a. 切割值为 .500通过上述模型分
7、析我们可以得到:X1(年龄)P=0.0140.05,所以接受原假设,则月收入与上下班关系不具有显著性。X3(性别)P=0.0240.05,所以拒绝原假设,则年龄与上下班关系具有显著性。方程中的变量B S.E, Wals df Sig. Exp (B)步骤 0 常量 -.143 .379 .143 1 .706 .867(3) 自变量中有显著性的变量对因变量的影响程度,即优势比的意义。方程中的变量EXP(B) 的 95% C.I.B S.E, Wals df Sig. Exp (B)下限 上限X1 .082 .052 2.486 1 .115 1.086 .980 1.202X2 .002 .002 .661 1 .416 1.002 .998 1.005X3(1) 2.502 1.158 4.669 1 .031 12.205 1.262 118.052步骤 1 a常量 -6.157 2.687 5.251 1 .022 .002a. 在步骤 1 中输入的变量: X1, X2, X3.通过上述Logistic回归模型分析,对上下班有显著性影响的是X1 (年龄)和X3(性别),从方程中的变量这个表格我们可以很清晰的得到: X3(性别)相比X1(年龄)更具有显著性影响。