1、20152016 学年第 一 学期实验报告课程名称: 多元统计分析 实验项目: 判别分析 实验类别:综合性 设计性 验证性 专业班级: 姓 名: 学 号: 实验地点: 统计与金融创新实验室(新 60801) 实验时间: 指导教师: 曹老师 成 绩: 数学与统计学院实验中心制1一、实验目的让学生掌握判别分析的基本步骤和分析方法;学习spss 统计分析从入门到精通P307-P320 的内容,掌握一般判别分析与逐步判别分析方法。二、实验内容1、应用胃病患者的测量数据和表征企业类型的数据.sav ,掌握一般判别分析与逐步判别分析方法。数据来源于spss 统计分析从入门到精通数据文件第 12 章的数据。
2、2、参考教材例 4-2 的数据进行分析,数据见文件何晓群多元统计分析(数据)中的例 4-2new。三、实验方案(程序设计说明)四、程序运行结果1. (1)分析案例处理摘要未加权案例 N 百分比有效 14 93.3缺失或越界组代码 1 6.7至少一个缺失判别变量 0 .0缺失或越界组代码还有至少一个缺失判别变量0 .0排除的合计 1 6.7合计 15 100.0组统计量类别 均值 标准差 有效的 N(列表状态)2未加权的 已加权的铜蓝蛋白 188.60 57.138 5 5.000蓝色反应 150.40 16.502 5 5.000尿吲哚乙酸 13.80 5.933 5 5.000胃癌患者中性琉
3、化物 20.00 13.323 5 5.000铜蓝蛋白 156.25 47.500 4 4.000蓝色反应 118.75 14.104 4 4.000尿吲哚乙酸 7.50 1.732 4 4.000萎缩性胃炎中性琉化物 14.50 8.386 4 4.000铜蓝蛋白 151.00 33.801 5 5.000蓝色反应 121.40 13.012 5 5.000尿吲哚乙酸 5.00 1.871 5 5.000其他胃病中性琉化物 8.00 7.314 5 5.000铜蓝蛋白 165.93 46.787 14 14.000蓝色反应 131.00 20.203 14 14.000尿吲哚乙酸 8.86
4、5.318 14 14.000合计中性琉化物 14.14 10.726 14 14.000汇聚的组内矩阵 a铜蓝蛋白 蓝色反应 尿吲哚乙酸 中性琉化物铜蓝蛋白 2217.995 -168.268 -48.264 158.682蓝色反应 -168.268 214.832 12.082 -13.773尿吲哚乙酸 -48.264 12.082 14.891 -8.273协方差中性琉化物 158.682 -13.773 -8.273 103.182a. 协方差矩阵的自由度为 11。协方差矩阵类别 铜蓝蛋白 蓝色反应 尿吲哚乙酸 中性琉化物铜蓝蛋白 3264.800 -711.300 -103.350
5、402.000蓝色反应 -711.300 272.300 9.100 -39.750尿吲哚乙酸 -103.350 9.100 35.200 -25.000胃癌患者中性琉化物 402.000 -39.750 -25.000 177.500铜蓝蛋白 2256.250 138.750 -27.500 -110.833蓝色反应 138.750 198.917 20.500 74.167尿吲哚乙酸 -27.500 20.500 3.000 12.333萎缩性胃炎中性琉化物 -110.833 74.167 12.333 70.333铜蓝蛋白 1142.500 144.500 -8.750 117.500蓝
6、色反应 144.500 169.300 8.750 -53.750尿吲哚乙酸 -8.750 8.750 3.500 -7.000其他胃病中性琉化物 117.500 -53.750 -7.000 53.5003对数行列式类别 秩 对数行列式胃癌患者 4 20.943萎缩性胃炎 .a .b其他胃病 4 15.315汇聚的组内 4 20.116打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。a. 秩 4b. 案例太少无法形成非奇异矩阵检验结果 a箱的 M 26.091近似。 1.121df1 10df2 305.976FSig. .345对相等总体协方差矩阵的零假设进行检验。a. 有些协方差
7、矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 21.390。特征值函数 特征值 方差的 % 累积 % 正则相关性1 3.167a 95.2 95.2 .8722 .159a 4.8 100.0 .370a. 分析中使用了前 2 个典型判别式函数。Wilks 的 Lambda函数检验 Wilks 的 Lambda卡方 df Sig.1 到 2 .207 14.958 8 .0602 .863 1.398 3 .7064标准化的典型判别式函数系数函数1 2铜蓝蛋白 .443 -.295蓝色反应 .605 -.753尿吲哚乙酸 .685 .
8、532中性琉化物 .347 .668结构矩阵函数1 2尿吲哚乙酸 .623* .309铜蓝蛋白 .229* -.031蓝色反应 .611 -.630*中性琉化物 .294 .527*判别变量和标准化典型判别式函数之间的汇聚组间相关性 按函数内相关性的绝对大小排序的变量。*. 每个变量和任意判别式函数间最大的绝对相关性典型判别式函数系数函数1 2铜蓝蛋白 .009 -.006蓝色反应 .041 -.051尿吲哚乙酸 .177 .138中性琉化物 .034 .066(常量) -9.023 5.622非标准化系数组质心处的函数函数类别1 2胃癌患者 2.092 -.0725萎缩性胃炎 -.825 .
9、527其他胃病 -1.431 -.349在组均值处评估的非标准化典型判别式函数组的先验概率用于分析的案例类别 先验未加权的 已加权的胃癌患者 .357 5 5.000萎缩性胃炎 .286 4 4.000其他胃病 .357 5 5.000合计 1.000 14 14.000分类函数系数类别胃癌患者 萎缩性胃炎 其他胃病铜蓝蛋白 .154 .122 .122蓝色反应 .780 .629 .649尿吲哚乙酸 .865 .429 .201中性琉化物 .131 .071 -.008(常量) -81.468 -50.292 -50.128Fisher 的线性判别式函数区域图典则判别函数 2-8.0 -6.
10、0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0+-+-+-+-+-+-+-+-+8.0 + 21 +I 21 II 21 II 21 II 21 II 21 6I6.0 + + + + + 21 + + +I 21 II2 21 II322 21 II 3322 21 II 33222 21 I4.0 + 33322+ + + + 21 + + + +I 33222 21 II 33322 21 II 3322 21 II 33222 21 II 33322 21 I2.0 + + 33222 + + 21 + + + +I 33322 21 II 3322 21 II 3322
11、2 21 II 33322 * 21 II 33222 21 I.0 + + + + 33322 + 21 * + + +I * 3322 21 II 33221 II 331 I7I 31 II 31 I-2.0 + + + + + 31 + + + +I 31 II 31 II 31 II 31 II 31 I-4.0 + + + + + 31 + + + +I 31 II 31 II 31 II 31 II 31 I-6.0 + + + + + 31 + + + +I 31 II 31 II 31 II 31 II 31 I-8.0 + 31 +-+-+-+-+-+-+-+-+-8.0
12、-6.0 -4.0 -2.0 .0 2.0 4.0 6.0 88.0典则判别函数 1区域图中使用的符号符号 组 标签- - -1 1 胃癌患者2 2 萎缩性胃炎3 3 其他胃病* 表示一个组质心分类结果 a预测组成员类别胃癌患者 萎缩性胃炎 其他胃病合计9胃癌患者 4 0 1 5萎缩性胃炎 0 3 1 4其他胃病 0 1 4 5计数未分组的案例 0 0 1 1胃癌患者 80.0 .0 20.0 100.0萎缩性胃炎 .0 75.0 25.0 100.0其他胃病 .0 20.0 80.0 100.0初始%未分组的案例 .0 .0 100.0 100.0a. 已对初始分组案例中的 78.6% 个进
13、行了正确分类。2. 分析案例处理摘要未加权案例 N 百分比有效 29 93.5缺失或越界组代码 2 6.5至少一个缺失判别变量 0 .0缺失或越界组代码还有至少一个缺失判别变量0 .0排除的合计 2 6.5合计 31 100.0组统计量有效的 N(列表状态)Group 均值 标准差未加权的 已加权的x1 3640.78267471224400 732.344675348464200 5 5.000x2 666.63951808359490 229.859408466203180 5 5.000x3 1709.21054749795870 423.831137448486970 5 5.000x
14、4 586.68108103915930 145.747543294018800 5 5.000x5 1334.93918986871840 353.261121197578600 5 5.000x6 931.56103219718310 287.292833824583100 5 5.000x7 814.19115093353990 269.651305651237300 5 5.0001x8 260.86584182100313 42.303649559856130 5 5.0002 x1 1674.38215879309040 524.988766483780200 13 13.0001
15、0x2 335.32628108172827 157.791341245207500 13 13.000x3 917.15865500491270 320.239807432860200 13 13.000x4 316.39963134995446 90.364061532010410 13 13.000x5 541.52807039114790 210.965261966270600 13 13.000x6 353.44607864726055 166.862761183509120 13 13.000x7 444.16926592129334 173.205494866747240 13
16、13.000x8 122.83209782823597 43.883878258504275 13 13.000x1 1621.79674326287110 278.771472503797100 11 11.000x2 449.20546612978720 67.846485790118630 11 11.000x3 983.38521778053560 212.787586838133250 11 11.000x4 275.98939754389720 47.325755156442490 11 11.000x5 639.43072743491230 117.404576993389040
17、 11 11.000x6 421.89527214930980 119.130823552343900 11 11.000x7 551.12526332392500 128.834528404794640 11 11.0003x8 151.14600667763634 30.617164953852978 11 11.000x1 1993.47053840561970 899.229366421852000 29 29.000x2 435.64480592786555 184.758066784714150 29 29.000x3 1078.83974648757100 415.2818907
18、26575300 29 29.000x4 347.67186157683010 141.448775178609850 29 29.000x5 715.45858159353630 355.905561478251700 29 29.000x6 479.08455782905900 271.966732998301840 29 29.000合计x7 548.53565890371340 216.413198176433800 29 29.00011x8 157.37077773538218 62.430639373791210 29 29.000组均值的均等性的检验Wilks 的 Lambda
19、F df1 df2 Sig.x1 .275 34.246 2 26 .000x2 .582 9.342 2 26 .001x3 .497 13.135 2 26 .000x4 .367 22.465 2 26 .000x5 .330 26.371 2 26 .000x6 .389 20.396 2 26 .000x7 .623 7.871 2 26 .002x8 .363 22.788 2 26 .000对数行列式Group 秩 对数行列式1 .a .b2 8 68.6433 8 66.156汇聚的组内 8 74.054打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。a. 秩 5b.
20、案例太少无法形成非奇异矩阵检验结果 a箱的 M 173.333近似。 2.845df1 36df2 1524.161FSig. .000对相等总体协方差矩阵的零假设进行检验。a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 75.391。12特征值函数 特征值 方差的 % 累积 % 正则相关性1 8.936a 89.8 89.8 .9482 1.020a 10.2 100.0 .711a. 分析中使用了前 2 个典型判别式函数。Wilks 的 Lambda函数检验 Wilks 的 Lambda卡方 df Sig.1 到 2
21、 .050 67.479 16 .0002 .495 15.816 7 .027标准化的典型判别式函数系数函数1 2x1 .698 -.918x2 -1.219 .226x3 -.406 .130x4 1.192 -.890x5 .817 1.001x6 .740 -.354x7 -1.677 .411x8 .539 1.045结构矩阵函数1 2x1 .529* .365x4 .438* .123x8 .383 .659*x5 .436 .571*x2 .214 .551*x6 .384 .494*x7 .209 .461*x3 .314 .355*13判别变量和标准化典型判别式函数之间的汇聚
22、组间相关性 按函数内相关性的绝对大小排序的变量。*. 每个变量和任意判别式函数间最大的绝对相关性典型判别式函数系数函数1 2x1 .001 -.002x2 -.008 .002x3 -.001 .000x4 .013 -.010x5 .004 .005x6 .004 -.002x7 -.009 .002x8 .014 .027(常量) -4.187 -1.808非标准化系数组质心处的函数函数Group1 21 5.991 .5402 -.510 -1.0473 -2.121 .991在组均值处评估的非标准化典型判别式函数分类处理摘要已处理的 31缺失或越界组代码 0已排除的至少一个缺失判别变量
23、 0用于输出中 31组的先验概率Group 先验 用于分析的案例14未加权的 已加权的1 .333 5 5.0002 .333 13 13.0003 .333 11 11.000合计 1.000 29 29.000分类函数系数Group1 2 3x1 .011 .005 -.001x2 -.071 -.019 -.002x3 -.009 -.001 .002x4 .127 .056 .014x5 .041 .008 .012x6 .021 -.003 -.014x7 -.079 -.021 -.001x8 .203 .071 .103(常量) -59.564 -12.059 -11.061Fi
24、sher 的线性判别式函数分类结果 a,c预测组成员Group1 2 3合计1 5 0 0 52 0 12 1 133 0 2 9 11计数未分组的案例 1 0 1 21 100.0 .0 .0 100.02 .0 92.3 7.7 100.03 .0 18.2 81.8 100.0初始%未分组的案例 50.0 .0 50.0 100.01 5 0 0 52 1 10 2 13计数3 0 3 8 111 100.0 .0 .0 100.02 7.7 76.9 15.4 100.0交叉验证 b%3 .0 27.3 72.7 100.0a. 已对初始分组案例中的 89.7% 个进行了正确分类。b. 仅对分析中的案例进行交叉验证。 在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。15c. 已对交叉验证分组案例中的 79.3% 个进行了正确分类。五、实验总结学生签名: 年 月 日六、教师评语及成绩16教师签名: 年 月 日