1、延安大学第四届大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从 A/B 中选择一项填写): A 我们的参赛报名号为: 所属学院(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 4. 日期:2012 年 8 月 27 日评阅编号(由组委会评阅前进行编号):1
2、课程关系量化分析摘要在教学中,一直以来以学生成绩作为学生学习状况的衡量标准。本文通过对某高校两个专业学生的四门课程成绩进行统计分析,分别运用了单因素方差分析、层次分析法、威尔逊相关系数法、双因素方差分析等方法对各科成绩进行具体评价分析,得出结果。本文需要分四个阶段进行:第一阶段对每门课程两个专业学生的分数数据进行处理,用 SPSS 软件检验判断其是否服从正态分布。然后在服从正态分布的基础上用单因素方差分析法,以专业一、专业二分别作为专业因子下的两个水平,对每门课程进行显著性检验,通过 SPSS 软件得出它们的 P 值,从而得出结论, 两个专业的学生在课程高级语言、数据结构和数据库原理上成绩都没
3、有显著性差异,而在课程离散数学上成绩有显著差异。第二阶段以各高校四门课程所修学分为依据,构造出成对比较矩阵,用层次分析法求得各门课程占总体课程的权重,利用加权后的总成绩来作为学生学习水平的衡量标准。然后同第一阶段相同,用单因素方差法以两专业为不同水平进行显著性检验,用 SPSS 软件求出 P 值,从而得出结论,表明两个专业学生的学习水平无明显差异。第三阶段要分析高级语言和离散数学对另两门课程的影响,首先将两专业各科成绩汇总,用相关系数检验法,得出高级语言和离散数学分别对数据结构和数据库原理学习的相关系数及相应 P 值,判断出其分别影响是显著的。再根据双因素方差分析法,得到高级语言和离散数学的交
4、互作用对另两门课程学习的相关系数及 P 值,从而得出结论。第四阶段我们主要是根据前三问得出的结论,对本科生主干专业课程的学习提出了建议。关键字: 单因素方差分析 双因素方差分析 相关系数 SPSS 软件2一、问题重述附件一、二分别是某高校两个专业的高级语言程序设计、离散数学、数据结构、数据库原理四门计算机主干课程的期末考试成绩数据,请根据数据分析并解决以下几个问题:(1)分析每门课程两个专业学生的分数是否有明显差异?(2)分析两个专业学生的学习水平有无明显差异?(3)分析说明高级语言程序设计和离散数学两门课程学习的优劣是否影响数据结构和数据库原理两门课程的学习?(4)根据你们所作出的以上分析,
5、面向全校本科生同学,撰写一篇 1000字左右的论文,阐述你们对于专业主干课程学习方面的看法。二、问题分析在做本题时,我们首先对题中所给的数据进行分析。通过 SPSS 软件中描述统计的探索命令,我们知道了所有学生的成绩都近似服从正态分布。对于问题一,要研究每门课程两个专业学生的分数是否有明显差异,我们可以用单因素方差分析法。在这里将专业看作因子来讨论专业对各门成绩是否会产生明显差异,专业一和专业二是两个水平,每个专业学生的各科成绩作为试验值,然后用 SPSS 软件求出 P 值,从而得出结论。对于问题二,要研究两个专业学生的学习水平有无明显差异,我们可以用每个学生的综合成绩作为指标,这就要求我们求
6、出每门课程的权重,再求综合成绩。在这里我们用层次分析法来求权重,而后再用单因素分析法来研究所给的问题,最后用 SPSS 软件求出 P 值,从而得出结论。对于问题三,要研究高级语言程序设计和离散数学两门课程学习的优劣是否影响数据结构和数据库原理两门课程的学习,我们要得到高级语言程序设计、离散数学两门课程的成绩和数据结构、数据库原理两门课程的成绩的相关系数,从而研究其相关性,在这里我们用 r 系数相关检验法。再根据双因素方差分析法,得到高级语言和离散数学的交互作用对另两门课程学习的相关系数及 P 值,从而得出结论。对于问题四,我们可以根据前三问得出的结果,面向本科生来阐述我们对于专业主干课程学习方
7、面的看法。3三、模型假设1、学生没有作弊现象,成绩数据真实、有效;2、各学生的成绩是相互独立的;3、学生的学习水平只与本题中的四门课程的成绩有关;4、老师的教学水平相当。四、符号说明:原假设0H:备选假设1:平均值:标准差: 置信度 下的临界值rP:观察到的显著性水平(由样本观察值得到的拒绝原假设的最小值)五、模型的建立与求解(一) 、问题一(单因素方差分析模型):问题一中,要求不同课程两个专业学生成绩是否有明显差异时,首先应该对数据进行分类处理,证明其服从正态分布。由于同一专业不同班级的成绩相差不大,故将同一专业各个班级成绩综合处理,则不同课程两个专业学生的成绩互相独立。用 SPSS 软件通
8、过对数据的处理(“分析描述统计探索” ) ,并画出直方图,得出如下结果(下表为对专业一学生高级语言成绩的处理):4通过偏度计算公式 ,作U检验,得出检验结果10gu,即P0.05,可认为该组数据服从正态分布。0.5.6196U由上表中偏度和峰度可知,专业一学生高级语言的成绩基本服从正态分布。同理,其他课程不同专业学生成绩也基本服从正态分布。(具体分析图表见附件)由于各专业数据均服从正态分布,我们用单因素模型进行分析。在单因素模型中将专业看作因子来讨论对各门课程成绩是否会产生明显差异。专业一和专业二看成两个不同的水平,而每个学生各科的成绩即是试验的样本值。最后也就是将研究专业各科成绩差异是否显著
9、的问题转化为讨论两个水平(专业)整体均值是否相等的问题。表1 单因素试验数据表水平(专业) 试验观察值(学生成绩)专业一 112,nx专业二 2第 行数据称为第 组数据,于是判断专业对成绩有无显著影响可以转化为如ii下假设检验: ,即检验均值是否相等。01212:,:H对于上述问题,用SPSS软件进行求解,Analyze- Compare Means- One-Way ANOVA,结果如下:5单因素方差分析表ANOVASum of Squares df Mean Square F Sig.Between Groups 249.257 1 249.257 1.155 .284Within Gro
10、ups 55909.984 259 215.869高级语言Total 56159.241 260Between Groups 1397.488 1 1397.488 9.556 .002Within Groups 37875.048 259 146.236离散数学Total 39272.536 260Between Groups 14.910 1 14.910 .076 .783Within Groups 50994.224 259 196.889数据结构Total 51009.134 260Between Groups 25.754 1 25.754 .130 .719Within Grou
11、ps 51277.487 259 197.983数据库原理Total 51303.241 260结果分析:因为在本题中置信度为 0.05,P1=0.2840.05, P3=0.7830.05,P4=0.7190.05,所以接受原假设,即两个专业的学生在课程高级语言、数据结构和数据库原理上都成绩都没有显著性差异;而P2=0.0020.05,所以应接受原假设,即两个专业学生的数学水平无明显差别。(三) 、问题三:(r 系数相关检验法和双因素方差分析)问题三中要求说明分析高级语言和离散数学对其他两门课程的影响,可以先用相关系数法求出高级语言和离散数学的成绩分别对其他两门课程的相关系数,判断单独影响下
12、的相关性是否显著;再用双因素方差分析法求出高级语言和离散数学的交互作用影响下对其他两门课程的相关性是否显著。1、相关系数检验法:选用 r 相关系数法:首先假设 ;012:,:0H选取统计量,1221()()niiiniiiixyrr 为相关系数,只要 时,则可说明二者线性相关性显著。在这个问题中,r因为考虑的问题并不涉及专业,所以我们把两个专业所有学生的成绩写到一块,作为样本。并且设高级语言、离散数学、数据结构和数据库原理的成绩分别为、 、 、 ,分别研究 对 、 和 对 、 的关系。1x21y21xy2x1y2用 SPSS 软件对模型进行求解,Analyze-Correlate-Bivari
13、ate,结果如下:8表 3Correlations高级语言x1 离散数学x2 数据结构y1Pearson Correlation 1 .199* .195*Sig. (2-tailed) .001 .002高级语言x1N 261 261 261Pearson Correlation .199* 1 .536*Sig. (2-tailed) .001 .000离散数学x2N 261 261 261Pearson Correlation .195* .536* 1Sig. (2-tailed) .002 .000数据结构y1N 261 261 261*. Correlation is signif
14、icant at the 0.01 level (2-tailed)表 4Correlations高级语言x1 离散数学x2 数据库y2Pearson Correlation 1 .199* .177*Sig. (2-tailed) .001 .004高级语言x1N 261 261 261Pearson Correlation .199* 1 .422*Sig. (2-tailed) .001 .000离散数学x2N 261 261 261Pearson Correlation .177* .422* 1Sig. (2-tailed) .004 .000数据库y2N 261 261 261*.
15、 Correlation is significant at the 0.01 level (2-tailed).结果分析:查表可得 ,表 3 中 P1=0.02, P2=0.00,均小于0.125r0.05,r1=0.195,r2=0.536,值都大于 ,表 4 中 P3=0.04, P4=0.00,0.125r均小于 0.05,r3=0.177 ,r4=0.422,均小于 ,所以拒绝原假设,即.高级语言和离散数学分别对数据结构和数据库原理的影响是比较显著的。92、双因素方差分析:用双素方差分析法求出高级语言和离散数学的交互作用对其他两门课程的相关性是否显著。以高级语言和离散数学成绩分别作为
16、两考察因素,以数据结构和数据库原理成绩作为试验指标,用 SPSS 软件求解双因素方差分析,可得结果为:主体间效应的检验源 因变量 III 型平方和 df 均方 F Sig.数据结构y1 1.342E6 197 6813.241 82.889 .000模型数据库原理y2 1.505E6 197 7642.008 67.831 .000数据结构y1 8999.885 44 204.543 2.488 .000高级语言x1数据库原理y2 10983.272 44 249.620 2.216 .002数据结构y1 14640.929 43 340.487 4.142 .000离散数学x2数据库原理y2
17、 10424.646 43 242.434 2.152 .003数据结构y1 16054.643 109 147.290 1.792 .006高级语言x1 * 离散数学x2数据库原理y2 17591.042 109 161.386 1.432 .059数据结构y1 5260.617 64 82.197误差数据库原理y2 7210.433 64 112.663数据结构y1 1347469.000 261总计数据库原理y2 1512686.000 261a. R 方 = .996(调整 R 方 = .984)b. R 方 = .995(调整 R 方 = .981)结果分析:由于表中交互作用对数据结
18、构 y1 影响的 p1=0.006,小于 0.05,所以拒绝原假设。即高级语言和离散数学的交互作用对数据结构的影响显著。对数据库原理 y2 影响的 p2=0.059,大于 0.05,所以接受原假设,即高级语言和离散数学的交互作用对数据结构和数据库原理的影响不显著。(四) 、问题四:日前,本科生的教育问题成为人们颇为关注的问题,而我们建立了数学模型来研究计算机专业课程对于不同专业的学生成绩是否有影响及各门课程的学习是否有相互影响等问题,通过研究得到的结果,我们对于本科生的学习有了一定的建议。首先,不同专业的学生对不同课程的学习本来是没有差异的,但是在我们的实际生活中,可能有的同学会感觉自己学的东
19、西与人家专门学的人学到的差距很大,殊不知这只是心理作用。除了那少部分的天赋极高的学生,大部分都是中等水平的,所以在本质上,我们是没有差别的。就像我们研究得出的结果,不同的专业对不同的课程的学习不存在很大影响。所以,我们要祛除心里的阴10影,用自信的心去学习每一门课程。其次,专业对数学水平是没有影响的。数学是一切学科的基础,可以说,有了数学,你就有了在其他学科中徜徉的语言,可见数学对我们有多么的重要。或许有的人感觉数学比较枯燥,也或许有的人一开始有了先入为主的观念,感觉数学比较难这些看法都直接限制了人们对数学的学习,可是在我们的研究中,专业对数学水平并没有影响,所以,只要同学们重新调整自己的心态
20、,以全新的自己接受所要学习的课程,结果一定不会差,毕竟每个人都是一样的,并未太大差别。再者,大部分课程之间的联系都是比较紧密的,并且可以融会贯通,所以在平时的学习中,我们一定要脚踏实地的,一步一步地往前走。有这样一部分人,在平时的学习过程中,三天打渔两天晒网,并不能持之以恒,这样的习惯是很不利的。热情高涨时学两天,厌烦了就放下,过上几天又有兴趣了,再接着学,这样的学习会使学习过程中断,从而前前后后联系不到一块,这直接导致学习成绩的下降。所以,在学习过程中,一定要循序渐进,持之以恒,这样才能收获别人收获不到的。总之,不管是什么专业、怎么样的学生,对自己都一定要有信心,学习并不难,难的只是习惯的改
21、变,所以,一定要迈过心里的那道坎,相信光明就在眼前!六、模型评价模型优点:1. 充分利用 SPSS 软件对大量数据进行处理,减少了计算的冗余度;2. 充分利用附表中的已知数据,通过对图表中数据的分类分析,绘图、制表相对来说结果比较准确、可靠;3. 本文建立单因素和双因素方差分析模型,适用范围广泛、推广性强。模型缺点:1. 在进行层次分析时,成对比较矩阵的构造主观性较强,导致权重的结果可能不大精确;2. 用偏度和峰度作为判断标准正态分布的标准,有一定的误差;3. 决定学生学习水平的相关因素不止题中四门课程成绩,即用量化加权后的总成绩作为衡量学生学习水平的标准不大准确。七、参考文献1 姜启源数学模
22、型(第三版)高等教育出版社2 刘新平概率论与数理统计陕西师范大学出版总社3 张文彤SPSS 统计分析基础教程高等教育出版社附件附件一:11附件二:MATLAB 程序:a=1,2,3/4,3/4;1/2,1,3/4,3/5;4/3,4/3,1,1;4/3,5/3,1,1a =1.0000 2.0000 0.7500 0.75000.5000 1.0000 0.7500 0.60001.3333 1.3333 1.0000 1.00001.3333 1.6667 1.0000 1.0000 x,y=eig(a); eigenvalue=diag(y); lamda=eigenvalue(1); c
23、i1=(lamda-4)/3; cr1=ci1/0.58cr1 =0.0272 w1=x(:,1)/sum(x(:,1)w1 =0.25320.16920.28190.295812附件三:正态分布检验及直方图:1314附件四:两个专业学生的综合成绩学号 专业 1 专业 2 学号 专业 1 专业 21 53.4 65.65 39 82.43 70.822 67.16 68.69 40 71.87 63.683 73.32 65.52 41 63.98 80.874 68.83 67.64 42 73.86 48.625 71.6 71.1 43 83.71 74.916 65.96 84.67
24、44 81.56 69.967 71.78 57.15 45 78.16 66.68 64.95 68.3 46 69.37 87.319 66.76 60.68 47 63.23 66.1910 65.18 50.05 48 78.24 63.8811 52.8 78.41 49 75.21 88.7812 75.07 84.87 50 87.06 70.4613 74.28 78.77 51 58.49 66.7714 76.79 82.25 52 66.01 68.4415 70.91 85.86 53 66.78 77.3716 59.22 72.54 54 63.24 56.717
25、84.07 87.9 55 68.72 74.7918 70.12 95.6 56 60.34 83.219 70.9 80.88 57 64.42 83.161520 80.94 79.63 58 67.21 90.7321 67.73 52.78 59 64.68 77.5322 52.22 57.21 60 67.61 61.9123 70.47 67.06 61 78.62 70.924 53.8 154.77 62 68.44 64.8925 67.92 69.64 63 71.24 79.8526 59 68.76 64 69.92 71.7227 65.24 59.35 65 6
26、6.59 90.0328 90.42 75.54 66 70.78 74.8129 52.08 65.07 67 68.27 69.8630 68.99 87.12 68 82.35 58.4331 77.55 77.66 69 65.61 78.5332 73.07 67.91 70 62.76 58.4333 59.85 66.28 71 0 77.1334 56.6 66.03 72 61.53 69.235 71.77 64.94 73 65.42 75.0536 71.49 66.41 74 71.13 91.9437 70.97 67.02 75 86.34 80.9238 73.
27、97 73.66 76 75.26 67.177 64.78 43.7 116 67.878 78.57 69.53 117 66.3479 82.41 86.63 118 76.0280 95.15 61.2 119 73.5881 94.42 75.91 120 79.7782 61.52 92.4 121 70.5583 67.95 79.87 122 81.3684 80.09 70.48 123 84.7985 62.92 80.79 124 75.1986 84.45 71.03 125 71.3287 69.99 69.09 126 79.0588 77.46 67.58 127
28、 67.6189 69.91 75.76 128 68.3690 71.07 79.59 129 77.9791 69.8 78.84 130 76.4392 64.03 82.87 131 65.0393 70.44 63.93 132 72.5194 62.35 90.77 133 77.0995 81.57 70.17 134 82.0896 96.2 65.09 135 68.5597 74.22 75.03 136 87.0498 74.07 61.25 137 64.7399 50.63 75.06 138 53.94100 72.23 65.35 139 66.6216101 9
29、0.77 76.75 140 78.37102 69.33 63.48 141 46.95103 70.39 86.76 142 51.06104 81.01 78.46 143 66.36105 78 83.22 144 62.35106 92.61 73.86 145 79.35107 65.26 73.14 146 61.84108 77.23 69.37 147 64.99109 69.39 148 75.26110 43.08 149 75.04111 77.21 150 66.47112 93.88 151 70.68113 76.08 152 73.12114 80.78 153 59.55115 76.96