1、2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,
2、在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名): 西安电子科技大学参赛队员 (打印并签名) :1. 李润泽2. 杜江3. 王力强指导教师或指导教师组负责人 (打印并签名):日期:2012 年 9月 12 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全
3、国组委会评阅前进行编号):葡萄酒的评价摘要针对问题一:在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。对于问题二,我们采用多元统计分析方法中的聚类分析对酿酒葡萄的理化指标进行了简化,选出酿酒葡萄中最具代表的几种理化指标,再运用相关系数分析他们对葡萄酒品质的影响程度,从而进一步结合酿酒葡萄的理化指标和酒的质量对葡萄进行分级。对于问题三,考虑到自变量的个数太多,我们首先利
4、用SPSS软件对酿酒葡萄的理化指标进行主成分分析,然后根据分析结果建立酿酒葡萄和葡萄酒理化指标之间的函数关系,最后用MATLAB软件进行拟合,出酿酒葡萄和葡萄酒的理化指标之间的关系。其中,正值说明对应的酿酒葡萄和葡萄酒的理化指标呈正相关,零值说明酿酒葡萄和葡萄酒的理化指标不相关,负值说明酿酒葡萄和葡萄酒的理化指标呈负相关。对于问题四,利用主成分分析方法,用葡萄酒质量分别对酿酒葡萄和葡萄酒理化指标中显著性较高的几组数据建立多元回归方程,由此可以得出两种理化指标对葡萄酒质量的影响。一、问题重述葡萄酒是一种碱性酒精饮料,具有天然的保健功能。随着经济的飞速发展,葡萄酒产业也进行的如火如荼。各类葡萄酒质
5、量的好坏也受到越来越多的关注。资深的品酒师在品尝葡萄酒后会根据各项指标进行品分,然后将各项评分总计加和得到酒的质量评分。俗话说,“种瓜得瓜,种豆得豆”,酿酒葡萄的好坏直接影响着葡萄酒的质量。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的
6、理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析针对问题一:两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以首先应当对评价数据进行 2 拟合检验法1,然后利用方差分析对两组评酒员的评价结果进行显著性分析。一个较好的评价组应是本着客观的原则进行评价,因此评价结果通常较为均匀,据此,可以分别计算出各组评酒员评价结果的方差,方差越大表明组内成员的评价差异越大,可信度就越低。针对问题二:首先对各酿酒葡萄样品的理化指标和评酒员对每个样酒的评分进行归一化处理,建立归一化模型,然后对题设的一级(蓝色)和二级(红
7、色)理化指标按不同比重对归一化后的每个样酒的不同指标数值进行求和,得出每个样酒的分数,最后根据分数来对酿酒葡萄进行分级。针对问题三:由于酿酒葡萄和葡萄酒的理化指标众多,要想得出其关系十分困难,为了简化模型,我们采用SPSS软件对酿酒葡萄进行主成分分析,然后由分析得出的碎石图和成分矩阵图建立主成分函数模型,然后用MATLAB软件进行拟合求解即可得出两者的关系。针对问题四:由于第四问涉及的因变量较多,考虑使用聚类分析的方法来减少变量的个数。先使用SPSS软件,对酿酒葡萄和葡萄酒的理化指标数据进行聚类分析,再运用相关指数公式计算,然后比较类中各个变量间的相关指数,最终将所有变量分为8类,分别选取相应
8、代表指标,将问题转化为分析代表指标对葡萄酒质量的影响。三、模型假设(1)酿酒葡萄的酿造水平与酿造环境相同;(2)酿制同一种酒使用的葡萄是相同的;(3)不考虑两种酿酒葡萄本身的品种(4)两组葡萄出自相同的地方(5)两组葡萄酒都是有同样的酿酒师酿造出来的,且排除他们的非系统性误差(6)橡木桶的陈化程度没有差别(7)酿酒葡萄和葡萄酒的贮存方式、条件都是一样的(8)排除评酒员在评价过程中视觉、嗅觉、味觉等产生的误差。四、符号说明kija :第一组评酒员中第i个评酒员对第j种红葡萄酒的第k个理化指标的评分; ija :第一组评酒员中第i个评酒员对第j种红葡萄酒的总评分;jV1 :第一组评酒员对第j种红葡
9、萄酒评价结果的方差;ijr :第i个指标与第j个指标间的相关系数。五、模型的建立与求解5.1.1数据的处理与准备根据题意,共有两组评酒员,每组有十个成员,每个评酒员在评价任意一种酒时,均考虑了四项一级指标和十项二级指标,每种酒的评价满分为100分,其中各个指标所占分值如表1所示。为方便计,将各个二级指标按照表1中从左至右的顺序依次编为110号。表5.1-1各指标所占分值一级指标 外观分析 香气分析 口感分析 整体二级指标 澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 整体分 值 5 10 6 8 16 6 8 8 22 11记 kija , ija 分别表示第一组评酒员中第i个
10、评酒员,对第j种红葡萄酒第k个二级指标的评分和对第j种红葡萄酒的总评分, kijb ,ijb 分别表示第二组评酒员中第i个评酒员,对第j种红葡萄酒第k个二级指标的评分和对第j种红葡萄酒的总评分, 10,2,1 i , 27,2,1 j , 10,2,1 k ,则有 .,101101k kijij k kijij bb aa假设把每一组所有评酒员对第j种红葡萄酒的平均评分,作为该组对该种红葡萄酒的最终评分,分别用 jA , jB 表示第一组和第二组对第j种红葡萄酒的最终评分,27,2,1 j 则 .27,2,1,101 ,101 101101 jbB aA i ijj i ijj 同样,记 ki
11、jf , ijf 分别表示第一组评酒员中第i个评酒员,对第j种白葡萄酒第k个二级项指标的评分和第j种白葡萄酒的总评分, kijg , ijg 分别表示第二组评酒员中第i个评酒员,对第j种白葡萄酒第k个二级指标的评分和第j种白葡萄酒的总评分, 10,2,1, ki , 28,2,1 j 。则 .,101101k kijij k kijij gg ff分别用jF , jG 表示第一组和第二组对第 j种白葡萄酒的最终评分,28,2,1 j 。则 .101 ,101 101101i ijj i ijj gG fF现以第1号红葡萄酒为例,分析两组评酒员评价结果的分布情况。20个评酒员对第1号酒的评分依次
12、为70,79,91,68,97,82,69,80,81,76,68,71,80,52,53 ,76,71,73,70,67。以10分为间距,统计落入各个区间数据的个数,结果见表2.表5.1-2评分结果分布统计区间 5059 6069 7079 8089 90100个数 2 4 8 4 2可以看出,20个评酒员对1号红葡萄酒的评分结果呈现出两头少中间多的分布。下面利用 2 拟合检验法1检验评价结果是否服从正态分布(取显著性水平05.0 )。原假设 0H :样本服从正态分布 ),( 2N 。计算参数及 2 的极大似然估计值分别是 201 1201 i ia , 201 212 )(201 i ia
13、 .计算出落入5个区间的频率依次为0.1,0.2,0.4,0.2,0.1.经过查卡方分布表,49.9205.0 ,而 49.917.92 ,所以接受原假设,即20个评酒员对1号红葡萄酒样品的评分可视为服从正态分布。类似地,其他54种酒的评价结果经检验均服从正态分布。5.1.2两组评价结果分析计算出两组评酒员对各种酒的评分情况,见图1.图1两组最终评分均值通过图1总结出,两组评酒员对于55种酒的评分走势大致相同,但对于红葡萄酒的评价,第一组的评分普遍高于第二组;对于白葡萄酒的评价,第一组的评分普遍低于第二组。针对第j种酒,两组评酒员的评分标准可能不同,主观性较大。为检验两组评酒员的评价结果是否存
14、在显著性差异,可进一步对两组评价结果进行t检验1。以红葡萄酒为例,第一组的十个评酒员对第j种红葡萄酒的评分构成样本101)( ija , 10,2,1 i ,第二组的十个评酒员对第j种酒的评分作为构成 101)( ijb ,10,2,1 i 。两个样本的容量为10,自由度为9。两样本的均值分别记作 jj 21 , ,标准差分别记作 jj ss 21 , ,则 101 222 101 211 1012 1011 .55,2,1,)(91 ,)(91 ,101 ,101i jijj i jijj i ijj i ijj jbs as ba 两样本总自由度为18,合并的标准差 js , .2 )()
15、( 2221 jjj sss 进一步计算相应的 jt , .|5 21 jjjj st 提出假设 0H :两个样本差异不显著。备择假设 1H :两个样本差异显著。通常显著水平 05.0 ,即置信概率为95%。经过查t分布表知,自由度为18时,10.205.0 t 。故当 10.2jt 时,接受原假设 0H ,表明两组评酒员对第j种红葡萄酒的评价结果差异不显著;故当 10.2jt 时,拒绝原假设 0H ,表明两组评酒员对第j种红葡萄酒的评价结果差异显著。经过上述计算,两组评酒员对27中红葡酒和28种白葡萄酒的评价差异结果如表3所示(其中,1表示两组评价结果不显著差异,0表示显著差异)。表5.1-
16、3各种酒的评价差异性红葡萄酒 白葡萄酒酒类 显著性 酒类 显著性 酒类 显著性 酒类 评分1 0 15 0 1 1 15 02 1 16 0 2 0 16 03 1 17 1 3 1 17 04 0 18 0 4 0 18 05 1 19 0 5 0 19 16 0 20 0 6 0 20 07 0 21 1 7 0 21 08 0 22 0 8 0 22 09 1 23 1 9 0 23 110 0 24 1 10 0 24 011 0 25 1 11 1 25 112 1 26 0 12 1 26 013 0 27 0 13 0 27 114 0 14 0 28 0两组评酒员对于55种酒的
17、评价,总计有37种存在显著性差异,占总数的67.3%。其中红葡萄酒17种,占红葡萄酒总数的63.0%,白葡萄酒20种,占白葡萄酒总数的71.4%,差异性略高于红葡萄酒。因此,两组评酒员对于这些酒的评价普遍存在显著性差异,为了得到更为准确客观的评价结果,必须分别对各组评酒员的评价结果进一步分析,比较两组评价的可靠性。一个好的评价组在评价某种酒时,每一个成员应当本着客观性的评价原则对酒的各项指标进行评分,尽量避免主观影响。因此好的评价组对于同一种酒的评价结果通常更为均衡,不会出现高分和低分居多,而中等分数偏少的现象。所以,组员评价结果的均衡度在很大程度上表征了该评价组评价结果的可信度,而表现均衡度
18、大小的数据就是评价样本的方差,方差越大,均衡度越小,评价组的可信度越低,反之亦然。对于第j种红葡萄酒,第一组的十个评酒员对第j种红葡萄酒的评分构成样本 101)( ija , 10,2,1 i ,第二组的十个评酒员对第j种酒的评分作为构成 101)( ijb ,10,2,1 i 。记两样本的方差为 jj VV 21 , ,则 .27,2,1,)(91 ,)(91 101 222 101 211 jbV aV i jijj i jijj 根据上式依次分别计算出,两组评酒员对27种红葡萄酒和28种白葡萄酒评价结果的方差,结果见图2.图5.1.1两组组评酒员评价结果方差通过图2,可以看出,第一组评酒
19、员对于各种酒评价结果的方差绝大部分大于第二组,这说明第一组评酒员在评价同一种酒时,组内成员的标准或认识差异较大,评价结果过于离散,均衡度较差,可信度也就较低,因此可以断定,第二组评酒员的评价结果更可信。5.2:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。本题附件2中测定了28个白葡萄样的59个理化指标,其中有30个一级指标,29个二级指标。为了找出影响葡萄品质的主要指标,我们采用SPSS 11.5软件,运用聚类分析法3和相关系数分析法对30个一级指标数据进行分析。首先,对白葡萄的30个一级指标进行R型聚类分析4,具体做法为打开附录1中数据文件“白葡萄.sav”,选择Analyz
20、e Classify HierarchicalCluster 把要进行聚类的指标选入Variable(s) 把样品编号选入Label Cases by选择Cluster栏的Variable 选择Plots窗体中的DendrogramOK输出结果得到指标的聚类谱系图(图2.1),同时根据分析将30项指标聚成5类,从谱系图的聚类距离和聚类的先后步骤可以看出,DPPH自由基、果皮质量、白藜芦醇、花色苷、柠檬酸、PH值、果梗比、单宁、葡萄总黄酮、果酸、可滴定酸、酒石酸、总酚、果皮颜色a*、黄酮醇、干物质含量、果皮颜色b*、果皮颜色L*、多酚氧化酶活力、出汁率这20项先聚为一类,再与固酸比聚类,说明21
21、个指标间的相关性较高,即这21项指标为相似水平类;同样的,总糖、可溶性固行物、还原糖、果穗质量、百粒质量、VC含量这6项指标为相似水平类;褐变度、蛋白质、氨基酸分别单独为一类。图5.2.1 白葡萄一级指标的聚类图再把第一类的21项指标与白酒的评分(酒的质量好坏)进行相关性分析(相关系数见表2.1),具体做法为打开数据文件“白葡萄.sav”,选择Analyze Correlate Bivariat 把要分析的变量名导入Variables OK。得出结果表明果皮颜色b*与酒的质量呈极显著的正相关,酒石酸与酒的质量呈显著的正相关,由此,我们可以用果皮颜色b*来代表这一水平类的其他性状。同样的,把第二
22、类的6项指标与白葡萄酒的评分进行相关性分析(表2.2),得到果穗质量与酒的质量呈显著的负相关,总糖、可溶性固行物与酒的评分呈显著的正相关。虽然氨基酸、蛋白质、褐变度分别单独为一类,但它们与酒的质量间的相关性不显著,所以,我们不采用其进行对葡萄的分级。综上,我们就得到了5项影响葡萄质量的理化指标,分别为果穗质量、可溶性固行物、总糖、果皮颜色b*、酒石酸,用这5项指标来对葡萄进行分级。表5.2-1第一类指标的相关系数DPPH自由基1/IC50(g/l) 酒石酸 果皮颜色b*白酒分数DPPH自由基1/IC50(g/l) Pearson Correlation 1 -.150 .364 .294Sig
23、. (2-tailed) . .447 .057 .129N 28 28 28 28PH值 Pearson Correlation -.027 .414(*) -.014 .145Sig. (2-tailed) .893 .029 .943 .462N 28 28 28 28果梗比 Pearson Correlation -.229 .411(*) .093 .117Sig. (2-tailed) .240 .030 .639 .552N 28 28 28 28单宁 Pearson Correlation .395(*) .001 .065 .171Sig. (2-tailed) .038 .
24、994 .743 .383N 28 28 28 28酒石酸 Pearson Correlation -.150 1 .191 .392(*)Sig. (2-tailed) .447 . .331 .039N 28 28 28 28总酚 Pearson Correlation .324 -.242 -.116 -.069Sig. (2-tailed) .093 .214 .555 .727N 28 28 28 28果皮颜色a* Pearson Correlation -.453(*) .113 -.692(*) -.130Sig. (2-tailed) .015 .568 .000 .508N
25、28 28 28 28干物质含量g/100g Pearson Correlation .215 .277 .392(*) .358Sig. (2-tailed) .271 .154 .039 .062N 28 28 28 28果皮颜色b* Pearson Correlation .364 .191 1 .523(*)Sig. (2-tailed) .057 .331 . .004N 28 28 28 28果皮颜色L* Pearson Correlation .418(*) .049 .858(*) .347Sig. (2-tailed) .027 .803 .000 .071N 28 28 2
26、8 28多酚氧化酶活力 Pearson Correlation -.428(*) -.022 -.282 -.235Sig. (2-tailed) .023 .910 .146 .229N 28 28 28 28白酒分数 Pearson Correlation .294 .392(*) .523(*) 1Sig. (2-tailed) .129 .039 .004 .N 28 28 28 28* Correlation is significant at the 0.05 level (2-tailed).* Correlation is significant at the 0.01 lev
27、el (2-tailed).表5.2-2 第二类指标的相关系数总糖 可溶性固行物g/L 还原糖 果穗质量 百粒质量 VC含量 白酒分数总糖 PearsonCorrelation 1 .846(*) .554(*) -.540(*) -.304 .104 .407(*)Sig. (2-tailed) . .000 .002 .003 .116 .599 .032N 28 28 28 28 28 28 28可溶性固行物 PearsonCorrelation .846(*) 1 .591(*) -.665(*) -.425(*) -.044 .429(*)Sig. (2-tailed) .000 .
28、 .001 .000 .024 .824 .023N 28 28 28 28 28 28 28还原糖 PearsonCorrelation .554(*) .591(*) 1 -.408(*) -.262 .030 .235Sig. (2-tailed) .002 .001 . .031 .178 .878 .228N 28 28 28 28 28 28 28果穗质量 PearsonCorrelation -.540(*) -.665(*) -.408(*) 1 .712(*) .190 -.456(*)Sig. (2-tailed) .003 .000 .031 . .000 .333 .0
29、15N 28 28 28 28 28 28 28百粒质量 PearsonCorrelation -.304 -.425(*) -.262 .712(*) 1 .288 -.261Sig. (2-tailed) .116 .024 .178 .000 . .138 .181N 28 28 28 28 28 28 28VC含量 Pearson .104 -.044 .030 .190 .288 1 -.062CorrelationSig. (2-tailed) .599 .824 .878 .333 .138 . .753N 28 28 28 28 28 28 28白酒分数 PearsonCorr
30、elation .407(*) .429(*) .235 -.456(*) -.261 -.062 1Sig. (2-tailed) .032 .023 .228 .015 .181 .753 .N 28 28 28 28 28 28 28表5.2-3 氨基酸、蛋白质、褐变度与酒质量的相关系数氨基酸总类 蛋白质 褐变度 白酒分数氨基酸总类 PearsonCorrelation 1 .121 -.123 .263Sig. (2-tailed) . .539 .532 .176N 28 28 28 28蛋白质 PearsonCorrelation .121 1 .460(*) -.063Sig.
31、(2-tailed) .539 . .014 .752N 28 28 28 28褐变度 PearsonCorrelation -.123 .460(*) 1 .138Sig. (2-tailed) .532 .014 . .483N 28 28 28 28白酒分数 PearsonCorrelation .263 -.063 .138 1Sig. (2-tailed) .176 .752 .483 .N 28 28 28 28现在,就所有白葡萄样品中的果穗质量的含量,由表2.2得果穗质量与酒质量负相关,我们可以通过对白葡萄中果穗质量的含量从小到大进行排序,把白葡萄分为优、良、中、差四个等级,同样
32、的,分别用葡萄中的总糖、果皮颜色b*、酒石酸的含量来把白葡萄分级。分级如表2.4所示:表5.2-4白葡萄的分级分级标准果穗质量 可溶性固行物 总糖 果皮颜色b* 酒石酸优 22、21、2、26、28、4、17 24、9、28、26、25、23、20 24、26、25、28、20、10、9 28、21、5、4、23、14、20 3、20、9、17、19、5、22良 5、10、9、25、14、19、27 5、10、3、27、21、12、2 12、21、2、4、5、23、19 26、17、11、2、7、9、18 28、21、6、27、23、8、10中 23、24、20、3、7、16、1 22、4、1
33、9、14、1、6、17 17、27、6、18、3、14、1 3、6、27、10、24、1、12 11、24、25、4、26、1、16差 8、12、13、18、6、11、15 16、11、13、18、8、7、15 16、15、11、22、7、8、13 22、25、13、15、8、19、16 15、2、13、12、7、18、14综上,经分析可以得出这些白葡萄样品的总分级:优:葡萄品种28、20、26、9、2、10、5良:葡萄品种21、23、27、19、4、25、24中:葡萄品种1、3、6、22、17、14差:葡萄品种13、15、8、16、18、7、11用同样的方法可以对红葡萄进行分级,首先,同样把
34、红葡萄的30个一级指标进行R型聚类分析,得到指标的聚类谱系图(图2.2),同时根据分析将30项指标聚成5类:第一类:总酚、葡萄总黄酮、DPPH自由基、单宁、蛋白质、出汁率、白藜芦醇、黄酮醇、果梗比、花色苷、褐变度、果酸、多酚氧化酶活力、PH值、固酸比第二类:总糖、可溶性固行物、干物质含量、还原糖、氨基酸总类、可滴定酸 第三类:果皮颜色a*、果皮颜色b*、酒石酸、柠檬酸第四类:白粒质量、果皮质量、果穗质量、果皮颜色L*第五类:VC含量由于第二类、第四类和第五类中的指标对红葡萄酒的质量的相关性不显著,所以我们选择了与葡萄酒比较显著的5个指标来对葡萄进行分级,这些指标分别是总酚、葡萄总黄酮、DPPH
35、自由基、果皮颜色a*、果皮颜色b*。得到红葡萄按各指标的分级如表2.5所示。图2.2 红葡萄一级指标聚类图表2.5红葡萄的分级分级标准 总酚 果皮颜色a* 果皮颜色b* 葡萄总黄酮 DPPH优 9、23、2、1、3、5、19、22、21 11、18、27、10、7、12、15、20、4 11、1、18、12、21、15、22、6、17 23、9、2、3、5、1、19、16、179、23、2、13、1、8、3、5、19良 17、8、14、13、20、12、15、25、16 6、22、25、9、23、16、21、14、17 24、5、16、4、9、7、23、20、8 8、24、20、22、14、2
36、1、13、6、15 21、14、17、25、10、26、22、24、20差 4、6、10、7、27、24、18、26、1126、3、13、24、5、8、19、1、214、3、26、25、10、27、2、19、25、18、27、10、4、12、7、26、11、6、4、27、16、18、15、12、13 11 7综上,经分析可以得出这些红葡萄样品的总分级为:优:葡萄品种1、9、23、5、22、21、2、3、19良:葡萄品种20、25、17、24、14、16、8、15、13差:葡萄品种27、26、18、4、7、10、6、11、125.3问题三的模型建立与求解:由于酿酒葡萄的理化指标有62个,葡萄酒的
37、理化指标有15个,为降低自变量维数,用SPSS软件对酿酒葡萄理化指标进行主成分分析,可以得出以下图表。图5.3.1 红葡萄的理化指标碎石图6261605958575655545352515049484746454443424140393837363534333231302928272625242322212019181716151413121110987654321 Component Number1086420-2Eigenvalue Scree Plot图5.3.2 白葡萄的理化指标碎石图636261605958575655545352515049484746454443424140393
38、837363534333231302928272625242322212019181716151413121110987654321 Component Number1050EigenvalueScree Plot红白葡萄酒的主成分分析矩阵图分别见附录表一、二。由以上得出的红葡萄酒的碎石图和主成分分析矩阵图可建立如下函数模型:(1)主成分矩阵 11 18621 628a aA a a ,(2)酿酒葡萄的理化指标与其主成分变量的线性关系:1 12 262 8x yx yAx y ,(3)分析可知存在一个B矩阵使得 8BA E ( 8E 表示8阶单位矩阵),那么由(2)中的线性关系可以得出: 1
39、12 262 8x yx yB BAx y ,所以有 1 12 28 62y xy xBy x ,(4)设酿酒葡萄的理化指标与葡萄酒的理化指标函数关系如下:1 2 62( , )i iC f x x x ,又由(2)中的线性关系可以得出: 1 2 8,i iC g y y y ,然后用MATLAB软件的regress函数拟合得 ig 形式为: 8 00 1i ij jjC B y y 其中 。B值的具体结果表: 表5.3.1 红葡萄酒B值表ji 0 1 2 3 4 5 6 7 81 569.26 28.41 -1.2 -8.19 10.55 36.68 2.44 -9.07 7.322 -19
40、.73 0.22 0.01 -0.13 0.15 0.14 0.09 -0.01 0.163 -294.49 14.31 -0.59 -4.16 5.35 18.41 1.26 -4.54 3.744 -294.49 14.31 -0.59 -4.16 5.35 18.41 1.26 -4.54 3.745 3.2 0.04 0.08 -0.26 0.16 -0.16 0.15 0.09 0.256 -3.05 0.03 0.1 -0.18 0.13 -0.13 0.15 0.08 0.247 6.8 0 -0.02 -0.06 0.02 -0.05 -0.01 0.02 08 0.84 0
41、0.02 -0.01 0.01 -0.01 0.01 0 0.039 -1.39 0.02 -0.02 -0.01 0.01 0.02 -0.01 -0.01 -0.0211 -0.96 0.01 0 -0.01 0.01 0 0.01 0 0.0112 171.47 -2.64 0.39 2.4 -1.63 -1.7 -0.27 0.27 -0.9713134.78 0.27 -0.85 -2.31 0.51 -1.51 -0.6 0.48 -0.6414 -8.91 -0.13 0.11 -0.2 0.34 -0.54 0.17 0.18 0.4915 13.94 0.05 -0.11 -
42、0.13 -0.03 -0.01 -0.1 0 -0.1816 122.93 0.08 -0.71 -2.01 0.48 -1.62 -0.49 0.51 -0.45然后将 1 12 28 62y xy xBy x 代入 8 00 1i ij jjC B y y 其中 可以得到 if (见附件一),其中,正值说明对应的红葡萄和葡萄酒的理化指标呈正相关,零值说明红葡萄和葡萄酒的理化指标不相关,负值说明红葡萄和葡萄酒的理化指标呈负相关。同理对白葡萄酒建立以下模型:(5)主成分矩阵 11 18621 628a aA a a ,(6)白葡萄的理化指标与其主成分变量的线性关系:1 12 262 9x y
43、x yAx y ,(7)分析可知存在一个B矩阵使得 9BA E ( 9E 表示9阶单位矩阵),那么由(2)中的线性关系可以得出: 1 12 262 9x yx yB BAx y ,所以有 1 12 29 62y xy xBy x ,(8)设白葡萄的理化指标与白葡萄酒的理化指标函数关系如下:1 2 62( , )i iC f x x x ,又由(2)中的线性关系可以得出: 1 2 9,i iC g y y y ,然后用MATLAB软件的regress函数拟合得 ig 形式为: 9 00 1i ij jjC B y y 其中 。B值的具体结果表: 表5.3.2 白葡萄酒B值表ji 0 1 2 3
44、4 5 6 7 8 91 0.0015 0.0005 0.0098 -0.0091 -0.0714 -0.0744 0.0091 -0.0749 -0.0211 -0.02032 0.0014 0.0355 0.0585 0.0018 -0.0403 -0.0488 -0.0502 -0.0316 0.0257 -0.02633 0.0063 0.2601 0.4403 -0.0026 -0.3514 -0.3378 -0.4240 -0.2150 0.3345 -0.28204 0.0004 -0.0115 -0.0022 -0.0062 -0.0218 -0.0320 0.0052 -0.
45、0393 -0.0071 -0.00855 0.0002 0.0071 0.0063 0.0029 -0.0048 -0.0041 -0.0111 0.0010 0.0107 -0.00686 0.0003 -0.0131 -0.0062 -0.0058 -0.0121 -0.0169 0.013 -0.0268 -0.0119 -0.00227 0.0001 -0.0032 -0.0029 -0.0008 -0.0006 -0.0009 0.0040 -0.0023 -0.0032 0.00118 -0.0002 -0.0022 0.0006 -0.0025 -0.0043 -0.0100
46、-0.0010 -0.0112 -0.0028 -0.00069 0.0001 -0.0062 -0.0029 -0.0030 -0.0057 -0.0093 0.0055 -0.0135 -0.0060 -0.000511 0.1032 -0.0190 -0.0071 0.0004 -0.0265 -0.0402 0.0151 -0.0365 -0.0143 -0.004812 0.0004 0.0288 0.0590 0.0083 0.0059 -0.0032 -0.0548 0.0119 0.0451 -0.020213 -0.0028 0.0143 -0.0813 -0.0141 0.
47、0561 0.1223 0.0511 0.0825 -0.0381 0.046914 -0.0043 0.0179 -0.0819 0.1166 0.4707 0.5764 0.1062 0.5265 -0.0452 0.2257然后将 1 12 29 62y xy xBy x 代入 9 00 1i ij jjC B y y 其中 中可以得到 if (见附件一),其中,正值说明对应的白葡萄和葡萄酒的理化指标呈正相关,零说明白葡萄和葡萄酒的理化指标不相关,负值说明白葡萄和葡萄酒的理化指标呈负相关。5.4:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量根据2、3问中的数据,利用主成分分析法,得到酿酒葡萄和葡萄酒理化指标中显著性较高的几组数据,分别与葡萄酒质量(即评分)建立多元回归方程。分析白葡萄酒的理化指标对白葡萄酒质量的影响,可以从回归估计结果表4.1(Model Summary),方差分析结果表4.2(ANOVA(b)回归系数估计表4.3(Coefficients(a)