1、2012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公
2、示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): S06014 所属学校(请填写完整的全名): 河南工程学院 参赛队员 (打印并签名) :1. 余翅飞 2. 崔盼盼 3. 郭雪峰 指导教师或指导教师组负责人 (打印并签名): 数模指导组 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编
3、号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1关于葡萄酒质量评价的分析摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评打分,从而确定葡萄酒的质量,而在葡萄酒的质量鉴定国家标准中,明确地规定了:卫生指标、理化指标以及感官评价。因此,探讨葡萄酒和酿酒葡萄检测的理化指标之间的联系以及对葡萄酒的质量评价很有意义。对于问题一,我们先对评酒员给出的分数进行正态分布检验,符合正态分布,可以采取置信区间法对每组数据进行筛选,减少特异值对整体的影响。建立 t 检验模型得到最终结果:两组评酒员之间的评价结果无显著性差异。根据两组检验结果的方差分析得到第二组评酒员的评价
4、结果差异性较小,更稳定,所以更加可信。对于问题二,先用主成分分析法得出 9 个红葡萄主成分和 10 个白葡萄主成分及其得分,再用 Spss 软件对样品的各个主成分得分向量进行聚类分析,结合品酒员对葡萄酒的评分得到结果:红葡萄分为好、中、差三个等级,白葡萄分为好、坏两个等级,以及 29 号样品为孤立点,我们最后抽出 5 个样品用判别分析法对分类等级进行预测,得到聚类判别的准确率为 100%。对于问题三,我们分别算出红、白两种葡萄与葡萄酒理化指标之间的相关系数 ,r建立相关度等级划分层,然后利用搜索取值法分别找出各等级范围内的相关系数,高度相关的指标进行线性拟合,拟合结果:酒中与葡萄中相同的指标之
5、间存在正相关关系;除酒中色泽 L*与葡萄花色苷之间存在负相关关系,其余高度相关的不同指标之间皆是正相关关系。分析中度相关指标结果:酿酒葡萄中的大部分指标含量对葡萄酒中的色泽 L*、a*及 b*是负相关的,葡萄的干物质含量和出汁率对葡萄的色泽 L*分别是负、正相关,对于 b*是分别是正、负相关,而葡萄中的花色苷、单宁、总酚、总黄酮、DPPH 自由基及蛋白质含量是决定葡萄酒中的指标多少的关键。对于问题四,我们建立基于 Kmeans 函数的组合比较模型,利用 Kmeans 函数对酿酒葡萄理化指标、葡萄酒理化指标、葡萄芳香物质、酒中芳香物质逐个分级,对分级编号进行调整,并进行标准化处理,画出对应的箱线
6、图。对箱线图分析可以得出单个因素不能用来对葡萄酒的质量进行评价。因此把四个因素两两组合,对六种组合做相同的处理,画出对应的箱线图,通过对箱线图的比较,可得出以下结论:酿酒葡萄理化指标和葡萄酒理化指标可以作为葡萄酒质量的评价的重要参考,但是这两个指标还不能完全替代品酒员对葡萄酒质量的评价。关键词:置信区间法 主成分分析 聚类分析 线性拟合 组合比较模型2一、问题重述现实当中确定葡萄酒的质量时一般是通过聘请一批有资质的品酒员进行品评,各个评酒员品酒后对酒的各类指标进行打分,然后求出总分,即为该葡萄酒的质量。酿酒葡萄的好坏直接影响到葡萄酒的质量,酿酒葡萄和葡萄检测的理化指标在一定程度上反映出葡萄和葡
7、萄酒的质量。根据附件中一些葡萄酒的评价结果,葡萄酒和酿酒葡萄的成分数据,完成以下问题。首先,分析出附件一中品酒员的评价结果有没有显著性差异,比较得出更可靠的一组,。其次,根据酿酒葡萄的理化指标和葡萄酒的质量,对酿酒葡萄划分等级。接着分析得出酿酒葡萄和葡萄酒的理化指标之间的关系。最后,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并且论证是否能够用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析问题一,我们考虑到各个品酒员之间的差异,采取了置信区间法对每组数据进行合理、可信的筛选,但在利用置信区间法之前我们需要判断一下评酒员给出的分数是否符合正态分布。由置信区间法得到两组红、白酒的
8、置信得分,根据置信得分建立 t检验模型。问题二,我们根据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,所以对酿酒葡萄分分级要考虑两个方面因素。酿酒葡萄的理化指标有 53 个指标,其中 26 个一级指标,27 个二级指标。由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量进行分级。我们可以直接将一级指标和葡萄酒的质量直接放一块,即为 27 个指标,进行分类,可以先将指标降维,再利用聚类分析。问题三,我们首先建立相关系数模型: ,利用 EXCEL 软件进行数据(,)CovxyrD处理,分别算出红色的酿酒葡萄与葡萄酒的理化指标
9、之间的相关系数 ,根据相关系数r的大小来判断各项理化指标之间的线性相关度, 时,可视为两个指标之间高度0.8r相关; 时可视为中度相关; 时,可视为低度相关; 时,0.5.8r.350.3r可视为相关程度很弱,不相关。高度相关的指标进行线性拟合和相关性检验,得到各指标之间的线性函数,进行结果分析。问题四,要先分析出酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响,可以通过单独分析酿酒葡萄理化指标、葡萄酒理化指标对葡萄酒质量的影响,然后再把两者放在一块综合考虑,根据数据处理的结果,对两种指标与葡萄酒质量之间的关系进行分析,进而可以论证出是否能够用葡萄和葡萄酒理化指标来评价葡萄酒质量。由于红葡萄和红葡萄
10、酒、白葡萄和白葡萄酒的各项指标基本相同,因此我们只分析了有关红葡萄和红葡萄酒的有关数据和问题,得到一定的结论,同理可得白葡萄和白葡萄酒的相关结论。三、问题假设(1)假设理化指标的检验是准确的。(2)假设对数据处理当中数据的微小改变忽略不记。3(3)假设评酒员的评价结果可靠性很高。(4)假设附录中的理化指标可以概括酿酒葡萄和葡萄酒中的全部的指标。(5)假设附录中所给数据均是正确的。(6)假设所给芳香物能够很好体现酒中的芳香性。(7)假设一级指标基本可以反映酿酒葡萄与葡萄酒之间的联系。四、符号说明峰度;1g偏度;2标准差;s置信得分;P显著性水平;aPt 检验结果;主成分分析的 个指标变量;12,
11、mx m主成分分析的评价对象个数;n第 个评价对象的第 个指标的取值;ijaij主成分分析的指标相关系数矩阵;R第 个指标与第 个指标的相关系数;ijrij相关系数矩阵 的特征值;12,m R相关系数矩阵 对应的特征向量;u主成分个数;p主成分 的信息贡献率;jbjy主成分 的累积贡献率;pa12,p相关系数;r、 变量;xy4拟合可信度;2R五、模型的建立与求解5.1 基于置信区间法的 t 检验对于问题一,我们考虑到各个品酒员之间的差异,采取了置信区间法对每组数据进行合理、可信的筛选,但在利用置信区间法之前我们需要判断一下评酒员给出的分数是否符合正态分布。5.1.1 正态分布检验根据附录一中
12、的数据,可以计算出各个品酒员对每种样品酒的打分,然后利用matlab 程序计算出出每种葡萄酒样品的 10 个打分的峰度 、偏度 和标准差 。1g2s根据峰度、偏度计算出 :, (1)10gus20gus结果见附录表 1,matlab 程序见附录一。1u2然后进行 U 检验,两种检验同时得出 ,即 ,从数据结果(见0.5196u0.5p附录一)可以看出各组数据都服从正态分布。5.1.2 置信区间法数据处理对于每种葡萄酒样品的 10 个打分记为 , , 是来自 的样本,则1x210x2,N的置信水平为 的置信区间为:1/ /29,910tsts 建立每种样品置信得分公式如下:(2)1nixP其中,
13、 1/21/290,90,1,2.0ixtstsni 分别为样本均值和样本标准差。这里我们取 ,则 ,所以,s 95()1.83t上式可化简为 ,根据以上的结果编写 matlab 程序见附录二,0.57,.7xsxs计算出每种葡萄酒样品的 10 个打分的置信区间,进而把在区间内的数据筛选出来,对区间内的数据求平均值,该平均值即为该种样品酒的最后得分见表 2。表 2 每种样品酒的置信得分置信得分 第一组红酒 第一组白酒 第二组红酒 第二组白酒葡萄酒样品 1 62.50 81.40 70.00 76.75 葡萄酒样品 2 80.75 75.80 74.50 77.33 葡萄酒样品 3 82.33
14、81.25 74.80 76.00 5葡萄酒样品 4 64.50 79.00 72.20 76.33 葡萄酒样品 5 72.75 74.75 72.75 81.17 葡萄酒样品 6 70.00 65.67 66.50 76.00 葡萄酒样品 7 72.67 78.40 66.60 73.00 葡萄酒样品 8 74.00 75.00 67.25 73.50 葡萄酒样品 9 80.33 72.00 78.50 80.67 葡萄酒样品 10 74.80 73.50 68.60 80.20 葡萄酒样品 11 70.83 74.00 63.00 74.50 葡萄酒样品 12 55.00 57.25 68
15、.40 74.20 葡萄酒样品 13 75.83 65.40 68.80 73.50 葡萄酒样品 14 73.43 72.80 72.20 77.00 葡萄酒样品 15 58.00 73.00 66.33 78.25 葡萄酒样品 16 74.00 72.00 69.50 66.67 葡萄酒样品 17 79.60 77.67 74.83 79.20 葡萄酒样品 18 60.00 72.00 64.17 76.00 葡萄酒样品 19 79.40 73.67 73.25 76.80 葡萄酒样品 20 79.33 80.75 77.00 75.50 葡萄酒样品 21 74.00 79.40 72.40
16、 79.83 葡萄酒样品 22 77.75 72.33 71.00 79.50 葡萄酒样品 23 84.50 76.50 78.33 77.50 葡萄酒样品 24 76.50 74.50 72.00 77.75 葡萄酒样品 25 68.00 77.20 67.17 81.29 葡萄酒样品 26 73.33 82.33 73.33 74.50 葡萄酒样品 27 74.20 62.50 71.13 78.00 5.1.3 t 检验模型的建立t 检验作为假设检验的一种方法,其基本步骤和假设检验相同。首先提出假设无效假设 :两组评酒员的评价结果之间不存在显著差异,即这两组评酒员的评价结果相0H同,实验
17、的处理效应(分数间的差异)为 0。备择假设 :两组评酒员的评价结果之AH间不相同,即存在处理效应,其意义是指两组评酒员的评价结果之间存在本质上的差异。接着确定显著性水平,令显著性水平为 为: 0.05。最后选定检验方法,这里假a设无效假设 成立,即两组评酒员的评价结果无差异,二者来自同一总体,则为双样0H本等方差假设。在无效假设 成立的前提下计算 t 值:0(3)12xts(4)112()dfndf6(5)121212xsdfn若计算出 P 则无效假设 成立,从而接受 否定 ;若计算出 P0.05;红酒检验结果:P=0.07774910.05。因此接受无效假设 ,从而得出结论:两组评酒员之间的
18、评0H价结果无显著性差异。白酒检验结果: 变量一方差 55.676564 大于变量二方差16.458987;红酒检验结果:变量一方差 37.757541 同样大于变量二方差 9.808572。而方差越大说明数据的差异性越大,稳定性越差,所以根据结果可以得出第二组评酒员的评价结果差异性更小,稳定性更高,更加可信。5.2 主成分分析和聚类分析建立对于问题二,要综合考虑据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量,即总指标进行分级。我们建立基于主成分贡献得分聚类综合评价模型
19、,先用主成分分析得到主成分得分,红葡萄有 9 个主成分,白葡萄有 10 个主成分。 5.2.1 酿酒葡萄基于主成分贡献的分类评价模型根据酿酒的理化指标和葡萄酒的质量对酿酒葡萄分级,所以对酿酒葡萄分分级要7考虑两个方面因素。酿酒葡萄的理化指标有 53 个指标,其中 26 个一级指标,27 个二级指标。由于一级指标在很大程度上可以反映酿酒葡萄,葡萄酒的质量决定因素可直接由品酒师得分判断。这样综合酿酒葡萄的一级指标和葡萄酒的质量进行分级。首先,对酿酒葡萄的 26 个一级指标和品酒师得分 27 个指标进行主成分分析法找主成分的得分。步骤如下:对原始数据标准化处理,即将各个指标转换成标准指标。(6)ij
20、jijaxs1,2;,injm 第 个指标的样本均值为: (7)j 1jija第 个指标的样本标准差为: (8)j 21nj ijjis1,m则标准化指标变量为: , (9)iiixs,计算相关系数矩阵 ,R()ijmr即: 式中 (10)1,1,2kinjijxr 1,iijir计算相关系数矩阵 的特征值 ,及对应的特征向量 ,R120m 12,mu其中 ,由特征向量组成 m 个新指标变量。12,Tjjmjuu(11)1212 212mmmyxuxyxx 选择 个主成分,计算特征值 的信息贡献率为:p1,2j(12)1,jjmkb主成分 的累积贡献率为: (13)12,py 1pkmka8当
21、 接近于 1( )时,则选取前 个指标变量 作为 个主成pa0.85pap12,py分,代替原来 m 个指标变量,从而可以对 个主成分进行综合分析。其中主成分的得分即为相关系数矩阵 的特征值 ,及对应的特R120m征向量 。12,mu用 matlab 程序(见附录) ,得到酿酒红葡萄前 9 个主成分方差贡献率大于 87%,所以主成分选择前 9 个,并且得到主成分的得分。得到酿酒白葡萄的前 10 个主成分方差贡献率大于 85%,所以主成分选择前 10 个,并且得到主成分的得分。5.2.2 基于主成分贡献聚类评价模型根据主成分分析可以得出样本的主成分得分矩阵,得分矩阵作为样本矩阵表示为:(14)1
22、1mnnxX均值表示为: (15)1njijx标准差表示为: (16)21nj ijjisx极差表示为: (17)1maJijijnnRZScores 进行标准化转换: 0ijjijxss01,2jinm若若(18)变换后的数据均值为 0,标准差为 1,消去了量纲的影响,当抽样样本改变时,它仍能保持相对稳定性。对数据进行处理后再对样本进行分类,利用 SPSS 软件中的系统聚类法,通过比较可知,选择组间平均距离链接法结果较好,对个样本分类,红葡萄样品可以得出聚类图见图一。9图一结果分为三类见表 4。表 4 红葡萄分类结果分类 第一类 第二类 第三类葡萄样品号11 13 10 12 16 22 4
23、 9 8 619 20 23 17 27 5 7 2 1 18 15 21 325 26 14 24再结合葡萄酒质量品酒员得分,最终分为三个等级见表 5。表 5 红葡萄分级结果分级 好 中 差葡萄样品号25 26 14 2419 20 23 17 27 5 7 2 1 18 15 21 311 13 10 12 16 22 4 9 8 6同理,对白葡萄样品进行聚类分析得到聚类图见图二。10图二结果分为两类见表 6。表 6 白葡萄分类结果分类 第一类 第二类葡萄样品号5 20 28 9 11 12 23 2 4 14 26 21 17 3 158 16 6 7 18 10 24 1 13 19
24、25 22再结合葡萄酒质量品酒员得分,最终分为三个等级见表 7,另外葡萄酒样品 27 是独立点。表 7 白葡萄分级结果分级 好 差葡萄样品号5 20 28 9 11 12 23 2 4 14 26 21 17 3 158 16 6 7 18 10 24 1 13 19 25 22我们利用判别分析法对分类结果进行检验,这里我们选择白葡萄样品为检验对象,根据问题二中对白葡萄样品的聚类分析可知,白葡萄样品可以聚为两类,其中白葡萄样品 5,20,28,9,11,12,23,2,4,14,26,21,17,3,15 为第一类,白葡萄样品 8,16,6,7,18,10,24,1,13,19,25,22 为
25、第二类,利用已经分好的类,我们任意挑选出几个样品作为假定的未分类,在这里我们随机选择出 3,7,12,18,22 组作为预测组,利用 SPSS 软件中的判别分析窗口,输入表中的数据,选择十一个主成分和部分样品等级作为自变量,选择等级为分组变量,用 Fisher 函数系数,使用步进式方法,可以计算出组内相关系数、组内协方差、分组协方差和总协方差,得到预测结果如下表 8。11表 8 判别分析结果检验最高组 第二最高组 判别式 得分P(Dd | G=g)案例数目 实际组 预测组 p dfP(G=g | D=d)到质心的平方 Mahalanobis 距离组P(G=g | D=d)到质心的平方 Maha
26、lanobis 距离函数 11 2 2 0.931 1 0.972 0.008 1 0.028 7.082 -1.7252 1 1 0.471 1 0.811 0.519 2 0.189 3.438 0.2163 未分组 的 1 0.394 1 0.996 0.725 2 0.004 11.737 1.7884 1 1 0.81 1 0.981 0.058 2 0.019 7.924 1.1775 1 1 0.525 1 0.993 0.403 2 0.007 10.301 1.5716 2 1* 0.199 1 0.502 1.649 2 0.498 1.665 -0.3487 未分组 的
27、2 0.248 1 0.584 1.335 1 0.416 2.013 -0.4838 2 2 0.591 1 0.991 0.289 1 0.009 9.687 -2.1769 1 1 0.692 1 0.987 0.157 2 0.013 8.826 1.33310 2 1* 0.23 1 0.556 1.44 2 0.444 1.889 -0.26411 1 1 0.462 1 0.805 0.541 2 0.195 3.382 0.20112 未分组 的 1 0.705 1 0.912 0.144 2 0.088 4.819 0.55713 2 2 0.412 1 0.769 0.67
28、4 1 0.231 3.075 -0.81714 1 1 0.45 1 0.797 0.571 2 0.203 3.307 0.1815 1 2* 0.309 1 0.667 1.033 1 0.333 2.427 -0.62216 2 2 0.076 1 1 3.152 1 0 18.92 -3.41417 1 1 0.621 1 0.99 0.245 2 0.01 9.418 1.43118 未分组 的 2 0.135 1 0.999 2.232 1 0.001 16.551 -3.13219 2 2 0.443 1 0.995 0.588 1 0.005 11.163 -2.40520
29、1 1 0.298 1 0.653 1.085 2 0.347 2.349 -0.10621 1 1 0.261 1 0.998 1.262 2 0.002 13.674 2.0622 未分组 的 2 0.901 1 0.952 0.016 1 0.048 6.001 -1.51323 1 1 0.138 1 0.999 2.198 2 0.001 16.457 2.41924 1 1 0.336 1 0.698 0.927 2 0.302 2.598 -0.02625 2 2 0.75 1 0.984 0.101 1 0.016 8.369 -1.95726 1 1 0.735 1 0.98
30、5 0.115 2 0.015 8.489 1.275初始27 1 1 0.288 1 0.998 1.127 2 0.002 13.222 1.998从表 8 中可以看出,白葡萄样品 3,7,12,18,22 的预测分组分别是 1,2,1,2,2,这个结果与问题二中聚类的结果一样,由此可以得出结论对问题二的聚类判别的准确率为 100%。125.3 基于相关系数法的线性拟合对于问题三,我们首先建立相关系数模型: (19)(,)CovxyrD利用 EXCEL 软件进行数据处理,分别算出红色的酿酒葡萄与葡萄酒的理化指标之间的相关系数 见表 9,根据相关系数的大小来判断各项理化指标之间的线性相关度,
31、r时,可视为两个指标之间高度相关; 时可视为中度相关;0.8r 0.5.8r时,可视为低度相关; 时,可视为相关程度很弱,不相关。利用353rMATLAB 软件编程对表 9 进行搜索取值得到:其中加粗部分表示这两个指标之间高度相关,加粗带倾斜部分表示同种指标之间的相关系数,倾斜部分表示这两个指标之间中度相关。表 9 红色葡萄与酒各指标之间的相关系数花色苷 单宁 总酚 酒总黄 酮 白藜芦 醇 DPPH L*(D65) a*(D65) b*(D65)氨基酸总量 0.106 0.496 0.336 0.201 0.334 0.400 -0.236 -0.100 0.356蛋白质 0.296 0.47
32、1 0.435 0.438 -0.005 0.384 -0.484 -0.033 0.047VC 含量 -0.089 -0.092 -0.129 -0.099 -0.028 -0.122 0.122 0.107 -0.368花色苷 0.923 0.720 0.774 0.709 0.200 0.671 -0.834 -0.349 -0.240酒石酸 0.034 0.281 0.271 0.157 0.218 0.237 -0.243 0.010 0.462苹果酸 0.693 0.298 0.353 0.267 -0.186 0.246 -0.346 -0.559 -0.310柠檬酸 0.380
33、 0.145 0.139 -0.082 -0.204 0.018 -0.254 -0.269 -0.015多酚氧化酶力 0.481 0.142 0.154 0.124 -0.128 0.074 -0.411 -0.007 0.102褐变度 0.767 0.445 0.459 0.443 -0.095 0.381 -0.564 -0.335 -0.244DPPH 自由基 0.567 0.753 0.814 0.764 0.421 0.778 -0.707 -0.123 -0.055总酚 0.613 0.817 0.875 0.883 0.459 0.874 -0.754 -0.168 0.055
34、单宁 0.661 0.718 0.743 0.701 0.315 0.701 -0.677 -0.093 -0.204葡萄总黄酮 0.441 0.684 0.815 0.823 0.567 0.813 -0.609 -0.067 0.048白藜芦醇 -0.035 0.049 0.076 0.047 0.014 0.073 0.162 -0.449 -0.110黄酮醇 0.408 0.579 0.405 0.299 0.074 0.422 -0.524 -0.049 0.223可滴定酸 -0.216 -0.066 -0.115 -0.180 0.109 -0.061 0.198 0.266 0.
35、074固酸比 0.315 0.238 0.239 0.323 -0.093 0.217 -0.246 -0.435 0.067干物质含量 0.230 0.415 0.296 0.245 0.076 0.330 -0.204 -0.249 0.39213果穗质量 -0.104 -0.267 -0.184 -0.237 0.076 -0.196 0.021 0.223 -0.037百粒质量 -0.263 -0.329 -0.255 -0.248 -0.045 -0.229 0.309 0.150 -0.176果梗比 0.501 0.473 0.401 0.298 0.192 0.333 -0.47
36、3 -0.063 -0.090出汁率 0.328 0.360 0.398 0.482 0.257 0.423 -0.440 -0.008 -0.100果皮质量 -0.039 -0.077 -0.100 -0.097 -0.022 -0.034 -0.026 0.329 0.053L* 1 -0.366 -0.464 -0.444 -0.343 -0.033 -0.392 0.494 0.049 -0.189a*(+红;-绿) -0.369 -0.298 -0.287 -0.286 -0.281 -0.296 0.594 -0.542 -0.064b*(+黄;-蓝) -0.129 -0.121
37、-0.081 -0.182 -0.246 -0.127 0.349 -0.626 0.0255.3.1 相同理化指标相关系数分析得出:除白藜芦醇与色泽 b*的相关系数分别为 0.014 和 0.025 均在不相关范围内,以及色泽 L*和色泽 a*在低度相关范围内,其余各项相同指标之间的相关系数均在中高度线性相关范围内,这在很大程度上说明了葡萄酒中的理化指标含量与酿酒葡萄中的这些相同的指标含量有很大的线性联系。因为酿酒葡萄中花色苷、总黄酮和总酚与葡萄酒中花色苷、总黄酮和总酚之间的相关系数都是在高度相关范围内,所以以花色苷指标为例研究酿酒葡萄中的理化指标含量与葡萄酒中的这些相同指标含量之间的联系。
38、5.3.2 花色苷研究过程如下:27 个酒样品酿酒葡萄与葡萄酒中的花色苷含量见表 10。表 10 葡萄与葡萄酒中的花色苷含量酒中花色苷 葡萄中花色苷 酒中花色苷 葡萄中花色苷 酒中花色苷 葡萄中花色苷973.878 408.028 138.714 44.203 198.614 115.704517.581 224.367 11.838 7.787 74.377 23.523398.770 157.939 84.079 32.343 313.784 89.282183.519 79.685 200.080 65.324 251.017 74.027280.190 120.606 251.570
39、140.257 413.940 172.626117.026 46.186 122.592 52.792 270.108 144.88190.825 60.767 171.502 60.660 158.569 49.643918.688 241.397 234.420 59.424 151.481 58.469387.765 240.843 71.902 40.228 138.455 34.190根据表 10 中数据利用 matlab 软件可以画出酒中花色苷与葡萄中花色苷之间的线性拟合拟合结果见图三。140 100 200 300 400 500 600 700 800 900 1000050
40、100150200250300350400450中中中中中中中中中中中图三有图一结果分析得到酒中花色苷与葡萄中花色苷含量之间的线性关系符合函数:,并且拟合可信度 0.5 较高,说明可以对高度相关的0.35941.23yx20.851R指标进行线性拟合。同理根据附录四结果可以分析得到酒中总黄酮与葡萄中总黄酮含量之间的线性关系符合函数: ;酒中总酚与葡萄中总酚含量之间的1.34.67yx线性关系符合函数: 。由此可以得出酒中指标与葡萄中相同指标2.970之间存在正相关关系。5.3.3 不同指标之间的相关系数分析我们由表九可以得到不单是同种指标之间的相关系数很大,不同指标之间的相关系数也有很大值出现
41、,因此我们对这些指标进行如 3.2 相同过程处理见附录四,通过处理最终得出葡萄总黄酮与酒中 DPPH 含量之间的线性关系符合函数:; 酒中 DPPH 与酿酒葡萄总酚含量之间的线性关系符合函数:0.213.489yx;酒中总黄酮与酿酒葡萄中总酚含量之间的线性关系符合函数:456;酿酒葡萄中总黄酮与酒中总酚含量之间的线性关系符合函数:.9.yx;酿酒葡萄总酚与酒中单宁含量之间的线性关系符合函数:021784;酒总酚与酿酒葡萄 DPPH 含量之间的线性关系符合函数:.65.3yx15;酒中色泽与酿酒葡萄花色苷含量之间的线性关系符合函数:0.361.2yx。可以发现除酒中色泽 L*与酿酒葡萄花色苷之间
42、存在负相关关系,.498.其余皆是正相关关系。由以上结果我们最终可以得出结论:酿酒葡萄中花色苷含量对葡萄酒中的花色苷存在正相关联系,但对葡萄酒中的色泽却存在负相关联系,这说明酿酒葡萄中的花色苷含量对葡萄酒中的花色苷和色泽 L 理化指标含量的影响是相反的,即酿酒葡萄中花色苷含量越高,葡萄酒中花色苷含量也越高但是葡萄酒中的色泽 L 却越低,可见酿酒葡萄中的花色苷对葡萄酒中的理化指标含量很重要;酿酒葡萄中 DPPH 自由基含量对葡萄酒中的总酚存在正相关联系,并且酿酒葡萄中 DPPH 自由基与葡萄酒中的花色苷、单宁、总黄酮、色泽 L*都是中度相关的,并且与色泽 L*是中度负相关,因此酿酒葡萄中 DPP
43、H 自由基含量对葡萄酒中的指标很重要;酿酒葡萄中的单宁与葡萄酒中的花色苷、单宁、总酚、总黄酮、DPPH 自由基、色泽 L*都是中度相关的,且对色泽 L*是中度负相关的,这说明酿酒葡萄中的单宁含量对葡萄酒中的指标含量也很重要;而酿酒葡萄中的总酚含量对葡萄酒中的单宁、总酚、酒总黄酮和 DPPH 自由基都存在正相关联系,这说明酿酒葡萄中的总酚含量对葡萄酒的理化指标含量很重要;酿酒葡萄中的总黄酮含量对葡萄酒中的总酚、酒总黄酮和 DPPH 自由基也都存在正相关联系;这也说明酿酒葡萄中的总黄酮含量对葡萄酒的理化指标含量也很重要。另外,我们得到酿酒葡萄中的大部分指标含量对葡萄酒中的色泽 L*、a*及 b*是
44、负相关的。我们同样利用 EXCEL 软件进行数据处理,分别算出白色的酿酒葡萄与葡萄酒的理化指标之间的相关系数 见表 11。加粗部分表示这两种理化指标之间中度相关。r表 11 白色葡萄与酒各指标之间的相关系数单宁 总酚 酒总黄酮 白藜芦醇 DPPH L*(D65)a*(D65)b*(D65)氨基酸总量 0.428 0.480 0.293 -0.216 0.206 -0.414 0.080 0.280 蛋白质 0.362 0.419 0.605 -0.223 0.225 0.079 0.451 -0.132 VC 含量 -0.166 -0.100 -0.155 0.130 0.233 0.220
45、-0.093 -0.101 花色苷 -0.217 -0.298 -0.163 0.065 -0.176 -0.079 -0.119 0.067 酒石酸 0.182 0.005 -0.188 -0.309 0.099 -0.253 -0.305 0.312 苹果酸 0.046 0.122 0.467 -0.249 -0.123 0.099 0.378 -0.271 柠檬酸 0.248 0.080 0.163 -0.098 -0.049 -0.083 -0.232 0.165 多酚氧化酶活力 -0.237 -0.403 -0.232 0.156 -0.369 0.006 -0.024 -0.046
46、 褐变度 -0.054 -0.018 0.233 -0.012 0.049 0.023 0.026 0.097 DPPH 自由基 0.409 0.449 0.133 0.082 0.386 -0.053 0.056 0.028 总酚 0.428 0.547 0.744 -0.136 0.422 0.122 0.401 -0.200 单宁 0.574 0.573 0.346 -0.002 0.426 -0.248 0.045 0.198 葡萄总黄酮 0.495 0.588 0.697 -0.101 0.429 0.102 0.434 -0.206 白藜芦醇 -0.062 0.037 -0.095
47、 -0.213 -0.052 -0.311 0.074 0.218 黄酮醇 0.411 0.386 0.614 -0.095 0.360 -0.198 -0.003 0.239 可滴定酸 0.056 0.009 -0.128 0.054 0.063 0.311 0.182 -0.310 固酸比 0.039 0.082 0.138 -0.159 -0.089 -0.371 -0.176 0.355 干物质含量 0.229 0.265 0.114 -0.015 0.048 -0.721 -0.339 0.684 16果穗质量 0.071 0.061 0.094 -0.052 -0.036 0.45
48、7 0.455 -0.536 百粒质量 0.242 0.172 0.139 -0.136 0.144 0.457 0.459 -0.499 果梗比 -0.349 -0.434 -0.521 0.064 -0.050 0.072 -0.458 0.076 出汁率 -0.294 -0.292 -0.049 0.091 -0.151 0.689 0.414 -0.757 果皮质量 0.373 0.397 0.273 -0.092 0.137 0.324 0.300 -0.323 L* 0.060 0.106 0.133 -0.228 0.318 -0.142 -0.189 0.154 a* 0.031 -0.002 -0.001 0.169 -0.136 -0.130 -0.030 0.114 b* -0.082 -0.059 -0.070 -0.152 0.038 -0.250 -0.256 0.277 从表 11 的结果来看:酿酒葡萄中的蛋白质含量对葡萄酒中