1、02012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上
2、公示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 数模组 日期: 2012 年 09 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):02012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由
3、全国组委会评阅前进行编号):1葡萄酒的评价摘要本文对葡萄酒的评价结果、葡萄的分级、葡萄和葡萄酒的理化指标之间的关系等,进行定量分析并确定合理的评价指标体系。针对问题一,利用 SPSS13.0 对两组评酒员的评价结果进行配对比较分析,结果说明有显著性差异,再根据变异系数,得出第二组的结果更可信。针对问题二, 采用第二组评酒员对葡萄酒的评价结果作为根据,以组距(组距=(最大值-最小值)组数)为标准对葡萄酒划分为 3 或 4 个等级,然后以葡萄的理化指标为辅,综合两者的结果来对酿酒葡萄进行分级。通过主成分分析和聚类分析将酿酒葡萄的理化指标进行分类,根据各主成份在葡萄样品中的理化指标的标准化值与贡献率
4、的乘积之和: 1(9,127)jnjiinjzXY来确定各酿酒葡萄品质的高低,最后将红葡萄分为 3 级,白葡萄分为 4 级。针对问题三,先根据酿酒葡萄和葡萄酒所共有的理化指标之间的关系强度大小进行相关性分析,进而得到各个理化指标之间的相关关系及关系的强弱程度,再采用线性回归分析法求出共有的理化指标的回归方程,从而进一步阐述了这些理化指标之间的关系,最后较全面地分析出了葡萄和葡萄酒的理化指标之间的联系。针对问题四,先通过主成分分析和聚类分析将酿酒葡萄的理化指标进行简化,求出各主成分中的各个理化指标的贡献率,再以这些贡献率作为自变量,以第二组品酒员的品酒得分作为因变量,进行非线性曲线拟和的相关性分
5、析,最后得出相关系数R1。随后,对酿酒葡萄的芳香物质采用同样的分析方法,将酿酒葡萄的芳香物质与理化指标的贡献率综合成一组新的贡献率,并以此新贡献率为自变量,以第二组品酒员的品酒得分为因变量,再次进行同样的相关性分析,得出新的相关系数 R2,最后把 R1和 R2 进行对比,依此类推,用相同的方法求出葡萄酒的两个相关系数,进行对比,发现无论是酿酒葡萄还是葡萄酒,综合芳香物质后的相关系数都比单独用理化指标的相关系数大,因此,最终得出结论:不能单独用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,必须综合芳香物质才能较准确、合理地评价葡萄酒的质量。最后,对全文做出总结,并对模型进行了评价和推广。关键词:
6、配对比较 相关性分析 主成分分析 聚类分析 线性回归分析2问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文将研究以下问题:1.分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄
7、和葡萄酒的理化指标来评价葡萄酒的质量?问题分析葡 萄 酒 中 含 有 丰 富 的 营 养 物 质 ,至 今 多 达 600 种 以 上 的 物 质 被 测 定 出 来 。 葡 萄具 有 的 营 养 和 医 疗 作 用 很 早 就 被 认 识 ,如 本 草 纲 目 中 有 “葡 萄 酒 益 气 调 中 ,耐 饥 强志 ”和 葡 萄 酒 驻 颜 、 耐寒的记载 1。之所以葡萄酒有如此的保健和营养价值,不仅由于葡萄赋予葡萄酒以丰富的糖分和较丰富的矿质元素, 尤其是大量元素钾,锌、硒等微量元素对调节人体生理平衡,增强免疫系统都有很好的作用。葡萄酒中维生素、氨基酸、丰富的有机酸与多酚类物质、单宁等物质使
8、得葡萄酒具有其它类酒中没有的保健作用。葡 萄 酒 因 其 特 殊 的 营 养 价 值 和 较 好 的 保 健 效 果 , 越 来 越 受 到 广 大 消 费 者 的 欢 迎 。在 此 形 势 下 , 葡 萄 酒 认 证 和 质 量 评 价 得 到 关 注 。 葡 萄 酒 的 质 量 , 即 葡 萄 酒 优 秀 的 程度 , 它 是 产 品 的 一 种 特 性 ,且 决 定 购 买 者 的 可 接 受 性 。 因 此 , 葡 萄 酒 能 够 满 足 人 类需 求 的 各 种 特 性 的 总 和 即 构 成 了 它 的 质 量 。 葡 萄 酒 认 证 保 证 了 市 场 中 酒 的 质 量 , 同
9、时 保 护 了 消 费 者 的 利 益 。 葡 萄 酒 的 认 证 包 括 理 化 性 质 分 析 、 感 官 评 价 、 物 理 化 学 指标 、 卫 生 指 标 等 手 段 。 质 量 评 价 是 认 证 中 的 重 要 阶 段 , 它 有 益 于 提 高 葡 萄 酒 的 酿 造工 艺 , 同 时 为 市 场 定 位 提 供 决 策 信 息 2。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。葡 萄 酒 的 每 一 项 理 化 指 标 是 其 质 量 的 单一 体 现 , 而 感 官 指 标 则 是 葡 萄 酒 质 量 的 综 合
10、 概 括 , 换 句 话 说 , 一 个 理 化 指 标 、 卫生 指 标 都 合 格 的 葡 萄 酒 未 必 是 高 质 量 的 葡 萄 酒 。 在 今 后 的 一 个 时 期 , 我 们 需 要 做的 是 从 葡 萄 酒 的 特 点 出 发 , 围 绕 葡 萄 和 葡 萄 酒 理 化 指 标 、 感 官 指 标 等 众 多 因 素 对葡 萄 酒 质 量 的 联 系 进 行 研 究 , 尽 可 能 确 定 较 为 合 理 的 葡 萄 酒 质 量 评 价 标 准 , 从 而 实现 既 保 证 市 场 中 酒 的 质 量 , 保 护 消 费 者 利 益 , 又 能 为 市 场 定 位 提 供 决
11、 策 信 息 , 达到 经 济 效 益 的 目 的 , 实 现 双 赢 。模型假设1假设红葡萄与白葡萄样品酒的生产工艺都相同。2假设评酒员的评酒水平基本是稳定的。符号说明评酒员的评分结果的标准差:s评酒员的评价结果的均值x3评酒员的评价结果的变异系数:v第 主成份的各个指标的标准化测量值之和ix第 主成分的贡献率:iy红葡萄样品 的理化指标得分jzj红葡萄样品 的第 主成分的各个指标的标准化测量值之和:jixi红葡萄酒对应的理化指标1a红葡萄对应的理化指标:b模型的建立和求解问题一1.问题分析针对问题 1,我们把第一组的红葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的红葡萄酒的品尝
12、得分的平均值归为一个样本组,再把第一组的白葡萄酒的品尝得分的平均值归为一个样本组,把第二组对应编号的白葡萄酒的品尝得分的平均值归为一个样本组,并采用 SPSS13.0 进行两次配对比较分析。2.模型一的建立与求解接着通过运用 SPSS13.0 软件运算可得,检验值 P=0.020,由于 Pa,(a=0.05),所以可以认为两组评酒员的评价结果有显著性差异。如图 1Paired Samples TestPaired Differences t df Sig. (2-tailed)MeanStd. DeviationStd. Error Mean95% Confidence Interval of
13、 the Difference Lower Upper Pair 1Ft - Sd2.56296 5.37424 1.03427 .43699 4.68894 2.478 26 .020Pair 2f2 - s2-2.521435.35934 1.01282-4.59956-.44329 -2.490 27 .019图 1 两组评酒员的品尝评分的检验结果因为两组的评价结果有显著性差异,所以利用变异系数来确定哪一组的评价结果更可信。同样利用 SPSS13.0 软件运算可得,第一组评价结果的标准差 =7.36093,第1s4二组评价结果的标准差 =3.97799。第一组评价结果的均值 =73.07
14、78,第二组评价2s 1x结果的均值 =70.5148。变异系数 ,第一组评价结果的变异系数 =1.41661,第2xsvx1v二组评价结果的变异系数为 =0.76556,由于 , ,所以可以认为第二组的结212s1v2果更可信,如图 2。Paired Samples StatisticsMean N Std. DeviationStd. Error MeanFirst 73.0778 27 7.36093 1.41661Pair 1Second 70.5148 27 3.97799 .76556f2 74.0107 28 4.80404 .90788Pair 2s2 76.5321 28 3
15、.17094 .59925图 2 两组评酒员的品尝评分的变异系数分析问题二1.数据分析主成分分析法首先对红葡萄的理化指标数据进行分析,考虑到理化指标较多,因此,采用主成份分析法对指标进行重新筛选和组合。按照主成份分析的理论,若前 R 个主成份的累计贡献率达到了 85%原则,则这 R 个主成份能反映足够的信息 3。利用 SPSS13.0 对红葡萄的 28 个理化指标进行主成份分析得出前 9 个主成份的累计贡献率已达到 86.278%,故选取前 9 个特征值作为相互独立的新的综合性指标。如表 1表 1 评价因子的特征根和累计贡献率Tabal1 The latent root and varianc
16、e contribution rate of evaluation factor 主成分 特征根 初始特征值贡献率(%) 累计方差贡献率(%)Principal Component latent root Contribution rateCunulative contribution rate1 6.963 23.211 23.2112 4.984 16.612 39.8243 3.692 12.305 52.1294 2.842 9.472 61.6015 1.994 6.647 68.2486 1.738 5.795 74.0427 1.428 4.761 78.8038 1.274 4
17、.245 83.0489 0.969 3.230 86.278可以分析出以下结果,第 1 主成分与蛋白质、单宁、DPPH 自由基、葡萄总黄铜、花色苷、总酚有较大正相关;第 2 主成分与总糖、干物质含量、还原糖、可溶性固形5物有较大正相关;第 3 主成分与白藜芦醇、果皮颜色 A、果皮颜色 B 有较大正相关,但与可滴定酸、果皮质量有较大负相关;第 4 主成分与 PH 值有较大正相关,但与苹果酸、褐变度、多酚氧化酶有较大负相关;第 5 主成分与果穗质量、固酸比有较大正相关,但与 VC 含量有较大负相关;第 6 主成分与黄铜醇有较大负相关;第 7 主成分与黄铜醇、果皮质量有较大正相关;第 8 主成分与
18、柠檬酸、酒石酸有较大负相关;第 9 主成分与有 VC 含量有较大正相关。如表 2表 2 红葡萄主成分矩阵Table2 Principal component matrix变量 因子 FactorVariable 1 2 3 4 5 6 7 8 9氨基酸 0.382 0.532 0.021 0.463 -0.256 -0.28 0.172 0.001 0.092蛋白质 0.608 -0.502 0.198 0.254 0.207 -0.134 0.112 -0.16 0.024VC 含量 -0.147 -0.398 0.107 -0.022 -0.532 0.151 -0.015 0.141 0
19、.626花色苷 0.845 -0.115 -0.107 -0.299 0.099 0.187 -0.111 0.076 0.012酒石酸 0.378 0.102 0.364 0.383 0.304 -0.14 0.225 -0.5 0.053苹果酸 0.392 0.324 0.146 -0.654 0.089 0.353 -0.152 0.151 -0.026柠檬酸 0.297 0.298 0.317 -0.374 0.351 -0.045 0.333 -0.427 0.221多酚氧化酶 0.318 0.093 -0.221 -0.598 0.243 -0.359 0.019 0.106 -0
20、.013褐变度 0.595 -0.088 0.042 -0.707 -0.02 -0.066 -0.09 0.108 0.101DPPH 自由基 0.751 -0.473 0.006 0.205 -0.012 0.115 0.206 0.123 -0.21总酚 0.862 -0.191 -0.163 0.228 -0.019 0.184 -0.03 0.109 -0.236单宁 0.757 -0.161 -0.272 -0.07 -0.154 0.26 0.249 -0.052 0.092葡萄总黄酮 0.717 -0.302 -0.18 0.283 0.04 0.298 0.11 0.078
21、-0.276白藜芦醇 0.06 -0.05 0.828 0.048 -0.191 0.166 0.29 0.289 0.043黄酮醇 0.557 0.014 0.026 -0.065 -0.193 -0.49 0.466 0.245 0.077总糖 0.268 0.776 -0.148 0.271 0.101 -0.05 -0.077 0.274 0.069还原糖 0.085 0.759 -0.128 0.155 0.086 -0.111 -0.086 0.119 0.063可溶性固形物 0.258 0.75 -0.319 0.162 0.114 -0.056 -0.034 0.255 0.0
22、11PH 值 0.264 -0.293 0.202 0.692 0.126 -0.123 -0.291 0.218 0.205可滴定酸 -0.291 0.454 -0.598 0.01 -0.33 0.245 0.296 -0.115 -0.026固酸比 0.391 -0.051 0.43 -0.008 0.534 -0.138 -0.328 0.204 0.0956干物质含量 0.386 0.849 -0.197 0.111 0.085 -0.025 0.047 0.041 0.103果穗质量 -0.347 -0.453 -0.223 0.065 0.602 0.029 0.225 0.09
23、7 0.229百粒质量 -0.536 -0.357 -0.474 0.09 0.262 0.146 0.193 0.234 -0.044果梗比 0.578 -0.219 0.174 -0.217 -0.426 -0.392 0.085 0.055 -0.067出汁率 0.547 -0.192 -0.255 0.162 0.036 0.397 -0.133 -0.014 0.384果皮质量 -0.257 -0.248 -0.621 -0.099 0.314 -0.08 0.459 0.254 0.126果皮颜色 L -0.571 -0.321 0.302 -0.046 0.045 -0.314
24、0.07 0.336 -0.12果皮颜色 A -0.332 0.292 0.737 0.034 0.002 0.289 0.245 0.221 -0.071果皮颜色 B -0.136 0.502 0.594 -0.034 0.213 0.446 0.277 0.115 -0.0242.数据验证聚类分析法下面的工作我们进一步采用聚类分析法对结果进行验证。聚类分析是研究分类问题的多元统计方法之一,就是根据研究对象的特征把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同类之间的个体具有高度的异质性的多元分析技术的总称 4。对红葡萄的理化指标进行 R 型因子聚类分析,得到理化指标的聚类
25、谱系图,同时依据主成分分析的结果将 28 项指标聚成 9 类,从聚类图谱的聚类距离和聚类的先后步骤可以看出,果穗质量、百粒质量、果皮质量聚成一类,说明这 3 个指标间的相关性很高,也就是说这 3 个性状为相似水平类;依次类推,PH 值与固酸比聚成一类,即这 2 个性状为相似水平类;花色苷、苹果酸、多酚氧化酶活力、黄酮醇、褐变度、果梗比聚为一类,即这 6 个性状为相似水平类;蛋白质、DPPH 自由基、总酚、单宁、葡萄总黄酮、出汁率聚为一类,即这 6 个性状为相似水平类;白藜芦醇、果皮颜色 A、果皮颜色 B 聚为一类,即这 3 个性状为相似水平类;酒石酸与柠檬酸聚为一类,即这 2 个性状为相似水平
26、类;氨基酸总量、还原糖、可溶性固形物、干物质含量、可滴定酸、总糖聚成一类,即这 6 个性状为相似水平类;果皮颜色 L、VC 含量无相似项单独为一类。这表明,同为一相似类别的果实品质理化指标之间具有较高的相关性,可选用一个理化指标代表同一水平类其它理化指标,将 28 个酿酒红葡萄理化指标予以简化,其中无相似项的果实理化指标具有相对独立性,结果表明,聚类分析验证了主成分分析结果的正确性。如图 37图 3 红葡萄不同理化指标聚类分析结果(n=30)3.模型二的建立和求解然后,通过上述的主成分分析和聚类分析,我们得到了红葡萄理化指标中具有代表性的 9 个主成分以及每个主成分所包含的指标,如表 3。表
27、3 红葡萄理化指标的主成分分析结果(n=30)主成分 包含成分名称 贡献率(%)第一主成分 果皮颜色 L 23.211第二主成分 果穗质量,百粒质量,果皮质量 16.612第三主成分 VC 含量 12.305第四主成分 PH 值,固酸比 9.472第五主成分 花色苷,苹果酸,多酚氧化酶活力,黄酮醇,褐变度,果梗比 6.647第六主成分 蛋白质,DPPH 自由基,总酚,单宁,葡萄总黄酮, 出汁率 5.795第七主成分 白藜芦醇,果皮颜色 A,果皮颜色 B 4.761第八主成分 酒石酸,柠檬酸 4.245第九主成分 氨基酸总量,还原糖,可溶性固形物,干物质含 量,可滴定酸,总糖 3.230在主成份
28、分析法理论中,贡献率达到 85%以上便具有统计学上的意义,因此,基于这一理论,我们不妨用各个指标的测量值与各自对应的贡献率的乘积的和来作为葡萄的理化指标得分,而为了使指标的测量值具有计算意义,我们把各个指标的测量值进行量纲统一,即把各个指标的测量值的均值标准化,以此新数据作为葡萄的各个指标的新的测量值,再以主成份为顺序进行排序。 (详见附录。 )8设第 主成份的各个指标的标准化测量值之和为 ,第 主成分的贡献率为 ,i ixiy红葡萄样品 的理化指标得分为 ,红葡萄样品 的第 主成分的各个指标的标准化jjzj测量值之和为 ,则可建立如下模型:jiX112192212991876231%.086
29、21.073.2%18.97495.4.6.0.jiinjixyxyzYzXY(9,7)j表 4 红葡萄的理化指标得分和评酒师对红葡萄的评分红葡萄样品 理化指标得分 评酒师得分葡萄样品01 18.99734 681葡萄样品02 46.41101 740葡萄样品03 51.67698 746葡萄样品04 -99.604 712葡萄样品05 72.28346 721葡萄样品06 -60.9712 663葡萄样品07 -93.878 653葡萄样品08 109.0392 660葡萄样品09 25.43808 782葡萄样品10 35.6495 688葡萄样品11 11.19592 616葡萄样品12
30、 -22.6788 683葡萄样品13 -21.1032 6889葡萄样品14 28.3185 726葡萄样品15 -65.9898 657葡萄样品16 -63.2904 699葡萄样品17 52.23925 745葡萄样品18 -79.9643 654葡萄样品19 1.075881 726葡萄样品20 30.78321 758葡萄样品21 -46.9646 722葡萄样品22 -56.9601 716葡萄样品23 80.72203 771葡萄样品24 32.27933 715葡萄样品25 -48.8541 682葡萄样品26 78.52161 720葡萄样品27 -14.3728 7154.
31、模型二的检验与分析通过以上的计算,我们得到了红葡萄的理化指标得分,又因为酿酒葡萄的质量与所酿葡萄酒的质量有直接的关系,即葡萄酒的质量的高低应与酿酒葡萄的理化指标得分的高低相一致,因此,可以利用评酒师对葡萄酒的感官得分来验证以上理化指标计算的合理性和正确性,如图 4。10图 4 红葡萄的理化指标得分和评酒师对红葡萄的评分比较显然可见,所计算出的红葡萄的理化指标得分与评酒师的感官得分在图表上具有高度的一致性,说明了指标模型的正确性和可行性。所以,一般而言,葡萄酒的质量越高,可以推断酿酒葡萄的质量也越高,这是因为虽然能有许多工艺措施对葡萄的缺点进行补救,但想用先天不足的葡萄酿出香气馥郁、结构丰满协调
32、、典型性独特的葡萄酒几乎是不可能的,所以葡萄酒的质量高,酿酒葡萄的质量也会高;反过来,虽然酿酒葡萄的质量是决定葡萄酒的关键因素,但却不一定能推断出葡萄酒的质量也越高。这是因为酿酒工艺及关键步骤对葡萄酒的风格和质量都有重要影响,所以葡萄的理化指标只能在一定程度上反映葡萄酒的质量 5。因此,我们要以葡萄酒的质量得分为主,葡萄的理化指标为辅对红葡萄进行分级,根据这个思路,我们以将酿酒红葡萄按评酒员的评分高低划分为3个等级,以组距为划分标准,组距=(最大值-最小值)组数=(782-616)3=56,以56组距划分,可得到第一组得分是782740,第二组得分是726681,第三组得分是663616,即对
33、应为一级,二级,三级,如表5。表 5 红葡萄的分级级别 红葡萄样品一级 红葡萄 2,红葡萄 3,红葡萄 9,红葡萄 17,红葡萄 20,红葡萄 23二级红葡萄 1,红葡萄 4,红葡萄 5,红葡萄 10,红葡萄 12,红葡萄 13,红葡萄 14,红葡萄 16,红葡萄 19,红葡萄 21,红葡萄 22,红葡萄24,红葡萄 25,红葡萄 26,红葡萄 27三级 红葡萄 6,红葡萄 7,红葡萄 8,红葡萄 11,红葡萄 15,红葡萄 18同理,计算得出白葡萄的等级划分,因主成分分析中得出的主成分较多,为了使划分更具合理性,我们将白葡萄按照得分高低分为 4 个等级,如表 6。 (算白葡萄的数据均在附录)
34、表 6 白葡萄的分级级别 白葡萄样品一级 白葡萄 6,白葡萄 10,白葡萄 11,白葡萄 15,白葡萄 17,白葡萄21,白葡萄 22,白葡萄 25,白葡萄 2811二级白葡萄 1,白葡萄 2,白葡萄 3,白葡萄 5,白葡萄 7,白葡萄 14,白葡萄 16,白葡萄 18,白葡萄 19,白葡萄 20,白葡萄 23,白葡萄 24,白葡萄 27三级 白葡萄 4,白葡萄 8,白葡萄 9,白葡萄 12,白葡萄 13,白葡萄 26四级 白葡萄 16问题三1.问题分析针对问题三,酿酒葡萄和葡萄酒的理化指标之间的联系全面概括为以下 3 种:第一种是葡萄与葡萄的理化指标之间的联系,第二种是葡萄酒与葡萄酒的理化指
35、标之间的联系,第三种是葡萄与葡萄酒的理化指标之间的联系。我们利用 SPSS13.0 对这 3 种联系的理化指标之间进行相关性分析及回归分析,以这两种分析代表理化指标之间的联系。2.理化指标约定记红葡萄中的 9 个理化指标分别为花色苷 1、单宁 1、总酚 1、葡萄酒总黄铜 1、白藜芦醇 1、DPPH1、果皮颜色 L1、果皮颜色 A1、果皮颜色 B1。记红葡萄酒中的 9 个理化指标分别为花色苷 2、单宁 2、总酚 2、葡萄酒总黄铜 2、白藜芦醇 2、DPPH2、果皮颜色 L2、果皮颜色 A2、果皮颜色 B2。记白葡萄中的 8 个理化指标分别为单宁 3、总酚 3、葡萄酒总黄铜 3、白藜芦醇3、DPP
36、H3、果皮颜色 L3、果皮颜色 A3、果皮颜色 B3。记白葡萄酒中的 8 个理化指标分别为单宁 4、总酚 4、葡萄酒总黄铜 4、白藜芦醇4、DPPH4、果皮颜色 L4、果皮颜色 A4、果皮颜色 B4。3.强度关系的联系相关性分析3.1 红葡萄和红葡萄酒之间的理化指标的相关性分析:表 7 红葡萄和红葡萄酒的理化指标之间的交互矩阵由表 6 中的交互矩阵可得红葡萄和红葡萄酒的理化指标的相关关系是:3.1.1 红葡萄中的花色苷和红葡萄酒中的花色苷、总酚、单宁、葡萄酒总黄酮、DPPH 具有较大的正相关,和红葡萄酒中的果皮颜色 L 具有较大负相关。3.1.2 红葡萄中的单宁和红葡萄酒中的花色苷、总酚、单宁
37、、葡萄酒总黄酮、DPPH具有较大的正相关,和红葡萄酒中的果皮颜色 L 具有较大负相关。123.1.3 红葡萄中的总酚和红葡萄酒中的花色苷、总酚、单宁、葡萄酒总黄酮、DPPH具有较大的正相关,和红葡萄酒中的果皮颜色 L 具有较大负相关。以此类推,其余的理化指标之间的相关性也可从图表中得出。3.2 红葡萄与红葡萄的理化指标之间的相关性分析:表 8 红葡萄和红葡萄的理化指标之间的交互矩阵3.2.1 红葡萄中的花色苷和单宁、总酚、葡萄总黄酮具有较大的正相关,和红葡萄中的果皮颜色 L 具有较大的负相关。3.2.2 红葡萄中的单宁和总酚、葡萄总黄酮、DPPH、花色苷具有较大的正相关。3.2.3 红葡萄中的
38、总酚和单宁、葡萄总黄酮、DPPH、花色苷具有较大的正相关。以此类推,其余的理化指标之间的相关性也可从图表中得出。3.3 红葡萄酒与红葡萄酒的理化指标之间的相关性分析:表 9 红葡萄酒和红葡萄酒的理化指标之间的交互矩阵3.3.1红葡萄酒中的花色苷和总酚、单宁、葡萄酒总黄酮、DPPH 具有较大的正相关,和果皮颜色 L 具有较大负相关。133.3.2 红葡萄酒中的单宁和花色苷、总酚、葡萄酒总黄酮、DPPH 具有较大的正相关,和果皮颜色 L 具有较大负相关。3.3.3 红葡萄酒中的总酚和花色苷、单宁、葡萄酒总黄酮、DPPH 具有较大的正相关,和果皮颜色 L 具有较大负相关。以此类推,其余的理化指标之间
39、的相关性也可从图表中得出。3.4 白葡萄和白葡萄酒中的理化指标之间的相关性分析:表 10 白葡萄和白葡萄酒的理化指标之间的交互矩阵3.4.1 白葡萄酒中的单宁和白葡萄中的单宁、总黄酮具有较大的正相关。3.4.2 白葡萄酒中的总酚和白葡萄中的总酚、单宁、总黄酮具有较大的正相关。3.4.3 白葡萄酒中的总黄酮和白葡萄中的总酚、总黄酮具有较大的正相关。以此类推,其余的理化指标之间的相关性也可从图表中得出。3.5 白葡萄与白葡萄的理化指标之间的相关性分析:表 11 白葡萄和白葡萄的理化指标之间的交互矩阵143.5.1 白葡萄中的单宁和总酚、总黄酮具有较大的正相关。3.5.2 白葡萄中的总酚和单宁、总黄
40、酮具有较大的正相关。3.5.3 白葡萄中的总黄酮和总酚、单宁具有较大的正相关。以此类推,其余的理化指标之间的相关性也可从图表中得出。3.6 白葡萄酒与白葡萄酒的理化指标之间的相关性分析:表 11 白葡萄酒和白葡萄酒的理化指标之间的交互矩阵3.6.1 白葡萄酒中的单宁和总酚、DPPH 具有较大的正相关。3.6.2 白葡萄酒中的总酚和总黄酮、单宁、DPPH 具有较大的正相关。3.6.3 白葡萄酒中的总黄酮和总酚具有较大的正相关。以此类推,其余的理化指标之间的相关性也可从图表中得出。4.数量关系的联系线性回归分析因为相关分析只测度了变量之间的关系强度这一联系,所以我们从数量伴随关系的角度出发,用回归
41、分析进一步说明酿酒葡萄和葡萄酒对应的理化指标之间的联系,以便更加全面地阐释这些理化指标之间的联系。利用 Excel 对已经标准化的理化指标值进行线性回归分析,则建立了以下对应的线性回归方程模型:4.1 令红葡萄酒的理化指标为 ,红葡萄的理化指标为 ,可以分别得到以下的回归方icid程:4.1.1 花色苷 1 对花色苷 2 的估计的回归方程: ,表示110.35946c+0.52367花色苷 2 每增加 1 单位,花色苷 1 平均增加 。以下的回归方程以此类推。.4.1.2 单宁 1 对单宁 2 的估计的回归方程: 22=7.894d4.1.3 总酚 1 对总酚 2 的估计的回归方程: 33.9
42、015c+164.1.4 总黄酮 1 对总黄酮 2 的估计的回归方程: 446.74.1.5 白藜芦醇 1 对白藜芦醇 2 的估计的回归方程: 55=.29c0243d154.1.6 DPPH 1 对 DPPH 2 的估计的回归方程: 66=0.8375c+0.18973d4.1.7 果皮颜色 L1 对果皮颜色 L2 的估计的回归方程: 225.4684.1.8 果皮颜色 A1 对果皮颜色 A2 的估计的回归方程: 88-.c14.1.9 果皮颜色 B1 对果皮颜色 B2 的估计的回归方程: 99=0371-0.73d4.2 令白葡萄酒的理化指标为 ,白葡萄的理化指标为 ,分别可以得到以下的回
43、归方jajb程:4.2.1 单宁 3 对单宁 4 的估计的回归方程: 11=.397658a+.704254.2.2 总酚 3 对总酚 4 的估计的回归方程: 2203891b4.2.3 总黄酮 3 对总黄酮 4 的估计的回归方程: 3.a.64.2.4 白藜芦醇 3 对白藜芦醇 4 的估计的回归方程: 44=-6107+074.2.5 DPPH3 对 DPPH4 的估计的回归方程: 55b1.208a.2394.2.6 果皮颜色 L3 对果皮颜色 L4 的估计的回归方程:66b=-1.475803a+1.903784.2.7 果皮颜色 A3 对果皮颜色 A4 的估计的回归方程: 77b=-0
44、.532168a-.319584.2.8 果皮颜色 B3 对果皮颜色 B4 的估计的回归方程: 894+02问题四1.问题分析由于葡萄酒和酿酒葡萄的理化指标过多,首先考虑利用 SPSS 对各自的理化指标进行主成分分析和聚类分析,对这些理化指标进行筛选和重新组合。在寻找聚类后的变量数组中,寻求理化指标和葡萄酒质量的联系。由于新数组依旧是多组数列,所以我们运用了 1st0pt 的非线性曲线拟合,得出其相关系数(R) ,并比较相关系数( R)的数值和大小来确认理化指标和葡萄酒质量之间的联系。2.数据处理由于附录 3 中,大量的空白数据,数据处理的原则是把任意一成分中,只要超过 3/4 的空白值,也就
45、是 10 个空白值,就剔除该指标的数据,小于或者等于 10 个空白数据的指标,用零(0)填充空白处。再对芳香物质依照上述方法,进行聚类分析和主成分分析。得到每个样品对各成分的贡献值。以此来进行以下相关性分析。3.模型的建立利用非线性曲线拟合处理工具 1stOpt,把酿酒葡萄、葡萄酒的理化指标分别和葡萄酒质量进行非线性曲线拟合,得到相应的相关系数,根据相关系数的大小来判定酿酒葡萄、葡萄酒的理化指标对葡萄酒质量影响的大小。然后把酿酒葡萄、葡萄酒的理化指标分别和对应的芳香物质的理化指标进16行综合后再和葡萄酒质量进行非线性曲线拟合,得到相应的相关系数,根据系数的大小来论证能否用葡萄和葡萄酒的理化指标
46、来评价葡萄酒的质量。4模型的求解相关性分析4.1.红葡萄的理化指标和红葡萄酒质量的相关性分析:相关系数(R1): 0.854520888039729图 5由相关系数和拟合图形可知:红葡萄的理化指标对葡萄酒的质量具有较大的影响。4.2 红葡萄酒的理化指标和红葡萄酒质量的相关性分析:相关系数(R2): 0.641487408864809图 6由相关系数和拟合图形可知:红葡萄酒的理化指标对葡萄酒的质量具有较大的影响。4.3 综合红葡萄的理化指标与红葡萄对应的芳香物质和红葡萄酒质量的相关性分析:相关系数(R3): 0.929307451759153图 7由 R3R1 可得:仅仅依靠红葡萄的理化指标能够
47、在一定程度上来反映葡萄酒的质量,但是,若综合红葡萄的理化指标与红葡萄对应的芳香物质指标后更能真实地评价葡萄酒的质量。4.4 综合红葡萄酒的理化指标与红葡萄酒对应的芳香物质和红葡萄酒质量的相关性分析:相关系数(R4): 0.83823499554582317图 8由 R4R2 可得:仅仅依靠红葡萄酒的理化指标能够在一定程度上来反映葡萄酒的质量,但是,若综合红葡萄酒的理化指标与红葡萄酒对应的芳香物质指标后更能真实地评价葡萄酒的质量。以同样的方法分析白葡萄、白葡萄酒的理化指标和葡萄酒质量的相关性,以及白葡萄、白葡萄酒的芳香物质分别和葡萄酒质量的相关性。得到以下总图:图 9由此得出单独考虑理化指标或者
48、芳香物质不能很好地反映出葡萄酒的质量。只有综合考虑葡萄样品中的理化指标和芳香物质才能更好的反映出葡萄质量水平。18模型的评价和推广1.模型的优点1.1 运用 1stopt 非线性曲线拟合进行处理,得到的相关系数,可以代表整组变量中的整体曲线趋势,而单纯的相关性分析没有这个效果。主成分分析和聚类分析得出的变量贡献模型,可以很好地反映原来数据的性质,又可以简化变量。 1.2 主成份分析、相关性分析和聚类分析可以使多个指标简化成几个主要的指标,可以简化检测程序,提高检测效率。2.模型的缺点与改进以通过主成份分析和聚类分析筛选出的指标作为研究分析的基础,存在一定的误差。3.模型的推广对于问题二,还可以
49、通过相关性分析求出葡萄中的各项理化指标与评酒员得分的相关系数,由相关系数的大小选择几个具有代表性的理化指标。根据已经分级的葡萄(以评酒员对葡萄酒的评分为分级基础)确定相应级别的具有代表性的理化指标的含量区间,最后,也可以依据具有代表性的理化指标的含量区间作为葡萄分级的标准。由对问题三的分析可知,酿酒葡萄的某些理化指标和葡萄酒的某些理化指标之间具有较大的相关性,而葡萄酒的理化指标会在一定程度上反映葡萄酒的质量。所以,我们在把酿酒葡萄加工成葡萄酒的工艺过程中,应特别注意酿酒葡萄和葡萄酒之间具有较大相关性的物质的保护,例如花色苷、单宁、总酚等,并不断改进加工工艺,提高葡萄酒的品质;另外还要注意葡萄的种植条件 6。参考文献1.聂继云,李明强,张桂芳,等.白梨品质评价指标的聚类分析J.中国果树,2000,(2):16-172.李运,李记明,姜忠军,等.统计分析在葡萄酒质量评价中的应用J.酿酒科技,2009,(4):81-823.梁学军, 诸葛宏庆