收藏 分享(赏)

葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc

上传人:无敌 文档编号:679718 上传时间:2018-04-18 格式:DOC 页数:51 大小:2.56MB
下载 相关 举报
葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc_第1页
第1页 / 共51页
葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc_第2页
第2页 / 共51页
葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc_第3页
第3页 / 共51页
葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc_第4页
第4页 / 共51页
葡萄酒的评价_大学生数学建模大赛国家二等奖论文.doc_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、1葡萄酒的评价摘要随着中国经济增长,葡萄酒也越来越普及化。然而市场上也出现了葡萄酒造假现象。于是怎样对葡萄酒进行评价越来越成为人民关注的重点。本文就葡萄酒的评价问题进行了研究分析。针对问题一,我们首先对附件 1 中各个指标的评分分数通过 SAS 软件进行归一化,得到一个统一的分数标准。观察附件 1 所给的数据,我们发现少部分数据存在异常、缺失的情况,因此我们先分别用原始数据和处理后的数据通过SAS 软件对两组红葡萄酒之间,两组白葡萄酒之间进行正态性检验,结果得到正态性分布不太明显,所以继续用 SAS 软件对其进行配对两样本的非参数检验。应用 UNIVARIATE 过程对数据进行检验后,得到两组

2、品酒员对红、白葡萄酒的评价结果都存在显著性差异。最后用假设检验的方法分别求两组品酒员评分的方差置信空间,接着进行方差比较,得出第二组品酒员的评价结果比较可信。针对问题二,首先在 EXCEL 中整理附件 2 和附件 3 的数据,对测试多次的指标求平均值,将不同样品的芳香物质进行求和操作。本题只考虑酿酒葡萄的一级指标,另外,将芳香物质也作为划分葡萄等级的标准之一。然后对所要考虑的因素通过 SAS 软件进行主成分分析,留下主成分。接着根据这些主成分,用 WARD 系统聚类分析的方法画出使用 WARD 法的谱系聚类图,对酿酒葡萄进行分类。等级 葡萄种类 第一类 第二类 第三类 第四类 第五类红葡萄 1

3、 2 3 9 23 11 6 7 12 15 18 5 10 17 20 24 25 264 8 13 14 16 9 21 22 27白葡萄 6 7 18 15 24 13 2712 14 2 8 11 16 3 9 19 23 25 26 2821 1 4 10 17 22 5 20针对问题三,为了从总体上把握两组指标之间的相关关系,用 SAS 软件做典型相关分析。首先考虑葡萄和葡萄酒所有指标之间的相关关系,用 SAS 软件进行分析后,发现两组指标之间的典型相关系数为 1,所以剔除相关系数较大的葡萄指标,然后用剩下葡萄指标与葡萄酒指标再进行典型相关分析,得出酿酒葡萄与葡萄酒的理化指标之间的

4、相关性很大,但不为 1,说明两组指标之间的相关性很大,得出葡萄和葡萄酒理化指标之间联系密切。针对问题四,根据问题三经过典型相关性分析得到的葡萄理化指标来讨论酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,建立多元线性回归模型,并通过 MATLAB 对所得模型进行残差分析和数据拟合,通过数据拟合图来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,然后用残差图进行检验。结果分析所建模型是合理的。由于葡萄和葡萄酒中都含有芳香物质,而葡萄酒质量的评定指标中有香气分析,因此接着我们继续考虑芳香物质和香气之间的关系,进一步论证芳香物质与葡萄酒质量之间的联系,结果得到相关性不明显,说明芳香物质不影响葡萄酒

5、质量,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。2最后,对模型的优缺点总结分析。利用文中所得结果能较好地评定葡萄酒好坏,对消费者购买葡萄酒提供了一定的参考价值,具有很好的实际意义。关键词 非参数检验 主成分分析 聚类分析 典型相关分析 回归分析一、 问题重述葡萄酒口感多样多变,保健功能明显,在我国快速发展着,怎样评价一瓶葡萄酒的好坏也逐渐成为人们关注的重点。葡萄酒的评价主要考虑葡萄和确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分(葡萄酒品尝评分由附件 1 给出) ,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄

6、酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量(数据存储为附件 2 和附件 3) 。利用 3 个附件中的数据,请尝试建立数学模型来回答以下 4 个问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、 条件假设1、假设题中所缺失和异常数据的剔除和修改对总体信息不会有显著影响;2、假设对酿酒葡萄进行等级划分

7、时不考虑酿酒葡萄的二级指标;3、假设芳香物质的指标由芳香物质不同种类含量的总和来体现;4、假设葡萄酒的质量由评分分数总分体现;5、假设各个理化指标之间相互独立,不相互影响。三、 符号说明:葡萄理化指标ix:葡萄酒理化指标iy:剔除相关系数较大的葡萄理化指标iX、 :红葡萄酒理化指标的典型变量1CY2、 :红葡萄理化指标的典型变量、 :剔除典型相关系数较小的红葡萄理化指标后的典型变量RGP、 :剔除典型相关系数较小的红葡萄酒理化指标后的典型变量W、 :剔除典型相关系数较小的白葡萄理化指标后的典型变量、 :剔除典型相关系数较小的白葡萄酒理化指标后的典型变量12四、 问题分析3问题一首先对附件 1

8、中各个指标的评分分数数据归一化,得到统一的分数标准。用原始数据和处理后数据首先分别对两组红、白葡萄酒进行正态性检验,然后检验是否符合正态分布。若不符合就用非参数检验(UNIVARIATE 过程) ,符合就用参数检验。然后由检验的结果分析是否存在显著性差异,最后用假设检验的方法得出两组品酒员评分的方差置信空间,接着进行方差比较,得出哪组品酒员的评价结果比较可信。问题二通过酿酒葡萄的理化指标和葡萄酒质量将酿酒葡萄等级划分。本题只考虑酿酒葡萄的一级指标,即考虑酿酒葡萄的氨基酸总量,蛋白质,VC 含量,花色苷等 28 个一级指标。另外,通过网上查找资料,知道芳香物质也是影响酿酒葡萄品质优劣的因素之一,

9、所以将芳香物质也作为划分等级的标准之一。然后我们对附件 2 和附件 3 中所需要的数据进行处理,附件 2 中有些项目如蛋白质,VC 含量,花色苷等测试了几次,所以需要对这些项目的数据进行求平均值的操作。附件 3 中主要是芳香物质的有关数据,数据量比较庞大,因此我们将不同样品的全部芳香物质数据进行求和,得到新的一组数据。用处理过的数据进行主成分分析,通过主成分分析得出对酿酒葡萄等级划分影响较大的因素,接着根据这些主成分,用 WARD 系统聚类分析的方法画出使用 WARD 法的谱系聚类图,对酿酒葡萄进行分类。问题三,主要分析酿酒葡萄与葡萄酒的理化指标之间的联系,为了从总体上把握两组指标之间的相关关

10、系,用 SAS 软件做典型相关分析。首先考虑葡萄和葡萄酒所有指标之间的相关关系,然后剔除相关系数较小的葡萄指标。接着用剩下葡萄指标与葡萄酒指标再进行典型相关分析,得出酿酒葡萄与葡萄酒的理化指标之间的相关系数,若相关系数大则说明相关性大,反之相关性小。问题四,根据问题三经过典型相关性分析得到的葡萄理化指标来讨论酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。经过分析建立多元线性回归模型,并通过 MATLAB 对所得的模型进行残差分析和数据拟合,通过数据拟合图来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,然后用残差图进行检验。由于葡萄和葡萄酒中都含有芳香物质,而葡萄酒质量的评定指标中有香气分

11、析,因此接着我们继续考虑芳香物质和香气之间的关系,进一步论证芳香物质与葡萄酒质量之间的联系,结果得到相关性不明显,说明芳香物质不影响葡萄酒质量,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。五、 模型的建立及求解5.1 问题一模型的建立与求解5.1.1 对附件 1 数据的处理因为葡萄酒有红、白两种品种,所以我们分别分析两组红葡萄酒,两组白葡萄酒之间的显著性差异。由于附件 1 中各个指标的评分分数标准不一致,所以首先通过 SAS 软件将附件 1 中的原始数据归一化(程序见附录 1) ,得到一个统一的分数标准。观察附件 1 所给的数据,我们发现少部分数据存在异常、缺失的情况,因此我们先用原始数据

12、来进行显著性分析,然后将异常、缺失的数据进行修改和剔除,之后再用处理后的数据进行显著性分析,根据分析所得到的结果进行比较,选择较为合理的数据(这个过程由 5.1.2 和 5.1.3 体现) 。然后根据原始数据和处理后的数据进行比较后将数据内容修改为:附件一第一组白葡萄酒品尝评分样品 8 中品酒员 9 的持久性分数 16 改为46;附件一第一组白葡萄酒品尝评分样品 3 中品酒员 7 的持久性分数 77 改为 7附件一第一组红葡萄酒品尝评分样品 20 中品酒员 4 的色调得分缺失,求另外 9 个品酒员色调分数的平均分为 6.2222,所以第一组红葡萄酒品尝评分样品20 中品酒员 4 的色调得分改为

13、 6。5.1.2 第一组红葡萄酒和第二组红葡萄酒的显著性差异分析根据归一化后的红葡萄酒评分分数数据(程序见附录 4) ,首先我们借助SAS 软件分别对两组红葡萄酒的原始数据和处理后的数据进行正态性检验(程序见附录 2,附录 5) ,得到正态性检验结果如下图所示(见图 1,图 2) ,同时分别描绘出两组红葡萄酒的直观图(见图 3,图 4)和 QQ 图(见图 5,图 6) 。 图 1 原始数据正态性检验结果图 2 处理后数据正态性检验结果图 3 原始数据直观图 图 4 处理后数据直观图图 5 原始数据 QQ 图 图 6 处理后数据 QQ 图结果分析:图 1 和图 2 可以看出原始数据正态性检验结果

14、 =1图 17 两组红葡萄方差比较结果:第一组的方差/第二组的方差=1,所以第二组的方差较小而且在样本数量相同的情况下,第二组的置信空间较宽,所以置信水平较高。两组白葡萄方差比较:选择备择假设为第一组的方差/第二组的方差=1图 18 两组白葡萄方差比较结果:第一组的方差/第二组的方差=1,所以第二组的方差较小在样本数量相同的情况下,虽然第一组的置信空间宽度比第二组的大,但9是方差却比第一组大得多,所以第二组更可信。5.2 问题二模型的建立与求解数据处理:附件 2 中有些项目如蛋白质,VC 含量,花色苷等测试了几次,所以需要对这些项目的数据进行求平均值的操作。附件 3 中主要是芳香物质的有关数据

15、,数据量比较庞大,因此我们将不同样品的全部芳香物质数据进行求和,得到新的一组数据。由 EXCEL 对数据进行处理得到影响酿酒葡萄等级划分的相关数据。然后将处理的数据使用 SAS 软件中的 INSIGHT 模块做主成分分析,得到影响酿酒葡萄等级划分的主要指标,再用 WARD 系统聚类分析法对酿酒葡萄进行等级划分。主成分分析,也称主分量分析,是对数据降维的一种方法,将给定的一组相关变量通过线性变化转换成另一组不相关的变量,即用一组互不相关的综合指标来代替原有指标。聚类分析,实际上就是要建立一种分类方法,它将样品或变量按照其性质上的亲疏、相似程度进行分类。5.21 酿酒红葡萄等级划分将 30 种对酿

16、酒红葡萄的有关指标分别编号为 ;将葡萄酒质量编1x28号为 ,芳香物质编号为 ;然后使用 SAS 软件的 INSIGHT 模块对酿酒红葡29x30x萄进行主成分分析,得出结果如下:图 19 相关系数矩阵的特征值可以看出,与酿酒红葡萄的等级划分之间相关关系较为显著的因素有() (1)9146201761238192513xxxx共 17 个,因此我们最终保留这 17 个指标来划分酿酒红葡萄等级。WARD 系统聚类分析方法可以将 27 个不同样品的红葡萄按照其性质上的亲疏、相似程度进行分类。所以接下来我们用 WARD 系统聚类分析的方法(程序见10附录 10)根据主成分分析所得到的 17 个指标将

17、 27 个不同样品的酿酒红葡萄分成 5 个类别(所得结果见图 20,21):图 20 WARD 法的谱系聚类图图 21 聚类过程从图 22 可以看出, 统计量很大,说明聚类的效果好。 的值总是在 02R2R和 1 之间,而且 的值总是随着分类个数 NCL 的减少而变小,根据 值的变2化,可以确定 27 个样品分成 5 类之前最为合适。因此根据所得分析结果,我们将 27 种红葡萄样品划分成 5 个等级,同聚一类的样品之间有着密切的相关性,由图 20 可以将红葡萄样品分成以下 5 个等级:表 1 酿酒红葡萄好坏等级划分等级 葡萄种类 第一类 第二类 第三类 第四类 第五类红葡萄 1 2 3 9 23 11 6 7 12 15 18 5 10 17 20 24 25 264 8 13 14 16 9 21 22 275.2.2 白葡萄的等级划分

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 管理论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报