收藏 分享(赏)

葡萄酒的评价_全国数学建模大赛优秀论文.doc

上传人:无敌 文档编号:679694 上传时间:2018-04-18 格式:DOC 页数:30 大小:1.04MB
下载 相关 举报
葡萄酒的评价_全国数学建模大赛优秀论文.doc_第1页
第1页 / 共30页
葡萄酒的评价_全国数学建模大赛优秀论文.doc_第2页
第2页 / 共30页
葡萄酒的评价_全国数学建模大赛优秀论文.doc_第3页
第3页 / 共30页
葡萄酒的评价_全国数学建模大赛优秀论文.doc_第4页
第4页 / 共30页
葡萄酒的评价_全国数学建模大赛优秀论文.doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、2012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公

2、示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 重庆工商大学 参赛队员 (打印并签名) :1. 伍家棋 2. 杜静 3. 黄丹 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号

3、):全国评阅编号(由全国组委会评阅前进行编号):1葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定的程度上反映葡萄酒和葡萄的质量。本论文主要研究葡萄酒的评价、酿酒葡萄的分级以及酿酒葡萄与葡萄酒的理化指标之间的相互关系问题。对于问题一:我们从假设检验的角度出发分析,对两组的评分进行均值和方差运算,并在零假设成立的前提下通过使用 Matlab 做 T 检验,得出两组评酒员对于红葡萄酒的评价结果无显著性差异,而对于白葡萄酒的评价结果存在显著性差异的结果。再建立可信度模型 ,计算结果如下表, mnn=1-xH第一组红葡萄酒 第二组红葡萄酒 第一组白葡

4、萄酒 第二组白葡萄酒0.100507 0.056413 0.064941 0.041433由表可得第二组的可信度更高。对于问题二:根据葡萄酒质量的综合得分,将其划分为优、良、合格、不合格四个等级,并对酿酒葡萄的理化指标进行主成分分析,得出对葡萄影响较大的理化指标:红葡萄主要理化指标 DPPH 自由基、葡萄总黄酮、PH 值、花色苷、蛋白质、黄酮醇、固酸比、果梗比白葡萄主要理化指标 氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇并根据酿酒葡萄的理化指标和葡萄酒的质量,利用模糊综合评价模型对葡萄酒进行了分类,结果如下: 等级数 级数 红酒数量 红葡

5、指标 白酒数量 白葡指标次品 4 3 1 0 3普通 3 11 4 7 4良好 2 12 20 19 16优质 1 1 2 2 5对于问题三:先对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程: 1123=2.0x0.680.15x+.54757yx红 红 红 红白 白 白 白对于问题四:在前面主成分分析和葡萄酒分级的基础上,建立 Logistic 回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。运用 SPSS 软件,通过 matlab 编程运算,求出受它们综合影响的线性回归方程。在验证

6、时,随机从上面选取理化指标,将它们带入 P 的计算式中,通过所求 P 值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。最后,对模型进行了改进和推广。关键词 T 检验 主成分分析 Logistic 回归模型2一、问题的重述葡萄酒作为体现时尚品味的元素,同名茶、咖啡一样备受追捧。在物质社会的今天,人们酿造葡萄酒的品质还是有待鉴定的,因此,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。此外,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理

7、化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,现需要用数学建模方法研究解决以下问题:1.分析附件 1 中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题的分析针对问题一:分析评酒员的评价结果有无显著性差异,需要从反面来论证,要从假设性检验角度来分

8、析问题。由于样本容量较大,近似地服从正态分布。因此,本论文采用了使用Matlab 做 T 检验,从而确定两组评价有无显著性差异。为了确定哪一组的结果更可信,建立了一种可以替代可信度的模型。又考虑到该样本涉及到的是正态分布,则数据的离散程度是对其影响最大的因素,所以采用用标准差与平均值的比值作为可信度模型 来衡量可信度的高低。mnn=1-xH针对问题二:该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级,故我们要对酿酒葡萄的理化指标和葡萄酒的质量进行综合评价,但是在进行综合评价以前我们有分别要对它们二者分别进行分析。在第一问中,我们已经对葡萄酒的整体进行了打分,因此,葡萄酒的

9、质量实际上已经分好类了,那么我们就需要对酿酒葡萄的理化指标进行分析。但是,由于影响酿酒葡萄的理化指标的因素有 30 个,要使问题得到简化,我们只需取其几个主要的影响因素,因此,采用主成分分析法来分析主要影响因素。然而,葡萄酒的质量的单位系与酿酒葡萄的理化指标的单位系不同,因此不能直接加减来判断,所以,我们采用了模糊综合评价模型来对酿酒葡萄进行分级。针对问题三:对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程针对问题四:基于前面主成分分析和葡萄酒分级的基础,建立 Logistic 回归模型,并利用最大似然估计法求

10、出线性回归方程的参数,得出线性回归方程。运用 SPSS 软件,通过matlab 编程运算,求出受它们综合影响的线性回归方程。在验证时,随机从上面选取理化指标,将它们带入 P 的计算式中,通过所求 P 值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒3的质量的结论。4三、基本假设1、各个样品酒中原产地相似,酿酒葡萄的产地对葡萄酒的质量影响相同;2、酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;3、葡萄酒的酿造工序和贮藏条件相同;4、各评酒员的资质较高,在对葡萄酒品平时都是客观的,不存在主观偏好;5、仪器对样本理化指标和所含芳香物质的测试不存在随机误差,附件所给的数据真

11、实、准确、可靠;6、酒样品容量较大时,认为各组样本服从正态分布且相互独立;7、两种葡萄酒和酿酒葡萄的分级标准相同,且葡萄酒分为优、良、合格、不合格四个级别;8、假设附件 1 中,酒样品为一级指标,外观、口感、香气分析和整体评价为二级指标,澄清度、色调、纯正度、浓度、持久性和质量为三级指标;四、符号定义:表示澄清度,色调等指标个数, ;a 1,20a:表示评酒员的个数, ;b,b:表示第 b 个评酒员对 a 指标的评分;ax:表示酒样品数, ;,imn,78imn 或:表示第 种酒样品评分的均值;i:表示总体均值;:表示两组对应红(白)酒的均值差;d:表示对均值差( )做 t 检验时的统计量;t

12、d:表示拒绝域;w:表示总体可信度的指标;H:表示酿酒葡萄的理化指标数, ;p 1,230p:表示第 种酒样品的第 中理化指标的值;nx:表示对 标准化后的值;*pnpx:表示相关系数矩阵的第 个特征值;:表示主要理化指标的贡献率;Q:表示主要理化指标的累计贡献率;Z:表示主要理化指标的综合评价函数, ;jF1,2jp:表示显著性水平;:表示方差;2s:表示相关系数矩阵的特征向量;ia:表示子集 中含有 个评判因素;kUikn:表示 个因数的权数分配;iAi5五、模型的建立与求解5.1、问题一模型的建立与求解5.1.1显著性差异的 T检验针对于如何确定有无显著性差异,我们从假设检验的角度出发,

13、通过使用 Matlab做 T 检验,分析它们的均值与方差来确定显著性。1、对数据均值进行分析计算均值即每种酒样品的平均得分,它表示每个评酒员对每种酒样品评定的质量的具体值,其公 为:1式, (5.1.1)10ab,=x其中,a 表示附件 1 中的三级指标; b 表示评酒员的个数。将各种葡萄酒样品各个评分代入式子(5.1.1) ,运用 excel 计算可得出如下结果:表 1 第一组红葡萄酒整体均值酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14平均得分 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9

14、74.6 73酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27平均得分 58.7 74.9 79.3 59.9 78.6 79.1 77.1 77.2 85.6 78 69.2 73.8 73表 2 第二组红葡萄酒整体均值酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14平均得分 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27平均得分 65.7 69.9 74.5 65.

15、4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5表 3 第一组白葡萄酒整体均值酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14平均得分 82 74.2 78.3 79.4 71 68.4 77.5 70.4 72.9 74.3 72.3 63.3 65.9 72酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 28品均得分 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3表 4 第二组白葡萄整体均值酒样品 1 2

16、3 4 5 6 7 8 9 10 11 12 13 14平均得分 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 28平均得分 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.62、对数据方差进行分析计算方差即各个数据与平均数之差的平方的平均数,它表示两组葡萄酒质量的波动大小,其公 为:1式6, (5.1.2)m2kii=1s(-x)其中

17、,m 表示酒样品数; 表示组数, =1,2.将以上各种葡萄酒样品的均值代入式子(5.1.2) ,可求得各组的方差,结果如下:表 5 两组红、白葡萄酒的方差第一组红葡萄酒 第一组白葡萄酒 第二组红葡萄酒 第二组白葡萄酒53.91410256 23.30787037 15.82439 10.054853、成对数据进行 T 检验根据表 1、表 2、表 3 和表 4 显示的结果,我们可将两组中红、白酒样品分别形成相应的成对数据,形式如下表:表 6 两组酒样品的成对数据及差值酒样品号 1 2 27x1 x2 x27y1 y2 y27x-y(d) d1 d2 d27首先,假设: , 且独立,则 ,其中21

18、(,)X:2(,)Y: 2(,)ddXY:, ;122d然后,T 检验问题为:零假设 ,即 ;0=H: 12对立假设 ,即 .1: 此时,用 T 统计量, (5.1.3)dtsm其中, , , 表示酒样品数, (红酒 ,白1mid221diis27m酒 ) ;28在零假设成立的前提下,此 统计量服从 分布。这时,零假设的 (dt1t )显著水平的拒绝域是如下的样本区域:0.5. (5.1.4)12()wtm将表 1 和表 2 中的数据代入式子(5.1.3)中,可求得红葡萄酒的统计量 t 值,通过查表法将 m 值代入(5.1.4)可以求得显著水平的拒绝域。结果为: =2.04569t=2.041

19、06d所以可得评酒员对红葡萄酒的评价没有显著性差异。同理,我们可计算出白葡萄酒的统计量 t 值,即 =-2.66648,不在拒绝域内,所dt以,结果可得两组评酒员对白葡萄酒的评价存在显著性差异。75.1.2可信度模型的建立及求解针对可信度的问题,我们用 H 表示可信度。在一定程度上,当平均值相等时,标准差能反映一个总体的离散程度,即标准差越大,离散程度越大,则表明这个总体的水平不稳定;标准差越小,反之水平越稳定。基于标准差和平均值的性质,我们用标准差与平均值比值的大小来表示一个总体可信度的高低。因而,我们建立一个可信度模型:,其中,H 表示标准差与平均值的比值,即 .mn=1-xH可见,H 值

20、越大时它的可信度越低,H 值越小时可信度越高。由此,可算得两组红葡萄酒样本的标准差与平均值的比值,如下表:表 7 两组红、白葡萄酒的均值标准差与平均值的比值第一组红葡萄酒 第二组红葡萄酒 第一组白葡萄酒 第二组白葡萄酒0.100507 0.056413 0.064941 0.041433由以上表格显示的结果可得出如下结论:对于两组中的红葡萄酒,有:,所以第二组对红葡萄酒的评价结果的可信度更高;21H对于两组中的白葡萄酒,有:,所以第二组对白葡萄酒的评价结果的可信度更高;综上所述:第二组更可信。5.2、问题二模型的建立和求解5.2.1对酿酒葡萄的质量进行分类该问题要求我们根据酿酒葡萄的理化指标和

21、葡萄酒的质量对这些酿酒葡萄进行分级,而在第一问中我们已经对葡萄酒进行了综合评分,现将其结果分为优、良、合格、不合格四类, 。对其质量进行等级分类,结果如下表格:表 8 红葡萄酒质量的等级分类等级(均值) 酒样品优( 75 以上) 9、20、23良(7075) 2、3、4、5、14、17、19、21、22、24、26、27合格(6570) 1、6、7、8、10、12、13、15、16、18、25不合格(65 以下) 11表 9 白葡萄酒质量的等级分类等级(均值) 酒样品优质(75 以上) 1、2、3、4、5、6、9、10、14、15、18、19、20、21、22、23、24、25、26、27、2

22、8良 (7075) 7、8、11、12、13合格(6570) 16不合格(65 以下)85.2.2对酿酒葡萄的理化指标进行主成分分析1、建立主成分分析数学模型样本观测数据矩阵为:, npnpxxX 212112px,21其中,12,1,230.ppnpx将酿酒葡萄的理化指标带入 X 中,求得了 X 的矩阵。将 个观测变量综合成为 个新的变量(综合变量) ,即pppp pxaxaF 21221211简写为:,pjjjj 21( ),1其中, 为综合评分函数, 为主成分系数, 为各样品酿酒葡萄的理化指标,jFijanpxn 为 127 个葡萄样品, p 为 130 个理化指标, 为理化指标的观测数据矩阵。X第一步:对原始数据进行标准化处理, ; )var(*pnnpxx(1,27;1,230)np 又: np1 ),(21)()var( pnip xx

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 管理论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报