收藏 分享(赏)

2012数学建模A题 葡萄酒的评价.doc

上传人:精品资料 文档编号:8959977 上传时间:2019-07-18 格式:DOC 页数:25 大小:1,023KB
下载 相关 举报
2012数学建模A题 葡萄酒的评价.doc_第1页
第1页 / 共25页
2012数学建模A题 葡萄酒的评价.doc_第2页
第2页 / 共25页
2012数学建模A题 葡萄酒的评价.doc_第3页
第3页 / 共25页
2012数学建模A题 葡萄酒的评价.doc_第4页
第4页 / 共25页
2012数学建模A题 葡萄酒的评价.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、2012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): 我们的参赛报名号为(如果赛区

2、设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 杨晓宇 2. 梁 言 3. 李玉珠 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):- 1 -葡萄酒的评价摘 要本文所研究的是葡萄酒等级的划分等一系列问题,这对于我国目前存在的葡萄酒的不完善的评价体系的改善有着深刻

3、的意义。针对问题一,要分析两组评酒员的评价结果有无显著性差异以及哪一组结果更可信。首先对葡萄酒的得分数据进行无量纲化处理,然后运用单因素方差分析法,将各样品酒的总分作为唯一的因子,取显著性水平为 0.05,通过计算可信度指标 值来判断差异性,最后通过计算出的方差来判断出第二组的评价p结果更可信。针对问题二,首先用因子分析法,对酿酒葡萄的理化指标进行选择,得到十种因子。再用 0-1 规划模型,对酿酒红葡萄进行分级:一级(优)包含样品9,25,20,2,17,3;二级(良)包含样品 26,5,21,14,19;三级(中)包含样品 4,24,27,22;四级(合格)包含样品 1,25,12,10,1

4、3,16;五级(不合格)包含样品 11,7,18,15,8,6。酿酒白葡萄分级:一级(优)包含样品 17,15,9,1,22;二级(良)包含样品 6,18,7,27,13;三级(中)包含样品 5,20,28,4,14,21;四级(合格)包含样品 23,26,2,12,10,24;五级(不合格)有样品 8,11,19,25,16,3。针对问题三,分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的 30 个指标中提取出了 12 个主要成分,进而通过多元回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。针对问题四,首先利用因子分析法分别给出酿酒葡萄和葡萄酒的理化指标对

5、葡萄酒质量的影响因素,再将每类葡萄和葡萄酒中的芳香物质总和作为样品中的芳香指标,与葡萄酒的理化指标一并进行因子分析,根据前后两者结果中由样品的芳香指标导致的影响差异,再结合感官指标,最终确定感官指标是评价葡萄酒质量的最有效指标。关键词: 单因子方差分析 0-1 规划 主成分分析法 多元回归模型 - 2 -一 问题重述随着我国经济的快速发展,葡萄酒市场竞争也日趋激烈。虽然国家已经对葡萄酒的质量做了规定,但由于相应规范的制定工作的限制,我国关于葡萄酒质量等级划分的标准还未完善,所以国家需要制定统一的质量等级制度。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝

6、后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:问题一:分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄

7、酒的理化指标来评价葡萄酒的质量?二 问题分析2.2.1 问题一的分析根据附件 1 的数据可知:两组评酒员分别对 27 组红葡萄酒和 28 组白葡萄酒进行评分,相当于每件样品都进行了两次评分,故可以求出平均的评分。此问题要求分析两组评酒员的评价结果有无显著性差异以及哪一组结果更可信,对于分析显著性的差异,我们用单因素方差分析法,取显著性水平为 0.05,运用 Excel 求出 值,根据 值与 0.05 的关系来判断有无显著差异性。方差是描p述数据波动的大小的,求出方差,比较两组数据方差的大小来判断哪一组结果更可信。 2.2.2 问题二的分析首先对附件一中的数据进行无量纲化处理,得到每种葡萄酒的平

8、均得分,用因子分析法,对酿酒葡萄的理化指标进行选择,得到十种因子,再用 0-1 规划模型,最后对酿酒红葡萄进行分级。2.2.3 问题三的分析要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的 30 个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。然后我们建立葡萄的理化指标与葡萄酒的 7 个理化指标之间的多元线性回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。2.2.4 问题四的分析利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件 3 中 4 个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比

9、较前后两者结果中由样品中的芳香指标导致的影响差异来确定,不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,最后结合感官指标做出分析。三 模型的假设- 3 -3.1 假设题目所给的数据真实可靠;3.2 评酒员的评价尺度相同;3.3 二级指标里的因素对酿酒葡萄分级的影响不大,可忽略不计;3.4 测试理化指标用的葡萄和相应酒样的酿酒葡萄是同一批;3.5 附件所给的理化指标具有代表性;四 符号说明 总方差;V组内方差;W组间方差;B实验次数;b组间均方差;2BS组内均方差;W酿酒葡萄的主成分即为新的指标;12,px葡萄酒的第 项理化指标;iyi酿酒红葡萄的前十二个主成分;121,红葡萄酒的各理化指标;

10、iz(,7)酿酒白葡萄的前十三个主成分;(2)(2)113yy第 种葡萄样品的第 个指标的值;ikik葡萄样品的第 个理化指标的值;y无量纲化处理后的第 种葡萄样品的第 个理化指标的值;ikaik第 个品酒员给第 类葡萄酒的评分;ijxj第 个品酒员给第 类葡萄酒的第 项指标的评分;kij ik第 类葡萄酒的平均总得分。ixi五 模型的建立与求解- 4 -5.1 问题一5.1.1 评价结果的显著性差异分析单因素方差分析方法的原理:首先在单因素试验结果的基础上, 、 、 。VWB(1)2()ijVx(2)Wiji(3)2()Bibx从公式可以看出,总方差衡量的是所有观测值 对总均值 的偏离程度,

11、反映ijxx了抽样随机误差的大小,组内方差衡量的是所有观测值 对组均值 的偏离程ij度,而组间方差则衡量的是组均值 对总均值 的偏离程度,反映系统的误差。ixx在此基础上,还可以得到组间均方差和组内均方差:(4)21BVSa(5)Wb在方差相等的假定下,要检验 n 个总体的均值是否相等,须首先给定原假设和备择假设。原假设 :均值相等即0H12n备择假设 :均值不完全不相等1则可以应用 统计量进行方差检验:F(6)2/BWWVaSb该统计量服从分子自由度 ,分母自由度为 的 分布。给定显著1abF性水平 ,如果根据样本计算出的 统计量的值小于等于临界值aF,则说明原假设 不成立,总体均值不完全相

12、等,差异并非仅1,Fb0H由随机因素引起。在本题中 ,分析红酒时 ,分析白酒时 ,此2a2728b题设显著性水平 ,0.5说明: 值反应了可以以多大的把握认为原假设成立。如果计算的 值p p小于给定的显著性水平 0.05 则应该接受原假设,否则应拒绝原假设。如果 值小于显著性水平,则均值相等,否则不相等。首先我们对数据进行处理,附件 1 里有四组数据:红葡萄酒和白葡萄酒各有两组数据,每种酒都有两组人进行对其进行评分,每件样品酒有十名品酒员号打- 5 -分,采用单因素方差分析法,我们将样品酒的总分作为唯一考虑的因素,运用matlab 软件编程求出品酒员对每组样品打的总分的平均分,见附录一:根据以

13、上分析和计算可以得到以下两个方差分析表格:(1)根据一、二组对红葡萄酒的综合评价可以得到表一:方差 自由度 均方差 F 值 P 值组间方差 87.50 1 87.15 2.499297 0.119961组内方差 1813.23 52 34.86981总方差 1900.38 53(2)根据一、二组对白葡萄酒的综合评价可以得到表二:方差 自由度 均方差 F 值 P 值组间方差 85.51 1 85.51 5.082542 0.028247组内方差 908.51 54 16.82426总方差 994.02 55通常情况下,实验结果 达到 0.05 水平或 0.01 水平,才可以说数据之间p具备了差异

14、显著或是极显著。在作结论时,应确实描述方向性(例如显著大于或显著小于) ,在此我们取 0.05 作为显著性水平标准。根据以上两表可知:红葡萄酒中表中 值为 0.1199610.05,故接受 ,且p0H对应的 也很小,故可知品酒员对红葡萄酒的评分没有显著性差异。白酒表中F的 值为 0.0282470.05,故拒绝 ,则评酒员对白酒的评分具有显著性差异。P0H5.1.2 评价结果的可信度 对于哪组数据更加可信,我们知道方差是考察数据的波动性的,方差小就说明数据比较稳定,方差大就是波动性比较大。故我们将红酒,白酒每组样品酒的平均组内方差求出来,比较方差和的大小,则可知道哪组数据更加可信。 红葡萄酒

15、白葡萄酒第一组 第二组 第一组 第二组平均组内方差51.92 15.24 22.75 9.70从表中结果可以直观看出,对于红葡萄酒和白葡萄酒而言,都是第二组的方差较小,所以得出结论:第二组的评分结果更为可信。5.2 问题二5.2.1 分析酿酒葡萄的理化指标及葡萄酒的质量(1)数据预处理:对酿酒葡萄的各项理化指标进行无量纲化处理(当出现多组数据时,将多组数据求平均值得出指标的唯一值;当有二级指标时,值采用一级指标。 ):(7)minikkikyaxy对葡萄酒的评分进行无量纲化处理:- 6 -(8)011kijijijx(2)对量化指标进行选择因子分析法应用原理:在这个问题中,需要研究多个变量,并

16、且这多个变量之间存在一定的相关性。为了从多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息(80%或 85%)以上,又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,所以就需要进行主成分分析。主成分的理论分析:因为在所有的线性组合中所选取的 应该是方差最大1F的,故称 为第一主成分。如果第一主成分不足以代表原来 个变量的信息,1F p再考虑选取 即第二个线性组合,为了有效地反映原来信息, 已有的信息就2 1不需要再出现在 中,用数学语言表达就是要求 ,称 为第二0),(21FCov2主成分,依此类推可以构造出第三、四第 个主成分。p主成分分析的数学模型:对于一个样本

17、资料,观测 个变量 ,px,21个样品的数据资料阵为:n(9)npnpxxX 212112px,21其中: pjxnjjj ,21,21(10)主成分分析就是将 个观测变量综合成为 个新的变量(综合变量) ,即pp(11)ppp pxaxaF 21221211简写为:(12)pjjjjx21p,- 7 -要求模型满足以下条件: 互不相关( , )jiF, jipi,21, 的方差大于 的方差大于 的方差,依次类推123F .,2kaakpk 于是,称 为第一主成分, 为第二主成分,依此类推,有第 个主成分。1F2 p主成分又叫主分量。这里 我们称为主成分系数。ij上述模型可用矩阵表示为:,其中

18、AXFp21 px21(13)ppppaaA 21212112称为主成分系数矩阵。基于因子分析法的理论,运用 SPSS 软件,分析酿酒红葡萄的理化指标,可得以下结果:第一因子:乙醛,乙酸甲酯,乙酸乙酯,乙醇,丙酸乙酯,2-戊酮,甲苯,乙酸丁酯,3-甲基-1-丁醇乙酸酯,乙酸戊酯,乙酸己酯,2-辛酮,4-己烯-1-醇-乙酸盐,1-己醇, (Z)-3-己烯-1-醇,乙酸辛酯,5-甲基糠醛,甲氧基苯基丙酮肟;第二因子:花色苷鲜重,DPPH 自由基,总酚,单宁,葡萄总黄酮;第三因子:(Z)-2-庚烯醛, (E)-2-己烯-1-醇,1-庚醇,反式-2-壬烯酸;第四因子:三氯甲烷, (E)-2-壬烯-1-

19、醇;第五因子:柠檬烯;第六因子:-蒎烯,(Z)-3,7-二甲基-2,6-辛二烯醛, (R)-3,7-二甲基-6-辛烯醇,(E)-3,7-二甲基-2,6-辛二烯-1-醇;第七因子:果酸;第八因子:多酚氧化酶活力;第九因子:1-辛醇,苯乙醛;第十因子:壬酸乙酯,(E,Z)-2,6-壬二烯醛,(E)-2-壬烯-1-醇。(3)基于多目标优化的酿酒葡萄分类模型:决策变量:以第 种酿酒葡萄是否分在第 类中为决策变量,即:i t- 8 -(14) 0, it1itd第 种 葡 萄 不 分 在 第 类, 第 种 葡 萄 分 在 第 类目标函数:不同酿酒葡萄的各个理化指标的误差平方和最小,即(15)2minpn

20、eitttJadm其中,定义向量 , 为第 种酿酒葡萄的 种指标; 为第12,iiika i ktm类理化指标的中心,t(16)1nittxm为第 类酿酒葡萄的个数,jn(17)1ntitd在所有分类中,不同种酿酒葡萄对应的葡萄酒质量得分的误差平方和最小,即:(18)2minpnijttWxd其中, 为第第 类葡萄酒质量得分的中心,txt(19)1nittxd约束条件:每一种酿酒葡萄只是分在一类,而不能同时分成两类,即:(20)1, ,2.pittdin保证每类中的酿酒葡萄个数相对均衡,故规定每类中,酿酒葡萄上下限。与 由具体的分类数和酿酒葡萄数来定,即:(21)1, 1,2.nitdtp各个

21、分类中酿酒葡萄数之和等于酿酒葡萄的总数,即:(22)1mtn由(14)-(22)式,得到如下的 01 规划模型- 9 -2111min i , ,2., 1,.pneitttpnijttmtpittnittitnittittJadmWxdintpdaxm (4)目标函数线性加权将两个目标归一化之后,进行线性加权,其中 。加权之后的目120,,标函数为(23)1 2minmininaxaxeJWZ125.2.2 基于葡萄酒质量的酿酒葡萄分级模型(1) 根据优质葡萄酒是由优质的葡萄酿制而成的,应用评酒员对葡萄酒打分的平均值作为定级的指标,即酿酒葡萄的平均质量得分(24)1, 1,2.tiinSxp

22、其中, 为第 类的酿酒葡萄个数, 为第 类中第 中酿酒葡萄的相对质量tnit i- 10 -得分。(2)实验结果:由数据可知, 可取 ,且 ,,127:, , , , ,其中 为主要理化指标个742m5p12nm数, 为酿酒葡萄分类数, 为红葡萄样品数,为确定最佳方案,取遍 的pn ,所有值,算出当 时, 最小。应用 lingo 软件解得酿酒红葡萄的理,6Z化指标分类堆: , , ,1785,1,250,3164,27,, ,其中,集合中元素为酿酒红葡萄编号。26,54,92,309则,酿酒红葡萄的分级结果如下表:酿酒红葡萄的分级结果分级类 红葡萄样品编号一级(优) 9,25,20,2,17,

23、3二级(良) 26,5,21,14,19三级(中) 4,24,27,22四级(合格) 1,25,12,10,13,16五级(不合格) 11,7,18,15,8,6同样方法,可得酿酒白葡萄的分级结果,如下:酿酒白葡萄的分级结果分级类 白葡萄样品编号一级(优) 17,15,9,1,22二级(良) 6,18,7,27,13,三级(中) 5,20,28,4,14,21四级(合格) 23,26,2,12,10,24五级(不合格) 8,11,19,25,16,35.3 问题三5.3.1 关于酿酒葡萄理化指标的主成分分析为了更好的反应酿酒葡萄理化指标的实质,本文采用主成分分析法对 30 个指标进行处理,提取

24、出葡萄理化指标的主成分;考虑到大多数葡萄到葡萄酒的化学反应时线性的,我们通过多元线性回归建立起葡萄和葡萄酒理化指标之间的联系。本文运用主成分分析法对酿酒葡萄的理化指标进行主成分分析,将多个理化指标合为几个具有代表性的主成分,从而实现对高维变量空间进行降维处理。(1)主成分分析法的步骤如下:假定有 n 个样本,每个样本共有 p 个变量,构成一个 np 阶的数据矩阵- 11 -(25)121212pnnpxxX降维处理:当 p 较大时,在 p 维空间中考察问题比较麻烦。降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之

25、间又是彼此独立的。定义:记 x1, x2,x P 为原变量指标,z 1,z 2,z m(mp)为新变量指标(26)1122212pmmplxlzxlxl 系数 lij 的确定原则: zi 与 zj( ij;i,j=1,2,m )相互无关; z1 是 x1,x 2,x P 的一切线性组合中方差最大者,z 2 是与 z1 不相关的 x1,x 2,x P 的所有线性组合中方差最大者;zm 是与 z1,z 2,z m1 都不相关的 x1,x 2,x P, 的所有线性组合中方差最大者。则新变量指标 z1,z 2,z m 分别称为原变量指标 x1,x 2,x P 的第一,第二,第 m 主成分。 从以上的分

26、析可以看出,主成分分析的实质就是确定原来变量 xj(j =1,2 , p)在诸主成分 zi(i=1,2,m)上的载荷 lij( i=1,2,m; j=1,2 , ,p) 。从数学上可以证明,载荷 lij 分别是相关矩阵的 m 个较大的特征值所对应的特征向量。 (2)计算相关系数矩阵rij( i,j=1 ,2,p)为原变量 xi 与 xj 的相关系数, rij=rji, 其计算公式为:1221()()nkikjjij nkikjjxxr121212ppprrRrr- 12 -(27)(3)计算特征值与特征向量: 解特征方程 求出特征值,并使其按大小顺序排列 ;0IR12,0p 分别求出对应于特征

27、值 的特征向量 ,要求 =1,即i (1,2)il il,其中 表示向量 的第 j 个分量。21pijlijlil 计算主成分贡献率及累计贡献率贡献率:(28) 1(,2)ipkp累计贡献率: (29)1(,2)ikpkip一般取累计贡献率达 8595%的特征值,所对应的第一、第二、第m(mp)个主成分。 (4)对原始数据进行标准化处理由于各指标的量纲与大小不同,首先须对初始指标的数值标准化,同一比较的尺度,方法如式(30)(1)()()ijjijxs其中 , 是矩阵 每一列的均值和标准差(1)jx()js(1)()2730ijA(5)主成分的求解将 27 个酿酒红葡萄样本的 30 个指标数据

28、标准化处理后构成一个标准化数据矩阵 ,求 的协方差阵 的特征值 及相应的2730X TCXni(1,27)特征向量 ,将 27 个特征值向量正交化得方阵 ,作变换iv(1,27) V,将 27 个特征值按大小顺序进行排列,相应的 27 个新变量YV iy。 越大的新变量 对模型的贡献率越大。新变量 分别(,2)i iiy 12,称为第一主成分,第二主成分,前面几个主成分构成了样本空间的最大变- 13 -化特征:(31)(1)()(1)222()()()12nppnyvxvx 前面几个主成分 对应的特征值 的和占总和的比12,py (7)12,p例(32)271pii即为主成分 的累计贡献率,当

29、 时,可选用前 个主成分12,py 0.8p代替原来酿酒葡萄样本中的 30 个理化指标。5.3.2 关于葡萄酒理化指标的多元线性回归 通过对酿酒葡萄的理化指标进行主成分分析,将多个理化指标合为几个具有代表性的主成分,现将酿酒葡萄的主成分作为新的指标(现仍记为)对葡萄酒的每一项理化指标进行多元回归。12,px多元线性回归的模型为(33)012pybxbx式中 为酿酒葡萄的主成分即为新的指标, 为葡萄酒的理化指标,12,px y为测量误差向量, 为回归系数。(,)i设 , 是 的 次测量值即确定12,iipxy 12,m 12,pxy为酿酒葡萄新的指标后葡萄的新指标值,则多元线性模型可表示为12,

30、p, (34)012iiipiiybxbx ,为葡萄酒的第 项理化指标。为书写方便,采用矩阵形式表达,令i, , , 12myY01pb121212pmmpxxX 12m则多元线性模型可表示为(35)Yb- 14 -求回归系数 的估计值 ,就是求最小二乘函数b(36)()()TQbyXb达到最小的 值。为此,令(37)0,1,2i p可以求得 的最小二乘估计b(38)1()TbXy从而得到多元线性回归方程(39):012nyxbx5.3.3 模型的求解(1)酿酒葡萄理化指标的主成分分析结果利用 SPSS 软件的主成分分析对酿酒葡萄(以红葡萄为例)的三十个理化指标进行主成分分析, 的前几个特征根

31、及其贡献率如表 5。1TCXn表 5:酿酒红葡萄理化指标的主成分分析结果序号 特征根 贡献率 累计贡献率1 6.933 23.11 23.112 5.01 16.701 39.8113 3.782 12.605 52.4164 2.862 9.538 61.9555 2.011 6.704 68.6596 1.718 5.726 74.3847 1.425 4.751 79.1358 1.288 4.292 83.4279 0.973 3.242 86.66910 0.726 2.421 89.0911 0.67 2.234 91.32412 0.521 1.736 93.06可以看出,前 8

32、 个特征根的累计贡献率就达到了 80%以上,主成分分析效果很好。下面选取前 12 个主成分(累计贡献率就达到了 93.06%)对酿酒葡萄的三十种理化指标进行替代,前 12 个特征值对应的特征向量见附录,由此可得 12个主成分分别为(40)112302112300.4.35.47197.69.08.5yxxx 从主成分的系数可以看出,第一主成分主要反映了前几个理化指标(氨基酸、蛋白质、花色苷、褐变度和总酚等方面)的信息,第二主成分主要反映了- 15 -白藜芦醇、黄酮醇、总糖和可滴定酸的信息,第三主成分主要反映了单宁、果皮质量和果皮颜色的信息,第十二个主成分主要反映了黄酮醇和果梗比的信息。把各酿酒

33、葡萄样本的原始三十个理化指标的标准化数据代入十二个主成分的表达式,就可以得到各葡萄样本的十二个主成分值。(2)葡萄酒理化指标的多元线性回归结果利用各葡萄样本的十二个主成分值,对葡萄酒的每一项理化指标进行多元线性回归,红葡萄酒各理化指标的回归结果为 112122712120.9.70.65348983.5.3.zyyzy 式中 为酿酒红葡萄的前十二个主成分, 为红葡萄121,y iz(,7)酒的各理化指标。从红葡萄的回归方程及主成分中,可知:酿酒红葡萄的第一、四主成分与红葡萄酒的理化指标存在较强的正相关关系,即红葡萄中的蛋白质、花色苷、褐变度、单宁和总酚及白藜芦醇、黄酮醇、总糖和可滴定酸等与红葡

34、萄酒的理化指标存在较强的正相关性,果梗比、果皮质量与红葡萄酒的理化指标存在负相关。白葡萄酒的各理化指标的回归结果为 (2)(2)(2)(2)11 13(2)(2)(2) (2)61 130.543.40.4798980.zyyyz 式中 为酿酒白葡萄的前十三个主成分, 为白(2)()113,yy iz,6)葡萄酒的各理化指标。从白葡萄的回归方程及主成分中,可知:酿酒白葡萄中的蛋白质、单宁和总酚及白藜芦醇、总糖和可滴定酸等与白葡萄酒的理化指标存在正相关关系,花色苷、褐变度、果梗比、果皮质量等与白葡萄酒的理化指标存在负相关关系。5.4 问题四 5.4.1 葡萄酒理化指标对葡萄酒质量的影响设 为观察

35、到的随机变量, 是不可观测的12,pXx 12,mF向量。则有 - 16 -1112221 mppmpxaF 用矩阵表示为: ,其中 称作误差或特殊因子,称XAF12,为第 个公共因子,式中 称为因子载荷矩阵,其元素(系数) 表示第 个iF ijai变量 在第 个公共因子 上的载荷,简称因子载荷,如果把 看成 维因子ixjj ixP空间的一个向量,则 表示 在坐标轴上 上的投影。ijaixjF5.4.2 模型求解由附表 2 中的数据,利用统计分析软件 SPSS,将附件中表 2 中的数据标准化,然后计算变量间的相关系数,可见变量之间存在公共因子的可能性很大,可以建立因子分析模型进行相关分析。对酿

36、酒红葡萄、白葡萄以及红葡萄酒、白葡萄酒理化指标建立因子分析模型,求得样本相关矩阵 R 的特征根和贡献率,由表绘制公共因子和特征值的碎石图。红葡萄酒解释的总方差初始特征值 提取平方和载入成份 合计方差的 % 累积 % 合计方差的 % 累积 %1 5.250 75.002 75.002 5.250 75.002 75.0022 1.097 15.668 90.670 1.097 15.668 90.6703 .372 5.321 95.9914 .156 2.226 98.2165 .058 .831 99.0486 .036 .510 99.5587 .031 .442 100.000提取方法:

37、主成份分析。5.4.3 论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量首先对附件 3 中每种样品所含芳香物质进行求和,以此值作为芳香物质指标。将之与红葡萄酒中主要理化指标进行因子分析得到下表 2,单独以红葡萄酒中主要理化指标进行因子分析得到下表 1- 17 -表 1加入芳香物质后:表 2对比以上两表中的数据可以发现,累计方差贡献率由 90.670 增至 93.636 ,白葡萄酒累计方差贡献率由 65.871 增至 95.740,所以芳香物质指标对葡萄酒质量的评价的重要性不容忽视。 (白葡萄酒的两个表见附录三)葡萄酒的质量是葡萄酒的一种特性,它是表示葡萄酒的优秀程度。葡萄的主要质量指标大体可

38、分为感官指标和理化指标两大类。感官指标主要指色泽、香气、滋味和典型性方面的要求,理化指标主要指精含量、酸度和糖分指标。 - 18 -从感官指标来看,首先要求葡萄具有天然的色泽,即原料葡萄的色泽,葡萄本身应 清亮透明无浑浊。葡萄除应有葡萄的天然果香外还应有浓厚的酯香, 不应有外来的气味,更不能有异味。 所以感官是目前国内外鉴定葡萄品质的主要手段。六 模型的优缺点分析6.1 模型优点6.1.1 在显著性和可靠性分析中,充分考虑了各个指标对葡萄酒质量的影响。6.1.2 本文所用的主成分分析法克服了评价方法中人为确定权数的缺陷,使得综合评价结果唯一且客观合理。6.1.3 文字与图表相结合,使结果一目了

39、然,更具有说服力。6.2 模型缺点在处理数据和求解过程中,不可避免会出现误差,在一定程度上也会影响到模型求解的准确性。 七 模型的推广本文所用的主成分分析法可以推广至对科普产品的开发和利用进行评估。随着科技的发展,社会的进步,人们的研究成果与科技产品层出不穷,而且各大领域都相互联系,形成了千丝万缕的关系,所以在这个社会不得不借助像显著性差异分析法、主成分分析法等数学方法来看清世界的本质。八 参考文献1姜启源、谢金星、叶俊编著, 数学建模 (第三版) ,北京:高等教育出版社,2003 年 8 月.2何正风编著,MATLAB 在数学方面的应用,北京: 清华大学出版社,2012 年 1 月.附录附录

40、一:样品号 第一组红葡萄酒 综合平均分 第一组白葡萄酒 综合平均分 第二组红葡萄酒 综合平均分 第二组白葡萄酒 综合平均分1 62.7 82 68.1 77.92 80.3 74.2 74 75.83 80.4 79.7 74.6 75.64 68.6 79.4 71.2 76.95 73.3 71 72.1 81.56 72.2 68.4 66.3 75.57 71.5 77.5 65.3 74.28 72.3 71.4 66 72.39 81.5 72.9 78.2 80.410 74.2 74.3 68.8 79.811 70.1 72.3 61.6 71.412 53.9 63.3 6

41、8.3 72.413 74.6 65.9 68.8 73.9- 19 -14 73 72 72.6 77.115 58.7 72.4 65.7 78.416 74.9 74 69.9 67.317 79.3 78.8 74.5 80.318 59.9 73.1 65.4 76.719 78.6 72.2 72.6 76.420 78.6 77.8 75.8 76.621 77.1 76.4 72.2 79.222 77.2 71 71.6 79.423 85.6 75.9 77.1 77.424 78 73.3 71.5 76.125 69.2 77.1 68.2 79.526 73.8 81

42、.3 72 74.327 73 64.8 71.5 7728 81.3 79.6附录二:成份矩阵 a成份1 2 3 4 5 6氨基酸总量 .339 .548 .025 .476 -.252 .303蛋白质 .610 -.492 .198 .277 .191 .118VC 含量 -.142 -.408 .074 -.033 -.545 -.102花色苷 .849 -.088 -.097 -.308 .108 -.174酒石酸 .375 .111 .378 .403 .300 .082苹果酸 .367 .334 .170 -.698 .094 -.307柠檬酸 .314 .210 .406 -.3

43、52 .342 .057多酚氧化酶活力 .323 .099 -.208 -.572 .228 .386褐变度 .650 -.058 .052 -.684 -.021 .050DPPH 自由基 .756 -.454 .001 .217 -.010 -.099总酚 .860 -.160 -.163 .235 -.003 -.192单宁 .760 -.135 -.274 -.060 -.150 -.249葡萄总黄酮 .715 -.279 -.184 .286 .053 -.306白藜芦醇 .029 -.071 .822 .052 -.220 -.109黄酮醇 .551 .032 .037 -.047

44、 -.184 .565总糖 .230 .785 -.146 .278 .109 .050还原糖 .050 .769 -.111 .136 .114 .122可溶性固形物 .218 .762 -.308 .162 .130 .071PH 值 .249 -.288 .197 .694 .128 .107可滴定酸 -.300 .452 -.609 -.002 -.314 -.222固酸比 .379 -.045 .450 -.005 .527 .124干物质含量 .348 .865 -.184 .113 .100 .027果穗质量 -.330 -.471 -.220 .050 .604 .019- 2

45、0 -百粒质量 -.554 -.383 -.473 .043 .282 -.057果梗比(%) .585 -.199 .179 -.197 -.425 .420出汁率(%) .533 -.185 -.273 .154 .036 -.397果皮质量 -.243 -.256 -.611 -.114 .336 .164L* -.549 -.364 .331 -.005 .049 .314a*(+红;- 绿) -.374 .283 .723 .048 .013 -.258b*(+黄;-蓝) -.200 .482 .611 -.064 .200 -.390解释的总方差初始特征值 提取平方和载入成份 合计

46、 方差的 % 累积 % 合计 方差的 % 累积 %1 6.933 23.110 23.110 6.933 23.110 23.1102 5.010 16.701 39.811 5.010 16.701 39.8113 3.782 12.605 52.416 3.782 12.605 52.4164 2.862 9.538 61.955 2.862 9.538 61.9555 2.011 6.704 68.659 2.011 6.704 68.6596 1.718 5.726 74.384 1.718 5.726 74.3847 1.425 4.751 79.135 1.425 4.751 79

47、.1358 1.288 4.292 83.427 1.288 4.292 83.4279 .973 3.242 86.66910 .726 2.421 89.09011 .670 2.234 91.32412 .521 1.736 93.06013 .474 1.580 94.63914 .374 1.247 95.88615 .298 .995 96.88116 .253 .845 97.72617 .225 .751 98.47718 .190 .634 99.11119 .074 .246 99.35720 .068 .227 99.58421 .051 .170 99.75422 .037 .125 99.87923 .021 .070 99.94824 .012 .040 99.98825 .004 .012 100.00026 2.175E-16 7.249E-16 100.00027 1.720E-17 5.732E-17 100.00028 -7.540E-17 -2.513E-16 100.00029

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报