1、葡萄酒的评价模型摘要问题背景:现在国际上对葡萄酒的质量评价一般是通过聘请一批有资质的评酒员进行品评。评酒员通过对葡萄酒的外观分析、香气分析、口感分析和整体评价进行打分。然而评酒员拼酒时还受个人的感官因数,比如年龄、口味风格等因素的影响。本模型在忽略一些影响因素的基础上对题目给出的问题进行分析。问题一:分析两组评酒员评价两种葡萄酒哪一组更合理的问题,我们把附表中两组评酒员评酒时的打分提炼为四组数据,分别为两组评酒员对 27 种红葡萄酒的评价结果和 28 种白葡萄酒的评价结果。然后做评酒员对葡萄酒的评价做配对样本 T 检验分析,运用 spss 软件将的到的四组数据求得方差分析方差所得结果,我们得到
2、第二组评酒员评酒的结果更具有合理性。问题二:对于问题 2 酿酒葡萄的分级问题,我们可以根第一问分析得出的葡萄酒的品分质量和葡萄的理化指标进行分析,运用排序中求秩和比的进行秩排序,并对葡萄酒的品分排序,利用模糊数学等级划分的方法对酿酒葡萄进行分级。 、问题三:首先,我们利用 SPSS 计算出酿酒葡萄与葡萄酒的理化指标的相关系数。由于葡萄的理化指标较多,通过整理数据,在 Excel 中得到某个葡萄酒的理化指标与若干个酿酒葡萄的理化指标的相关系数,并且规定相关系数大于等于 0.6 表示两者相关性显著;最后,在 SPSS 中分别求出回归方程。问题四,首先利用 SPSS 分别计算出葡萄酒的理化指标与葡萄
3、酒质量的相关系数、葡萄的理化指标与葡萄酒质量的相关系数。然后通过分析其相关系数,分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。关键词:模糊数据分析原理、偏相关系数、排序问题重秩和比法、主成分分析、配对样本 T 检验、回归分析原理、相关分析原理问题重述葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了
4、该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件 1:葡萄酒品尝评分表(含 4 个表格)附件 2:葡萄和葡萄酒的理化指标(含 2 个表格)附件 3:葡萄和葡萄酒的芳香物质(含 4 个表格)问题假设1、 假设评酒员在品尝葡萄酒时,所有的评酒员同时打开酒瓶同时品酒,忽略到由于时间
5、关系葡萄酒的挥发问题。2、 假设各位品酒员品酒过程中感觉器官疲劳度是相同的。3、 假设各位品酒员当时的情绪对品酒的评分影响相同。4、 忽略掉感官品酒员的性别、年龄、地区性、习惯性、个人爱好的影响5、 假设两组品酒员所品尝的红葡萄酒和白葡萄酒都是同一酒厂同一批次生产的酒。6、 假设对理化指标的检测误差在可接受范围之内。7、 假设样本数据服从正态分布。8、 假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒。9、 假设本文所引用的数据、资料均真实可靠。问题分析问题一中,每个品酒员都要从外观、香气、口感、整体四个大方面对每个酒样进行评分,可将每个方面的评分
6、相加作为总分确定葡萄酒的质量。问题一涉及的是葡萄酒感官评价结果的统计检验问题,由于样本量偏小,且葡萄酒质量评分的分布难以确定,因此,可考虑采取配对样本T检验的办法。要评价哪组的评价结果更可信,主要是检验组内品酒员的评分是否集中,即比较哪组的方差更小,亦可以通过该组内所有品酒员与最终得分的差异来确定谁的可信度更改。问题二中,要根据葡萄酒的质量和酿酒葡萄的理化指标对酿酒葡萄进行分级,从题意可得知,葡萄酒的质量是通过评酒员从外观分析、香气分析、口感分析和平衡评价而得到的。且通过问题一我们得到第二组品酒员的品酒打分更合理(通过问题一进行的独立样本 T 检验我们得知第二组品酒员的品酒数据是更可靠的。由此
7、问题二中变优化采用第二组数据进行分析) 。所以我们采用第二组品酒员品酒的数据来表示葡萄酒的综合评分。酿酒葡萄的综合评分要根据酿酒葡萄的理化指标和葡萄酒的质量综合考虑,由于题中指标的繁杂且无法确定哪些指标的重要性较大,因此降维方法的选择上,可考虑运用主成分分析法将众多的指标数据进行转化到几个简单的理化指标上,然后运用排序问题中求秩和比的方法求出秩和比。根据所得秩和比得到的总评分对葡萄理化性质进行排序分级。并参照葡萄酒的质量排序,利用模糊数学等级划分的方法进行等级划分。本题的重要思想是可运用排序检验中的求秩和比的方法,进行模糊数学等级划分。问题三的分析,葡萄酒和葡萄的两组指标数量大,问题二中已经进
8、行里降维处理,我们便进行统计分析中的回归和相关等方法建立联系。根据题意,要分析两组理化指标之间的联系,可建立指标之间的函数关系用来表征指标之间的联系。由于本问中的指标变量之间的关系是多变量对多变量,则在建立联系时,可以葡萄酒理化指标为因变量,在以求得主成分的结果的基础之上,求葡萄酒理化指标的每一个主成分对葡萄所有主成分之间的回归关系。建立多个回归关系式来分析指标之间的联系。问题四的分析,要求理化指标与葡萄酒质量间的联系,在已经有前几问求解的基础上,可考虑将这三个变量统一化。由于理化指标的值是多个指标的含量,而葡萄酒的质量则是专家打得分数,因此,直接分析理化指标对葡萄酒质量的影响是不好实现的,而
9、第一问和第二问均将葡萄酒质量与酿酒葡萄的理化指标转换为了秩和,则也可将葡萄酒的理化指标转化为秩和。要研究理化指标的秩和排序对葡萄酒质量秩和排序的影响,可用相关性分析比相关性系数的大小。最后,根据相关性的结果加以分析。假设符号第一组每种红葡萄酒的平均得分第二组每种红葡萄酒的平均得分第一组每种白葡萄酒的平均得分第二组每种白葡萄酒的平均得分- 两组红葡萄酒平均数之差- 两组白葡萄酒平均数之差是控制了 条件下, , 之间的偏相关系数rzxy, zxy是控制了 , 条件下, , 之间的偏相关系数z21, 12是变量 , 之间的简单相关系数(零阶相关系数)xy, 分别是变量 , 之间和 , 之间的简单相关
10、系数rzz xzyz特定的偏相关系数观测值个数n控制变量个数k- -2自由度:单宁 :葡萄总黄酮 1 n2:总酚 :蛋白质 n3 4:可溶性固形物 :干物质含量5 6:果梗比 :果穗 7 8:出汁率9:酒-单宁 :酒-总酚 h1h2:酒-酒总黄酮 :酒-果皮颜色 l* 3 4:酒-果皮颜色 a* :酒-果皮颜色 b*h5 h6模型的建立与求解模型一的建立与求解对于白葡萄酒和红葡萄酒题中两组评酒员分别做出了感官评价 ,然而对于同一种葡萄酒两组品酒员的品酒打分结果存在差异,在问题假设条件下,存在的差异不予考虑,但在一定的差异范围内是循序的。问题一要判定两组品酒员的品酒结果是否存在显著差异,应根据附
11、表一中给出的各组评酒员的打分结果构造统计标量 ,检验评酒员品酒打分的合理性。对于解决问题中的问题我们构造了 t 检验模型,根据附录一中的数据我们整理成如下表格:红拼酒员 1 组 红拼酒员 2 组 白品酒员 1 组 白品酒员 2 组样品 1 62.7 68.1 82 77.9样品 2 80.3 74 74.2 75.8样品 3 80.4 74.6 85.3 75.6样品 4 68.6 71.2 79.4 76.9样品 5 73.3 72.1 71 81.5样品 6 72.2 66.3 68.4 75.5样品 7 71.5 65.3 77.5 74.2样品 8 72.3 66 71.4 72.3样
12、品 9 81.5 78.2 72.9 80.4样品 10 74.2 68.8 74.3 79.8样品 11 70.1 61.6 72.3 71.4样品 12 53.9 68.3 63.3 72.4样品 13 74.6 68.8 65.9 73.9样品 14 73 72.6 72 77.1样品 15 58.7 65.7 72.4 78.4样品 16 74.9 69.9 74 67.3样品 17 79.3 74.5 78.8 80.3样品 18 59.9 65.4 73.1 76.7样品 19 78.6 72.6 72.2 76.4样品 20 78.6 75.8 62.1 76.6样品 21 77
13、.1 72.2 76.4 79.2样品 22 77.2 71.6 71 79.4样品 23 85.6 77.1 75.9 77.4样品 24 78 71.5 73.3 76.1样品 25 69.2 68.2 77.1 79.5样品 26 73.8 72 81.3 74.3样品 27 73 71.5 64.8 77样品 28 81.3 79.6根据表格中的数据,我们设定函数变量第一组每种红葡萄酒的平均得分,第二组每种红葡萄酒的平均得分第一组每种白葡萄酒的平均得分第二组每种白葡萄酒的平均得分- 两组红葡萄酒平均数之差- 两组白葡萄酒平均数之差基本数学原理:成对样本的均值比较 t 检验,假设这两个样
14、本之间的均值差异为零,用于检验的统计量为:t= (式中,n-1为自由度,n 为数据对数)2.建立检验假设: (其中为均值差异)其假设的意义为,当差异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试验方法在发生作用或有效。运用 spss 软件我们得到如下结果:成对样本统计量均值 N 标准差 均值的标准误红品酒 73.0556 27 7.34262 1.41309对 1红品酒_A 70.5148 27 3.97799 .76556白品酒 73.4185 27 5.53687 1.06557对 2白品酒_A 76.4185 27 3.17272 .61059成对样本相关系数N 相
15、关系数 Sig.对 1 红品酒 -蓝) 1.727 5.756 74.108 1.727 5.756 74.1087(果皮质量) 1.415 4.717 78.826 1.415 4.717 78.8268 (L*) 1.261 4.204 83.030 1.261 4.204 83.030根据附表四红葡萄主成分矩阵(见附表一) ,我们得到红葡萄的影响因子为 :总酚、干物质、a*(+红;-绿)、ph 值、固酸比、b*(+黄;-蓝)、果皮质量、L*经得出的主成分来求酿酒葡萄理化性质总评分要运用加权秩和比法。加权秩和比法基于原理是在一个 n 行 m 列矩阵中,通过无量纲统计 WRSR;在此基础上,
16、编出每一个指标各评价对象的秩。然后对其中效益型指标从小到大编秩,成本型指标从小到大编秩,同一指标数据相同者平均秩。得到的秩矩阵记为 : ijR公式: ijmjRwnWS1其中: ;mjjjw1个 评 价 指 标 的 权 重 ,为 第计算得到如下排序:红葡萄样品编号 秩和比 排名葡萄样品 4 296.822 1葡萄样品 13 200.692 2葡萄样品 11 85.408 3葡萄样品 6 43.992 4葡萄样品 12 111.400 5葡萄样品 15 62.893 6葡萄样品 20 118.603 7葡萄样品 18 342.826 8葡萄样品 21 135.018 9葡萄样品 19 149.5
17、90 10葡萄样品 25 57.605 11葡萄样品 3 66.125 12葡萄样品 17 55.222 13葡萄样品 5 268.357 14葡萄样品 24 66.918 15葡萄样品 7 147.763 16葡萄样品 22 100.347 17葡萄样品 26 72.396 18葡萄样品 9 79.747 19葡萄样品 16 71.103 20葡萄样品 23 75.602 21葡萄样品 10 122.030 22葡萄样品 27 149.180 23葡萄样品 2 112.189 24葡萄样品 14 80.220 25根据问题一中我们得出的结论,第二组评酒员的打分比较合理,所以我们参考第二组评酒
18、员的评分来作为葡萄酒质量的综合评分,运用 Excel 软件将葡萄酒的的综合评分进行排名如下:红葡萄酒样品 评酒员打分 排名样品 11 61.6 27样品 7 65.3 26样品 18 65.4 25样品 15 65.7 24样品 8 66 23样品 6 66.3 22样品 1 68.1 21样品 25 68.2 20样品 12 68.3 19样品 10 68.8 18样品 13 68.8 17样品 16 69.9 16样品 4 71.2 15样品 24 71.5 14样品 27 71.5 13样品 22 71.6 12样品 26 72 11样品 5 72.1 10样品 21 72.2 9样品
19、14 72.6 8样品 19 72.6 7样品 2 74 6样品 17 74.5 5样品 3 74.6 4样品 20 75.8 3样品 23 77.1 2样品 9 78.2 1通过以上模计算得到了酿酒葡萄理化指标的综合得分和酿酒葡萄的综合得分。若把两个综合得分处理成一个综合得分。需要用参差分析法扥确定两者的权重。打包参差分析国语主管,而却本问题中,酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄的等级影响是比较模糊和复杂的。因此我们对得分进行排序,利用模糊数学知识进行葡萄等级划分。得分排名模糊划分标准葡萄模糊等级标准 葡萄理化指标排名 葡萄质量评分排名按照模糊数学知识进行划分得到如下等级表:红葡萄等
20、级等级 酿酒葡萄品种1 2,3,9,14,21,232 1,19,223 5,8,20,274 4,6,7,9,11,12,13,14,15,16,24,25,265 17,18同理可得,白葡萄的主成分分析如下图:白葡萄主成分分析: Total Variance ExplainedInitial EigenvaluesComponent Total % of VarianceCumulative %1 7.206 20.017 20.0172 5.844 16.233 36.2503 4.074 11.317 47.5674 2.350 6.527 54.0945 2.159 5.996 60
21、.0906 2.011 5.586 65.6767 1.690 4.693 70.3698 1.563 4.341 74.7109 1.314 3.650 78.36010 1.248 3.465 81.82511 1.055 2.930 84.755根据主成分矩阵(附表二)得出白葡萄的主成分为:干物质含量、总酚、固酸比、苹果酸、黄酮醇、酒石酸、柠檬酸、单宁、果梗比、花色苷1 级(最高等级) 19 192 级 19 10183 级 1018 10184 级 1018 19275 级 1927 1927白葡萄的秩和比排序与质量评分排序:白葡萄 秩和比 排名 白葡萄酒 样品 质量评分 排名葡萄样品
22、 22 14.19307 28 样品 16 67.3 28葡萄样品 17 15.30065 27 样品 11 71.4 27葡萄样品 4 15.58681 26 样品 8 72.3 26葡萄样品 28 16.11748 25 样品 12 72.4 25葡萄样品 26 16.54078 24 样品 13 73.9 24葡萄样品 21 16.79437 23 样品 7 74.2 23葡萄样品 14 16.79971 22 样品 26 74.3 22葡萄样品 19 16.81207 21 样品 6 75.5 21葡萄样品 9 16.85442 20 样品 3 75.6 20葡萄样品 23 17.63
23、513 19 样品 2 75.8 19葡萄样品 5 17.82072 18 样品 24 76.1 18葡萄样品 20 18.06184 17 样品 19 76.4 17葡萄样品 25 18.2667 16 样品 20 76.6 16葡萄样品 18 18.27033 15 样品 18 76.7 15葡萄样品 2 18.41599 14 样品 4 76.9 14葡萄样品 3 19.23884 13 样品 27 77 13葡萄样品 11 19.87153 12 样品 14 77.1 12葡萄样品 7 20.06896 11 样品 23 77.4 11葡萄样品 6 20.12097 10 样品 1 7
24、7.9 10葡萄样品 16 20.3948 9 样品 15 78.4 9葡萄样品 27 20.93585 8 样品 21 79.2 8葡萄样品 12 21.15782 7 样品 22 79.4 7葡萄样品 8 22.9942 6 样品 25 79.5 6葡萄样品 24 23.72052 5 样品 28 79.6 5葡萄样品 13 25.04621 4 样品 10 79.8 4葡萄样品 10 26.47937 3 样品 17 80.3 3葡萄样品 15 29.82945 2 样品 9 80.4 2葡萄样品 1 63.97136 1 样品 5 81.5 1根据酿酒白葡萄的理化性质综合评分和白葡萄酒
25、质量的综合评分得到白葡萄的等级如下:白葡萄等级等级 葡萄品种1 5,9,22,25,282 3,10,17,20,21,23,263 2,4,12,14,15,194 1,12,185 6,7,8,11,13,16,27模型三的建立与求解3.1 计算酿酒葡萄与葡萄酒的理化指标的相关系数偏相关系数1.偏相关的有关概念在研究多个变量之间的相关关系时,由于变量间常常是相互影响的,因而两个变量间的简单相关(直线相关)系数往往不能正确确定两个变量间的真正关系,有时甚至是假象。只有在排除其他变量影响的情况下,计算它们之间的偏相关系数(partial correlation coefficient),才能真
26、正地解释他们之间的内在联系。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度指标。偏相关系数的取值范围亦在-1到+1 之间。2.建立模型(1)偏相关系数的计算公式:当有一个控制变量 时,变量 与 的偏相关公式(或称零阶相关zxy系数)为:=rzxy,ryzxzy21当有两个控制变量 , 时,变量 与 的偏相关公式如下:2xy=rzxy21, rzyzxy2211(2)对相关系数的检验方法再偏相关分析中,由于两个变量之间相关系数是在固定(控制)了一个或某几个变量后进行的,考虑到这种因素及抽样误差的影响,其检验统计量为:=trkn213.模型求解:(1)
27、分析酿酒红葡萄与红葡萄酒的理化指标之间的偏相关系数:通过 SPSS,利用相关分析,计算出酿酒红葡萄与红葡萄酒的理化指标之间的相关系数,如表:酿酒葡萄与葡萄酒的理化指标之间的相关系数-红葡萄 酒-花色苷(mg/L)酒-单宁(mmol/L)酒-总酚(mmol/L)酒总黄酮(mmol/L)酒-白藜芦醇(mg/L)酒-DPPH半抑制体积(IV50) 1/IV50(uL)L*(D65)a*(D65)b*(D65)氨基酸总量mg/100gfw.106 .496 .336 .201 .334 .400 -.236 -.100 .356蛋白质mg/100g.296 .471 .435 .438 -.005 .
28、384 -.484 -.033 .047VC 含量(mg/L)-.089 -.092 -.129 -.099 -.028 -.122 .122 .107 -.368花色苷mg/100g鲜重.923 .720 .774 .709 .200 .671 -.834 -.349 -.240酒石酸(g/L).034 .281 .271 .157 .218 .237 -.243 .010 .462苹果酸(g/L).693 .298 .353 .267 -.186 .246 -.346 -.559 -.310柠檬酸(g/L).380 .145 .139 -.082 -.204 .018 -.254 -.26
29、9 -.015多酚氧化酶活力E(A/mingml).481 .142 .154 .124 -.128 .074 -.411 -.007 .102褐变度A/g*g*min*ml.767 .445 .459 .443 -.095 .381 -.564 -.335 -.244DPPH 自由基1/IC51(g/L).567 .753 .814 .764 .421 .778 -.707 -.123 -.055总酚(mmol/kg).613 .817 .875 .883 .459 .874 -.754 -.168 .055单宁(mmol/kg).661 .718 .743 .701 .315 .701 -
30、.677 -.093 -.204葡萄总黄 .441 .684 .815 .823 .567 .813 -.609 -.067 .048酮(mmol/kg)白藜芦醇(mg/kg)-.035 .049 .076 .047 .014 .073 .162 -.449 -.110总糖 g/L .052 .320 .193 .193 .155 .265 -.061 -.185 .376还原糖 g/L -.068 .087 -.007 -.015 -.003 .077 .017 -.200 .567可溶性固形物 g/l.190 .410 .236 .248 .007 .313 -.147 -.178 .24
31、8PH 值 -.019 .235 .144 .285 .179 .232 -.135 -.087 .018可滴定酸(g/l )-.216 -.066 -.115 -.180 .109 -.061 .198 .266 .074固酸比 .315 .238 .239 .323 -.093 .217 -.246 -.435 .067干物质含量 g/101g.230 .415 .296 .245 .076 .330 -.204 -.249 .392果穗质量/g-.104 -.267 -.184 -.237 .076 -.196 .021 .223 -.037百粒质量/g-.263 -.329 -.255
32、 -.248 -.045 -.229 .309 .150 -.176果梗比(%) .501 .473 .401 .298 .192 .333 -.473 -.063 -.090出汁率(%) .328 .360 .398 .482 .257 .423 -.440 -.008 -.100我们规定两者的相关系数绝对值大于 0.6 时,认为两者的相关性显著。从而筛选出与红葡萄酒理化指标相关性显著的酿酒红葡萄的理化指标。从表中可以发现:酿酒红葡萄中的花色苷、苹果酸、褐变度、总酚、单宁与红葡萄酒中的 1花色苷的相关性较为显著;酿酒红葡萄中的花色苷、DPPH 自由基、总酚、单宁、葡萄总黄酮与红葡 2萄酒中的
33、单宁的相关性较为显著;酿酒红葡萄中的花色苷、DPPH 自由基、总酚、单宁、葡萄总黄酮与红葡 3萄酒中的总酚的相关性显著;酿酒红葡萄中的花色苷、DPPH 自由基、总酚、单宁、葡萄总黄酮与红葡 4萄酒中的酒总黄酮的相关性显著;酿酒红葡萄中葡萄总黄酮与红葡萄酒中白藜芦醇的相关性显著; 5酿酒红葡萄中的花色苷、DPPH 自由基、总酚、单宁与葡萄酒中的 DPPH 6半抑制积的相关性显著;酿酒红葡萄中花色苷、DPPH 自由基、总酚、单宁葡萄总黄酮与红葡萄酒 7中色泽 L*呈现较大相关性;酿酒红葡萄中苹果酸与红葡萄酒色泽 A*的相关性较为显著; 8酿酒红葡萄中还原糖与红葡萄酒色泽 B*的相关性较为显著。 9
34、(2)分析酿酒白葡萄与白葡萄酒的理化指标之间的联系:同上,通过 SPSS,利用相关分析,计算出酿酒白葡萄与白葡萄酒的理化指标之间的相关系数,如表(见附录二):我们规定两者的相关系数绝对值大于 0.5 时,认为酿酒白葡萄中的某项理化指标与白葡萄酒中的某种成分的相关性显著。从而筛选出与白葡萄酒理化指标相关性显著的酿酒白葡萄的理化指标。我们发现:酿酒白葡萄中的单宁、葡萄总黄酮与白葡萄酒中的单宁的相关性显著; 1酿酒白葡萄中的单宁、葡萄总黄酮、总酚与白葡萄酒中的总酚的相关性 2显著;酿酒白葡萄中的蛋白质、总酚、葡萄总黄酮与白葡萄酒中的酒总黄铜的 3相关性显著;酿酒白葡萄中的可溶性固形物、干物质含量与白
35、葡萄酒中的色泽 L*的相 4关性显著;酿酒白葡萄中的果梗比、果穗与白葡萄酒中的色泽 A*的相关性显著; 5酿酒白葡萄中的可溶性固形物、干物质含量、出汁率与白葡萄酒中的色 6泽 B*的相关性显著。3.2 分析酿酒葡萄与葡萄酒的理化指标之间的联系回归分析模型(多元线性回归)1.多元线性回归分析概念多元线性回归分析是多元回归分析(multiple regression analysis)中最为简单而又最常用的一种分析方法。其原理与直线回归分析的完全相同,但是要涉及到一些新概念,在计算上要复杂得多,当自变量较多时要借助于电脑进行计算。许多非线性回归(no-linear regression)问题都可转
36、变为线性回归来解决。进行多元线性回归分析的基本任务是根据各自变量的实现观察值建立依变量与各自变量之间的线性回归方程,以揭示依变量与各自变量之间的具体线性联系形式,其目的在于所建立的线性回归方程进行预测和控制。2.模型建立(1)多元线性回归方程的建立设变量 , 有 组观察数据,其中 为自变量,m,21 nm,21为依变量。第 组观察值( =1,2, )可表示为k,( , ) ,是 +1 维空间中的一个点。mk,21 k如果依变量 同时受到 个自变量 的影响,且这 个自m,21变量都与 成线性关系,则这 +1 个变量的关系就形成 元线性回归。因此,一个 元线性回归的数学模型为kmkkk aa210
37、 n,21式中, 为 个待估参数; 为可精确测m, 1m,量或可控制的一般变量,也可以是可观察的随机变量; 为可以观察的随机k变量,随 而变,并受实验误差影响; 为随机变量,相互独立,m,21 k且服从同一正态分布 N(0, ) 。2一个 元线性回归方程可给定为: = mbb210(式中, 是 的最小二乘法。 )bm,210 am,2103.模型求解3.1 红葡萄的理化指标与红葡萄酒的理化指标的回归分析(1)在 SPSS 中,利用回归分析,计算出酿酒红葡萄中的花色苷、苹果酸、褐变度、总酚、单宁与红葡萄酒中的花色苷的多元线性回归方程(SPSS 的分析结果见附录三):=-33.887+1.718
38、+8.474 +0.116 -2.263 +4.73y1x12x34x5(2)同理,我们在 SPSS 中得到其他酿酒红葡萄与红葡萄酒的理化指标的多元线性回归方程:=0.814+0.04 +0.262 +0.088 +6.689 -0.169214567=1.333+0.008 +0.098 +0.035 +3.359 +0.119y3xxx=-0.254+0.06 +0.25 +0.05 -1.729 +0.162414567=0.87+0.33657=-0.41+6.115exp(-5) +0.13 +0.02 +0.118y6 x14x56=79.106-0.127 -0.911 -0.2
39、71 -41.146 +0.8127 x7=60.2+60.282=-6.246+0.125y9x83.2 白葡萄的理化指标与白葡萄酒的理化指标的回归分析同 3.1,我们也利用回归分析,得到酿酒白葡萄与白葡萄酒的理化指标的多元线性回归方程:=0.856+0.178 +0.086h1n12=0.717+0.108 +0.109 +0.0112 12n3=-5.296+0.056 +0.372 +0.009h3 n23n4=104.922-0.004 -0.0994 56=-0.455-0.095 +0.001h5 78=4.692+0.009 -0.211 -0.1136n56n9模型四的建立与
40、求解。4.1 利用相关分析原理,算出酿酒葡萄的理化指标与葡萄酒质量的偏相关系数,分析分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。1模型建立与 5.3.1 的大致相同。2. 模型求解(1)葡萄酒的理化指标与葡萄酒质量的相关系数红葡萄酒的理化指标与葡萄酒质量的相关系数 1花色苷(mg/L)单宁(mmol/L)总酚(mmol/L)酒总黄酮(mmol/L)白藜芦醇(mg/L)DPPH 半抑制体积(IV50) 1/IV50(uL)L*(D65)a*(D65)b*(D65)0.153 0.486 0.493 0.518 0.511 0.549 -0.454 0.186 0.245从图中可以看出,除了
41、色泽 L*(D65)对红葡萄酒的质量有较显著的负相关,其余都与红葡萄酒的质量有正相关,尤其是单宁、总酚、酒总黄酮、白藜芦醇、DPPH 半抑制体积。由此可以分析出,红葡萄酒的理化指标对红葡萄酒的质量有较大的影响。白葡萄酒的理化指标与白葡萄酒质量的相关系数 2单宁(mmol/L)总酚(mmol/L)酒总黄酮(mmol/L)白藜芦醇(mg/L)DPPH半抑制体积(IV50) L*(D65)a*(D65)b*(D65)1/IV50(uL)0.106 0.065 -0.194 -0.164 0.191 -0.17 -0.135 0.175从图中可以看出,白葡萄酒中的理化指标和白葡萄酒的质量的相关系数相对
42、较小,即白葡萄酒中的理化指标和白葡萄酒的质量的相关性不是很显著。由此可以分析出,与红葡萄酒的相关系数相比,白葡萄酒中的理化指标对白葡萄酒的质量的影响较小。(2)葡萄的理化指标与葡萄酒质量的相关系数红葡萄的理化指标与葡萄酒质量的相关系数 1对 SPSS 计算结果中的相关系数的分析,在红葡萄的理化指标中,有些与红葡萄酒的质量成正相关,像蛋白质、DPPH 自由基、总酚、葡萄总黄酮、PH 值与红葡萄酒的质量有显著的相关性,但其余成分的相关性不明显;也有一些与红葡萄酒的质量成负相关,但只有个别与其相关性显著。由此可以分析出,与红葡萄酒的理化指标对红葡萄酒的质量的影响,红葡萄的理化指标对红葡萄酒的质量没有
43、明显的影响。白葡萄的理化指标与葡萄酒质量的相关系数 2对 SPSS 计算结果中的相关系数的分析,在白葡萄的理化指标中,只有极少数的指标与酒的质量相关性显著。因此类似上面的结论,白葡萄的理化指标对白葡萄酒的质量没有明显的影响。4.2 利用 4.1 的相关结论,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。(1)通过分析 5.4.1 中葡萄酒的理化指标与葡萄酒质量的相关系数,可以发现葡萄酒的理化指标与葡萄酒的质量相关性显著,可以认为能够用葡萄酒的理化指标来评价葡萄酒的质量是比较客观的。(2)通过分析 5.4.1 中葡萄的理化指标与葡萄酒质量的相关系数,可以发现葡萄的理化指标与葡萄酒的质量相关
44、性很低,可以认为不能够用葡萄的理化指标来评价葡萄酒的质量。模型的优缺点及改进方向一模型的优点:1、问题一模型中配对样品的 t 检验方法利用数据配对的方法将多组数据一起处理,spss 软件操作简单2、问题一的数据可信度评价中将数据的可信度比较转化为两组评酒员评价稳定性分析,模型得以简化3、问题二模型中用模糊数学划分等级简化合理,用信息熵从分利用了数据的信息。二、模型的缺点:1、各模型的数据使用前基本上都需要进行标准化处理2、在处理问题二中,由于指标过多,我们只对一级指标进行处理,运用朱陈芬分析会丢掉一部分数据三:模型的改进:在处理问题时可将红、白两种葡萄统一成葡萄,可以简化模型参考资料1祝国强.
45、谈谈两总体比较的非参数检验方法J.Journal of Mathematical Medical,524-525,2011. 2郑莉莉.葡萄酒香气成分分析的研究进展J.中外葡萄与葡萄酒.38-40,2008.3 姜启源,谢金鑫,叶俊.数学建模,北京:高等教育出版社,20044 单锋,朱丽梅 ,田贺民,数学建模,北京:国防工业出版社,2012.25 刘保东等, 葡萄酒原汁含量的多元回归分析J, 山东大学学报, 33(2):236-240,19986 王颉,试验设计与 SPSS 应用,北京:化学工业出版社,2007;7李运,李计明,姜忠军,统计分析在葡萄酒质量评价中的应用J,酿酒科技, 4:79-
46、82,2009附录附录四:红葡萄主成分分析矩阵成份矩阵 a成份1 2 3 4 5 6 7 8氨基酸总量 .373 .545 .033 .451 -.251 -.295 .162 .000蛋白质 mg/100g .614 -.500 .174 .275 .193 -.134 .073 -.135VC含量(mg/L) -.140 -.403 .080 -.007 -.536 .147 -.015 .182花色苷 mg/100g鲜重.848 -.100 -.108 -.301 .103 .195 -.089 .068酒石酸(g/L) .380 .100 .373 .384 .305 -.157 .1
47、91 -.517苹果酸(g/L) .390 .315 .170 -.663 .093 .370 -.103 .119柠檬酸(g/L) .304 .187 .404 -.369 .354 -.085 .288 -.420多酚氧化酶活力 .309 .077 -.207 -.594 .229 -.345 -.017 .157褐变度 .596 -.095 .054 -.707 -.019 -.053 -.077 .119DPPH自由基1/IC50(g/L).758 -.458 -.021 .219 -.017 .111 .214 .098总酚(mmol/kg) .864 -.165 -.176 .22
48、5 -.015 .184 -.007 .073单宁(mmol/kg) .757 -.143 -.283 -.066 -.159 .244 .249 -.060葡萄总黄酮(mmol/kg).721 -.277 -.202 .287 .037 .292 .128 .039白藜芦醇(mg/kg) .062 -.079 .813 .074 -.209 .172 .300 .293黄酮醇(mg/kg) .558 .020 .033 -.067 -.178 -.506 .469 .224总糖 g/L .253 .791 -.132 .255 .098 -.041 -.073 .299还原糖 g/L .07
49、7 .775 -.093 .123 .105 -.116 -.055 .090可溶性固形物 g/l .236 .774 -.314 .152 .145 -.029 -.010 .248PH值 .271 -.273 .180 .699 .131 -.104 -.287 .252可滴定酸(g/l) -.301 .468 -.588 -.006 -.329 .214 .300 -.143固酸比 .393 -.058 .435 -.001 .532 -.097 -.316 .222干物质含量 g/100g .373 .865 -.168 .088 .089 -.032 .051 .044果穗质量/g -.337 -.448 -.235 .071 .606 .031 .223 .095百粒质量/g -.530 -.344 -.482 .087 .2