收藏 分享(赏)

葡萄酒的评价 建模.pdf

上传人:精品资料 文档编号:8998162 上传时间:2019-07-19 格式:PDF 页数:38 大小:1.27MB
下载 相关 举报
葡萄酒的评价 建模.pdf_第1页
第1页 / 共38页
葡萄酒的评价 建模.pdf_第2页
第2页 / 共38页
葡萄酒的评价 建模.pdf_第3页
第3页 / 共38页
葡萄酒的评价 建模.pdf_第4页
第4页 / 共38页
葡萄酒的评价 建模.pdf_第5页
第5页 / 共38页
点击查看更多>>
资源描述

1、葡萄酒的评价 摘要 对葡萄酒进行评价时一般是通过一批有资质的评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 针对第一个问题,先补全给出的两组评酒员的数据中缺失的数据,然后对数据进行正态性检验,得出评酒员的数据基本符合正态分布。再对两组评酒员的两组数据进行 t检验,得出两组评酒员的结果在红葡萄酒 和白葡萄酒 上 均 无显著性差异。最后比较两组评酒员组内评分的方差 得出第二组评酒员的结果较为可信。 针对第二个问题 ,要使用酿酒葡萄的理化指标和葡萄

2、酒的质量对葡萄酒进行分级。 先由酿酒葡萄的理化指标对葡萄酒进行分级: 由于 酿酒葡萄的理化指标数量过大 ,不适合直接分析,所以 先对其进行 主成分分析 , 降维处理 以 减少指标数量 ,然后使用 k-means聚类方法,对得到的主成分进行聚类得到结果。再由葡萄酒的质量对葡萄酒进行分级,对评酒员对葡萄酒的得分进行 k-means聚类,得到分级结果。 针对第三个问题 要对酿酒葡萄和葡萄酒之间的理化指标进行分析,先对指标数量过 大的酿酒葡萄指标进行主成分分析降维 ,然后对酿酒葡萄新成分数据和葡萄酒的指标数据进行典型相关分析。得出两类数据在相关性最大时的典型相关系数,以便于对两类指标进行两两之间的正负

3、相关分析。 针对第四个问题 , 首先使用典型相关分析分析 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。再使用 bp神经网络,训练网络进行拟合,再放进测试数据,使用 t检验检查通过网络得到的酒评分与真实评分之间没有显著性差异,最后进行相关性分析,发现得到的评分与真实评分之间有相关性,可以使用葡萄和葡萄酒的理化指标对葡萄酒进行评价。 【关键词】 t检验,主成分分析, k-means 聚类,典型相关分析, bp神经网络 1、 问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与

4、所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1给出了某一年份一些葡萄酒的评价结果,附件 2和附件 3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一 组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2、 模型假设 1、评酒员的评价公平公正。 2、忽

5、略制造工艺,酿造方式不同对酿酒葡萄和葡萄酒之间的影响。 3、葡萄酒和葡萄的理化指标真实可靠。 3、 符号说明 Sig 显著性指标 显著性检验值 隐含层节点调节常数 4、 模型的建立和求解 4.1 问题一 4.1.1 问题一的分析 为分析中两组评酒员的评价结果有无显著性差异,首先检查数据的完整性,在缺漏的地方用该组其他评酒员评分的平均值代替,然后对两组评酒员的数据进行正态性检验,得出其服从正态分布。考虑到数据服从正态分布且该问题是两组小样本进行比较,使用 t检验来检查两组数据的显著性差异。对于两组评酒员哪一组更可信,使 用两组组内的评分的方差作为参照,方差较低的一组则更为可信。 4.1.2 问题

6、一的解答 4.1.2.1 数据的处理与分析 一、对数据中缺漏的地方补充处理: 找到缺漏的地方 , 将其他评酒员得分的平均值插入其中 : = 10=19 其中 x为 缺漏的地方填入的值 , 为同样的指标其他组员的评分值 。 二、 计算每一组评酒员对每一组样品总评价的 平 均值 x = 10=1 x = 10=110 其中 表示第 j位评酒员对酒指标的评分 , x表示第 j位评酒员对样品各项指标评分的总分 , X表示该组对葡萄酒样品评分总分的平均值。 三 、 对葡萄酒样品总分的平均值进行正态性检验 使用 spss数据分析软件 , 对两组评酒员对葡萄酒样品的评价总分的平均值进行 单样本 Kolmog

7、orov-Smirnov 检验: 如图所示 为例 ,图中为 第二组评酒员对白葡萄酒澄清度的评价,由图中可以看出第二组评酒 员对白葡萄酒澄清度的评价数据基本符合正态分布。其他数据的检验结果在附录一中给出,分析可得两组评酒员对红葡萄酒和白葡萄酒的评价数据均符合正态分布。 4.1.2.2 显著性差异分析 由于数据服从正态分布且该问题是两组小样本进行比较,所以 运用 spss通过 t检验来检查两组数据 有无 显著性差异。 以红葡萄酒的 t检验为例 , 先对两组评酒员对红葡萄酒的评价总分的平均值进行 t检验 , 得到以下结果 : 独立样本检验 方差方程的 Levene 检验 F Sig. 总分 假设方差

8、相等 3.915 .053 假设方差不相等 独立样本检验 均值方程的 t 检验 t df Sig.(双侧 ) 均值差值 标准误差值 总分 假设方差相等 1.599 52 .116 2.57074 1.60815 假设方差不相等 1.599 40.033 .118 2.57074 1.60815 由方差方程的 Levene 检验结果中, sig 值为 0.0530.05,即表明方差相等的假设成立,查看 t检验中假设方差相等一行的结果, t检验值为 1.599,通过查阅 t检验临界值表可得, t(df)0.05=2.007。 即 tt(df)0.05, 所以无显著性差异 。 同理 , 对白葡萄酒的

9、 t检验结果如下 : 独立样本检验 方差方程的 Levene 检验 F Sig. V12 假设方差相等 5.044 .029 假设方差不相等 独立样本检验 均值方程的 t 检验 t df Sig.(双侧 ) 均值差值 标准误差值 V12 假设方差相等 -1.973 54 .054 -2.2714 1.1512 假设方差不相等 -1.973 44.634 .055 -2.2714 1.1512 由方差方程的 Levene 检验结果中, sig 值为 0.0290.05,即表明方差相等的假设不成立,查看 t检验中假设方差不相等一行的结果, t检验值为1.973,通过查阅 t 检验临界值表可得, t

10、(df)0.05=2.015。 即 tt(df)0.05,所以无显著性差异 。 4.1.2.3 可信度分析 两组评酒员对红葡萄酒的评分的统计量如下: 组统计量 样品号 N 均值 标准差 均值的标准误 总分 1 27 73.0856 7.34857 1.41423 2 27 70.5148 3.97799 .76556 不难看出,第一组的评分的标准差比第二组的 评分的标准差要大,且两组数据均服从正态分布,所以第二组评酒员对红葡萄酒的评价更为可信。 两组评酒员对白葡萄酒的评分的统计量如下: 组统计量 样品号 N 均值 标准差 均值的标准误 V12 1 28 74.261 5.2012 .9829

11、2 28 76.532 3.1709 .5993 同样可以看出,第一组的评分的标准差比第二组的评分的标准差要大,且两组数据均服从正态分布,所以第二组评酒员对 白 葡萄酒的评价更为可信。 4.2 问题二 4.2.1 问题二的分析 为了对酿酒葡萄进行分级,要根据对酿酒葡 萄的理化指标和葡萄酒质量的聚类 结果 来进行分级。首先,因为酿酒葡萄理化指标 数量 过多 会为分析数据以及聚类带来困难 , 因此应 对它进行 使用 主成分分析 的方法降维处理 ,得到它的主成分得分,并对此和葡萄酒质量的指标进行 K-means聚类分析,分别得到各自的分级作对比,从而类比得出酿酒葡萄的分级。 4.2.2 问题二的解答

12、 4.2.2.1 对葡萄理化指标的主成分分析。 以红葡萄为例 : 基本步骤为: 对原始数据进行标准化处理: ),2,1;,2,1()Var(-xxxx jjij*ij pjni 其中 nijni ijj xxxxx jijnV arn 121 )(11)(;1 ( j=1,2, ,p) 是指标, x是样本数, n是样本数 计算样本相关数据矩阵 为了方便,假定原始数据标准化后仍用 X来表示,则经过标准化处理后的数据的相关系数为 rrrrrrrrppppppR212222111211r 其中, 1,1 )(),c o v ( 1ijr nnnkk jjiiji xxxxxx 。 计算相关系数矩阵

13、R的特征值 计算出相关系数矩阵 R的特征值 1 2 0, 及对应的标准化特征向量 u1, u2, u. 选择 p个主成分 , 计算综合评价值 。 计算特征值的信息贡献率和累积贡献率。称 = 69=1, = 1,2,69 为主成分 的信息贡献率 ;而且称 = =1 69=1 为主成分 1, 2, 的累积贡献率 。 当 接近与 1时 (即取 = 0.9时 ),则选择前 p个指标变量作为 p个主成分,代替原来 69个指标变量,从而可对 p个主成分进行综合分析。 计算综合得分: Z = =1 ,其中: 为第 j个主成分的信息贡献率 , 根据综合得分值就可进行评价 。 利用 spss统计软件计算红葡萄的

14、理化指标 的主成分 如下,由于成分数较多,就不一一展示了,只截取前一部分。 从表 可以看到,前 15个主成分的累积贡献率为 90.723%,便取前 15个主成分用来代表红葡萄的理化指标。 解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 11.070 16.043 16.043 11.070 16.043 16.043 2 10.294 14.919 30.962 10.294 14.919 30.962 3 7.995 11.587 42.549 7.995 11.587 42.549 4 6.742 9.771 52.320 6.7

15、42 9.771 52.320 5 4.931 7.146 59.466 4.931 7.146 59.466 6 3.601 5.218 64.685 3.601 5.218 64.685 7 3.165 4.586 69.271 3.165 4.586 69.271 8 3.073 4.454 73.725 3.073 4.454 73.725 9 2.204 3.195 76.920 2.204 3.195 76.920 10 2.168 3.142 80.062 2.168 3.142 80.062 11 1.813 2.627 82.689 1.813 2.627 82.689 12

16、 1.719 2.492 85.181 1.719 2.492 85.181 13 1.345 1.949 87.130 1.345 1.949 87.130 14 1.300 1.884 89.014 1.300 1.884 89.014 15 1.179 1.708 90.723 1.179 1.708 90.723 16 1.000 1.449 92.172 17 .973 1.410 93.581 再计算出每一种红葡萄样本的主成分得分 如下 样品编号 主成分得分 葡萄样品 14 1.15611 葡萄样品 1 -0.56616 葡萄样品 15 -2.86556 葡萄样品 2 -0.832

17、5 葡萄样品 16 -5.4615 葡萄样品 3 6.90834 葡萄样品 17 2.3495 葡萄样品 4 -11.48378 葡萄样品 18 0.04956 葡萄样品 5 -0.34579 葡萄样品 19 0.99827 葡萄样品 6 0.16765 葡萄样品 20 0.01384 葡萄样品 7 -2.20397 葡萄样品 21 -0.80966 葡萄样品 8 3.0076 葡萄样品 22 -0.36614 葡萄样品 9 2.18401 葡萄样品 23 8.53561 葡萄样品 10 3.59673 葡萄样品 24 -0.53094 葡萄样品 11 5.39011 葡萄样品 25 -2.8

18、4371 葡萄样品 12 1.10638 葡萄样品 26 -1.16299 葡萄样品 13 -2.73058 葡萄样品 27 -3.26046 4.2.2.2 聚类分析 对于各个样品的主成分得分,进行 k-means 聚类分析 ,主要原 理是: 从 N个数据对象任意选择 K个对象作为初始聚类中心。 循环 到 直到每个聚类不在发生变化为止 。 根据每个聚类对象的均值,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分。 重新计算每个聚类的均值 , 直到聚类中心不再发生变化 。 这种划分使得下式最小 : E = 2=1 . 考虑到一共只有 27 个样本,所以设定 K的取值范围定

19、为 2-4 当 k=2时 , ANOVA分析 得到 以 下结果 , 平均方差为 8.258 ANOVA 聚类 误差 F Sig. ANOVA 聚类 误差 F Sig. 均方 df 均方 df VAR00001 183.541 1 8.258 25 22.225 .000 当 k=3时 , ANOVA分析 得到以 下结果 , 平均方差为 3.976 均方 df 均方 df VAR00001 147.286 2 3.976 24 37.042 .000 当 k=4时 , ANOVA分析 得到 以 下结果 , 平均方差为 1.958 聚类 误差 F Sig. 均方 df 均方 df 主成分得分 11

20、4.990 3 1.958 23 58.733 .000 方差最低,所以取 k=4作为聚类个数 ,得到如下结果 聚类成员 案例号 聚类 距离 案例号 聚类 距离 1 1 1.155 15 2 .362 2 1 1.422 16 2 2.234 3 3 .036 17 1 1.760 4 4 .000 18 1 .540 5 1 .935 19 1 .409 6 1 .421 20 1 .575 7 2 1.024 21 1 1.399 8 1 2.418 22 1 .955 9 1 1.595 23 3 1.591 10 1 3.008 24 1 1.120 11 3 1.555 25 2 .

21、384 12 1 .517 26 1 1.752 得到聚类结果 ,再根据聚类中心,对 4种类别进行排序: 最终聚类中心 聚类 1 2 3 4 主成分得分 .5891 -3.2276 6.9447 -11.4838 分出 类别 3为 1级 ,类别 1为 2级 ,类别 2 为 3级 ,类别 4为 4级 。 再据此对葡萄酒进行分级 如下: 第一 级: 3号, 11 号, 23号 第二 级: 1号, 2号, 5号, 6号, 8号, 9 号, 10号, 14号, 17号, 18号,19号, 20 号, 21号, 22号, 24号, 26号, 第三 级: 7号, 13 号, 15号, 16号, 25号,

22、27号 第四 级: 4号。 同理,可以计算出红葡萄酒得分的聚类结果,白葡萄理化指标的聚类 结果,白葡萄酒得分的聚类结果(聚类数据在附录中给出,以下就不再赘述),结果如下: 红葡萄酒得分 分级 结果 : 第一 级: 2号, 3号, 9号, 17号, 20号, 23号 13 2 .497 27 2 .033 第二 级: 5号, 10 号, 13号, 14号, 16号, 19号, 21号, 22号, 24号,26号, 27 号 第三 级: 1号, 4号, 6号, 7号, 8号, 11 号, 25号 第四 级: 12号, 15 号, 18号 白葡萄理化指标 分级 结果: 第一 级: 3号, 15 号,

23、 27号, 28号 第二 级: 1号 , 2 号, 6号, 20号, 23号 第三 级: 5号 , 7 号 , 8号, 10号, 11号, 13号 , 14号 , 16号 , 17号 , 18号 , 21 号 , 24号 , 25号 第四 级: 4号, 9号, 19号, 22号, 26号 白葡萄酒得分 分级 结果 : 第一 级: 5号, 9号, 10号, 15号, 17号, 21号, 22号, 25号, 28号 第二 级: 1号, 2号, 3号, 4号, 6号, 14 号, 18号, 19号, 20号, 23号, 24 号, 27号 第三 级: 7号, 8号, 11号, 12号, 13号, 2

24、6号 第四 级: 4号 以上得到的便是根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级的结果。 4.3 问题三 4.3.1 问题三的分析 要分析酿酒 葡萄与葡萄酒的理化指标之间的联系, 由于酿酒葡萄的理化指标有 69个,数据量过大又无明显联系,因此 要对 酿酒 葡萄的理化指标进行主成分分析降维 ,得到新的成分 。因为 降维后的数据与葡萄酒的理化指标 都能很好的代表它们各自的样本数据且符合多元正态分布,而我们需要分析酿酒葡萄与葡萄酒理化指标之间的联系 ,所以可以使用典型相关分析 分析 新成分与葡萄酒理化指标之间的关系 。 4.3.2 问题三的解答 一、 分别对红葡萄和白葡萄的理化指标进

25、行主成分分析,得出他们的主成分分析,取它们的主成分,分别用 x1( xxx n21, )和 x2( xx n, 21x )表示。 二、 把两组的主成分分别与葡萄酒的质量指标进行典型相关分析。 基本步骤为: 定义向量 a1, b2,有 u=a1x1,v=b1x2。 于是有 corr(u,v)=11b11a112211T12ba baTT 其中 为 x1 与 x2的协方差, 为 x1与 x1的协方差,为 x2 与 x2的协方差。 当 corr(u,v)有最大值的时候,得到最优解 a1和 b1。 在约束条件为 =1, =1时,求出 的最大值。即构造 Lagrangian 等式,有 12 111a1

26、11T a 11 22bb T b11 12a T a1b112-111 b 1a121-122 便可以求出 a1和 b1,同理可得典型变量为: yxbv a1111u ; yxbv a2222u ; yxbv avrrrr ( r min( p, q) 其中 p为 x的维数, q为 y的维数。 检验各典型相关变量的显著性差异。 易知 0,cov 0,cov )( )( vv uujiji ,分析 ui 与 uj 之间的显著性差异,当 ui 与 uj 的相关性为 0时,即 2组典型相关变量没有意义,取相关性最高的若干组典型相关变量。 三、 利用 spss 分别对两组变量进行典型相关分析 以白葡

27、萄酒为例, 典型相关系数表 1 2 3 4 5 6 7 8 0.991 0.997 0.942 0.898 0.809 0.765 0.674 0.542 由典型相关系数表得前 3个典型相关系数都大于 0.9,故前 3组典 型 相关变量 的解释能力足够强。 典型相关系数检验表 Test that remaining correlations are zero: wilks Chi-SQ DF Sig. 1 0 187.393 144 0.009 2 0 132.657 119 0.185 3 0.01 90.734 96 0.633 由典型相关系数检验表可以知道,只有第一组典型相关变量的 si

28、g ( P) 0.05,即只有第一组典型相关变量相关性显著 .所以只取第 一组典型相关变量即可表示。 x1变量间的相关系数表 y变量间的相关系数表 有xxxxxxxxu 976543211 033.0134.0049.0327.0319.057.0149.0326.0 xxxxxxxx 1716151413121110 252.0065.0178.0234.04.003.0305.0045.0- yyyyyyyyv 876543211 896.1484.0195.1246.0404.0746.0034.0304.0 由 x1和 y的变量相关系数表可知, x3 与 y6, y8的相关性较 高 ,

29、查看 x1的成分表 成份矩阵 a 成份 1 2 3 4 5 6 7 氨基酸总量 .438 .292 .377 .510 -.047 .132 .046 蛋白质 mg/100g .312 -.310 .544 -.347 .019 -.221 .076 VC含量( mg/L) .009 -.311 -.529 -.303 .098 .099 .084 花色苷 mg/l00g -.462 .113 -.229 .241 .148 .343 -.023 酒石酸 .099 .575 -.138 .270 .291 .357 .244 苹果酸 .217 -.184 .315 .567 .210 .032

30、 .461 柠檬酸 .049 .271 .217 .094 .245 .343 .461 多酚氧化酶活力 -.441 .007 -.400 -.202 -.065 .328 .278 褐变度 .290 -.028 -.011 -.578 .312 -.262 .332 DPPH 自由基 1/IC50( g/L) .555 -.150 .233 -.160 -.238 .150 -.187 总酚 (mmol/kg) .155 -.442 .755 -.136 .259 .151 .013 单宁 (mmol/kg) .347 .043 .524 -.208 -.224 .146 -.051 葡萄总

31、黄酮( mmol/kg) .091 -.481 .764 -.067 .155 .227 -.043 白藜芦醇 (mg/kg) -.046 .087 .269 .383 .214 -.601 -.230 黄酮醇 (mg/kg) .096 .065 .602 -.357 .493 -.034 .288 总糖 g/L .494 .558 .073 -.053 -.415 -.055 .064 还原糖 g/L .446 .488 .213 .057 -.349 -.317 .205 可溶性固形物 g/l .462 .684 .081 -.094 -.363 .167 .171 PH值 -.057 .

32、560 .163 -.007 .167 .120 -.490 可滴定酸( g/l) .393 -.600 -.094 .244 -.316 -.254 .300 固酸比 -.327 .691 .169 -.188 .228 .289 -.207 干物质含量 g/100g .494 .650 .258 .088 -.137 -.133 .100 果穗质量 /g -.353 -.636 .301 .268 .059 -.040 -.215 百粒质量 /g -.227 -.523 -.073 -.089 -.401 .110 .170 果梗比 (%) -.074 .104 -.612 .162 .2

33、74 -.133 .153 出汁率 (%) -.252 -.535 -.245 .267 .176 -.065 .131 果皮质量( g) -.266 -.339 .444 .221 -.320 .268 .149 L* 1 .678 -.061 -.019 .296 .319 .100 -.176 L*2 .788 -.174 -.226 -.266 .343 -.076 -.042 l*3 .852 -.157 -.105 .021 .074 .194 -.235 a*(+红; -绿 ) 1 -.749 .337 .074 -.218 -.051 -.189 .184 A*2 -.704

34、.424 .279 .014 .094 -.286 -.028 a*3 -.690 .437 .204 .059 .168 -.210 .104 b*( +黄 ;-蓝) 1 .794 .160 -.147 .314 .186 -.157 .051 b*( +黄 ;-蓝) 2 .817 .040 -.326 -.165 .212 -.077 .081 b*( +黄 ;-蓝) 3 .844 -.011 -.304 -.021 -.022 .080 -.087 可得白葡萄中的总酚,葡萄总酚,和黄酮醇对白葡萄酒中的酒总黄酮,色 泽 L和色泽 b有正相关,白葡萄中的果梗比对白葡萄酒中的酒总黄酮,色 泽

35、L和色泽 b有负相关。 同理可得 2条红葡萄 理化指标和红葡萄质量的 2组典型相关变量。从第 一组中可知,红葡萄酒中的可定酸对白葡萄酒中的花色苷有负相关。从第二组可知,红葡萄酒中的总糖,干物质含量,固酸化,果 穗 和酒石酸对红葡萄酒中的总酚,色泽 b有正相关,对酒总黄酮有负相关。红葡萄酒中的 VC 含量对红葡萄酒中的总酚,色泽 b有负相关,对酒总黄酮有正相关。 4.4 问题四 4.4.1 问题四的分析 首先,要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。由于葡萄酒是酿酒葡萄通过一系列的加工处理后得到的,所以认为葡萄酒的理化数据与酿酒葡萄的理化数据不是平行的指标, 要分开进行处理。 通过分

36、别用葡萄酒和葡萄的理化指标与葡萄酒质量分数进行典型相关分析,可以 分析 得到它们 对葡萄酒质量的影响。再使用一部分样本数据 ,以 葡萄酒和葡萄的理化指标输入,葡萄酒质量分数为目标, 对 bp神经网络进行训练, 得到训练好的网络 后,使用剩下的样本通过网络计算出得分,将计算出的分数与实际数据比较,就可以得出葡萄酒和葡萄的理化指标是否能够对葡萄酒的质量进行评价。 4.4.2 问题四的解答 4.4.2.1 分析 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 4.4.2.1.1 处理 酿酒葡萄的 理化指标数据 由于 酿酒葡萄的理化指标 指标 数量 较多,所以要先对酿酒葡萄的理化指标使用 spss进行主

37、成分分析降维处理,具体过程如第二题所示,这里直接给出结果: 白葡萄 理化指标 的降维结果 : 如图所示,对白葡萄的理化指标降维处理后,取前 15个主成分,其累计贡献率达到 93.788%,可以较好的表现出白葡萄的理化指标。 分析得出 15个主成分分别代表: 1、果皮颜色 2、黄酮醇 (mg/kg) 可溶性固形物 g/l 固酸比 果穗质量 /g 3、总酚 (mmol/kg) 葡萄总黄酮( mmol/kg) 果梗比 (%) 4、苹果酸 褐变度 5、总糖 g/L 6、 白藜芦醇 (mg/kg) 7、柠檬酸 8、 单宁 (mmol/kg) 9、 花色苷 mg/l00g 10、 果皮质量( g) 11、

38、氨基酸总量 12、 百粒质量 /g 13、 DPPH自由基 1/IC50( g/L) 14、多酚氧化酶活力 15、 L*1 红葡萄 理化指标 的降维结果 : 同样,对红葡萄的理化指标降维处理后,取前 15个主成分,其累计贡献率 95.946%,可以较好的表现出红葡萄的理化指标。 分析得出 15个主成分分别代表: 1、花色苷, DPPH自由基总酚,单宁,葡萄总黄酮, 2、总糖 g/L,干物质含量 g/100g, 3、可滴定酸 4、多酚氧化酶活力,褐变度, PH值 5、氨基酸总量 6、 VC含量,固酸比,果穗质量 7、酒石酸 8、果皮质量 9、出汁率 10、 L2, 11、果梗比 12、柠檬酸 1

39、3、多酚氧化酶活力 14、 L*1 15、还原糖 4.4.2.1.2 用葡萄酒和葡萄的理化指标与葡萄酒质量分数进行典型相关分析 红葡萄酒的分析 : x1 花色苷 (mg/L) x2 单宁 (mmol/L) x3 总酚 (mmol/L) x4 酒总黄酮 (mmol/L) x5 白藜芦醇 (mg/L) x6 DPPH 半抑制体积( IV50) 1/IV50(uL) x7 颜色 L*(D65) x8 颜色 a*(D65) x9 颜色 b*(D65)) y1 澄清度 y2 色调 y3 香气纯正度 y4 香气浓度 y5 香气质量 y6 口感纯正度 y7 口感浓度 y8 口感持久性 y9 口感质量 y10

40、 综合评分 使用 红 葡萄酒的理化指标,与 红 葡萄酒质量分数进行典型相关分析: 得到红葡萄酒的典型相关系数为 : 又根据 方检验的 sig 值,得出取第一组数据进行检验 ,如图所示 。 x1 x2 x3 x4 x5 x6 x7 x8 x9 1.812 0.979 -1.807 1.236 0.019 -0.204 2.164 0.252 0.815 分析两组数据可以得出 红葡萄酒理化指标中花色苷 , 单宁 ,酒总黄酮,颜色 L*(D65)对葡萄酒质量的 香气纯正度,口感质量有正相关影响 ,对澄清度,色调,香气质量,综合评分有负相关影响 ; 红葡萄酒理化指标中 总酚(mmol/L), 颜色 b

41、*(D65)对葡萄酒质量的 澄清度,色调,香气质量,综合评分有正相关影响 , 对香气纯正度,口感质量有负相关影响。 y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 -.491 -.913 .866 -.088 -.434 .064 -.132 -.088 .841 -.677 同理,对白葡萄酒的的理化指标,与白葡萄酒质量分数进行典型相关分析, 发现卡方检验的 sig值远大于显著性检验值( 0.05),因此无法进行有效的分析。 对此,我们采用了另外一种分析方法 双变量相关分析,分析白葡萄酒理化指标与白葡萄 酒质量之间的相关性,具体数据如下图所示: 根据双变量相关分析的结果 , 可以

42、得到 : 单宁对色调 , 口感持久性有正相关关系 ;总分对色调,香气浓度,口感持久性,口感质量 有正相关关系 ; 酒总黄酮对澄清度 , 香气质量 , 口感纯正度 , 口感质量有负相关关系 ; 白藜芦醇对澄清度有有正相关关系 , 对口感浓度 , 口感持久性 , 口感质量 , 综合评分有负相关关系 ; DPPH半抑制体积对色调 , 香气浓度 , 口感浓度 , 口感质量 , 口感持久性有有正相关关系 ; L*(D65), a*(D65)对色调有负相关关系; b*(D65) 对色调有正相关关系。 使用葡萄的理化 指标降维得到的主成分,与葡萄酒质量分数进行典型相关分析: 将红葡萄理化指标 的 15个主成

43、分 与葡萄酒质量分数进行典型相关分析,得到 典型相关系数 分析卡方检验结果,应该取两组数据进行分析,即以下两组数据 y1 -0.252 0.116 y6 -0.492 -0.091 y2 -0.309 -0.448 y7 -0.091 0.868 y3 -0.443 -0.080 y8 0.202 0.242 y4 0.302 0.736 y9 -0.278 -0.437 y5 -0.224 -0.221 y10 0.331 -0.049 x1 -0.345 0.049 x9 -0.063 0.325 x2 0.617 0.395 x10 0.023 0.377 x3 0.049 0.423

44、x11 -0.114 -0.150 x4 0.129 -0.395 x12 0.118 0.114 x5 -0.449 0.229 x13 0.139 -0.172 x6 -0.236 0.373 x14 0.090 0.000 x7 -0.252 0.001 x15 -0.037 -0.045 x8 -0.317 0.004 分析得知 , 花色苷, DPPH自由基总酚,单宁,葡萄总黄酮 , 氨基酸总量 ,酒石酸 ,果 皮质量 ,果梗比 对 澄清度,色调,香气纯正度,香气质量,口感纯正度,综合评分 有正相关关系 ,对 香气浓度 , 口感浓度,口感持久性 有负相关关系; 总糖 g/L,干物质含量,可滴定酸 VC含量,固酸比,果穗质量,出汁率 , L2、 柠檬酸 对 浓度 , 口感浓度,口感持久性 有正相关关系,对 澄清度,色调,香气纯正度,香气质量,口感纯正度,综合评分 有负相关关系。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报