收藏 分享(赏)

现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx

上传人:无敌 文档编号:662137 上传时间:2018-04-17 格式:DOCX 页数:21 大小:431.97KB
下载 相关 举报
现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx_第1页
第1页 / 共21页
现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx_第2页
第2页 / 共21页
现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx_第3页
第3页 / 共21页
现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx_第4页
第4页 / 共21页
现代葡萄酒业中统计方法的应用大学生数学建模竞赛论文.docx_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、12012 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上

2、公示,在书籍、期刊和其他媒体进行正式或非正式发表等) 。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 07268 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):22012 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进

3、行编号):1现代葡萄酒业中统计方法的应用摘要:“现代葡萄酒业中统计方法的应用”数学模型运用了一些经典的统计原理和统计方法,探讨在已知葡萄及葡萄酒的理化指标数据的情况下,如何有效地利用来对葡萄酒进行一个简明初步的分级,并对葡萄与葡萄酒的理化指标之间的联系和两组不同品酒师对相同葡萄酒评价的差异性和可信度进行分析,再通过以葡萄及葡萄酒的理化指标对葡萄酒的分级与品酒师对葡萄酒的评定比较,最终得出对葡萄酒鉴定的合理方案。该数学模型借助 SPSS 软件运用 T 检验对两组品酒师对酒的评价的差异性进行了分析,又通过主成分分析对葡萄和葡萄酒的理化指标进行了归类和简化,进而对葡萄和葡萄酒的理化指标对葡萄酒品质的

4、贡献做了综合性的分析;肯德尔和谐系数、方差分析的运用和数据相关性系数的计算又为评价品酒师对酒品打分的客观性和数据的关联性提供了有力的依据。通过模型我们可以得出结论:两组品酒员评价结果无显著性差异,第二组品酒师的结果更可信;仅靠葡萄和葡萄酒的理化指标不能准确评价葡萄酒的质量。关键词:理化指标 统计方法 T 检验 主成分分析 肯德尔和谐系数相关系数2一、 问题重述与分析1.1 问题的重述葡萄酒是酒中的精魂,飘渺于生命的内在,又令心灵交融;她是有生命的,来自于天地恩赐,日月光泽;她恍如披着柔幔的处女,娇憨清新,浓淡相宜。葡萄酒的质量是葡萄酒的一种特性,它是表示葡萄酒优秀的程度。复杂性和协调性构成了葡

5、萄酒质量的主要属性。复杂性意味着葡萄酒有浓郁的令人愉快的香气与滋味,及它的潜力与精巧性。协调性是指各种感官成分的结合是平衡的,每一种成分与其它成分相比,它的存在及其含量是非常适宜的,而且它的复杂性、颜色强度、香气、滋味、后味是稳定一致的。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。在拥有附件 1(某一年份一些葡萄酒的评价结果) 、附件 2(该年份这些葡萄酒的成分数据)和附件 3(

6、酿酒葡萄的成分数据)的情况下,我们需要尝试建立数学模型讨论下列问题:1两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3酿酒葡萄与葡萄酒的理化指标之间有什么样的理化的联系。4酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响以及能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 1.2 问题的分析由题意可知,目的就是为了建立数学模型,探讨在已知葡萄及葡萄酒的理化指标数据的情况下,如何有效地利用来对葡萄酒进行一个简明初步的分级,并对葡萄与葡萄酒的理化指标之间的联系和两组不同品酒师对相同葡萄酒评价的差异性和可信度进行分析,再通过以葡萄及葡

7、萄酒的理化指标对葡萄酒的分级与品酒师对葡萄酒的评定比较,最终得出对葡萄酒鉴定的合理方案。问题一中,首先可以用 SPSS 软件对两组品酒师评价进行 T 检验以确定两组品酒师评价的差异性,然后再利用 SPSS 求出两组品酒师评价结果的肯德尔和谐系数和方差以评定两组品酒师评价的可信度。而问题二,可以用主成分分析的方法对葡萄的理化指标和葡萄酒的质量做综合性的分析,以完成对酿酒葡萄的分级。由题意可知葡萄酒的质量由品酒师的打分确定,故需要对两组品酒师的打分结果进行综合评定。问题三,采用求相关系数的方法,求解出两种葡萄与对应的两种葡萄酒的理化指标之间的相关系数以确定酿酒葡萄与葡萄酒的理化指标之间有什么样的理

8、化的联系。问题四中,首先对葡萄和葡萄酒的理化指标进行综合的分级,然后求综合分级与品酒员对酒品评价高低的相关性,可知若相关性较高,则说明用葡萄和葡萄酒的理化指标来评价葡萄酒的质量具有一定的可行性,反之则说明不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、 建模的过程1) 问题一1、模型假设:1、两组品酒员无信息交流,彼此之间打分无影响。32、样本足够大。 3、假设葡萄酒的酿造时期和被品尝时期相同。2、定义符号说明:R相关性系数3、模型的建立与求解差异性:如下图,对于红白葡萄酒质量评分,两组 20 名品酒员给出的结果如下:1.红葡萄样品 1 2 3 4 5 6 7 8 9A 62.7 80.3

9、 80.4 68.6 73.3 72.2 71.5 72.3 81.5B 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2样品 10 11 12 13 14 15 16 17 18A 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9B 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4样品 19 20 21 22 23 24 25 26 27A 78.6 78.6 77.1 77.2 85.6 78 69.2 73.8 73B 72.6 75.8 72.2 71.6 77.1 71.5 6

10、8.2 72 71.52.白葡萄样品 1 2 3 4 5 6 7 8 9 10A 82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3B 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8样品 11 12 13 14 15 16 17 18 19 20A 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8B 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6样品 21 22 23 24 25 26 27 28A 76.4

11、71 75.9 73.3 77.1 81.3 64.8 81.3B 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6对上述两表进行 T 检验,结果如下:41.白葡萄:对于白葡萄酒来说,F值为2.808,相伴概率为 0.111,大于显著性水平 0.05,不能拒绝方差相等的假设,可以认为第一组和第二组品酒员的评价结果无明显差异。然后看方差相等时的 T 检验结果,T 统计量的相伴概率为 0.478,大于显著性水平 0.05,不能拒绝 T 检验的零假设。也就是说,品酒员对白葡萄酒的评价结果不存在明显差异。另外从样本的均值差的 95%置信区间看,区间跨 0,这也说明两组品酒员对

12、白葡萄酒的评价无显著性差异。2.红葡萄:组统计量A N 均值 标准差 均值的标准误1.00 10 73.6680 5.09807 1.61215VAR000012.00 10 73.5780 3.06119 .96803独立样本检验方差方程的 Levene 检验 均值方程的 t 检验差分的 95% 置信区间F Sig. t dfSig.(双侧)均值差值标准误差值 下限 上限假设方差相等2.426 .137 .048 18 .962 .09000 1.88046 -3.860704.04070VAR00001假设方差不相等.048 14.743 .962 .09000 1.88046 -3.92

13、4194.10419组统计量A N 均值 标准差 均值的标准误1.00 10 74.2600 8.45874 2.67489VAR000012.00 10 76.5320 5.16612 1.63367独立样本检验方差方程的 Levene 检验 均值方程的 t 检验差分的 95% 置信区间F Sig. t dfSig.(双侧)均值差值标准误差值 下限 上限假设方差相等2.808 .111 -.725 18 .478 -2.272003.13431 -8.856944.31294VAR00001假设方差不相等-.725 14.894 .480 -2.272003.13431 -8.956764.

14、412765对于红葡萄酒来说,F 值为 2.426,相伴概率为 0.137,大于显著性水平 0.05,不能拒绝方差相等的假设,可以认为第一组和第二组品酒员的评价结果无明显差异。然后看方差相等时的 T 检验结果,T 统计量的相伴概率为 0.962,大于显著性水平0.05,不能拒绝 T 检验的零假设。也就是说,品酒员对红葡萄酒的评价结果不存在明显差异。另外从样本的均值差的 95%置信区间看,区间跨 0,这也说明两组品酒员对红葡萄酒的评价无显著性差异。相关性检验取两组的平均分:一组 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1二组 68

15、.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6一组 53.9 74.6 73 58.7 74.9 79.3 59.9 78.6 78.6 77.1 77.2二组 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6一组 85.6 78 69.2 73.8 73 82 74.2 85.3 79.4 71 68.4二组 77.1 71.5 68.2 72 71.5 77.9 75.8 75.6 76.9 81.5 75.5一组 77.5 71.4 72.9 74.3 72.3 63.3 65.

16、9 72 72.4 74 78.8二组 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3一组 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3二组 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6相关性VAR00001 VAR00002Pearson 相关性 1 .454*显著性(双侧) .001VAR00001N 55 55Pearson 相关性 .454* 1显著性(双侧) .001VAR00002N 55 55*. 在

17、 .01 水平(双侧)上显著相关。R=0.4540.4 有一定的相关性总评:统计量A N 均值 标准差 均值的标准误1 10 73.67 5.098 1.612V22 10 73.58 3.061 .968独立样本检验方差方程的 Levene 检验 均值方程的 t 检验F Sig. t dfSig.(双侧)均值差值标准误差值差分的 95% 置信区间6统计量A N 均值 标准差 均值的标准误V2 1 10 73.67 5.098 1.612下限 上限V2 假设方差相等2.426 .137 .048 18 .962 .090 1.880 -3.861 4.041假设方差不相等.048 14.743

18、 .962 .090 1.880 -3.924 4.104对于葡萄酒来说,F 值为,相伴概率为 2.426,大于显著性水平 0.05,不能拒绝方差相等的假设,可以认为第一组和第二组品酒员的评价结果无明显差异。然后看方差相等时的 T 检验结果,T 统计量的相伴概率为 0.962,远大于显著性水平 0.05,不能拒绝 T 检验的零假设。也就是说,品酒员对葡萄酒的评价结果不存在明显差异。另外从样本的均值差的 95%置信区间看,区间跨 0,这也说明两组品酒员对葡萄酒的评价无显著性差异。可信度:1.对于同一种酒的同一指标的评价,在两组无显著性差异的情况下,一组 10 人的评价分数相差越小则可信度越高,评

19、价分数的散聚程度由标准差的大小来评价。共27(28)组,标准差大小如下:x=1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28;y1=28.92 18.92 20.31 31.18 23.62 23.19 30.54 19.90 17.22 16.54 25.24 26.77 20.11 18.00 27.75 12.76 28.14 20.61 20.65 15.31 32.32 21.34 17.10 25.96 24.12 16.78 21.17 0;y2=28.81 42.54 57.32

20、 20.06 33.73 38.27 18.77 40.65 28.89 43.75 39.93 32.28 39.20 32.06 34.42 40.02 36.02 37.54 20.44 24.07 39.43 35.33 19.82 31.62 17.46 25.61 36.05 26.91;y3=27.15 12.08 16.63 19.28 11.09 13.79 23.75 24.21 15.22 18.04 18.50 15.04 11.73 14.44 19.29 13.45 9.08 21.27 22.28 18.75 17.88 14.78 14.93 9.82 19.8

21、4 19.34 13.58 0;y4=15.26 21.01 35.81 19.47 15.38 14.30 19.48 16.74 30.93 25.17 28.11 35.50 20.52 11.95 22.05 27.20 18.60 16.50 15.31 21.22 24.07 21.96 10.22 18.63 30.96 30.43 17.89 15.11;比较直观的从下图来分析:7上图中四条曲线分别表示 A,B 两组对红白葡萄酒的总体评价的标准差的大小,由蓝色和红色的两条曲线可以看出 A 组对红葡萄酒的评价差较 B 组来说更大,同样有棕色和浅蓝色的两条曲线得出白葡萄酒仍然是 A

22、 族的标准差大。2.做两组品酒员所得结果的 Alpha 系数A 组的 Alpha 系数:案例处理汇总N %有效 55 100.0已排除 a 0 .0案例总计 55 100.0可靠性统计量Cronbachs Alpha 项数0.825 10B 组的 Alpha 系数:案例处理汇总N %有效 55 100.0已排除 a 0 .0案例总计 55 100.0可靠性统计量Cronbachs Alpha 项数0.834 108由上图可以看出两组的 Alpha 系数均大于 0.8,及说明数据的可靠性都较强,但第二组的 Alpha 系数略好于第一组,所以第二组的可靠性略好于第一组。所以综合以上两个方面,第二组的可靠性更高。2)问题二1、模型假设:1、假设品酒师对葡萄酒的打分作为酿酒葡萄质量的指标之一。2、假设酿酒葡萄理化指标中的数据不受单位的影响。4、假设样本的量足够大且具有代表性。2、定义符号说明:Xi-第 i 个理化指标ZXi-原始变量经过标准化处理之后的数据Hi-红葡萄样品 iBi-白葡萄样品 i3、模型建立与求解:对于酿酒葡萄的分级问题,先通过因子分析对葡萄的众多指标进行提炼,用少数几个变量来替代酿酒葡萄的变量。表 2.1将表 2.1 中的数据运用 SPSS 软件处理,对酿酒葡萄的 26 项指标进行因子分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 管理论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报