1、基于流速调制的电子鼻系统开发及其在黄酒酒龄分类中的应用 钱曙 邢建国 王雨 程辉 浙江工商大学计算机与信息工程学院 摘 要: 一种基于流速调制的电子鼻系统, 在流速可变的情况下, 通过改变进气流速来扩大传感器对不同气体的响应范围, 以此来提高识别正确率, 缩短检测时间。应用改进的自适应主成分分析算法 (Adaptive Principal Component Analysis, AD-PCA) 对黄酒酒龄进行分类来验证此电子鼻系统, 并将该算法的结果与支持向量机算法 (Support Vector Machine, SVM) 和误差反向传播神经网络算法 (Back-Propagation Ne
2、ural Network, BPNN) 的结果进行对比, 实验结果表明:对于 5 种不同酒龄的黄酒, AD-PCA 得到的平均正确分类率为 93.6%, SVM 得到的平均正确分类率为 92%, BPNN 得到的平均正确分类率为 100%, 与固定流速相比, 可以在保证较高准确率的基础上做到快速分类, 并且有效缩短检测时间。关键词: 黄酒; 电子鼻; 模式识别; 流速调制; 作者简介:钱曙, 硕士研究生作者简介:邢建国, 副教授, 通讯作者, E-mail:。收稿日期:2017-10-16基金:浙江省科技厅公益项目 (2016C32G2050021) The development of el
3、ectronic nose system based on flow modulation and its application in the wine age classification of the Chineseyellow wineQIAN Shu XING Jian-guo WANG Yu CHENG Hui School of Computer Science Abstract: We designed an electronic nose system based on flow modulated, in the case of variable flow rates, i
4、n order to improve the accuracy of recognition and short the detection time, we maximize the gas response range of sensors to different components and concentrations by changing the intake flow rate.We used adaptive principal component analysis (AD-PCA) to classify the age of Chinese yellow wine in
5、order to verify the system, and compare the result of AD-PCA with support vector machine (SVM) and back-propagation neural network (BPNN) , The experimental resultshows that among the 5 different ages of Chinese yellow wine, the average correct classification rate by AD-PCA is 93.6%, SVM is 92% and
6、BPNN is 100%, it is proved that the system can quickly classifythewineage on the basis ofa higher accuracy rate, and can shorten the detection time compared with the fixed flow rate.Keyword: Chinese yellow wine; electronic nose; pattern recognition; flow modulation; Received: 2017-10-16黄酒是世界上最古老的酒类之
7、一, 源于中国, 与啤酒、葡萄酒并称世界三大古酒。黄酒以大米、黍米、粟为原料, 含有人体必需的多种氨基酸1, 其中包括有数种未知氨基酸。黄酒中的检测方法主要有人为感官品评和理化指标检测。前者主要凭借人的主观感官感受来判断, 而这种判断往往只是初步的口味是否纯正的判断, 无法做到对其中化学物质的定量检测, 并且受外界干扰和人为因素影响;后者是通过仪器判断, 方法主要有气相色谱2-3、高效液相色谱4-6等, 这些方法虽然准确率较高, 但是往往检测时间长并且成本也比较高。随着传感器技术的发展和各种分类算法的不断演进完善, 目前已经应用于饮料、酒8-11等食品的检测。电子鼻的分类大多使用传感器阵列的稳
8、态值作为特征值和 PCA、SVM、BPNN 等分类算法12-14。由于受传感器数量自身物理特性限制, 金属氧化物型气敏传感器与气体反应至稳态通常需要几分钟以上, 恢复时间也较长15, 因此检测一次往往需要较长时间, 使得电子鼻的应用范围大大受限。本文从流速调制的角度设计了一种电子鼻系统, 通过改变进气流速, 进而调节传感器阵列中气体分子的分布, 进而提高识别正确率, 缩短检测时间。采用不同进气流速下对应的区间梯度作为特征向量, 并且在 PCA 算法的基础上设计了一种改进的自适应 PCA 算法 (AD-PCA) 。将该系统应用于黄酒酒龄分类, 对比了 AD-PCA、SVM、BPNN 几种分类算法
9、, 以验证此系统的有效性。1 材料与方法1.1 实验材料本文实验材料为 2017 年 3 月份生产的 5 种不同酒龄的瓶装黄酒 (每种黄酒 5 瓶) (见表 1) , 采购自当地超市。表 1 黄酒种类 Table 1 Kinds of Chinese yellow wine 下载原表 本文设计了一种基于流速调制的电子鼻系统, 其硬件模块包括采样阀、气敏传感器阵列、采样气腔、流量计、流速控制阀、气泵、STM32F407 微控制器、计算机和连接导管;其软件模块包括采样控制模块和数据处理模块。硬件结构框图如图 1 所示。图 1 硬件结构示意图 Fig.1 Figure of hardware str
10、ucture 下载原图样品气体或洁净的空气由采样阀进入气腔, 采样阀的作用是控制实验的进行和排废, 若采样阀中通过的是样品气体则进行的是正常实验环节;若采样阀中通过的是洁净的空气则进行的是一次实验结束后的排废环节。气体通过采样阀后进入气腔, 气腔内均匀分布有传感器阵列, 传感器阵列由 10 个 MOS 型气敏传感器组成, 气体通过气腔经过流量计 (用来直观的显示出当前流速) 再经由流速控制阀以某一进气流速通过, 本文根据实验实际情况设计了 100m L/min、200m L/min、300m L/min、400m L/min 四种进气流速, 流速控制阀根据程序指令自动切换进气流速。气腔采集到的
11、样品数据值由采样控制模块传输到数据处理模块, 通过 STM32F407 微控制器的 UART-to-USB 发送到计算机端进行数据处理和分析。本文的电子鼻系统采用的气敏传感器型号如表 2:表 2 所用气敏传感器列表 Table 2 List of sensors 下载原表 1.2 AD-PCA 算法分析在模式识别和模式分类中, 常用的分类算法如 PCA 和 SVM 通常采用达到稳态的数据 (如平均值, 最大值) 进行降维分类, 稳态数据需要传感器信号稳定之后才能得到, 而传感器信号要达到稳定一般需要较长时间, 实验完成后的排废时间也很长, 两次测量时间间隔长, 使得检测速度慢, 检测周期长。为
12、了提高检测速度, 缩短检测周期, 本文提出了一种改进的自适应 PCA 算法进行分类来验证实验结果, 即使用不同流速下对应的区间梯度作为特征向量。流速 100m L/min、200m L/min、300m L/min、400m L/min (分别用v1、v 2、v 3、v 4表示) 下某个传感器 k (k1, , 10) 的归一化响应值依次用 来表示, 样本的种类用 c 来表示 (c1, 2, 3, 4, 5) , 在每次测试过程中, 四种流速由低到高依次持续 10s, 特征值为各个流速区间中的梯度值 (由于采用了相同的进气时间间隔, 梯度计算中省去了时间, 下同) 即:组成的特征向量为:在流速
13、 v1时, 特征矩阵 ;在流速 v2时, 特征矩阵 ;在流速 v3时, 特征矩阵 ;在流速 v4时, 特征矩阵2 结果与分析2.1 实验过程实验过程中分别取每种酒龄的黄酒 100m L 置于 250m L 锥形瓶中, 传感器预热1h。样品检测前, 先抽取 60s 洁净空气, 排出气腔和导管内的废气, 待传感器稳定输出后, 依次以 100m L/min、200m L/min、300m L/min、400m L/min 的进气流速进行测试, 每种流速的测试时间为 10s, 之后由采样控制模块控制流速控制阀自动切换到下一进气流速, 总的检测时间为 40s, 一组检测结束后, 以最大进气流速通入洁净空
14、气进行 2.5min 的排废, 每个样本检测 25 次。2.2 数据分析本文提出的一种改进的自适应的 PCA 算法 (AD-PCA) , 使用不同流速对应的区间梯度作为特征向量, 图 2 为传感器对三年陈黄酒一次采样的原始数据, 从图中可以看出各传感器对样品气体的响应值曲线和响应值变化情况, 进气流速从小到大依次进行切换, 在图中可以看出, 随着时间的推移, 采样点的增加, 流速的每一次切换, 曲线均有明显的斜率上的变化, 传感器与气体刚开始反应时, 响应值数据变化较慢, 流速切换后反应明显加快, 响应值变化幅度明显变大。图 2 三年陈黄酒传感器响应值图 Fig.2 Response valu
15、e of 3 years Chinese yellow wine 下载原图2.3 AD-PCA 算法分析图 3 是 5 种黄酒经过 AD-PCA 算法处理后在不同流速下的三维散点图, 从图中可以看到不同酒龄的黄酒分布的集中区域不同, 不同流速下对应不同酒龄的黄酒的分布情况不同, 100mL/min 流速下, 无法区分酒龄分布, 200mL/min 时, 六年陈黄酒已经区分开来, 300mL/min 流速下, 三年陈, 六年陈和八年陈的黄酒已经可以区分出来, 最后 400mL/min 流速下, 各年份黄酒均区分出来。随着流速的增大, 不同酒龄黄酒的集中分布越显著。相同种类黄酒分布比较集中, 不同
16、种类的黄酒分布则有一定距离。图 3 四种流速下的 AD-PCA 三维散点图 Fig.3 Scatter plot of AD-PCA under four kinds flow rates 下载原图AD-PCA 的分类正确率如图 4 所示, 可以看出, 随着流速的增大, 4 种不同流速下的分类正确率均有提高, 最终在 400m L/min 流速下达到最高。图 4 不同流速下 AD-PCA 分类正确率 Fig.4 Correct classification rate of AD-PCA under different flow rates 下载原图2.4 SVM 算法分析图 4 是 SVM 分
17、类算法得到的分类图, 总的样本数为 125 个, 每种黄酒的样本总数为 25 个, 将其中的 15 个作为训练集, 剩下的 10 个作为测试集。训练集总数为 75 个, 编号 1-75;测试集总数为 50 个, 编号为 1-50。其中 1-10 为三年陈, 11-20 为五年陈, 21-30 为六年陈, 31-40 为八年陈, 41-50 为十年陈。从图中可以看出, 50 个测试集数据中有 4 个分类错误, 对应不同酒龄黄酒的正确率为:五年陈、六年陈、十年陈黄酒的分类正确率为 100%;三年陈、八年陈黄酒的分类正确率为 80%, 平均分类正确率为 92%。图 5 SVM 分类图 Fig.5 C
18、lassification graph of SVM 下载原图2.5 BPNN 算法分析BP 神经网络构建根据系统输入输出特点确定 BP 神经网络的结构, 由于样本气体输入信号有 40 维 (即 4 种流速下传感器阵列中 10 个传感器的响应值, 共 40维) , 待分类信号共有 5 类 (即 5 中不同酒龄黄酒) , 所以神经网络的结构为40-41-5, 即输入层有 40 个节点, 隐含层有 41 个节点 (40 维输入信号和 1 维分类信号) , 输出层有 5 个节点。从原始数据中提取 125 个样本数据, 其中 100 个作为训练样本, 剩下的 25 个作为预测样本。图 5 为测试集样本
19、的预测类别与实际类别的对比图, 得到的 5 种酒龄的黄酒分类正确率均为 100%, 可见使用 BPNN 算法能够准确的分类出黄酒酒龄。平均分类正确率为 100%。一方面该结果也验证了 AD-PCA 中采用平均值作为特征向量得到的结果是比较准确的, 另一方面也可能是因为数据样本数较少, 使得正确率结果较高。图 6 预测分类和实际分类对比图 Fig.6 Comparison of forecast classification and actual classification 下载原图表 3 是 3 种算法的分类正确率表。采用 AD-PCA 算法, 三年陈和六年陈黄酒最大分类正确率为 100%,
20、 五年陈, 八年陈和十年陈黄酒分别为 88%, 84%, 96%, 平均正确率为 93.6%。采用 SVM 算法, 五年陈, 六年陈和十年陈正确率为 100%, 三年陈和八年陈为 80%, 平均正确率为 92%。采用 BPNN 算法, 三年陈, 五年陈, 六年陈, 八年陈和十年陈正确率均为 100%, 平均正确率为 100%。表 3 三种算法的分类正确率表 Table 3 The correct classification rates of AD-PCA SVM and BPNN 下载原表 3 结论本文设计了一种基于流速调制的电子鼻系统, 通过改变进气流速来最大程度扩大传感器对不同成分和不同
21、浓度气体的响应范围。使用改进的自适应主成分分析算法 (AD-PCA) 、支持向量机算法 (SVM) 、误差反向传播神经网络算法 (BPNN) 进行分类识别。用黄酒酒龄分类验证该电子鼻系统, AD-PCA 得到 93.6%的平均分类正确率, SVM 得到 92%的平均分类正确率, BPNN 得到 100%的平均分类正确率, 证明本系统可以有效缩短检测时间, 提高分类正确率, 做到快速分类。参考文献1陈佩仁, 陈江萍, 王林秋, 等.黄酒产业发展的前世今生和未来浅析J.酿酒, 2015, 42 (4) :111-114. 2严冬霞, 高红波.静态顶空-气相色谱法分析不同年份黄酒中主要香气成分J.酿
22、酒科技, 2011 (7) :114-117, 120. 3胡健, 池国红, 吴苗叶, 等.利用风味物质鉴别黄酒产地J.酿酒科技, 2009 (6) :17-19. 4江伟, 兰玉倩, 黄毅, 等.固相微萃取与气相色谱-质谱联用法对不同酒龄黄酒的微量风味分析与应用J.食品与发酵工业, 2011, 37 (2) :144-148. 5鲍忠定, 孙培龙, 许荣年.动态顶空进样 GC/MS 法测定不同酒龄绍兴酒的挥发性醛类化合物J.酿酒科技, 2007 (1) :97-98. 6诸葛庆, 李博斌, 郑云峰, 等.反相高效液相色谱法测定黄酒中的 -苯乙醇J.食品科学, 2009, 30 (14) :1
23、75-177. 7杨智, 王楠, NIAMAT U, 等.电子鼻对红枣乳酸发酵饮料的品质分析J.西北农业学报, 2015, 24 (11) :149-156. 8杨利军, 汤旭祥, 张千金, 等.基于智能电子鼻系统对不同品牌啤酒区分J.食品科学, 2011, 32 (22) :184-187. 9徐晚秀, 李臻峰, 张振, 等.基于电子鼻的中国白酒酒龄检测J.食品与发酵工业, 2016, 42 (2) :144-149. 10张振, 李臻锋, 宋飞虎, 等.电子鼻结合化学计量法用于检测黄酒酒龄J.食品与机械, 2015, 31 (3) :57-62. 11缪璐, 何善廉, 莫佳琳, 等.电子鼻
24、技术在朗姆酒分类及原酒识别中的应用研究J.中国酿造, 2015, 34 (8) :106-110. 12SHI Z B, YU T, ZHAO Q, et al.Comparison of algorithms for an electronic nose in identifying liquorsJ.Journal of Bionic Engineering, 2008, 5:253-257. 13FANY, YIN L A, XUE Y, et al.Analyzing the flavor compounds in Chinese traditional fermented shrim
25、p pastes by HS-SPME-GC/MS and electronic noseJ.Oceanic and Coastal Sea Research, 2017, 16 (2) :311-318. 14TANG X W, HE H J, GENG L H, et al.Evaluation of Maturity and Flavor of Melons Usingan Electronic NoseJ.Agricultura l Science&Technology, 2011, 12 (3) :447-450. 15周宇, 孟庆浩, 亓培锋, 等.基于单类支持向量机的电子鼻在白酒真假识别中的应用J.传感技术学报, 2015, 28 (12) :1741-1746.