1、基于气体传感器动力学模型的细菌分类研究 袁伟 石锐 重庆大学计算机学院 摘 要: 对于气体传感器获得的样本数据, 常规的处理方法是基于样本的表象来提取特征进行分类, 具有固有的局限性。基于热电子发射理论和等温吸附理论, 对气体传感器的电压响应值与温度、样本浓度等参数建立数学方程, 将方程简化, 构造了简易的响应动力学模型。通过主成分分析, 降低样本维数。将模型向降维后的样本数据拟合, 可得到模型的一组系数, 作为样本的特征值。将特征值集合运用模式识别方法进行训练, 测试分类性能。实验结果显示:分类预测的准确率较高。关键词: 气体传感器; 肖特基势垒; 吸附; 特征提取; 动力学模型; 分类;
2、作者简介:袁伟 (1990-) , 男, 硕士研究生, 主要研究方向为模式识别, E-mail:。收稿日期:2017-01-03基金:国家国际科技合作项目 (2014DFA31560) Research on classification of bacteria based on kinetics model for gas sensorYUAN Wei SHI Rui College of Computer Science, Chongqing University; Abstract: For sample data acquired by gas sensor, ordinary way
3、 is to extract features based on surface pattern of samples, so as to classify, so it has inherent limitation. Based on thermionic emission theory and adsorption theory, a mathematic equation can be built to demonstrate the connection of voltage response values of gas sensor with temperature, sample
4、 concentration, etc. A simple model of gas sensors response kinetics can be derived by simplify the equation before. Through the method of principal component analysis ( PCA) , the dimensions of samples is reduced. A group of parameters, which will be treated as features of samples eventually, can b
5、e settled when fitting the model to the samples. A prediction model will be trained and benchmarked by using the feature sets. The result shows that the kinetics model has a satisfied prediction accuracy in classification, this is for the reason that the model is set up based on reflection of nature
6、 of sensor response.Keyword: gas sensor; Schottky barrier; adsorption; feature extraction; kinetics model; classification; Received: 2017-01-030 引言传统的疾病检测主要依靠提取患者的体液, 对其化学成分进行检测或者将其涂样到培养基上进行体外培养、识别, 上述方法虽然准确度较高, 但需要专业人员进行操作, 检测周期长、操作复杂, 不适应快速检测的需求。随着近年来人工嗅觉技术持续发展, 电子鼻系统因其易操作、成本低、便携和现场实时检测1,2的特点而逐渐出现
7、在人们的视野里。电子鼻是由具有部分专一性的传感器阵列, 结合相应的模式识别算法构成的系统, 用于识别单一成分或复杂成分的气体3, 主要由气味取样操作器、气体传感器阵列和信号处理系统三部分构成2。1 电子鼻系统原理电子鼻系统的运行流程大致如下:系统采集样本气体, 送入装有传感器阵列的气室, 传感器阵列对该样本具有一组响应值, 即原始特征。由于采集的原始数据具有较高的稀疏性, 一般要进行数据预处理, 用相关方法提取出关键特征, 最后运用模式识别领域的方法进行训练和预测。1.1 气敏传感器工作原理以常见的 Sn O2气体传感器为阐述样例。当金属氧化物半导体传感器与空气接触时, 由于费米 (fm) 能
8、级差的原因, 其表面一般都会吸附氧上述过程会造成传感器表面的电子被吸附的氧所捕获, 半导体表面电子数量减少, 电阻增大;传感器接触到还原性气体 (例如 H2) 后, 一般认为 O 与还原性气体之间的作用是影响传感器电导率的主要因素4,5上述反应会使得被氧捕获的电子释放回半导体表面, 被测气体提供给元件敏感材料的电子增多, 敏感材料的电阻显著降低6。同时, 由反应方程式可知在该过程中, 有 H2O 生成, 根据采样数据绘制的湿度响应曲线如图 1, 印证了该反应过程的正确性。图 1 相对湿度响应曲线 下载原图1.2 数据处理方法数据处理包括数据的预处理和数据训练预测。预处理主要是对原始的响应数据进
9、行去异常点、滤波和特征提取7等, 特征提取方法主要有:基于传感器原始响应曲线的特征提取8,9、基于拟合曲线的特征提取8,9、基于变换域的特征提取10。数据训练预测主要是基于统计学习方法或者神经网络来进行分类识别。常用的统计学习方法有:朴素贝叶斯法、决策树、支持向量机等。常用的神经网络有:反向传播 (back propagation, BP) 神经网络、径向基函数 (radial basis function, RBF) 神经网络、自组织映射 (self-organization mapping, SOM) 神经网络等11。在提取到样本的特征后, 可以通过上述某一方法进行训练, 待训练模型收敛后
10、便能够对新进入的样本进行分类预测。2 传感器响应动力学模型烧结型 Sn O2传感器是 N 型半导体, 由微小晶粒聚集、以晶界相接触的多晶结构。一般认为其敏感性属于表面控制型5,12。根据热电子发射理论中的 Richardson-Dushman 方程13, 可以将传感器的电阻变化与材料特性、温度和势垒变化等变量联系起来式中 J 为电流密度;A 为 Richardson 常数, 与具体材料有关;k 为玻尔兹曼常数;T 为绝对温度;q 为电子的电量; 为电势的变化量;V 为电压的变化量。由传感器的电路设计可知, 其两端加载的电压几乎不变, 即 V0, 那么根据电学的相关基本公式, 同时为了简化计算,
11、 假设导体是单位长度、单位面积、单位电压、单位电场强度, 则有现需要以半导体与金属接触形成肖特基势垒为例分析其计算势垒变化量 。由于半导体与金属的费米 (fm) 能级不同, 因此, 半导体的电子会进入接触面的金属侧, 这样接触面的半导体侧就会形成一个宽度为 d 的耗尽层 (近似为势垒宽度, 即耗尽层近似14) , 根据泊松方程可以得到抛物线形状的势垒为式中 q 为载流子电荷数;N d为施主密度; 为介电常数;d 为势垒宽度;x 为距离界面的距离。在 x (0d) 的区域的体电荷密度为 q Nd, 又根据电中性条件, 可知表面电荷密度为-q N s, 那么在界面处的电势为式中 Ns为表面载流子浓
12、度。又由于势垒 的变化是由于传感器接触了不同的气体造成了表面电子浓度的变化, 所以有 与电子的表面覆盖率 之间的关系代入式 (5) 可得根据等温吸附理论中的 Freundlich 吸附式15可以建立表面覆盖率与气体浓度之间的关系。又在 Freundlich 函数中, n 一般介于 23, 而在本实验中 p 与 t有关, 不妨假设气体浓度与时间成如下分段线性关系为了简化计算模型, 即可以设在接触气体阶段的 p=at-b, a, b 为常数系数, t为时刻, n=2 代入 Freundlich 吸附式并简化可得式中 A, B, C 均为待定系数。根据传感器的电路设计, 通过欧姆定律计算可知, 最终
13、采集的传感器响应电压为可知传感器的电压变化可以近似为 Logistic 型函数, 实际的样本响应曲线证实了模型的推测结论。如图 2, 其中实竖线为传感器开始接触样本气体的时刻, 虚竖线为传感器停止接触样本气体的时刻。图 2 样本响应曲线由于传感器在未接触样本时, 仍有一个响应基线, 需要对上述模型进行修正, 可得式中 A 为传感器对样本响应的最大值;D 为从基线开始取得最大响应值的 1, 2的时间点;E 为未接触样本时的响应基线值;B, C 均为待定系数, 可在 Matlab 中对样本响应曲线做非线性拟合得到。式 (13) 即为传感器的响应电压随时间变化的简易动力学模型。3 实验步骤与结果实验
14、利用项目自建的电子鼻系统采集了 3 个种类的细菌代谢物, 分别为大肠杆菌 34 组, 金黄葡萄球菌 34 组, 绿脓杆菌 34 组, 共 102 组样本, 同种类样本的组内有浓度变化。3.1 实验步骤1) 由于每一个原始样本数据为 34840 维数据, 其有效数据非常稀疏, 因此对其进行一次 PCA 处理。以某一样本为例, 得到了其第一主成分 (贡献率 77.15%) 和第二主成分 (贡献率 14.28%) 。由实验报告已知实验的各个阶段起始时间, 因此, 截取从基线阶段到采集阶段中的一段时间的采集的数据作为待拟合数据, 处理后如图 3。图 3 某样本进行 PCA 变换后的响应曲线 下载原图图
15、 4 PCA 变换后的样本集 下载原图2) 根据前文的分析, 第一主成分可以用式 (13) 拟合。从图 3 观察可以知道, 第二主成分可以近似用直线 y=K 拟合。对处理后的样本数据求解拟合参数, 最后每个样本便由“6 维特征+1 维标签”组成。3) 由于样本数量较少, 所以采用交叉验证方式建模。随机抽取 80%的样本作为训练集, 剩余 20%的样本作为测试集, 然后在 Matlab 中构建 RBF 神经网络和随机森林, 将训练集样本分别送入训练, 待预测模型收敛后, 分别使用测试集测试预测性能。重复上述过程 10 次。3.2 实验结果表 1 为经过交叉验证后得到的数据。表 1 实验结果 下载
16、原表 实验属于三分类问题, 实验结果中大肠杆菌和金黄葡萄球菌的预测准确率相对较低, 从图 4 中也可以看出两类样本集的曲线具有较高的相似性, 因此, 导致了模型的整体预测准确率受到影响。但总体来说, 实验显示了模型具有较好的分类预测能力。4 结论本文从传感器响应变化的本质, 即造成其变化的物理、化学因素入手, 建立了气体传感器响应的简易动力学模型, 并且通过模式识别的经典方法对模型的准确性进行验证, 显示出了模型具有较好的分类预测性能。由于模型简化了一部分影响因素, 而且训练集的样本数量相对较少, 导致模型在分类大肠杆菌和金黄葡萄球菌的准确率相对绿脓杆菌的识别准确率偏低。因此, 下一步的工作将
17、有两个大方向:在动力学的基础上对模型继续修正, 以便能更加精确地拟合响应曲线, 同时增加训练集样本数量;采用新的模式识别方法。经过上述改善后的模型识别率有望得到提升。参考文献1Wang Z, Wang C.Is breath acetone a biomarker of diabetes A historical review on breath acetone measurementsJ.J Breath Res, 2013, 7 (3) :10-16. 2张厚博, 梅笑冬, 赵万, 等.用于食醋品质预评价的电子鼻研究J.传感器与微系统, 2013, 32 (3) :62-64. 3闫嘉.基
18、于电子鼻技术的人体伤口感染检测系统构建及算法研究D.重庆:重庆大学, 2013. 4王康.Sn O2 基气敏传感器的制备与研究D.威海:山东大学, 2013. 5曾文.Sn O2/Ti O2 体系气敏性能及其机理研究D.重庆:重庆大学, 2011. 6刘元隆, 钟荣, 胡继豹.Fe2O3/Zn O 复合氧化物气敏元件的制备与性能J.传感器与微系统, 2012, 31 (12) :104-106. 7邹慧琴.基于“气”仿生嗅觉系统在中药品质整体评价中的方法学研究D.北京:北京中医药大学, 2013. 8洪雪珍.基于电子鼻和电子舌的樱桃番茄汁品质检测方法研究D.杭州:浙江大学, 2014. 9Mo
19、usumi Palit, Bipan Tudu, Nabarun Bhattacharyya, et al.Comparison of multivariate preprocessing techniques as applied to electronic tongue based pattern classification for black teaJ.Analytica Chimica Acta, 2010, 675:8-15. 10樊澍.基于量子粒子群的电子鼻伤口感染检测算法研究D.重庆:重庆大学, 2014. 11杜晓亮.人工神经网络在空气质量预测中的应用研究D.济南:山东大学, 2009. 12刘阳, 李勃, 姚有为, 等.改善 Sn O2 气体传感器气敏性能的研究进展J.传感器与微系统, 2012, 31 (12) :5-8. 13马殿飞.Ag/Si NWs 肖特基二极管温敏特性的研究D.上海:华东师范大学, 2011. 14刘恩科, 朱秉升, 罗晋生.半导体物理学M.7 版.北京:电子工业出版社, 2008:216-221. 15席彩红, 高晓平, 刘国汉.二氧化锡气体传感器敏感机理的研究J.曲阜师范大学学报:自然科学版, 2008 (2) :65-68.