1、本 科 生 毕 业 论 文苹果可溶性固形物 NIR 线性模型建立院 系 化学化工学院 专 业 食品科学与工程 班 级 学 号 学 生 姓 名 联 系 方 式 指 导 教 师 职称: 副教授 2011 年 5 月独 创 性 声 明本人郑重声明:所呈交的毕业论文是本人在指导老师指导下取得的研究成果。除了文中特别加以注释和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果。与本研究成果相关的所有人所做出的任何贡献均已在论文中作了明确的说明并表示了谢意。签名: 年 月 日授权声明本人完全了解许昌学院有关保留、使用本科生毕业论文的规定,即:有权保留并向国家有关部门或机构送交毕业论文的复印件和磁盘,
2、允许毕业论文被查阅和借阅。本人授权许昌学院可以将毕业论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编论文。本人论文中有原创性数据需要保密的部分为:无。签名: 年 月 日指导教师签名: 年 月 日摘 要本文以红富士苹果为样品,研究可见近红外光谱技术进行苹果糖度的无损检测方法。采集苹果的漫透射光谱(500-1010nm),采用杠杆值(阈值为 0.136)与学生残差 (阈值为 3)检验判别方法剔除异常样本,考察了不同的光谱信号校正方法对光谱噪声消除的效果,并对处理后光谱进行变量优选,分别建立 PLS 和 SMLR,PCR 苹果糖度的校正模型,以 RPD 值评价
3、模型稳健性,比较可得 SMLR 最优,其R=0.940,RMSEC=0.483,RMSEP=0.545,RPD=2.400。结果表明:在诸如苹果糖度这一类农产品品质综合指标的光谱检测中,应用 SMLR 建模进行定量分析是完全可行的。关键词:可见/近红外光谱;无损检测;苹果;糖度ABSTRACTIn this paper, Fuji apple samples were used to study the visible / near infrared(Vis/NIR) spectroscopy for nondestructive testing method for souble solid
4、s content. Apples diffuse reflectance spectra (500-1010nm) were collected by portable Vis/NIR spectrometer. The performance of different signal correction methods were evaluated after removing abnormal samples according to the Studentized Residual(3) and Leverage(0.136) test methods. PLS, SMLR and P
5、CR calibration models were constructed to predict the SSC of Fuji apple which are based on the selection of spectral variables. RPD value was used to evaluate model robustness, compare the best available SMLR, the R = 0.940, RMSEC = 0.483, RMSEP = 0.545, RPD = 2.400. The results showed that: in the
6、souble solids content of this type of agricultural products such as Apples comprehensive index of the quality of spectral detection, the application of SMLR model for quantitative analysis is feasible.Key words: Visible / near infrared spectroscopy; Non-destructive measuring ; Apple; Souble solids c
7、ontent(SSC)缩略词PLS,Partial Least Squares,偏最小二乘法MLR, Multiple Linear Regression,多元线性回归法MSC,Multiplicative Scatter Correction,多元散射校正PRESS,Prediction Residual Error Sum of Squares,预测残差平方误差总和R,Correlation Coefficient,相关系数RMSEC,the Root Mean Square Error of Calibration,校正均方根偏差RMSECV,the Root Mean Square E
8、rror of Cross Validation,内部交叉验证均方根偏差RMSEP,the Root Mean Square Error of Predication,预测均方根偏差SMLR,Stepwise Multiple Linear Regression,逐步多元线性回归法SSC, Soluble Solid Content,可溶性固形物SNV,Standard Normal Variety,标准正态变量变化目录1 前言 12 近红外光谱分析的基本原理 12.1 近红外分析原理 12.2 苹果光谱采集模式 22.3 数据处理方法 22.3.1 光谱预处理方法 .22.3.2 异常样品剔
9、除 .32.3.3 建模方法及评价 .32.3.3.4 校正模型的评价 .42.4 检测流程 53 实验部分 53.1 实验仪器与材料 .53.2 数据采集 .63.2.1 光谱数据采集 63.2.2 标准值测定 .63.3 数据预处理 73.3.1 数据分集 .73.3.2 光谱预处理 .83.4 建模及模型评价 103.4.1 偏最小二乘法(PLS) 103.4.2 主成分分析(PCR) 113.4.3 逐步多元线性回归(SMLR ) 124 结果与讨论 .12参考文献 .14致 谢 .160苹果可溶性固形物 NIR 线性模型建立1 前言苹果是我国主要的水果之一,近年来,随着人们生活水平的
10、日益提高,不论是出口还是内销,人们对水果的质量要求都越来越高。水果的品质已不能单从外观来判断,而需要通过对水果的糖度、硬度、酸度等各项指标来评定。消费者对于水果内部品质如糖度、口感和内部营养成分等指标也极为重视。传统的检测方法是通过抽样方式进行破坏性检测,制样繁琐且检测成本高,已无法满足水果快速分级分选的现实要求。近红外光谱分析技术与传统化学方法相比,具有廉价、方便、快速和无损伤等特点,在农产品评价方面有广泛的应用价值 1-3。多篇综述性评论文章 4-5,均报道了近红外光谱技术在水果的品质无损评价中的应用。近红外光谱技术被称为“具有解决全球农业分析的潜力。 ” 国内外学者利用近红外光谱技术在水
11、果糖分含量无损检测方面做过相关研究,Lammertyn Jeroen 等(2000) 6在 11363-6060cm-1 范围内利用光纤探头对 Jonadold 苹果糖分含量进行了近红外光谱反射特性的试验研究,通过偏最小二乘法分析得出两者的相关系数在 0.79-0.91 之间;杜冉,闸建文,付家庭等 7通过运用近红外透射光谱技术快速分析了苹果的糖度和硬度,使用偏最小二乘法建立预测模型,得出校正集苹果糖度的最佳主因子维数为 3,相关系数 R 为 0.9943,校正标准差为 0.2476;校正集苹果硬度交叉校验的最佳主因子维数为 3,相关系数 R 为 0.9644,校正标准差为 0.3529.周丽
12、萍 8采用偏最小二乘回归交互验证法建立预测模型完全不能预测苹果的硬度,对苹果糖度的预测相关系数为 0.585,相关性较低;而偏最小二乘回归杠杆值校正法对苹果的糖度和硬度的预测相关系数分别为0.994、0.99,验证集均方根误差分别为 0.099、0.071,预测速度快、精度高。本文以富士苹果为对象,采集可见光近红外光谱漫透射,采用杠杆值与学生残差T检验进行异常样本筛选,分别建立苹果糖度的主成分分析(PCR),偏最小二乘法(PLS )和多元线性回归(SMLR)模型,并对模型的稳健性进行了比较。2 近红外光谱分析的基本原理2.1 近红外分析原理近红外光是指波长范围为 7802526 nm,介于可见
13、/和中红外区之间的电磁波。当分子受到红外线照射时,被激发产生共振,同时光的能量一部分被吸收,测量其吸收光,可以得到极为复杂的图谱,这种图谱就表示被测物质的特征 9-10。 近红外光谱是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的,它记录的是分子中单个化学键的基频振动的倍频和合频信息,它常常受含氢基团 X1H(C、N、O)的倍频和合频的重叠主导,所以在近红外光谱范围内,测量的主要是含氢基团 XH 振动的倍频和合频吸收 11-12。苹果内部组分十分丰富,不同组分含氢基团较多,水是苹果中最丰富的组成成分,占苹果重量的 85%-90%左右,苹果的可溶性固形物约占 9%20%,含量高,信号
14、强,适宜光谱的采集和分析。2.2 苹果光谱采集模式光谱的采集方式分为漫反射、透射和漫透射,如图 1 所示(Nicolai et al., 2007),不同的光谱采集方式具有不同的特点,可以满足不同的检测要求 4。漫透射和透射适宜苹果内部水心、褐腐病、鸭梨内部褐变等果皮较厚的果实。其优缺点是:可以测量果实整体,可以测量厚皮果品,可以检测果实内部特征,只限于易透光物料,需要配置高灵敏度、高动态范围检测器。图 1 采集方式图2.3 数据处理方法2.3.1 光谱预处理方法本文主要采用标准正态化、平滑、求导、多元散射校正(Multiplicative Scatter Correction, MSC)进行
15、光谱预处理:(1)微分法微分法可以减少谱峰重叠影响,消除基线漂移。通常可分为一阶微分、二阶微分、高阶微分等,其中一、二阶微分最常用。(2)卷积平滑(Savitky-Golay smoothing)S-G 平滑 13方法是一种用多项式处理数据的平滑方法,它基于最小二乘法原理,能2够保留分析信号中的有用信息,消除随机噪声,但是过度平滑会失去有用信息。(3)Norris 平滑滤波 14Norris平滑滤波是由Karl Norris与1957年提出的一种滤波方法。(4)多元散射校正(MSC )MSC可补偿在反射光谱中遇到的波长依赖的光散射变化,目的是校正每个光谱的散射并获得“理想”的光谱。具体计算公式
16、如下 15:平均光谱 : (1)1/njiiA线性回归 : (2)iiimbMSC 校正 : (3) iiMSC(5)标准正态化(SNV)标准正态化主要是用来消除固体颗粒大小、表面散射以及光程变化对NIR 漫反射光谱的影响。SNV 是原光谱 xi 减去该光谱的平均值 xi 后,再除以该光谱数据的标准偏差 s,实质是使原光谱数据标准正态化。2.3.2 异常样品剔除所谓异常样品,是由于实验测量或仪器本身测量引起的浓度标准值或光谱数据存在较大误差的样品,本研究采用的异常值剔除方法为样品杠杆值与学生残差T 检验判别方法和狄克松(Dixon) 检验法进行剔除。T检验法是选择学生残差值为3和3倍的杠杆值作
17、为临界值。当学生残差值大于 3,当Leverage值超过临界值时,则认为是化学值可能有错误;通过进一步考察化学值是否极大或极小,可以考虑是否剔除该样品。狄克松(Dixon)检验法,对可疑的样品剔除是根据Rank值作为临界值,当光谱数据大于Rank值即为光谱异常。2.3.3 建模方法及评价采用偏最小二乘法,主成分分析和多元线性回归建立数学模型,数据分析与模型建立使用智能定量分析软件TQ Analyst V8.0(Thermo Scientific,USA )软件完成。2.3.3.1 偏最小二乘法(Partial Least Squares,PLS)偏最小二乘法(PLS) 16能同时对 x 矩阵和
18、 y 矩阵做分解,消除其中无用的信息。PLS 的优点是:(1)可以使用全部或部分光谱数据: (2)数据矩阵分解和回归交互结合为一步,得到的特征向量与被测组分或性质相关,而不是与数据矩阵中变化最大的变量相关;(3)比较适用于小样本多元数据分析:(4) 可以适用于复杂的分析体系。PLS 的缺点是:(1)3计算速度相对较慢,计算过程复杂,需要多次迭代;(2)模型建立过程复杂,较抽象,难理解。故本实验首先用 PLS 进行建模。2.3.3.2 主成分分析法(Principal Components Regression,PCR) 主成分分析法 17 (PCR)在化学计量学建模预测方法中最为常用。它是一种
19、简化数据集的技术。在建模的过程中很多变量都会在不同程度上影响模型的精度,而变量太多模型就会变得非常复杂。2.3.3.3 多元线性回归校正(MLR)多元线性回归(Multiple linear Regression,简称 MLR) 18用于校正一般属于直接校正方法。但在很多校正方法中,都用到了多元线性回归的基本原理,它是将纯组分灵敏度系数构成的矩阵直接代替化学测量模型中的系数矩阵 B,然后其求未知样本浓度的方法。2.3.3.4 校正模型的评价近红外光谱预测模型的质量评定一般采用相关系数(R) 、内部交叉验证均方根偏差差(RMSECV) 、预测均方根偏差( RMSEP) 、预测相对标准偏差(RPD
20、)来评定 15。(1) 相关系数(R)(4)1221()()miiii iiizyR其中:y i 为通过光谱测量及数学模型预测的结果;z i 为用标准方法测得的结果;(2) 校正均方根偏差(RMSEC)(5)2()iizyRMSECn其中n 为校正集样品数。(3) 预测均方根偏差(RMSEP)(6)2()iizyRMSEPm其中m 为预测集样品数。(4) 预测相对标准偏差(RPD)4(7)RPD=SME2.4 检测流程 水果近红外光谱检测流程主要包括如下几个方面(图 2):近红外光谱检测水果样品中某种内部成分的具体过程为:选择一定数量且具有代表性的水果样品( 又称标准样品集)。用近红外光谱仪采
21、集水果的近红外光谱。用常规理化分析方法准确测定各个水果要预测的成分含量, 并作为实测值。应用化学计量学分析软件建立水果近红外光谱和成分分析值之间的数学模型。利用已建立的定量数学模型对未知样品进行预测和精度分析。图2 水果近红外光谱检测流程3 实验部分3.1 实验仪器与材料实验采用日本Kubota株式会社的便携式近红外光谱仪(KBA-100R型),配备光纤采集附件,采用CCD检测器。该仪器采用内置光源,发光光纤束为环形设计,其外径为39.5mm,内径为38.7mm,受光光纤束位于环形发光光纤束中心,直径为5mm。光谱测量波长范围500-1010nm,波长点间隔2nm,共有256个数据点。手持数字
22、式糖度仪PAL-1型(Atago, Japan )测量糖度,读数结果为%Brix,具备自动温度校正功能。5供试样品为市售红富士苹果,产于新疆阿克苏地区。样品无明显外部缺陷,颜色较均匀,直径范围为76.8-84.6mm,平均值为80.2mm,标准偏差3.21。实验前将苹果置于实验室(26,相对湿度 64%)8小时至室温,苹果样品的光谱采集和标准值测定当天完成。3.2 数据采集3.2.1 光谱数据采集由于苹果为不均匀物料,其生长过程中向阳面和阴面的糖度并不相同,因此,生产中多测量苹果表面多个点的糖度值,平均后作为其品质评价指标。在每个苹果样品赤道圈上等距离标定 4 个测试区域(直径约为 40mm)
23、,每个测试区域避免明显缺陷,在同一区域进行光谱采集和糖度测定。四点光谱的平均光谱作为该样品的最终光谱如图 3 所示,共有 202 样本光谱。图 3 苹果近红外原始光谱图从图3可以看出,图谱在500-1010nm范围内较为明显,包含丰富的信息。反映苹果糖度等内部品质的含H基团如:C-H、N-H、O-H、H 2O的特征波长分别在900、800、750、740nm等波数峰值处,波峰强度有较为明显的变化,鲜明的吸收特征为苹果的含糖量和硬度定量分析提供了丰富的信息基础。3.2.2 标准值测定 糖度的测定:苹果的糖度测定具体参照食品卫生检验方法理化部分总则( GBPT5009112003)。用手持数字式糖
24、度仪 PAL-1 型(Atago, Japan) 测量糖度,单位%6Brix。3.3 数据预处理3.3.1 数据分集 (1)异常值剔除根据 Rank 值作为临界值剔除 4 个样品(31、72 、109、139)如图 4 所示:图 4 光谱异常样品剔除根据平均杠杆值 0.045 的 3 倍和学生残差 3 作为临界值的 T 检验法剔除 6 个样品(5、80、197、34、66、202)如图 5 所示:图 5 化学值异常样品剔除(2)数据分集剔除 10 个异常样品共 192 余下个样品按预测集与建模集比例为 3:1 进行分集,其中 145 个样品作为建模样品集,剩余 47 未参与建模的样品作为预测样
25、品集,用于评价模7型的预测能力和稳健性。建模和预测集样品可溶性固形物含量真实值的详细分布情况如表 1 所示。表 1 建模和预测集样品 SSC(%Brix)含量真实值分布样本数 平均值 最大值 最小值 标准偏差 变异系数%校正集 145 15.98 19.55 12.08 1.42 8.89预测集 47 15.96 18.58 12.63 1.31 8.193.3.2 光谱预处理由检测器检测到的光谱信号除含样品待测成分信息外,还包括各种仪器噪声,如高频随机噪声、基线漂移、杂散光、样品背景等。因此,对测量的光谱进行合理的处理,减弱以至于消除各种非目标因素对光谱信息的影响,为稳定、可靠的校正模型建立
26、奠定基础。标准正态化主要是用来消除固体颗粒大小、表面散射以及光程变化对 NIR 漫反射光谱的影响。经 SNV 处理后的光谱如图 6 所示:图 6 经 SNV 预处理后的光谱图经多元散射校正方法 ( MSC) 预处理的光谱图如图 7所示,它有效地消除样品由于散射影响所产生的光谱噪声、基线平移和偏移现象,提高原吸光度光谱的信噪比,增强待8测样品成分含量与吸光度之间的相关性,明确待测成分在近红外波段的特征吸收位置,为波长的优选提供了依据。图 7 经 MSC 预处理后的光谱图经一阶微分处理后的光谱如图8所示,它使线性背景达到固定值,有效地消除了基线漂移。经过一阶导数据处理的光谱的波峰和波谷比原始光谱更
27、为明显。9图 8 经一阶导预处理后的光谱图经二阶微分处理后的光谱图如图9所示,二阶微分使线性背景为0,同时消除了平移和线性倾斜。图 9 经二阶导预处理后的光谱图3.4 建模及模型评价模型采用外部验证法对其性能进行评价,由相关系数(R) 、建模均方均根误差(RMSEC) 、交互验证均方根误差(RMSECV)和预测均方根误差(RMSEP)进行评价。R越大, RMSEC、RMSECV 和RMSEP 越小,RPD 值接近3,模型的预测能力越强。3.4.1 偏最小二乘法(PLS)采用 PLS 法建立定量校正模型时,为充分提高光谱信号的利用率,需要对主因子的阶数进行合理选择,以避免出现“欠拟合”或“过拟合
28、”现象。本文采用内部交叉验证法,选择了最佳建模主因子数,建立了稳定的模型。苹果糖度的 PLS 主因子数和RMSECV 值的相关关系图如图 11 所示,从图中可以看出选择 12 个主因子建模时,校验误差最小,模型最稳定,故最佳因子数为 12。10图 11 苹果 SSC PLS 建模结果主因子数在软件建议默认光谱范围 606-618、620-894nm 范围内建模比较经 SNV,二阶导和Norris 平滑处理的模型较好,建模结果如图 10 所示,其R=0.938,RMSEC=0.490,RMSEP=0.577。3.4.2 主成分分析(PCR)在软件建议默认光谱范围 606-618、620-894n
29、m 范围内建模比较可得光谱预处理为SNV,二阶导, Norris 平滑处理的结合模型较好,建模结果如图 12 所示,其R=0.910,RMSEC=0.590,RMSEP=0.592。图 10 苹果 SSC PLS 建模结果散点图113.4.3 逐步多元线性回归(SMLR )软件建议光谱范围选取 656、964、758、824、862、910、882nm 共 7 个点,经建模比较光谱预处理为 SNV,原光谱,不做平滑处理的结合模型较好,建模结果如图 13 所示,其 R=0.940, RMSEC=0.483,RMSEP=0.545。4 结果与讨论将上述建模结果汇总,汇总结果如表 2 所示,从表 2
30、 可以看出三种建模方法的相关系数均大于 0.85,根据 R 越大,RMSEC、RMSECV 和 RMSEP 越小,RPD 值接近 3,图 12 苹果 SSC PLS 建模结果散点图图 13 苹果 SSC SMLR 建模结果散点图12模型的预测能力越强。故其中 SMLR 的预测效果最好,其R=0.940,RMSEC =0.483,RMSEP =0.545,RPD =2.40。可见在诸如苹果糖度这一类农产品品质综合指标的光谱检测中,应用 SMLR 建模进行定量分析是完全可行的。表 2 各模型校正和预测结果建模方法 最佳因子数 R 光谱数据/nm RMSEC RMSEP RPDPLS 12 0.93
31、8 606-618620-894 0.490 0.577 2.27PCR 15 0.910 606-618620-894 0.590 0.592 2.21SMLR 7 0.940656,964758,824862,9108820.483 0.545 2.4013参考文献1 应义斌 , 刘燕德. 水果内部品质光特性无损检测研究及应用J. 浙江大学学报(农业与生命科学),2003,29(2):125-129.2 , 陈卓等. 洋梨硬度的便携式可见/近红外漫透射检测技术J. 农业机械学报,2010,44(11):130-133.3 章海亮 , 孙旭东, 刘燕德等. 近红外光谱检测苹果可溶性固形物J.
32、 农业工程学报,2009,25(2):340-344.4 Nicola B M, Beullens K, Bobelyn E, et al. Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy:A review. Postharvest Biology and Technology,2007,46:99118.5 韩东海, . 水果内部品质近红外光谱无损检测研究进展J. 中国激光,2008,35(08):1123-1131.6 Lammertyn Jeroen, Peirs
33、 Ann, et al. Light penetration properties of NIR radiation in fruit with respect to nondestructive quality assessment J. Postharvest Biology and technology,2000,18:121-132.7 杜冉 , 闸建文, 付家庭等. 运用近红外透射光谱技术检测苹果内部品质 J. 农机化研究,2008(9):139-141. 8 周丽萍. 基于可见/近红外光谱技术的圣女果和苹果品质检测技术研究D. 西安:西北农林科技大学,2009.9 Blanco M
34、 and Villarroya I. NIR spectroscopy:a rapid-response analytical tool. Trends in analytical chemistry,2002,21(4):240-250.10 Sierler H W, Ozaki Y, Kawano S et al. Near Infrared Spectroscopy,Wiley-VCH,200411 严衍禄. 近红外光谱分析基础及应用M. 北京:化学工业出版社, 2005:125-127.12 陆婉珍. 现代近红外光谱分析技术(第二版).北京: 中国石化出版社,2006:85-90.13
35、 徐广通 , 袁洪福, 陆婉珍. CCD 近红外光谱谱图预处理方法研究. 光谱学与光谱分析,2000,20(5):619-622.14 郑咏梅, 张铁强, 张军, 等. 平滑、导数、基线校正对近红外光谱 PLS 定量分析的影响研究. 光谱学与光谱分析,2004,24(12):1546-1548.13 赵杰文, 孙永海. 现代食品检测技术(第二版)M. 北京:中国轻工业出版,2007:197-199.1414 Norris K H, Williams P C. Optimization of mathematical treatments of raw near-infrared signal
36、in the measurement of protein in hard Red Spring wheat. Influence of particle size. Cereal Chemistry,1984,62(2):158-165.15 赵杰文, 孙永海. 近红外相关光谱的多元散射校正处理研究J. 光谱学与光谱分析,2007,27(5):877-880.16 虞佳佳, 何勇, 鲍一丹. 基于光谱技术的芒果糖度酸度无损检测方法研究J.光谱学与光谱分析,2008,28(12):2839-2842.17 王学民. 应用多元分析 (第二版)M. 上海:上海财经大学出版社 , 2004.18 刘
37、树深, 易忠胜. 基础化学计量学M. 北京:科学出版社,1999:70-71.致 谢15转眼大学生活已经接近尾声,自己也从当年一个懵懂的孩子变成一个成熟青年,回想自己四年的大学生活,这里面有多少辛酸多少欢乐。毕业论文的完成也将为大学生活画上句号,从论文开题到论文的顺利完成,一直都离不开老师,同学,朋友给我的真诚帮助,在这里我将向他们表达我最真心的感谢!本学位论文是在老师的亲切关怀和细心指导下完成的,从刚开始课题的选择到论文的最终完成,王老师始终都给予了细心的指导和不懈的支持,并且在耐心指导论文之余,王老师仍不忘拓展我们的文化视野。王老师治学严谨,科研能力很强,他的指导使我获益菲浅,并且将终生受用无穷。借此向王老师表示我最衷心的感谢!此外,本文得以顺利完成,与食品科学与工程的各位老师的帮助是分不开的,在大学四年里,他们不仅是我的良师也是我的益友,教会了我许多专业知识和人生道理。我向他们表示感谢!在实验过程中遇到困难,总有同学伸出援助之手帮我解决问题,我对他们一直心存感激。在我背后一直默默支持我的是我的父母,不管在经济上还是在精神上他们永远都是我的坚强后盾,始终给我极大的信任,不管遇到什么挫折他们都会给我安慰,我谢谢他们一直以来为我所做的一切!2011 年 5 月 1 号