收藏 分享(赏)

模型验证相关材料.doc

上传人:tangtianxu1 文档编号:2836186 上传时间:2018-09-28 格式:DOC 页数:18 大小:1.70MB
下载 相关 举报
模型验证相关材料.doc_第1页
第1页 / 共18页
模型验证相关材料.doc_第2页
第2页 / 共18页
模型验证相关材料.doc_第3页
第3页 / 共18页
模型验证相关材料.doc_第4页
第4页 / 共18页
模型验证相关材料.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、4.6.1 模型拟合能力评价模型拟合能力评价主要用于表明模型解释训练集变化的能力。本文主要采用以下几个统计评价指标对模型拟合能力进行评价:1)相关系数(R)相关系数表示预测值与目标值之间线性关系的密切程度,其取值范围在0到1之间。其值越接近于1,表示线性关系越强;越接近于0表示线性关系越差。2)决定系数(R 2)决定系数又称为复相关系数,它是判定线性回归拟合优度的重要指标,其定义为 niii iiii YyR 1222 )()(Variton TtlExped (4-1)从上面的公式可以看出,决定系数等于回归平方和在总平方和中所占的比例,因此它体现了回归模型所能解释的应变量变异的百分比。例如,

2、R 2=0.825说明应变量的变异82.5%是由自变量引起的;R 2=1则表明所有的观测点都落在回归方程上;R 2=0则说明自变量与应变量间不存在线性关系。3)均方根误差(RMSE) 、平均绝对误差(AAE ) 、平均相对误差(APE)和标准误差(SE)均方根误差表示随机误差的分散程度,其定义为nyRMSni obsipredi12,)((4-2)平均绝对误差表示拟合值与目标值之差,其定义为nyAEni obsipredi1,(4-3)平均相对误差的定义为nyAPEniobsipred1,(4-4)标准误差指拟合值的标准误差,其定义为1)(12,nySEni obsipredi(4-5)上述各

3、式中,n为实验样本数, 和 分别为样本预测值及目标值。prediy,obsi,这些参数都是衡量模型精确度的一些常用参数,它们依赖于应变量数据的范围和分布,并受“离域点”的影响 133。4)F检验F检验是一种检验自变量和应变量之间的线性关系是否显著的方法,适用于基于MLR 方法建立的模型 133。它将回归离差平方和与剩余离差平方和进行比较,分析二者之间的差别是否显著。如果是显著的,说明两个变量之间存在线性关系,如果不显著,则说明两个变量之间不存在线性关系。上述评价指标能够对模型的拟合能力进行较好的评价。然而,对于QSPR研究中经常出现的两类问题“欠拟合”和“过拟合”问题,它们却无法进行有效的鉴别

4、。所谓“欠拟合” ,是指模型没有充分揭示出样本集所包含的变量信息,从而导致模型的预测能力降低,这类问题常出现于采用线性建模方法所得到的模型;所谓“过拟合”则是由于拟合了误差信息,导致模型拟合度高于性质数据和描述符结合的变化性,这类问题常出现于采用非线性建模方法所得到的模型 134。由于这两类问题与模型的稳定性紧密相连 133,135,因此对于此类问题的鉴别,常需要通过模型的稳定性分析加以解决。4.6.2 模型稳定性分析所谓模型稳定性分析实际上是对模型的“不稳定性”进行分析。模型“不稳定性”的含义是模型受训练集中某些个别化合物或化合物子集的影响比较大,如果化合物的预测值超出模型的置信区间,就会导

5、致模型不稳定 133。目前文献上直接对模型的不稳定性进行定量分析的研究较少。对模型不稳定性的研究更常用的方法是通过内部验证的方式进行。因为任何内部验证技术都能在一定程度上评价模型的不稳定性。因此,本文采用以下几种内部验证技术对模型稳定性进行研究:1) “留多法”交互验证 136“留多法”(Leave-many-out, LMO)交互验证是一种较为常用的内部验证技术。该方法将初始训练集中的n个样本平均划分为大小为m 的G (=n/m)个子集,然后每次去除m个数据点,采用剩下的n-m个样本作为训练集重新建模并验证由m个样本构成的验证集。经G次计算,得到交互验证系数Q 2来表征模型的稳定性和内部预测

6、能力 136。一般认为,如果Q 2大于0.5,则模型比较稳定;如果大于0.9,则模型的稳定性非常优秀 137。Q 2的计算公式如下:traingiitriiCVy122)(4-6)其中,y i, 和 分别代表训练样本的自燃点实验值、预测值及实验值平iy均值。2) “留一法”交互验证 136“留一法”(Leave-one-out,LOO)交互验证是一种特殊的“留多法”交互验证方法,其具体过程与“留多法”相似,区别仅在于m 1。由于“留一法”利用了全部的样本数据,因而也是一种最经济的方法。尽管有研究者指出, “留一法”交互验证所得结果常会过高的估计模型的预测能力 138,但它在QSPR建模过程中仍

7、是必不可少的,尤其是对于小样本的研究体系。3)Y- 随机性检验 136Y-随机性检验也是一种广泛用于表征模型稳定性的统计方法。它将原样本集因变量Y随机打乱,与原有自变量组合成新的样本集,建立模型。重复上述过程50100次,将结果与原样本集结果对比,若原样本集预测模型性能参数明显优于新样本集的性能参数,则认为原样本数据中存在真正的QSPR关系,所建模型稳定性较好,不存在“偶然相关”现象;反之,则表明原所建模型不能被接受。4)残差图分析法残差图分析法指在直角坐标系中以预测值为横轴,以残差为纵轴绘制残差的散点图。如果散点呈现明显的规律性,则认为所建模型存在自相关性或者存在非线性、非常数方差的问题;如

8、果散点呈现随机分布,则认为所建模型是合适的,在建立过程中未产生系统误差。内部验证在QSPR建模过程中是必不可少的一步,但是内部验证结果好只能说明模型稳定性较高或具有较强的内部预测能力,并不能保证模型对外部样本的真实的预测能力也好。因此,还必须对模型的外部预测能力即外推性进行评价。4.6.3 模型预测能力评价QSPR模型的预测能力以模型的拟合优度、稳定性为基础。评价模型预测能力最有效的方法是进行外部验证,即采用未参与建模的独立的样本集作为验证集,以评价模型对未知化合物的预测能力。其具体方式如下:将原始样本集按照一定的比列随机划分为训练集和测试集两个子集,其中训练集用于变量选择和建模,测试集则用于

9、对模型的外部验证 136。外部验证的结果既能够体现所建模型的泛化能力,又能够反映模型对未参与建模的外部样本的真实预测能力。对于样本划分时训练集和测试集中样本的比例,目前还没有明确的定论,大多数研究中测试集的样本个数都远远小于训练集的样本个数。Gramatica 138最近的研究指出,对某一QSPR 模型预测能力的验证不能仅仅通过少量化合物(5个)进行,而必须建立在足够大的外部测试集的基础之上(样本集的20),以避免“偶然相关”现象的发生。因此,本文在各燃爆特性的预测研究中均随机选择样本集中20的样本作为测试集,其余80样本作为训练集,以保证模型验证的有效性。模型的外部预测能力可以用测试集样本预

10、测值与目标值之间的交互验证系数Q 2ext来衡量:predictonitrritiext yQ122)(4-7)其中,y i和 分别表示测试样本燃爆特性的实验值和预测值, 表示训练iy try样本燃爆特性实验值的平均值。此外,前面评价模型拟合能力所用的统计评价指标,如 R2,RMSE,AAE ,APE和 SE 等,均同样可以用来对模型的预测能力进行衡量。一般来说,针对测试集的指标都要比训练集的差一些,但如果前者远远差于后者,那么模型很有可能发生了“过拟合” 。此外,Q 2ext 与测试集的拟合系数 R2 之间没有相关性,较高的 Q2ext 值仅仅是模型具有较高预测能力的必要条件,而非充分条件

11、139,140。5.3 结果与讨论5.3.1 模型结果针对训练集样本,采用GA-MLR方法在广泛的分子描述符空间进行搜索,通过比较所得各模型适应度函数的大小,确定了本研究中与有机物闪点最为密切相关的5个分子描述符,其类型与定义列于表5-1;最佳描述符所对应的最优MLR模型见下式:FP=81.321-28.669*CIC0+80.491*RDCHI+54.497*ESpm02d+34.098*nHDon-5.651*nCOOR (5-1)回归范围:169.15 K FP716 KR2=0.967,Q 2LOO=0.967,SE=12.59,F=4832.180,n=824式中,FP为闪点,R 2

12、为复相关系数, Q2LOO为“留一法”交互验证的复相关系数,SE 为模型标准误差,F为F检验值,n为模型中样本数。模型的其它统计学参数见表5-1。表5-1 模型 所选择的分子描述符及其统计学参数Table 5-1 Descriptors selected for model and their statistics parameters描述符 类型 定义 系数 系数标准误差 t-值 平均影响值常数 - - 81.321 - - -CIC0 拓扑描述符 补充信息量(0 阶邻域对称性 ) -28.669 0.881 -32.536 -95.760RDCHI 拓扑描述符 反距离 Randic 类型指

13、数 80.491 1.489 54.068 175.897ESpm02d 边缘邻接指数 边缘邻接矩阵中的 02 谱矩(按偶极矩加权) 54.497 1.340 40.680 175.243nHDon 官能团 与 N 原子和 O 原子相连的H 原子数 34.098 0.613 55.650 12.952nCOOR 官能团 脂肪酯数目 -5.651 1.125 5.021 -0.679在模型所选择的5个分子描述符中,CIC0和RDCHI均为拓扑描述符,由分子图论获得。其中,CIC0主要衡量分子中元素的差异程度;而RDCHI主要表征分子的大小和形状。ESpm02d为边缘邻接指数,它主要表征分子中键的

14、数目和强度。nHDon和nCOOR均为官能团描述符。其中, nHDon表示分子中与所有的O原子和N原子相连的H原子的总和,它与分子中氢键形成的可能性密切相关;而nCOOR表示分子中脂肪酯的数目,它能够对相应化合物的结构特征进行更好的表征 67。随后,应用模型(式5-1)对训练集中824个样本的闪点进行校准,以评价模型的拟合能力;同时,对测试集中206个样本的闪点进行预测,以验证模型的外部预测能力。经过计算,所得闪点校准值与预测值见附表1,模型的主要性能参数见表5-2,模型校准值和预测值与实验值的比较见图5-1。表5-2 模型I,II,III的主要性能参数Table 5-2 The main s

15、tatistical parameters of the obtained models (I, II, III) 模型 I 模型 II 模型 III性能参数训练集 测试集 样本集 训练集 测试集 样本集 训练集 测试集 样本集R2 0.967 0.970 0.968 0.975 0.973 0.975 0.975 0.974 0.976Q2LOO 0.967 - - 0.973 - - 0.974 - -Q2ext - 0.970 - - 0.972 - - 0.973 -AAE 10.22 9.67 10.11 8.65 8.95 8.71 8.62 8.93 8.68RMSE 12.58

16、 12.23 12.51 10.93 11.64 11.07 10.89 11.43 11.00n 824 206 1030 824 206 1030 824 206 103010203040506070203040506070 训 练 集测 试 集模型I闪点预测值(校准值)(K)闪 点 实 验 值 (K)图5-1 模型I 所得闪点预测值(校准值)与实验值的比较Fig.5-1 Correlation between the predicted (calibrated) and experimental FP values for model I从表5-2 可以看出,模型对测试集样本的预测平均绝

17、对误差为9.67 K,在10 K145,146的闪点实验误差允许范围之内,这说明 模型具有较强的预测能力。同时,通过比较训练集和测试集的预测结果发现,两个子集的预测误差(AAE和RMSE )不但较低,而且均比较接近。这说明模型不但具备较强的预测能力,而且具有较强的泛化性能 138。随后,对样本集中所有1030个化合物的预测相对误差进行计算。通过计算,得到模型的预测平均相对误差为2.90%,最大相对误差为10.6%。具体计算结果见图5-2 。从图中可以看出,共有859个化合物的预测相对误差小于5%,超出了模型中所有样本数的80%。198 206172 152131964821 4 0 20501

18、001502002500-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10+各区间化合物个数误 差 区 间图5-2 模型I所得预测相对误差及各误差范围中的化合物个数Fig. 5-2 The percent errors obtained by model I and the number of compounds in each range然而,从图 5-1 和图 5-2 中也可以看出,个别化合物的预测误差较大,如1,4-Benzenedicarboxylic acid,bis(2,3-Dihydroxypropyl)ester 和 Diisodecyl ph

19、thalate,其预测误差均大于 40K,这说明模型中可能有“异常值” 存在,这些“异常值”对整个模型的预测性能产生了一定的影响。因此,本文对模型中可能存在的“异常值”进行研究,以预测绝对误差大于模型标准误差 SE 的 3 倍为标准,对模型 I 中可能存在的“异常值” 进行筛选,筛选结果列于表 5-3。表 5-3 各模型中的“异常值”及其闪点实验值与预测值Table 5-3 The outliers in each model and their experimental and predicted flash points闪点预测值(K)化合物 闪点实验值(K) 模型 I 模型 II 模型

20、III1,4-Benzenedicarboxylic acid,bis(2,3-dihydroxypropyl)ester a 575 616.90 583.65 584.22Diisodecyl phthalate a 505.37 546.48 520.56 523.78Hexamethyl phosphoramide a,b,c 378.71 339.35 335.83 331.95Diisononyl phthalate a 489 529.14 511.77 509.44Diethyl phthalate b 390.15 418.39 425.42 411.79l-Glutamic

21、 acid b,c 478 505.20 512.45 520.46Sebacic acid b 496 469.77 461.45 466.472,6-Toluene diisocyanate b 388 415.75 424.65 417.39Isophorone diisocyanate b 383.15 413.21 421.13 397.80Tartaric acid b 483.15 502.87 516.67 512.96gamma-Valerolactone c 354 327.30 324.26 320.39a 模型 I 中的“异常值”;b 模型 II 中的“异常值”;c 模

22、型 III 中的“异常值”关于“异常值”产生的原因,可能主要有两个方面:一是其闪点实验数据本身存在问题;二是其与闪点密切相关的部分结构特征没有得到很好的表征。具体原因将在下文中继续予以讨论。5.3.2 模型结果模型是以模型所选择的分子描述符作为输入变量,以相应的闪点作为输出变量,应用非线性的支持向量机方法所建立的混合性 QSPR 模型。为了与模型具有可比性,模型中选取的训练集和测试集与模型完全相同。模拟开始前首先对所有样本数据进行“归一化”处理,确保所有数据点均在-11范围之内;随后针对训练集样本,采用基于“留 1/5 法”交互验证的格点搜索方法确定 SVM 模型的最优参数如下: C=512,

23、=0.03125,=0.125,相应的支持向量数为 348;然后以上述参数作为 SVM 的输入参数建立相应的 QSPR 预测模型,即模型。模型建立以后,应用该模型分别对训练集和预测集样本的闪点进行预测,所得 1030 个样本的预测值见附表 1,模型的主要性能参数见表 5-2,模型预测值与实验值的比较见图 5-3。从表 5-2 可以看出,模型对测试集样本的预测平均绝对误差为 8.95K,在闪点实验误差允许范围(10 K)之内,说明模型 同样具有较强的预测能力。同时,对训练集和测试集的预测结果进行比较,发现两个子集的预测误差不但较低,而且比较接近,说明模型同时具备较强的预测能力和泛化性能。1020

24、304050607010203040506070 训 练 集测 试 集模型闪点预测值(K) 闪 点 实 验 值 (K)图5-3 模型所得闪点预测值与实验值的比较Fig.5-3 Correlation between the predicted and experimental FP values for model 通常,由于 SVM 方法具有强大的数据拟合能力,在输入变量相同的情况下,模型的预测性能一般要优于模型。通过对两个模型进行比较,发现模型相对于训练集和测试集的预测误差 RMSE 分别比模型下降了 13.1%和 4.8%。随后,对样本集中所有1030个化合物的预测相对误差进行计算,得到

25、模型的预测平均相对误差为2.52%,最大相对误差为23.29%。具体计算结果见图5-4。从图中可以看出,共有909个化合物的预测相对误差小于5%,接近模型中所有样本数的90%。说明与模型相比,模型中具有较大预测误差的样本数明显减少。251 24719612986 6038 126 3 20501001502002503000-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10+各区间化合物个数误 差 区 间图5-4 模型所得预测相对误差及各误差范围中的化合物个数Fig. 5-4 The percent errors obtained by model and t

26、he number of compounds in each range同样,从图 5-3 和图 5-4 中也可以看出,模型中可能有“异常值”存在。本文以模型标准误差 SE 的 3 倍为标准,对模型 中可能存在的“异常值”进行筛选,筛选结果列于表 5-3。5.3.3 模型 III 结果为了进一步对闪点与其分子结构间可能存在的非线性关系进行研究,本文采用新建立的GA-SVM方法建立相应的最优纯非线性模型。模型II 中通过搜索所获得的SVM最优参数在 GA-SVM参数设置中被保留。同时,为了与前面两个模型具有可比性,在进行GA-SVM筛选时,模型III 中所选取的分子描述符个数以不大于5个为标准。

27、随后,针对同样的训练集样本,采用GA-SVM方法在广泛的分子描述符空间进行搜索,当算法满足终止条件以后,得到与有机物闪点非线性关系最为密切的5个结构描述符,其类型与定义列于表5-4。在这5个分子描述符之中,有3个描述符(RDCHI,ESpm02d,nHDon)同样出现在模型之中,其所表征的分子结构特征见模型。SIC0为拓扑指数,主要衡量分子中元素的差异度和分子形状;RCON为GETAWAY描述符,与分子的3D结构有关,主要表征分子的大小、构象变化以及周期性。表5-4 模型III所选择的分子描述符Table 5-4 Descriptors selected for model III描述符 类型

28、 定义RDCHI 拓扑描述符 反距离 Randic 类型指数SIC0 拓扑描述符 结构信息量(0 阶邻域对称性)ESpm02d 边缘邻接指数 边缘邻接矩阵中的 02 谱矩(按偶极矩加权)RCON GETAWAY 描述符 Randic 类型 R 矩阵连接性nHDon 官能团 与 N 原子和 O 原子相连的 H 原子数随后,应用所选择的这5个结构参数建立相应的SVM模型,模型的输入参数通过“留1/5法”交互验证确定如下:C=32,=0.03125,=0.25,相应的支持向量数为333。模型建立以后,应用该模型分别对训练集和测试集样本的闪点进行预测,所得1030个样本的预测值见附表1,模型III的主

29、要性能参数见表5-2,模型预测值与实验值的比较见图5-5。10203040506070203040506070 训 练 集测 试 集模型I闪点预测值(K)闪 点 实 验 值 (K)图5-5 模型III所得闪点预测值与实验值的比较Fig.5-5 Correlation between the predicted and experimental FP values for model III从表5-2 可以看出,模型III 对测试集样本的预测平均绝对误差为8.93 K,在闪点实验误差允许范围(10 K)之内,这说明模型 III同样具有较强的预测能力。同时,通过对模型III训练集和测试集的预测结果

30、进行比较发现,两个子集的预测误差不但较低,而且比较接近,说明模型III同样具备较强的泛化性能。同时,对模型III和模型的预测性能进行比较,发现模型III相对于训练集和测试集的预测误差RMSE 分别比模型下降了13.4%和6.5%。与模型II相比,模型III 的预测性能得到进一步提升。随后,对样本集中所有1030个化合物的预测相对误差进行计算,得到模型III的预测平均相对误差为2.50%,最大相对误差为12.35%。具体计算结果见图5-6。从图中可以看出,共有929个化合物的预测相对误差小于5%,接近于模型中所有样本数的90%。同样,模型III中具有较大预测误差的样本数比模型明显减少。239 2

31、48201134 10748 25 185 4 10501001502002503000-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10+各区间化合物个数误 差 区 间图5-6 模型III所得预测相对误差及各误差范围中的化合物个数Fig. 5-6 The percent errors obtained by model III and the number of compounds in each range关于模型 III 中存在的“异常值”,以同样的标准进行筛选,筛选结果列于表 5-3。 从表 5-3 可以看出, Hexamethyl phosphora

32、mide 在 3 个模型中均作为“异常值”出现,即无论是在线性模型、混合模型还是非线性模型之中,该物质均被认为是“异常值”。结合前文关于“异常值”产生原因的讨论,可以推断该物质成为模型“异常值”的主要原因是其闪点实验数据本身存在问题。关于模型中出现的其它“异常值”,由于3个模型中至少有一个模型能够对其进行较好的预测,因此可以推断这些物质在某些模型中成为“异常值”的主要原因,可能是由于其与闪点密切相关的有关分子结构特征在相应模型中没有得到很好的表征。5.3.4 模型稳定性分析为了进一步对所建模型的稳定性进行分析,排除建模过程中“偶然相关”现象的发生,本文采用“Y-随机性检验”方法分别对三个模型进

33、行验证。 “Y-随机性检验”是一种评估QSPR模型对“偶然相关”现象依赖程度的方法。该方法首先将训练集样本中的自变量x保持不变,将对应的应变量y 顺序随机打乱,使应变量和自变量不再一一对应,从而消除两者之间可能存在的内在相关性;随后,针对上述改变序列的新样本集建立新的QSPR模型,并计算其相关性能参数如R 2等;将上述过程重复运行50100次,获得某一相对 “最优”的预测模型,将其与基于原始样本建立的实际预测模型进行比较,若实际预测模型的性能参数明显优于相对“最优”模型,则认为原始样本数据中存在真正的QSPR关系,所建立的模型稳定性较好,不存在“偶然相关”现象;反之,则表明原所建模型不能被接受

34、。本文将“Y-随机性检验”方法针对三个模型分别运行50次。对于模型所得最大R 2为0.020,模型最大R 2为0.022,模型III最大R 2为0.025,三者均分别不足原始模型R 2的1/10。由此可见,只有在使用正确的应变量数据时样本数据才能产生合理的QSPR模型。因而本文所建立的预测模型不存在“偶然相关“现象,具备较强的稳定性。随后,本文还对模型的预测残差进行分析,讨论模型在建立过程中是否有系统误差产生。三个模型的预测残差图分别见图 5-7,5-8 及 5-9。由图可以看出,三个预测模型的计算残差均随机分布于基准线的两侧,不存在明显的规律性。由此可以推断,三个预测模型在建立过程中未产生系

35、统误差。10203040506070-5-40-3-20-101203405 训 练 集测 试 集残差(模型I)闪 点 实 验 值 (K)图5-7 模型闪点预测残差图Fig. 5-7 Plot of the residuals versus the experimental FP values for model10203040506070-5-40-3-20-101203405 训 练 集测 试 集残差 (模型)闪 点 实 验 值 (K)图5-8 模型闪点预测残差图Fig. 5-8 Plot of the residuals versus the experimental FP values

36、 for model 10203040506070-5-40-3-20-101203405 训 练 集测 试 集残差(模型I) 闪 点 实 验 值(K)图5-9 模型III闪点预测残差图Fig. 5-9 Plot of the residuals versus the experimental FP values for model III5.3.6 模型的比较5.3.6.1 三个模型的比较从表 5-2 结果可以看出,在本文所建立的 3 个闪点预测模型中,模型 III 的性能最为优越,同时具有最佳的数据拟合能力和最优的外部预测能力。此外,通过模型稳定性分析可以看出,模型 III 还具有最优的稳

37、定性和可靠性。由此可见,与线性模型 I 和混合模型 II 相比,非线性模型 III 在模型稳健性和预测能力等方面都具有明显的优越性。这一结果也表明,本文所建立的 GA-SVM 组合算法是一种高效的 QSPR 算法,比传统的 GA-MLR 算法和混合建模方法更适合于对有机物闪点的 QSPR 预测研究。从表 5-2 也可以看出,与线性模型 I 相比,混合模型 II 的各项性能均较优。由于两模型所使用的分子描述符相同,性能上的差异主要是由于前者使用线性方法 MLR 建模,而后者使用非线性方法 SVM 建模所致。由此可见,与传统线性方法相比,SVM 方法具有更强的预测能力和泛化性能,特别适用于这种非线

38、性的 QSPR 研究体系。同样,与混合模型II相比,非线性模型III 的各项性能均较优。由于两模型均采用SVM 方法进行建模,性能上的差异主要是由于两模型所使用的分子描述符不同所致:前者使用线性变量选择方法GA-MLR筛选出的结构参数作为分子描述符,而后者使用非线性变量选择方法GA-SVM 筛选出的结构参数作为分子描述符。这一结果表明,通过线性变量选择方法筛选出的最佳描述符不一定是非线性拟合的最佳选择,有机物闪点与其分子结构间的非线性关系只有采用通过非线性方法筛选出的描述符才能进行更为有效的表征。然而,需要注意的是,尽管与混合模型II和非线性模型III相比,线性模型I的各项性能相对较差,但是,

39、无论是混合模型II还是非线性模型III均使用非线性的SVM 方法建模,而 SVM方法建立的是一种“ 黑箱”模型,不能给出直观的数学表达式,因而就无法根据模型直接准确地了解和掌握各分子描述符对闪点的影响程度和规律,也就无法有效地对模型机理作出解释,而这些正是MLR模型的优势。此外,与模型II 、II 相比,线性模型I还具有建模简单、使用简便等优点。因此,这三种模型各有利弊,并存在一定的互补性,在实际应用过程中,可根据实际需要加以选择。5.3.6.2 与已有模型的比较为进一步对本文所建模型的可靠性和优越性进行验证,将其与文献上已有的闪点预测模型进行全面的比较。首先,将本文模型的预测性能与已有模型进

40、行比较,结果列于表 5-7。从表5-7 可以看出,本文采用 GA-SVM 算法建立的非线性模型 III 具有较强的预测性能,在所有已有的闪点预测模型中仅次于文献50所建的基团贡献模型(以平均绝对误差 AAE 为标准) 。这说明模型 III 对有机物闪点与其分子结构存在的非线性关系进行了较好的表征,同时再次表明本文所建立的 GA-SVM 组合算法是一种高效的 QSPR 算法,比传统的 GA-MLR 算法和混合建模方法更适用于有机物闪点的 QSPR 预测研究。表 5-7 本文模型与已有模型预测性能的比较Table 5-7 Performance comparisons between the pr

41、esented models and previous models模型 R2 AAE RMSE nSuzuki 等 36 0.9351 10.3 13.52 400Tetteh 等 37 0.9326 10.2 13.1 400Katritzky 等 54 0.902 - 16.1 271Zhokhova 等 38 0.959 - 14.6 398Katritzky 等 55 0.878 13.9 - 758Gharagheizi 和 Alamdari 56 0.9669 10.2 12.7 1030Gharagheizi 等 39 0.9757 8.101 11.206 1378Pan 等

42、 50 0.974 6.894 11.367 1282本文模型 I 0.968 10.11 12.51 1030本文模型 II 0.975 8.71 11.07 1030本文模型 III 0.976 8.68 11.00 1030然而,必须指出的是,上述各预测模型均建立在不同的样本集基础之上,因而预测结果间存在不一致性;同时,各模型的建立使用了不同的研究方法,因而每个模型均有其自身的优缺点。因此,仅仅对模型的预测性能进行比较是不合理的,必须从模型其它的一些重要特征,如模型应用效率、应用范围、可解释性等方面着手,对各预测模型进行更为全面的比较分析。本研究以文献56和文献50所建模型为例,将本文模

43、型与其进行较为全面的比较。文献56所建模型在本文第一章进行过介绍,是一个典型的 QSPR 模型,在文献上已有的闪点 QSPR 预测模型中性能最为优越。同时,前文进行过介绍,为与该模型进行比较,本文研究过程中采用了与其完全相同的样本集和样本划分方式。因此,将本文模型与该模型进行比较,对于验证本文方法的可靠性和有效性具有重要的参考价值。本文从如下多个角度出发,对本文模型和该模型进行较为深入的比较和探讨:关于模型的输入参数,本文模型 I 和 II 及模型 III 分别采用以 GA-MLR 算法和 GA-SVM 算法筛选出的与有机物闪点密切相关的各 5 个结构参数作为模型的输入参数,而文献56 模型则

44、采用 GA-MLR 算法筛选出的 4 个结构参数作为输入参数,各组参数所表征的结构特征较为类似,一般认为文献56模型因具有较少的输入变量(4 vs. 5)因而模型简便性和稳定性略优于本文模型;关于模型的预测性能,本文线性模型 I 要略优于文献56模型,这说明本文所改进的GA-MLR 算法是成功的,与传统 GA-MLR 算法相比具有较强的变量选择和模型优化能力,混合模型 II 和非线性模型 III 的各性能参数则要明显优于文献 56的线性模型,这验证了前文关于“有机物闪点与其分子结构之间可能存在较强非线性关系”的推断;关于模型的可解释性和可操作性,模型 I 与文献56模型均为线性的 MLR 模型

45、,使用简便,可解释性强,而模型 II、III 均采用机器学习方法 SVM 建立相应的非线性模型,与文献 56所建立的 MLR 模型相比,可解释性和可操作性较差。文献50所建模型在本文第一章进行过介绍,是一个典型的基团贡献模型,在文献上已有的应用基团贡献法预测闪点的模型中性能最为优越。因此,本文以该模型作为闪点基团贡献预测模型的代表,将其与本文模型进行较为深入和全面的比较。关于样本集的大小,文献50模型的样本数要大于本文模型(1282 vs. 1030) ,因此其样本集更具代表性和广泛性;关于模型的输入参数,文献50模型基于基团贡献法原理以 57 个分子基团作为输入参数,而本文模型均仅以 5 个

46、结构描述符作为输入参数,一方面使所建立的预测模型更为简便和稳固,另一方面因结构参数具有明确的物理意义因而便于对模型进行解释;关于模型性能参数,文献50 模型对整个样本集的预测平均绝对误差要低于本文所有模型,然而其预测均方根误差却高于本文模型 II 和 III,这可能是由于文献 50模型中存在较多的“异常值”所致。此外,虽然文献50模型对整个样本集的预测性能较优,但其对测试集的预测平均绝对误差却要高于本文所有模型,这说明该模型的外部预测性能低于本文模型,泛化性能较差,这可能是由于该模型中包含有过多的输入变量所致。关于模型的适用范围,文献50模型基于基团贡献法原理建立,其应用范围受研究体系的影响较大,如果某个基团不在建模所选取的那组基团范围之内,那么对于含有该基团的化合物就无法应用该模型进行预测,而本文模型均以仅需分子结构就能计算的分子描述符作为输入参数,理论上能够对所有已知分子结构的有机物闪点进行预测,适用范围更广。由此可见,与已有的有机物闪点预测模型相比,本文模型在模型稳定性、模型可解释性、模型外部预测能力和适用范围等方面都具有一定的优越性。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报