1、过渡态、反应路径的计算方法及相关问题SoberevaDepartment of Chemistry, University of Science and Technology Beijing, Beijing 100083, China前言:本文主要介绍过渡态、反应路径的计算方法,并讨论相关问题。由于这类算法极多,可以互相组合,限于精力不可能面面俱到展开,所以只介绍常用,或者实用价值有限但有启发性的方法。文中图片来自相关文献,做了一定修改。由于本文作为帖子发布,文中无法插入复杂公式,故文中尽量将公式转化为文字描述并加以解释,这样必然不如公式形式严谨,而且过于复杂的公式只能略过,但我想这样做的好
2、处是更易把握方法的梗概,有兴趣可以进一步阅读原文了解细节。对于 Gaussian 中可以实现的方法,文中对其在 Gaussian中的使用进行了一些讨论,希望能纠正一些网上流传的误区。虽然绝大多数人不专门研究计算方法,其中很多方法也不会用到,但多了解一下对开阔思路是很有好处的。文中指的“反应”包括构象变化、异构化、单分子反应等任何涉及到过渡态的变化过程。“反应物”与“产物”泛指这些过程的初态和末态。 “优化”若未注明,包括优化至极小点和优化至过渡态。势能面是高维的,但为了直观以及表述方便,文中一般用二维势能面模型来讨论,应推广至高维情况。限于纯文本格式,向量、矩阵无法加粗表示,但容易自行判断。目
3、录:1.过渡态2.过渡态搜索算法2.1 基于初猜结构的算法2.1.1 牛顿-拉弗森法 (Newton-Raphson,NR)与准牛顿法(quasi-Newton,QN)2.1.2 AH 方法(augmented Hessian)2.1.2.1 RFO 法(Rational Function Optimization,有理函数优化)2.1.2.2 P-RFO 法(Partitioned-RFO)2.1.2.3 QA 法(Quadratic Approximation,二次逼近)2.1.2.4 TRIM 法 (trust-region image minimization,置信区域镜像最小化)2.
4、1.2.5 在高斯中的常见问题2.1.3 GDIIS 法(Geometry Direct Inversion in the Iterative Subspace)2.1.4 梯度模优化(gradient norm minimization)2.1.5 Dimer 方法2.2 基于反应物与产物结构的算法2.2.1 同步转变方法(synchronous transit,ST)2.2.2 STQN 方法 (Combined Synchronous Transit and Quasi-Newton Methods)2.2.3 赝坐标法(pseudo reaction coordinate)2.2.4
5、DHS 方法(Dewar-Healy-Stewart,亦称 Saddle 方法)与 LTP 方法(Line-Then-Plane)2.2.5 Ridge 方法2.2.6 Step-and-Slide 方法2.2.7 Mller-Brown 方法2.2.8 CI-NEB、 ANEBA 方法2.3 基于反应物结构的算法2.3.1 最缓上升法(least steep ascent,shallowest ascent)2.3.2 本征向量/本征值跟踪法(eigenvector/eigenvalue following,EF。也称 mode walking/mode following/Walking
6、up valleys)2.3.3 ARTn(activation-relaxation technique nouveau)2.3.4 梯度极值法(Gradient extremal,GE)2.3.5 约化梯度跟踪(reduced gradient following,RGF)2.3.6 等势面搜索法(Isopotenial Searching)2.3.7 球形优化(Sphere optimization)2.4 全势能面扫描3.过渡态相关问题3.1 无过渡态的反应途径(barrierless reaction pathways)3.2 Hammond-Leffler 假设3.2 对称性问题3
7、.3 溶剂效应3.4 计算过渡态的建议流程4.内禀反应坐标(intrinsic reaction coordinate,IRC)5.IRC 算法5.1 最陡下降法(Steepest descent)5.2 IMK 方法(Ishida-Morokuma-Kormornicki)5.3 Mller-Brown 方法5.4 GS(Gonzalez-Schlegel)方法6.chain-of-states 方法6.1 Drag method 方法6.2 PEB 方法(plain elastic band)6.3 Elber-Karplus 方法6.4 SPW 方法(Self-Penalty Walk)
8、6.5 LUP 方法(Locally Updated planes)6.6 NEB 方法(Nudged Elastic Band)6.7 DNEB 方法(Double Nudged Elastic Band)6.8 String 方法6.9 Simplified String 方法6.10 寻找过渡态的 chain-of-state 方法6.10.1 CI-NEB 方法6.10.2 ANEBA 方法(adaptive nudged elastic band approach)6.11 chain-of-states 方法的一些特点6.12 高斯中 opt 关键字的 path=M 方法6.13
9、CPK 方法(Conjugate Peak Refinement)1.过渡态过渡态结构指的是势能面上反应路径上的能量最高点,它通过最小能量路径(minimum energy path,MEP)连接着反应物和产物的结构(如果是多步反应的机理,则这里所指反应物或产物包括中间体) 。对于多分子之间的反应,更确切来讲过渡态结构连接的是它们由无穷远接近后因为范德华力和静电力形成的复合物结构,以及反应完毕但尚未无限远离时的复合物结构。确定过渡态有助于了解反应机理,以及通过势垒高度计算反应速率。一般来讲,势垒小于 21kcal/mol 就可以在室温下发生。在势能面上,过渡态结构的能量对坐标的一阶导数为 0,
10、只有在反应坐标方向上曲率(对坐标二阶导数)为负,而其它方向上皆为正,是能量面上的一阶鞍点。过渡态结构的能量二阶导数矩阵(Hessian 矩阵)的本征值仅有一个负值,这个负值也就是过渡态拥有唯一虚频的来源。若将分子振动简化成谐振子模型,这个负值便是频率公式中的力常数,开根号后即得虚数。分子构象转变、化学反应过程中往往都有过渡态的存在,即这个过程在势能面上的运动往往都会经历满足上述条件的一点。化学反应的过渡态更确切应当成为“反应过渡态” 。需要注意的是化学反应未必都经历过渡态结构。由于过渡态结构存在时间极短,所以很难通过实验方法获得,直到飞秒脉冲激光光谱的出现才使检验反应机理为可能。计算化学方法在
11、目前是预测过渡态的最有力武器,尽管计算上仍有一些困难,比如其附近势能面相对于平衡结构更为平坦得多、低水平方法难以准确描述、难以预测过渡态结构、缺乏绝对可靠的方法(如优化到能量极小点可用的最陡下降法)等。搜索过渡态的算法一般结合从头算、DFT 方法,在半经验、或者小基组条件下,难以像描述平衡结构一样正确描述过渡态结构,使得计算尺度受到了限制。结合分子力场可以描述构象变化的过渡态,但不适用描述反应过渡态,因为大部分分子力场的势函数不允许分子拓扑结构的改变,虽然也有一些力场如 ReaxFF 可以支持,有的力场还有对应的过渡态原子类型,但目前来看适用面仍然较窄,而且不够精确,尽管更为快速。注:严格来说
12、, “过渡结构”是指势能面上反应路径上的能量最高点,而“过渡态”是指自由能面上反应路径上的能量最高点,由于自由能变主要贡献自势能部分,所以多数情况二者结构近似一致。但随着温度升高,往往熵变的贡献导致自由能面与势能面形状发生明显偏离,从而导致过渡结构与过渡态明显偏离,两个词就不能混用了。但本文不涉及相关问题,故文中过渡态、过渡结构一律指势能面上反应路径上的能量最高点。2.过渡态搜索算法2.1 基于初猜结构的算法2.1.1 牛顿-拉弗森法 (Newton-Raphson,NR)与准牛顿法(quasi-Newton,QN)NR 法是寻找函数一阶导数为 0(驻点)位置的方法。通过对能量函数的泰勒级数的
13、二阶近似展开,然后使用稳态条件 dE/dr=0,可导出步进公式:下一步的坐标向量 = 当前坐标向量 - 能量一阶导数向量 * Hessian 矩阵的逆矩阵。在势能面上以 NR 法最终找到的结果是与初猜位置 Hessian 矩阵本征值正负号一致、离初猜结构最近的驻点,由于能量极小点、过渡态和高阶鞍点的能量一阶导数皆为 0,故都可以用 NR 法寻找。对于纯二次形函数 NR 法仅需一步即可找到正确位置,而势能面远比之复杂,所以需要反复走步直至收敛。也因为势能面这个特点,为了改进优化,实际应用中 NR 法一般还结合线搜索步(line search),对于优化至极小点,就是找当前点与 NR 法算出来的下
14、一点的连线上的能量极小点作为实际下一步结构;若优化至过渡态,且连线方向主要指向过渡态,则找的是连线上能量极大点,若主要指向其它方向则找连线的能量极小点,若指向二者程度均等则一般不做线搜索。由于精确的线搜索很花时间,所以一般只是在连线的当前位置附近计算几个点的能量,以高阶多项式拟和后取其最小/最大点。NR 法每一步需要计算 Hessian 矩阵并且求其逆,所以十分昂贵。 QN 法与 NR 法的走步原理一样,但 Hessian 矩阵最初是用低级或经验方法猜出来的,每一步优化中通过当前及前一步的梯度和坐标对 Hessian 矩阵逆矩阵逐渐修正。由于只需计算一阶导数,即便 Hessian 矩阵不准确造
15、成所需收敛步数增加,但一般仍比 NR 法速度快得多。QN 法泛指基于此原理的一类方法,常用的是 BFGS(Broyden Fletcher Goldfarb Shanno),此法对 Hessian 的修正保持其对称性和正定性,最适合几何优化,但显然不能用于找过渡态。还有 DFP(Davidon-Fletcher-Powell),MS(Murtagh-Sargent,亦称 symmetric rank 1,SR1),PSB(Powell-symmetric-Broyden)。也有混合方法,如 Bofill 法是 PSB 和 MS 法对 Hessian 修正量的权重线性组合,比二者独立使用更优,权
16、重系数通过位移、梯度改变量和当前 Hessian 计算得到,它对 Hessian 的修正不强制正定,很适宜搜索过渡态。将 NR 步进公式放到 Hessian 本征向量空间下其意义更为明显(此时 Hessian 为对角矩阵) ,可看出在每个方向上的位移就是这个方向势能的负梯度除以对应的本征值,比如在 i 方向上的位移可写为 X(i)=-g(i)/h(i),在受力越大、越平坦的方向位移越大。每一步实际位移就是这些方向上位移的矢量和。对于寻找过渡态,因为虚频方向对应 Hessian 本征值为负,使位移为受力相反方向,所以 NR 法在过渡态附近每一步都是使虚频方向能量升高,而在其它正交的方向朝着能量降
17、低的方向位移,通过这个原理步进到过渡态。若有 n 个虚频,则 NR 法就在 n 个方向升高能量而其它方向降低能量找到 n 阶鞍点。由于 NR 法的这个特点,为找到正确类型的驻点,初猜结构必须在目标结构的二次区域(quadratic region)内。所谓的二次区域,是指驻点附近保持 Hessian 矩阵本征值符号不变的区域,它的形状可以用多变量的二次函数近似描述,例如二维势能面情况下这样的区域可以用 F(x,y)=A*x2+B*y2+C*x+D*y+E*x*y 来近似描述。对于能量极小点,就是指初猜点在目标结构附近 Hessian 矩阵为正定矩阵的范围;对于找过渡态,就需要初猜点在它附近含有且
18、仅含有一个负本征值的范围内。并且这个范围内不能有其它同类驻点比目标结构距离初猜结构更近。NR 法方便之处是只需要提供一个初猜结构即可,但是由于过渡态二次区域很小(相对于能量极小点来讲) ,复杂反应过渡态又不容易估计,故对使用者的直觉和经验有一定要求,即便是老手,也往往需要反复尝试。NR 法对初猜结构比较敏感,离过渡态越近所需收敛步数越少,成功机率越高。模版法可以帮助给出合理的初猜,也就是如果已经知道其它机理相同的反应的过渡态结构,可以保持反应位点部分的结构不变而替换周围的原子,使之变成自己要研究的化合物反应的初猜结构。2.1.2 AH 方法(Augmented Hessian)AH 方法并不是
19、独立的寻找过渡态的方法,而是通过修改原始 Hessian 矩阵来调整 NR 法步进的长度和方向的一种方法。在 NR 法的步进公式中加入了一个移位参数 ,式子变为X(i, )=-g(i)/(h(i)-),NR 法相当于 等于 0 时的特例。 控制着每步步进距离,它与h(i)的相对大小也控制着这个坐标上的步进方向。根据设定 方法的不同,常见的有RFO、P-RFO 和 QA/TRIM。这些方法每一步也使用 QN 方法来快速地更新 Hessian。下面提及的置信半径 R(Trust radius)是指二阶泰勒级数展开这种近似的合理的区域,可以在优化过程中固定也可以动态改变,比如下一步位置的实际能量与使
20、用二阶泰勒级数展开预测的能量符合较好则加大 R,反之减小。优化的每一步移动距离不应超过 R,否则可能进入二阶泰勒级数展开近似的失效区域,NR 法在势能面平坦的时候容易超过这个范围,应调整 避免。2.1.2.1 RFO 法(Rational Function Optimization,有理函数优化)对能量函数根据有理近似展开,而不是 NR 法的二阶泰勒级数近似展开,可推得与 AH 方法形式相同的步进公式。确定其中 的公式是 =( g(i)2/(h(i)-) ),g(i)和 h(i)代表此方向的梯度和本征值,加和是对所有本征向量方向加和。通过迭代方法会解出 N+1 个 (N 代表势能面维数) ,将
21、 按大小排列,则有 (i) h(i) (i+1)。故选其中最小的 可使各个方向位移公式的(h(i)-)项皆为正,保证每步位移都向着极小点。选其中大于 m 个Hessian 本征值的 ,将会在本征值最低的 m 个方向上沿其上的受力反方向位移提升能量,在其余 N-m 个方向上降低能量,由此确保优化到 m 阶鞍点,若 m 为 1 即用来找过渡态。所以用了这个方法寻找指定类型驻点不再像 NR 法对初猜位置 Hessian 本征值符号有要求,而是直接通过选择 来设定向着何种鞍点位移。如果每步步长度超过了 R,则乘以一个小于 1 的因子来减小步长。值得一提的是, 与势能面维数 N 的平方根近似成正比,随着
22、体系尺度的增大,RFO 的 对 NR 法的二次近似就会趋现“校正过度”情况,产生大小不一致问题,可使用 SIRFO(Size independent RFO)方法解决,即 AH 走步公式中的 改为/N0.5 。2.1.2.2 P-RFO 法 (Partitioned-RFO)专用于优化过渡态,效率比 RFO 更高。RFO 对所有方向的步进都使用同一个 ,而在 P-RFO 中在指向过渡态的方向使用独立计算的 (TS),(TS)=g(TS)2/(h(TS)-(TS) ,应选这个一元二次方程的最大的解,可保证在这个方向上升高能量。其余方向 的确定和 RFO的公式一样,加和就不再包含指向过渡态的方向,
23、并且选最小的 解以使这些方向能量降低。这里所谓指向过渡态的方向一般是指最低本征值的方向,在上述 RFO 方法 m 为 1 时也是如此假设(限于其形式 RFO 也只能用这最低模式) ,但有时会是其它的非最低的模式,P-RFO 也可以将这样的模式作为指向过渡态的模式,见后文 EF 方法的讨论。2.1.2.3 QA 法(Quadratic Approximation,二次逼近)确定 的公式是(X(i)2=( -g(i)/(h(i)-) )2=R2,也就是说每一步移动的距离恰好是置信半径,这样步进速度较快。若优化到过渡态,计算 公式的加和中指向过渡态本征向量的那一项的 改为-,即 X(TS)=-g(T
24、S)/(h(TS)+)。2.1.2.4 TRIM 法(trust-region image minimization,置信区域镜像最小化)这个方法假设 Hessian 本征值最小的方向的梯度和曲率符号与原本相反,而其它方向不变。经过这样的变化后原来的过渡态位置就成为了能量极小点(过渡态的 image),这样就可以通过优化到极小点而得到过渡态。将 TRIM 的假设 g(TS)=-g(TS),h(TS)=-h(TS) 代入 AH 方法的步进公式 X(i,)=-g(i)/(h(i)-),再使分子分母同乘以-1,可知在过渡态方向上的步进公式与其它方向区别仅在于反转了 的符号。又由于 TRIM 也是通过
25、调整 使步进长度等于为置信半径,所以在公式的形式上与 QA 法找过渡态的公式完全一致,QA 与 TRIM 可互为同义词。通过如上调整 AH 方法引入的 可使 NR 法的步进更有效率、更稳定,还可以通过它改变步进公式在不同方向上的分母项符号,使优化过渡态的初猜点不限于过渡态的二次区域。可直接指定沿某个振动模式升高能量来找过渡态,即便当前点这个方向的 Hessian 本征值可能是正值,例如从极小点开始跟踪至过渡态,见后文的 EF 方法。2.1.2.5 在高斯中的常见问题高斯中 opt=ts 是使用 Berny 算法来找过渡态,需要提供一个初猜结构。Berny 默认的走步的方法是 RFO/P-RFO
26、(分别对于优化至极小值/ 鞍点) ,若加了 Newton 选项,则走步基于 NR法。每一步对 Hessian 矩阵的更新方法以 UpdateMethod 选项指定,寻找极小点时默认用BFGS,找过渡态时默认用 Bofill。Berny 算法还包括一些细节步骤在内,比如投影掉被冻结的变量、更新置信半径、设定了线搜索过程中几种方案等等,详见手册 opt 关键字。使用了每步修正 Hessian 的准牛顿法后,初猜的 Hessian 矩阵质量明显影响结构收敛速度,它的不准确容易导致搜索过渡态失败(在高斯中默认使用价键力场得到 Hessian) 。这种情况需要昂贵的 calcfc 关键字以当前方法水平计
27、算最初的 Hessian 矩阵,若使用的方法在程序中支持解析二阶导数,速度会较好。或者用 readfc 来读取包含了 Hessian 矩阵信息的 chk文件,可以先使用低水平方法进行简正振动分析得到 chk 文件,再将之读入作为 Hessian 矩阵初猜,能够节约时间,但前提是此势能面对方法等级不敏感(一般如此) 。使用了更准确的初猜后不仅可以增加找到过渡态的成功机率,还有助于在更短的优化步数内达到收敛标准。若使用 calcall,则每一点都重新准确计算 Hession,会更为可靠,但极为昂贵。高斯中 berny 方法寻找过渡态默认每步会检查 Hessian 矩阵的本征值是否仅有一个为负,如果
28、不符,就会提示“a wrong sign eigenvalue in hessian matrix”,经常一开始就报错,原因是初猜结构不符合这个条件,即便这个初猜通过 berny 方法最终能够正确优化到过渡态,这时应加 noeigentest 选项避免本征值符号的检查,不符合要求也继续优化,但因此可能收敛到其它类型驻点。有时这种情况由初猜的 Hessian 不准导致,可用 calcfc 解决。如果搜索的过渡态出现多个负本征值,可根据适当的虚频(高斯中以负数频率表示)振动方向调整结构以降低能量,直至剩下一个虚频,再重新优化。高斯中默认的置信半径为 0.3 bohr,若优化中步长(RFO/P-RF
29、O 步)超过就会输出“Maximum step size ( 0.300) exceeded in Quadratic search”和“Step size scaled by xxx”,即乘以 xxx 调小步长至置信半径内。也可以使用 iop(1/8=k)将置信半径改为 k*0.01 bohr(1 bohr=0.5292 埃),调大后往往可以显著减少收敛步数,很适合势能面平坦的大体系。注意并不是每一步的步长都固定为 k*0.01 bohr,若没超过置信半径则步长并不因此改变。寻找极小点时默认为允许动态改变置信半径,此时 iop(1/8)设的就是最初的置信半径,对于寻找过渡态默认为关闭此功能(
30、相当于用了 NoTrustUpdate) ,可以使用 trustupdate 关键字来打开这个功能。2.1.3 GDIIS 法(Geometry Direct Inversion in the Iterative Subspace)GDIIS 与 DIIS 原理一致,但用于几何优化,这个方法趋于收敛到离初始位置最近的驻点,包括过渡态。下一步坐标 X(new)=X“-Hg“,H代表当前步的 Hessian 逆矩阵,可见公式形式与NR 法是一致的,但是 X“与 g“不再指当前步的坐标和梯度,而是由之前走过的点的坐标 X(k)和梯度 g(k)插值得到的,X“=c(k)X(k),g“=c(k)g(k)
31、,代入上式即 X(new)=c(i)(X(i)-Hg(i),其中是对之前全部走过的点加和。系数 c(k)通过使误差向量 r 的模最小化得到,r= c(k)e(k),并以 c(k)=1 为限制条件。 e(k)常见有两种定义,一种是 e(k)=-Hg(k),另一种更常用,是 e(k)=g(k),可看出 GDIIS 利用的是已经搜索过的子空间中坐标与梯度的相关性,目的是估出梯度(即误差向量)的模尽可能小的坐标,这一点与后述的梯度模方法相似。此方法缺点是由于势能面复杂,步进中容易被拉到已经过的势能面的其它驻点而不能到达指定类型驻点,还容易走到类似肩膀形状的拐点,梯度虽小却不为 0,由于不能达到收敛标准
32、而反复在此处震荡。另外随优化步数增加,误差向量数目逐渐加大,会逐渐出现的误差向量之间的线性相关,导致伪收敛和数值不稳定问题。在改进的方法中将 GDIIS 与更可靠的 RFO 方法结合,比较二者的步进方向和长度,并检验 GDIIS 中的组合系数 c,根据一定规则来决定每一步对之前走过的点的保留方式,必要时全部舍去而重新开始GDIIS。 Gaussian 中用的这种改进的 GDIIS 方法解决了上述问题同时提高了效率,速度等于或优于 RFO 方法,尤其是以低水平对势能面平坦的大体系优化时更为突出。GDIIS 计算量小,对 Hessian 矩阵很不敏感,可以在优化中不更新,也可以用 QN 法更新来改
33、善性能。此方法自 Gaussian98 起就是默认的半经验优化算法,其它方法下也可以用 OPT 的 gdiis 关键词打开。2.1.4 梯度模优化(gradient norm minimization)势能面上的驻点,包括能量极小点、过渡态和高阶鞍点的势能梯度都为 0,所以在相应于势能面的梯度模面上进行优化找到数值为 0 的点,经过 Hessian 矩阵本征值符号的检验,就能得到过渡态。这相当于把搜索过渡态问题转化为了能量极小化问题,就有了更可靠的算法可用。 (注:梯度模指的是势能梯度在各个维度分量平方和的平方根,即梯度大小的绝对值) 。但是寻找数值更小点的优化方法比如最陡下降法只能找到离初始
34、位置最近的极小点,若找到的梯度模面上的极小点数值大于 0 则是势能面肩膀形拐点,没有什么用处,而这样的点收敛半径往往很大,例如图中在 x=2 至 8 的区域内都会收敛到函数拐点,只有提供的初猜结构在 x=1 和 9 附近很小的范围内才会收敛到过渡态,收敛半径太小,难以提供合理初猜。梯度模面上还多出一些极大点,如 x=1.5 处,若使用收敛更快的 NR 法找极小点还容易收敛到这样没有意义的点上。基于这些原因,梯度模法很少使用。图 1原函数与它的梯度模曲线。2.1.5 Dimer 方法Dimer 方法是一种高效的定位过渡态的方法。这个方法定义了由两个点 R1 和 R2 组成的一个 Dimer,能量
35、和所受势能力(由原始的势能面梯度造成受力,下同)分别为 E1 和 E2、F1和 F2。两个点间距为 2R ,R 为定值。这两点的中间点为 R,其受力 F(R)=(F1+F2)/2。 Dimer 的总能量为 E=(E1+E2)/2。这个方法的每一步包括平移 Dimer 和旋转 Dimer 两步。旋转 Dimer:保持 R1、R2 中点位置 R 不变作为轴,旋转 Dimer 直到总能量 E 最小。通过推导可知在旋转过程中,E 与 R 点在 dimer 方向(R1-R2 方向)上的曲率关系 C 是线性的,即最小化 E 的过程就是最小化 C 的过程。所以每一步的 Dimer 方向都是曲率最小方向,当最
36、终 R 收敛到过渡态位置时, Dimer 就会平行于虚频方向。平移 Dimer:Dimer 根据受力 F移动 R 的位置,结合不同方法有具体步进方式,如 quick-win、共轭梯度法。当 C0(极小点二次区域内) ,F等于 F(R)平行于 Dimer 方向力的分量的负值,而没有垂直于 Dimer 方向的力,促使 Dimer 尽快离开这个区域。由于 Dimer的方向就是曲率最小的方向,在过渡态二次区域内就是指虚频方向,在 Dimer 方法中 F的定义使这个方向以受力相反方向移动以升高能量,而其它方向顺着受力方向移动来最小化能量,可看出原理上与 NR 法相似。费时的计算 Hessian 矩阵最小
37、本征值以确定提升能量方向的过程被旋转 Dimer 这一步代替了,仅需要计算一阶导数。Dimer 法对初始位置要求很宽松,并不需要在过渡态二次区域内,若在极小点二次区域内就类似于后述的 EF 方法沿着最小振动模式爬坡。如果在高阶鞍点二次区域内,只在曲率最负的虚频方向沿着受力反向移动,在其它虚频方向上仍最小化能量,而不会像 NR 法收敛到高阶鞍点。图 2右侧为 Dimer 法在 Mller-Brown 模型势上面搜索两个过渡态过程中 Dimer 走的路径。势能面上往往有许多鞍点,Dimer 方法还可以做鞍点搜索。通过分子动力学方法给予 Dimer一定动能,使之能够在势能面上广阔的区域内运动,根据一
38、定标准提取轨迹中的一些点作为初猜,再执行标准 Dimer 方法就可以得到许多不同的鞍点。Dimer 方法很适合双处理器并行,两个点的受力分别由两个处理器负责,速度可增加将近一倍。2.2 基于反应物与产物结构的算法2.2.1 同步转变方法(synchronous transit,ST)提供合理的初猜结构往往不易,ST 方法可以只根据反应物和产物结构自动得到过渡态结构。“同步转变”这个名字强调的是反应路径上所有坐标一起变化,这是相对于后面提到的赝坐标法来说的(即只变化指定的坐标,尽管其它坐标优化后坐标也会变化) 。ST 分为两种模型,最简单的就是 LST 模型(Linear synchronous
39、 transit,线性同步转变),这个方法假设反应过程中,反应物结构的每个坐标都是同步、线性地变化到产物结构。如果反应物、产物的坐标分别以向量 A、B 表示,则反应过程中的结构坐标可表示为(1-x)*A+x*B,x 由 0 逐渐变到 1 代表反应进度。注意 LST 并不是指反应中原子在真实空间上以直线运动,只有笛卡尔坐标下的 LST 才是如此,在内坐标下的 LST,原子在真实空间中一般以弧线运动。以 LST 的假设,反应路径在其所用坐标下的势能面图上可描述为一条直线,LST 给出的过渡态就是这条直线上能量最高点(图 3 的点 1) 。LST 的问题也很显著,其假设的坐标线性变化多数是错误的,绘
40、制在势能面图上也多数不会是直线,故给出的过渡态也有较大偏差,容易带两个或多个虚频。比 LST 更合理的是 QST(quadratic synchronous transit,二次同步转变),它假设反应路径在势能面上是一条二次曲线。QST 在 LST 得到的过渡态位置上,对 LST 直线路径的垂直方向进行线搜索找到能量极小点 A(图 3 的点 2) 。QST 给出的反应路径可以用经过反应物、A 、产物的二次曲线来表示,如果这条路径上能量最大点的位置恰为 A,则 A 就是 QST 方法给出的过渡态;如果不是,则以最大点作为过渡态。若想结果更精确,可以再对这个最大点向垂直于路径的方向优化,再次得到
41、A 并检验,反复重复这个步骤,逐步找到能量更低、更准确的过渡态。QST 方法在计算能力较低的年代曾是简单快速的获得过渡态和反应路径的方法,然而如今看来其结果是相当粗糙的,已极少单独使用,可以将其得到的过渡态作为 AH 法的初猜。图 3LST 与 QST 方法示意图2.2.2 STQN 方法(Combined Synchronous Transit and Quasi-Newton Methods)STQN 是 ST 与 QN 方法的结合(更准确地说是与 EF 法的结合) 。但不要简单认为是按顺序独立执行这两步,即认为“先利用反应物和产物结构以 ST 方法得到粗糙过渡态,再以之作为初猜用 QN
42、法精确寻找过渡态”是错误的。STQN 方法大意是:使结构从低能量的反应物出发,以 ST 路径在当前位置切线为引导,沿着 LST 或 QST 假设的反应路径行进(爬坡步) ,目的是使结构到达假设路径的能量最高处附近(真实过渡态二次区域附近) 。当符合一定判据时就转换为 QN 法寻找精确过渡态位置(EF 步) 。下面介绍具体步骤。先说明后面用到的切线的定义:STQN 当中的 LST 路径与前面 ST 部分介绍的 LST 路径无异,都是直线,切线 T 在优化中是不变的,就是反应物 R 指向产物 P 的单位向量。STQN 方法中的 QST 路径定义与 ST 方法介绍的不同,走的不是二次曲线而是圆形的一段弧,如图 4所示。这个圆弧经过 R、P 以及优化中的当前步位置 X,切线就是圆在 X 处的单位切线向量,圆弧和切线在每一步都是变化的。虽然 QST 路径比 LST 更为合理,但对于 QSTN 方法,QST路径在收敛速度和成功机率上的优势并不显著。