Amber 教程.doc-道客多多_道客多多docduoduo.com

资源描述

1、研究案例一种稳定蛋白质的全部原子结构预测和折叠模拟这段教程展示的是一个研究实例，像您演示如何重现下述文章中的研究工作： Simmerling, C., Strockbine, B., Roitberg, A.E., J. Am. Chem. Soc., 2002, 124, 11258-11259 (http:/dx.doi.org/10.1021/ja0273851)我们建议您在开始本教程前首先阅读上述文章，获得该蛋白的氨基酸序列及其他有用信息。警告 1: 本教程中的一些计算耗时很长，我使用了由 16 个 1.3GHz cup 的 SGI Altix 进行了 27 小时计算才完成整个工作，因

2、此如果您没有足够的计算能力，我强烈建议您在重复本教程的过程中使用我为您提供的 out 文件，以使得您能够流畅地完成整个教程。警告 2: 如果您重复本教程，我们并不能保证您能够精确地重现我的计算结果，在计算过程中，不同结构的计算机会产生不同的近似误差，从而使得计算过程搜索的是相空间的不同部位，但是模拟的平均结果是大致相同的。另外，尽管您完全重复了本教程也有可能无法获得论文中给出的结果，而且即便是我们自己也无法保证论文中的结果能够重现，这可能是因为我模拟的时间不够长，获取的仅仅是一个局部最小点，但是尽管如此，本教程的工作还是展示了蛋白折叠中一些有趣的行为。背景这篇论文应用 AMBER FF99 力

3、场和经典的全原子动力学对一个肽的折叠过程进行了模拟。模拟的对象“trpcage“是一个由 20 个氨基酸构成的小肽，华盛顿大学的 Andersen 已经对这个蛋白做过了结构优化，它是现在已知最小的能够显示两种不同折叠状态的蛋白，而且这个蛋白在室温下可以稳定存在。该蛋白的小身量使得它成为模拟蛋白质折叠的绝嘉对象。当最早的关于这个蛋白的折叠的计算结果出炉时，对这个蛋白结构的实验测定还没有完成，所以整个模拟过程是在没有实验数据作为指导的情况下完成的。当蛋白的结构经由实验手段测定之后，人们惊喜地发现，计算机模拟的结果与实验测定的数值之间的 RMSD 值仅为 1.4A。考虑到整个模拟过程是从蛋白的一级结

4、构开始并且完全没有同源蛋白作为参考，这样的一个计算结果是非常精确的。本教程中，我们试图重复论文中的结果，计算的设定都与论文非常接近，只是由于计算能力的限制，在教程中我们只进行一个 50ns 级的模拟。这已经足够重见蛋白质折叠的结果了。在这里必须提醒的是，由于模拟过程的长度所限，在不同的计算机，或在处理器数量不同的情况下，计算的结果将会是不同的。这是由分子动力学模拟的方法决定的，实施过程的细微变化或者浮点计算中舍入的变化都意味着由不同的计算机进行采样的动力学轨迹会随着时间的流逝发生不可预知的分化。这并非误差或者程序的 bug，也并不意味着某一个模拟过程比其他的过程更合理。这仅仅意味着不同的模拟过

5、程搜索的是相空间的不同区域，如果我们平均一下模拟的结果，或者运行更长时间的动力学过程，我们会在不同的机器上得到完全相同的结果，他们之间仅仅在过程上有所不同。因而我们说在本教程中我们很难精确的再现论文中的结果，但是我们试图重新创造那个重要的结果，即用 AMBER 程序来预测一个20 氨基酸的小蛋白的空间结构是可以完成的。那么记住这一点，让我们开始吧第一步：构建起始结构在以往的教程中，我们要么有一个可用的晶体结构，要么可以通过程序生成一个已经初步优化的结构。而在这个教程中我们要用的结构太复杂，没法通过手画的办法完成，同时我们也没有一个可用的 PDB结构，因此我们就需要构建一个线形的肽链，非常幸运的

6、是，在 LEAP 中有一个命令可以完成这个工作，就是 sequence。蛋白的一级结构序列在所列论文中可以查到，如下所示:NLYIQWLKDGGPSSGRPPPS这是用单字母符号显示的蛋白质一级结构序列，在 Leap 中使用之前我们需要将其转换成标准的三字母表示下面的表格给出了单字母表示和三字母表示之间的转换关系：单字母与三字母的转换 conversionGPAVLIMCFYWHKRQNEDST甘氨酸 (Gly)脯氨酸 (Pro)丙氨酸(Ala)缬氨酸(Val)亮氨酸 (Leu)异亮氨酸 (Ile)蛋氨酸 (Met)半胱氨酸 (Cys)苯丙氨酸 (Phe)酪氨酸 (Tyr)色氨酸 (Trp)组

7、氨酸 (His)赖氨酸 (Lys)精氨酸 (Arg)谷氨酸盐 (Glu)天冬酰氨 (Asn)谷氨酸 (Glu)天冬氨酸 (Asp)丝氨酸 (Ser)苏氨酸 (Thr)那么上述序列可以转写为：ASN LEU TYR ILE GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO SER但是这还没有结束，LEaP 不能自动识别序列的两端，所以我们必须手工为这个序列标定 N 末端和 C末端，标定的方法就是在 N 末端氨基酸前方加上 N，C 末端氨基酸前方加上字母 C。最终在 LEaP 中使用的序列如下：NASN LEU TYR ILE

8、GLN TRP LEU LYS ASP GLY GLY PRO SER SER GLY ARG PRO PRO PRO CSER下面启动 xleap 并调用 ff99 力场:$AMBERHOME/exe/xleap -s -f $AMBERHOME/dat/leap/cmd/leaprc.ff99(使用 xLeap 的时候一定要记住要关闭 Num Lock 键！否则工具栏会无法使用)下面使用 sequence 命令来建立蛋白的起始结构 (如需了解 sequence 命令的详细情况可以在 Leap 中键入: help sequence). 注意：为了版面设计的需要，下面将命名分为三行显示，实际

9、上您必须将所有内容在一行内输入，其间不能回车。TC5b = sequence NASN LEU TYR ILE GLN TRP LEU LYSASP GLY GLY PRO SER SER GLY ARGPRO PRO PRO CSER 我们需要的起始结构就放在 TC5b 中我们可以使用 edit 命令来观察这个结构。edit TC5b现在我们获得了一个线形的蛋白质序列作为起始结构，但是在这个起始结构中很多原子是相互抵触的，所以在进行分子动力学模拟之前我们要对这个结构首先进行短时间的优化。我们暂时将 Unit 中的这个结构存成一个.lib 文件，这样在之后的操作中，我们只要调用这个 lib 就

10、可以简单地取出起始结构，同时我们还要将这个结构存成一个 PDB 文件，以便直观地进行观察。saveoff TC5b TC5b_linear.libsavepdb TC5b TC5b_linear.pdb(TC5b_linear.lib, TC5b_linear.pdb)第二步：创建 prmtop 和 inpcrd 文件我们已经有了起始结构，下一步的工作是创建 prmtop 以及 inpcrd 文件。在进行这一步之前我们需要首先确认我们使用的参数和文献中报道的是一样的，在论文的第三段讲到：We initiated our simulations using only the trpcage TC

11、5b2 amino acid sequence (N20LYIQWLKDGGPSSGRPPPS39), with an extended initial conformation built by the LEaP module of AMBER version 6.0.4 All molecular dynamics (MD) simulations were fully unrestrained and carried out in the canonical ensemble using the SANDER module, which we modified to improve pe

12、rformance on the Linux/Intel PC cluster that was used for all calculations. The ff99 force field5 was employed, with the exception of phi/psi dihedral parameters which were refit6 (see Supporting Information) to improve agreement with ab initio relative energies7 of alanine tetrapeptide conformation

13、s. Parameters were not fit to data for the trpcage. Solvation effects were incorporated using the Generalized Born model,8 as implemented9 in AMBER.文献显示，他们首先建立了一个线形的起始结构，这一步我们已经完成了，之后他们运行了没有限制的恒温动力学模拟过程（即正则系综中的模拟）在动力学过程中他们使用了广义波恩近似来模拟溶剂效应的影响。AMBER 程序可以支持很多不同的广义波恩模型，在这些模型中最先进的是由 A. Onufriev, D. Bashf

14、ord 和 D.A. Case 等人开发的改良 GB 模型，这个 GB 模型使用了模型 II 的半径 (IGB=5) 具体可以参考 AMBER 用户手册的 GB 模型一章。在论文中，他们没有使用特殊的 GB 模型，这是因为在那时 AMBER 程序中只有 IGB=1 这个设定可用。为了使我们的教程尽可能接近文献报道，我们也使用 IGB=1 的设定。由于 Leap 默认的设定就是 IGB=1，所以我们无需专门对此作出设定。论文中还声明他们使用了 FF99 力场，这与我们之前设定的是一样的，但是他们的立场有改进的 phi/psi 二面角参数，这是对 FF99 立场中 phi/psi 二面角参数的一种

15、校正，可以更好的模拟蛋白质中 alpha 螺旋的结构。为了更好地重复文献中的工作，我们需要建立一个包含上述修正的参数文件。但是比较麻烦的是，文献中并没有明确给出那些参数做了如何的改变，仅仅给出了一个修正后的parm99.dat 文件。出现这种情况的原因我认为可能是 AMBER6 本身不带 FF99 力场，在当时存在很多不同的版本，文献的作者为了让人们了解他们使用的是官方版本的 FF99 力场所以在论文中展示了 parm99.dat 文件。但很不幸，ACS 以 PDF 文件格式给出了这个文件，这使得我们很难直接使用这个文件。幸运的是，在 AMBER8 版本中，给出了这个修正的力场，位于下述路径：

16、$AMBERHOME/dat/leap/parm/ as frcmod.mod_phipsi.1. 下面我也列出了文件的内容，以备不时：frcmod.mod_phipsi.1from Simmerling, Strockbine, Roitberg, JACS 124:11258, 2002. Modifies parm99.MASSBONDANGLDIHEDRALN -CT-C -N 1 0.700 180.000 -1.N -CT-C -N 1 1.100 180.000 2.C -N -CT-C 1 1.000 0.000 1.NONB如你所见，只有三个二面角参数发生了变化，所以我们只需

17、要打开 xLEaP，读取这个文件，其中的参数就会自动覆盖原有的参数。如果现在你已经关闭了 xLEaP，可以重新打开并调入蛋白质结构： $AMBERHOME/exe/xleap -s -f $AMBERHOME/dat/leap/cmd/leaprc.ff99loadoff TC5b_linear.lib然后调入修正的二面角参数：loadamberparams frcmod.mod_phipsi.1下面就可以存储我们的 prmtop 和 inpcrd 文件:saveamberparm TC5b TC5b.prmtop TC5b.inpcrd下面是生成的输入文件 TC5b.prmtop, TC5b

18、.inpcrd第三步：预优化蛋白质.在运行分子动力学模拟之前我们必须对起始结构进行短时间的优化，这样的话我们的体系就不会因为局部能量的聚集而在动力学过程中出现问题。结构优化的过程会整理整个分子结构，重新修整氢的位置，这样的过程之后我们的动力学模拟会比较稳定。下面是结构优化的输入文件:min1.inStage 1 - minimisation of TC5b&cntrlimin=1, maxcyc=1000, ncyc=500,cut=999., rgbmax=999.,igb=1, ntb=0,ntpr=100/我们总共运行 1000 步优化过程，其中 500 步为最陡下降法(ncyc=50

19、0) ，然后紧跟 500 步共轭梯度法(maxcyc-ncyc)。这样的设置已经足够充分地释放聚集在起始结构中的能量。需要提醒的是我在输入文件中设置了非常大的截断值(cut=999. angstroms)，这样设置是因为我们使用了非周期模拟(ntb=0) ，故而我们没有使用 PME 方法，也就不会出现长程的静电相互作用。如果使用了 PME，推荐的截断值是 8 埃，在这样一个范围内实际上模拟的主要是范德华相互作用。但是如果不使用 PME 而设置截断值的话，范德华相互作用和静电相互作用都在截断值的范围内被截断了，所以在没有使用 PME 方法的状况下，最好要将截断值尽可能设大。需要提醒的是，模拟的

20、耗时是与截断值的平方成正比的，（参见教程一的 5.1.2 节）所幸我们模拟的体系非常小，足够承受没有截断值(cut=999)的计算。基于同样的原理我们将 rgbmax 也设置为 999 埃，这个参数控制了在计算非键相互作用过程中列用于计算有效波恩半径的粒子对的最远间距。这个值设定的越大，计算的结果就越好，当然也就需要花费越多的计算时间。考虑到我们面对的体系只有 20 个氨基酸残基我们可以把所有的粒子都纳入到有效波恩半径中来，所以我们设定的 rgbmax 远远大于计算的尺度。.下面开始运行优化过程:$AMBERHOME/exe/sander -O -i min1.in -o min1.out

21、 -p TC5b.prmtop-c TC5b.inpcrd -r min1.rstInput Files: TC5b.prmtop, TC5b.inpcrd, min1.inOutput Files: min1.out, min1.rst在 16 个 1.3GHzCPU 的 SGI Altix 上这个过程需要 3.5 秒完成为了直观的比较优化前后的结构，我们生成一个 pdb 文件 :$AMBERHOME/exe/ambpdb -p TC5b.prmtop min1.pdb将优化前后的两个文件打开(min1.pdb and TC5b_linear.pdb)你可以选择任何可用的显示软件，比如VMD

22、起始结构用蓝色显示，优化后的结构用黄色显示。如你所见，优化过程并未造成主链结构太大的变化但是色氨酸和酪氨酸残基发生了比较明显的移动，这些能量热点集中的区域有可能在我们开始分子动力学模拟之后带来麻烦，如果你不相信，可以用未经优化的结构跑一个动力学过程看看，肯定飞！第四步：体系加热.接下来我们要在这个体系中正式开始分子动力学模拟，首先我们要分 7 步花费 50ps 时间对体系进行升温模拟。将升温过程分为 7 步完成可以在每一步升温之后维持一段时间，以免一次升温造成体系能量聚集最终跑飞，另外一种可行的方法是对升温过程加一个权重限制。您可以参阅 AMBER 用户手册以获取更多信息。一般而言我们升温的最

23、终目标是室温即 300K 但是为了重复文献的运算我们选择325K：MD simulations of 100 ns were performed at 300 K, but all were kinetically trapped on this time scale, showing strong dependence on initial conditions and failing to converge to similar conformational ensembles. We therefore increased the temperature to 325 K.文献认为必须将

24、体系加温到 325K 进行模拟，否则有可能使模拟的结果最终落入局部最小点，所以我们也做同样的设定。但是你必须牢记更高的模拟温度会导致体系中各化学键发生更加显著的振动，这意味着如果你打算做一个 600K，以 2fs 为步长的动力学模拟，你就要考虑一个应用了 shaken 的 300k效果会与之相同，但 600K 的模拟却要临步长过大的问题，过大的步长会导致体系不稳定。还好 325K不算太高，还比较接近常用的 300K，2fs 的步长可以处理含氢的键的振动。可是假如我们要在 400K的条件下运行动力学模拟的话，那模拟的步长就要缩减到 1.5fs。我们的起始结构是手工搭建的，不是通常常见的来自实验的

25、晶体结构，所以我们的体系在模拟的开始阶段要面临不如晶体结构稳定的问题。为了让我们的体系能够在可控制的状况下来释放能量，在模拟起始的升温阶段我们选择步长为 0.5fs，进入相对稳定的生成相之后，我们再选择常规的 2fs 步长0.5fs 的步长确实有些矫枉过正，但是保证体系的安全毕竟还是最重要的。我们进行升温模拟的方案如下：第一阶段 - 10,000 步, 步长 0.5fs (共 5ps), 起始温度 0.0K, 结束温度 50.0K, 温度耦合系数 1.0ps第二阶段 - 10,000 步, 步长 0.5fs (共 5ps), 结束温度 100.0K, 温度耦合系数 1.0ps第三阶段 - 10

26、,000 步, 步长 0.5fs (共 5ps), 结束温度 150.0K, 温度耦合系数 1.0ps第四阶段 - 10,000 步, 步长 0.5fs (共 5ps), 结束温度 200.0K, 温度耦合系数 1.0ps第五阶段 - 10,000 步, 步长 0.5fs (共 5ps), 结束温度 250.0K, 温度耦合系数 1.0ps第六阶段 - 10,000 步, 步长 0.5fs (共 5ps), 结束温度 300.0K, 温度耦合系数 1.0ps第七阶段 - 40,000 步, 步长 0.5fs (共 20ps),结束温度 325.0K, 温度耦合系数 1.0ps下面是第一阶段的输

27、入文件：heat1.inStage 1 heating of TC5b 0 to 50K&cntrlimin=0, irest=0, ntx=1,nstlim=10000, dt=0.0005,ntc=2, ntf=2,ntt=1, tautp=1.0,tempi=0.0, temp0=50.0,ntpr=50, ntwx=50,ntb=0, igb=1,cut=999.,rgbmax=999./其他六个阶段的输入文件与之非常接近，只需要改变一下相应的温度就可以了，可以从此处下载现成的输入文件： (heat2.in, heat3.in, heat4.in, heat5.in, heat6.in

28、, heat7.in).下面是一个运行升温模拟的 PBS 脚本，你也可以根据你的系统自己写一个脚本。#PBS -l ncpus=16#PBS -l walltime=500:00:00#PBS -l cput=2000:00:00#PBS -j oesetenv AMBERHOME /usr/people/rcw/amber9cd rcw/initial_heatingmpirun -np 16 $AMBERHOME/exe/sander -O -i heat1.in -p TC5b.prmtop -c min1.rst -r heat1.rst -o heat1.out -x heat1.m

29、dcrdgzip -9 heat1.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i heat2.in -p TC5b.prmtop -c heat1.rst -r heat2.rst -o heat2.out -x heat2.mdcrdgzip -9 heat2.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i heat3.in -p TC5b.prmtop -c heat2.rst -r heat3.rst -o heat3.out -x heat3.mdcrdgzip -9 heat3.mdcrdm

30、pirun -np 16 $AMBERHOME/exe/sander -O -i heat4.in -p TC5b.prmtop -c heat3.rst -r heat4.rst -o heat4.out -x heat4.mdcrdgzip -9 heat4.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i heat5.in -p TC5b.prmtop -c heat4.rst -r heat5.rst -o heat5.out -x heat5.mdcrdgzip -9 heat5.mdcrdmpirun -np 16 $AMBERHOME/

31、exe/sander -O -i heat6.in -p TC5b.prmtop -c heat5.rst -r heat6.rst -o heat6.out -x heat6.mdcrdgzip -9 heat6.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i heat7.in -p TC5b.prmtop -c heat6.rst -r heat7.rst -o heat7.out -x heat7.mdcrdgzip -9 heat7.mdcrdecho “DONE“译者提供的 bash 脚本如下：#!/bin/bash#heatingsan

32、der -O -i heat1.in -p TC5b.prmtop -c min1.rst -r heat1.rst -o heat1.out -x heat1.mdcrdgzip -9 heat1.mdcrdsander -O -i heat2.in -p TC5b.prmtop -c heat1.rst -r heat2.rst -o heat2.out -x heat2.mdcrdgzip -9 heat2.mdcrdsander -O -i heat3.in -p TC5b.prmtop -c heat2.rst -r heat3.rst -o heat3.out -x heat3.m

33、dcrdgzip -9 heat3.mdcrdsander -O -i heat4.in -p TC5b.prmtop -c heat3.rst -r heat4.rst -o heat4.out -x heat4.mdcrdgzip -9 heat4.mdcrdsander -O -i heat5.in -p TC5b.prmtop -c heat4.rst -r heat5.rst -o heat5.out -x heat5.mdcrdgzip -9 heat5.mdcrdsander -O -i heat6.in -p TC5b.prmtop -c heat5.rst -r heat6.

34、rst -o heat6.out -x heat6.mdcrdgzip -9 heat6.mdcrdsander -O -i heat7.in -p TC5b.prmtop -c heat6.rst -r heat7.rst -o heat7.out -x heat7.mdcrdgzip -9 heat7.mdcrdmkdir initial_heatingcp heat1.out initial_heatingcp heat2.out initial_heatingcp heat3.out initial_heatingcp heat4.out initial_heatingcp heat5

35、.out initial_heatingcp heat6.out initial_heatingcp heat7.out initial_heatingcp heat1.mdcrd.gz initial_heatingcp heat2.mdcrd.gz initial_heatingcp heat3.mdcrd.gz initial_heatingcp heat4.mdcrd.gz initial_heatingcp heat5.mdcrd.gz initial_heatingcp heat6.mdcrd.gz initial_heatingcp heat7.mdcrd.gz initial_

36、heatingecho “DONE“在 16 个 1.3GHz CPU 的 SGI Altix 上，7 个步骤全部完成共耗时 7 分钟。下面提供了全部过程的输出文件，你可以分别下载，也可以下载最终的一个压缩文件。Heating Stage Output File Restrt File Mdcrd FileStage 1 heat1.out heat1.rst heat1.mdcrd.gzStage 2 heat2.out heat2.rst heat2.mdcrd.gzStage 3 heat3.out heat3.rst heat3.mdcrd.gzStage 4 heat4.out he

37、at4.rst heat4.mdcrd.gzStage 5 heat5.out heat5.rst heat5.mdcrd.gzStage 6 heat6.out heat6.rst heat6.mdcrd.gzStage 7 heat7.out heat7.rst heat7.mdcrd.gzComplete file set heating.tar.gz (5.2 Mb)将轨迹文件用 VMD 打开就可以看到在升温过程中究竟发生了什么。你可以看到体系随着温度升高开始折叠，我们对这一阶段的轨迹并不关心，观看升温过程主要的目的在于确认整个升温过程一切OK，没有发生什么意外。下图显示了升温过程结束

38、后肽链的结构:从这个结构我们看出，一些 alpha 螺旋已经形成了，但是这个结构距离最终的稳定折叠构像还有很长的路要走。第五步：生产相动力学模拟本教程分子模拟部分的最后一步是在 325K 条件下进行一个时间非常长的动力学模拟。在文献中他们做了 50ns 的动力学模拟，但是实际上我们看到的结果在模拟进行了 20ns 之后就已经呈现在人们面前了，之后继续进行的 30ns 模拟的意义仅仅在于说明之前的计算获得的就是一个稳定的结果。尽管文献的作者发现在模拟的最初 520ns 中蛋白就已经充分折叠，我们在本教程中仍然进行 50ns 的动力学计算，以重复文献的报道。“Two independent si

39、mulations converged to essentially identical families of structures after 5 and 20 ns.“我们将这个总时间长度为 50ns 的模拟分为 10 个阶段，每段 5ns，这样做是为了一旦系统崩溃，我们不会损失已经进行的所有工作。而且这样分开处理还可以保证每个输出文件和轨迹文件的大小都适合处理。这 10 个阶段的模拟我们会使用相同的输入文件，文件如下所示 :equil.inStage 2 equilibration 1 0-5ns&cntrlimin=0, irest=1, ntx=5,nstlim=2500000,

40、dt=0.002,ntc=2, ntf=2,ntt=1, tautp=0.5,tempi=325.0, temp0=325.0,ntpr=500, ntwx=500,ntb=0, igb=1,cut=999.,rgbmax=999./每一个阶段的模拟都会进行 250,000 步(由 nstlim 的取值决定)，步长为 2fs(由 dt 的取值决定) 即总共进行 5 ns 的模拟。请注意我们在模拟全过程中使用了 SHAKE(ntc=2, ntf=2)，我们使用了 Berendsen 恒温器来保证模拟过程中体系温度恒定(ntt=1)，另外由于我们的体系已经完成升温，并且保持稳定，所以我们选择了耦合

41、地更加紧密的恒温器(tautp=0.5)，这个恒温器的作用在于保持我们模拟的对象始终保持 325K 的温度。如同文献中所列，我们将模拟的温度设定在 325K，每隔 500 步书写一次输出文件和轨迹文件. 过于频繁地写入这些文件会产生非常巨大的文件，这是不容易处理的。按照我们进行的设定，每 5ns 的模拟会产生一个 35 Mb 的轨迹文件，对于我们的研究来说，500 步记录一次已经足够了。下面是进行生产相模拟的 PBS 脚本，您可以根据您系统的状况修改脚本。#PBS -l ncpus=16#PBS -l walltime=500:00:00#PBS -l cput=8000:00:00#PBS

42、-j oesetenv AMBERHOME /usr/people/rcw/amber9cd rcw/productionmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c heat7.rst -r equil1.rst -o equil1.out -x equil1.mdcrdgzip -9 equil1.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil1.rst -r equil2.rst -o

43、equil2.out -x equil2.mdcrdgzip -9 equil2.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil2.rst -r equil3.rst -o equil3.out -x equil3.mdcrdgzip -9 equil3.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil3.rst -r equil4.rst -o equil4.out -x

44、equil4.mdcrdgzip -9 equil4.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil4.rst -r equil5.rst -o equil5.out -x equil5.mdcrdgzip -9 equil5.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil5.rst -r equil6.rst -o equil6.out -x equil6.mdcrdgz

45、ip -9 equil6.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil6.rst -r equil7.rst -o equil7.out -x equil7.mdcrdgzip -9 equil7.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil7.rst -r equil8.rst -o equil8.out -x equil8.mdcrdgzip -9 equil8.m

46、dcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil8.rst -r equil9.rst -o equil9.out -x equil9.mdcrdgzip -9 equil9.mdcrdmpirun -np 16 $AMBERHOME/exe/sander -O -i equil.in -p TC5b.prmtop -c equil9.rst -r equil10.rst -o equil10.out -x equil10.mdcrdgzip -9 equil10.mdcrdecho “

47、DONE“在 16 个 1.3GHz CPU 的 SGI Altix 上全部的十段模拟共耗时 27 小时。下面是每一步模拟的结果输出，您可以下载这些结果，但是您需要注意每一个轨迹文件在压缩之后都有 13Mb 左右你可以将轨迹文件载入到 VMD 等看图软件中，提醒一下，你要首先解压缩这个轨迹文件，然后载入它，整个过程有可能需要花费一天时间，然后你就可以欣赏整个动力学过程了，如果你用飘带模型来显示的话会非常好看。下面是一个抓图：第六步：分析模拟结果下面我们要开始分析模拟的结果，我们要绘制模拟过程的温度、总能量、动能、势能变化曲线，这些信息可以从输出文件中获取，检查这些数据也可以让我们知道在动力学模

48、拟过程中有没有发生什么异常状况。我们可以看到，温度的曲线非常平滑，并且维持在 325K。动能和势能的曲线也一样，会在平衡位置比较平滑。这些曲线任何的突刺都暗示了我们的模拟过程发生了一些意外，我们就需要看看是不是用了不好的起始结构、太长的动力学步长或者不合适的参数等等。为了从输出文件中提取我们需要的数据，我们可以使用下述 perl 脚本： process_mdout.perl。用下面的命令我们可以把 10 个输出文件中的信息提取到一个文件中：mkdir analysiscd analysis/process_mdout.perl /heat1.out /heat2.out /heat3.out

49、/heat4.out /heat5.out /heat6.out /heat7.out /equil1.out /equil2.out /equil3.out /equil4.out /equil5.out /equil6.out /equil7.out /equil8.out /equil9.out /equil10.out下面这个文件是运行 process_mdout.perl 提取出来的信息： analysis.tar.gz (2.3 Mb)下面我们可以用一些图形化的数据处理软件如 xmgr 来分析动力学数据。xmgr 我们在教程 1 中使用过，当时也是用来绘制温度和能量数据的曲线。首先处理温度：温度升温相的温度结果正如我们所愿，温度非常平缓地在 325K 附近波动，升温相也显示为平缓的上升，没有突然的跃升。下面我们来看能量的状况，我们最感兴趣的是势能，我们可以找到势能最低的构像，把它作为标准的折叠模式，然后又可以得到一条 RMSd 的曲线总能量(黑色) ，势能 (红色)，动能 (绿色)看起来还不错，动能的曲线非常平滑，这从此前的温度曲线可以预测出来，因为温度与动能是直接相关的，所以温度稳定，动能也一定稳定。最初总能量和势能呈现减少的趋势，最终也趋于稳定，这表明我们的体系从最初的相对不稳定的状态折叠成一个稳定的状态，从图上我们能够比较明显地看到

展开阅读全文