1、 分子仿真及在生物工程上之应用第一章绪论1.1 课题研究背景环糊精葡萄糖基转移酶从淀粉和其它 a-l,4- 葡聚糖合成非还原性的的麦芽低聚糖即环糊精。环糊精有三种主要的类型,分别是由6,7 和 8 个。(1-4)糖昔键连接的。cD、p-cD 和 Y-cD。环糊精是一种具有内疏水外亲水的筒形结构,因此它们能与许多疏水客体化合物或功能基团形成包合物从而改变其物理或化学性质。环糊精这种独特的性质使其在食品、医药、农业、化妆品、化学环保等领域有广泛的应用 ll。随着生物技术的不断发展,以淀粉为原料、利用 CGTase 生产 CD,不仅可以充分利用我国丰富的淀粉资源,同时还可以减少环境污染和节约能源。C
2、GTase 作为生产 CD 过程中最重要的酶,是提高 CD 质量,降低 CD 生产成本的关键。随着环糊精的应用越来越广,生产环糊精所必需的 CGTase 已经成为当今研究的热点,受到人们的广泛关注。环糊精葡萄糖基转移酶于 1891 年被Villle 玛所发现, 1939 年被 Tilem 和 Hudson 所证实,并命名为环状糊精糖基转移酶2。到目前为止,很多细菌都被证实能产生cGTase,其中能产生 eoTase 的细菌主要有五类 :(l)好氧、嗜温细菌,如刀 acizzu,maeeran 、,B.me gaterium、B.cereus、B.ohbensis、Klebsiella Pneu
3、moniae、Kotoca、 Mierococ cusluteus 等;(2)好氧、嗜热细菌如Bstearorherm 叩 hilus:(3)厌氧、嗜热细菌如如 rigenes;(4)好氧、嗜碱细菌,如 B.circulan、,丑 acillussp.AL-67 等;(5)好氧、嗜盐细菌如B.halOPhilus。不同来源的 CGTase 性质差异很大,现将部分细菌所产的 CGTase 的性质比较如表 1,1 所示。来自不同微生物的CGTase 酶氨基酸序列的相似性程度从 47%到 99%不等,表 l 一 2 所列为来自不同芽抱杆菌的 CGTase 酶的氨基酸数目以及合成环糊精的主要类型#。表
4、 1 一 2 中的数据表明,即使属于同属的微生物,不同菌种所产的 CGTase 酶合成环糊精的主要类型差别很大。虽然不同菌种产的 CGTase 酶的氨基酸个数基本相同,但各菌株 CGTase酶的氨基酸序列相似程度差别也很大,而且序列相似程度的大小与CGTase 酶的类型没有直接相关性。1.1.2 环糊精葡萄糖基转移酶的作用CGTase 酶属于 a-淀粉酶家族,是淀粉降解酶中重要的组成成员。CGTase 酶是一种多功能型酶,与 a-淀粉酶家族的其它淀粉降解酶不同,CGTase 酶的水解活性较低,催化性质非常独特,它能催化四种不同的反应:三种转糖基反应(歧化反应、环化反应和偶合反应)和水解反应。可
5、以用式 G(n)+G(m)=G(-x)+G(n,十 x)来表示图 1-1 中的cGTase 酶催化的转糖基反应。式中 G(n)、G(m) 分别表示由 n 和 m个葡萄糖单元组成的供体和受体低聚糖分子。CGTase 酶的四种催化反应如下: 水解反应则是将直链淀粉分子切断,然后两段均转移到水分子上,CGTase 酶具有轻微的水解活性。淀粉水解为 CD 的速度一般为 CD 的环化反应速度的万分之十五左右。这四种反应的机理基本相同,仅仅是受体分子不同。cGTase 酶在表观上是一种从淀粉分子的非还原末端开始降解的外切酶,不能跨过支化点,但是,在分析 CGTase 酶作用于分子量较大的底物( 直链淀粉)
6、 生成大元环时,发现其采用的是内切方式,而 CGTase 酶在表观上显示为外切方式主要是由于采用低分子量或者高度支化的淀粉或糊精作为底物,这些底物比高分子量的直链淀粉更容易发生反应。CGTase 酶能通过环化反应利用淀粉生产环糊精,这是其工业应用的基础。cGTase 酶也能通过偶合和歧化反应获得,先将淀粉或环糊精转化为单糖、双糖或低聚糖,然后将这些糖分子作为供体转移到各种受体分子上,从而改善受体分子的性质,如 CGTase 酶催化低聚糖转移到蔗糖或果糖上可以制备具有难蚀性的偶合糖,催化甜菊普、橙皮普、芸香普、L 一抗坏血酸、鼠李糖等进行糖基化,能显著提高这些物质的使用性能。上述产物中,甜菊营是
7、一种带苦味且溶解度较低的化合物,通过糖基化反应能减少甜菊营的苦味并且增加其溶解度;橙皮普是维生素 P 黄酮类化合物之一,难溶于水,它与低聚糖经 CGTase 酶转糖普作用后生成的 a 一葡萄糖基橙皮普的水溶性大大提高,而且产品无毒、无臭无味,可用于食品、医药和化妆品等领域;新橙皮营和柏皮普采用同样的方法处理也可以显著提高它们的水溶性和减少苦味;芸香营转化为 a 一葡萄糖基芸香昔后,水溶性提高了近 3.1 倍,而它作为绿色染料的性能却没有变化;L 一抗坏血酸 (维生素 C)的稳定性差,在水溶液中很容易氧化,它与低聚糖的混合物在 CGTase酶转糖营作用下生成葡萄糖基-L-抗坏血酸后,产物稳定性明
8、显提高。第二章理论基础和计算方法分子动力学是研究由众多原子组成的系统一非电子系统,原子的运动规律一般可以用牛顿第二定律描写,而相互作用非常复杂,可以采用第一原理计算,对于蛋白质分子,现在更多地采用经验势,以加快计算速度。为此我们采用了由伊利诺伊香槟分校(University of Illinoisaturbana Champaign)的生物物理组开发的 NAMn 程序,采用全原子 cHARMM 势场。下面将分别介绍研究所用到的主要理论和方法,为后续章节的研究提供必要的基础。2.1 分子动力学分子动力学从原子的位置、键接方式、各种势能函数、原子的速度计算出体系的总能量。然后计算各个原子在该力场中
9、的势能梯度。每个原子在分了力场中所受的力计算出来以后,按照牛顿第二定律.就可以计算原子的运动行为,通过运动方程的积分过程,得到一个多体问题的解,和在相空间(即原子的位置及动量坐标的空间) 中的运动轨迹。然后通过统计力学可以求得相关的宏观物理量。NAMD开发工作由美国伊利诺伊大学香槟分校的 K.Schulten 小组完成,曾获 2002 年度 Gordon Bell 奖,目的是生物大分子系统的大规模模拟。它基于 C+十为基础的 CHARMM+并行支持库,高端硬件平台上可以保持较高并行效率直到数千个处理器规模。NAMD 最有特色的地方是通过 CHARMM+实现了动态负载平衡,能够很容易地扩展到数百
10、乃至数千个处理器上运行,效率却不会下降太多。2003 年度诺贝尔化学奖得主 peter Agre 和 Roderiek Mae Kinnon 的细胞膜水通道选择透过性的分子模拟研究,就是应用 NAMD 进行的。对较大规模分子体系在大量处理器上的有效模拟是它相对于其他分子动力学软件包的一个优势。第三章 分子模拟能量优化的研究. 37-573.1 概述 .373.2 测试能量函数描述.37-403.3 能量优化. 40-523.4 实验结果比较及分析 .52-543.5 本章小结 .54-57第四章 CGTase 蛋白质高温解折叠. 57-834.1 概述. 57-584.2 方法. 58-604
11、.2.1 模型建立. 584.2.2 等温动力学方法. 58-594.2.3 计算参数的设置. 59-604.3 常温常压下 CGTase 的构象. 60-654.4 结果与讨论 .65-814.5 本章小结. 81-83第五章 盐桥与 CGTase 蛋白质耐热性. 83-1015.1 概述. 83-845.2 方法. 84-865.3 结果与讨论. 86-1005.4 本章小结. 100-101结论耐热酶的耐热机制及分子模拟中能量优化是当前蛋白质和分子模拟研究中的重要课题。目前国际上有很多大的课题组在进行相关的计算生物方面的研究,他们的相关的基础工作包括软件的编写大多已经系统化,而国内相关的
12、课题组相对较少,并且研究的进展也一般较落后。论文中用分子动力学模拟方法对蛋白 CGTase 的结构进行模拟研究,并且根据我们的需要编写了算法优化程序及部分数据处理程序。具体研究内容是:将改进的群体智能优化算法应用于蛋白质动力学模拟前的能量优化过程计算、野生型 CGTase 高温解折叠的分子动力学模拟和野生型 CGIase 的局部结构变化对蛋白质整体结构的热稳定性的影响的分子动力学模拟。在模拟之前对体系的能量优化是否合理直接影响着后面的模拟结果。如何优化能量计算算法一直是分子模拟中一个至关重要的课题。由于局部最优的数目随着分子大小是呈指数增长的,导致了势能函数的全局最优搜寻的困难。群体智能优化算
13、法是一种模拟生物群体行为的演化计算方法,其中 QPSO 算法是在深入研究 PSO 算法的基础上提出的一种具有寻优过程更简单、控制参数更少、收敛速度更快的算法,针对能量优化的算法易早熟收敛和受维度约束的缺点,将 QPSO 算法改进并应用于蛋白质分子动力学模拟前的能量优化过程,有效地提高了寻优能力。蛋白质解折叠问题除了利用一系列实验技术研究以外,计算机模拟具有不可替代的作用。分子动力学模拟是在原子水平上研究分子体系的运动过程,利用分子动力学模拟软件研究蛋白质折叠/解折叠,成为近年来的研究热点。由于 CGTase 的体外解折叠的不可逆性,更加增加了实验的研究难度。本文利用 NAMD 软件包,CHAR
14、MM力场及 VMD 可视化软件,以来源 Bacillu、maceran 、的 CGTase 为对象,研究了高温对 CGTase 解折叠过程中结构变化的影响及结构内部分子间联系的变化,进一步了解其结构一热稳定性之间的关系。进一步完善对生物分子的结构分析,由于影响蛋白质耐热性的因素有很多,需要进一步研究其它的影响机制。并用于研究其它典型蛋白质的分子内相互作用的结构特征和进化特征。对耐热家族的其他成员的耐热性及结构展开研究,进一步提高对耐热家族酶的耐热进化的认识。使得改造后的蛋白质相较于天然的蛋白质分子具有更好的生物功能和使用价值。同时由于模拟结果具有一定的随机性,这些结果需要密切结合实验进行验证,这方面还需进行很多工作。