1、X-ray衍射法解析蛋白质晶体结构,选择目的基因,合成 DNA 并连接标记,在表达系统中插入DNA,用亲和层析柱或其他方法纯化蛋白,蛋白质结晶,组织中提取蛋白,在培养物中大量生产蛋白,NMR色谱仪,蛋白质结构解析基本流程,X光衍射,蛋白质结构,数据分析,蛋白质晶体结构测定基本步骤,1 结晶2 数据收集与处理3 相角测定4 相角改进5 电子密度计算和解释6 修正,蛋白质的结晶,蛋白质结晶原理蛋白质结晶技术蛋白质结晶步骤蛋白质晶体,蛋白质结晶原理,溶液中存在的作用力有疏水相互作用、静电力、氢键作用力等,当吸引力与排斥力达到平衡时溶液处于稳定状态。当吸引作用增大,或分散的或排斥的相互作用减小时,分子
2、开始趋向与聚集状态。例如在液态环境中,如果生物大分子溶液很浓,没有足够的水维持其溶剂化作用,则分子可能聚集成非晶态沉淀,也可能结晶出来。,蛋白质结晶过程,注意:要使体系非常缓慢地趋向溶解度最小,从而达到有限的过饱和度。这样可以防止晶核形成过多,并且可以控制晶体生长速度,以获得质量较好的单晶。,晶核形成过程:是结晶过程的关键,条件合适的话,晶体进一步生长。晶体生长速度及形态受环境因素影响。,蛋白质结晶方法,常用的使蛋白质沉淀的方法是加入沉淀剂,这种方法是通过降低水的流动性来增加蛋白质的有效浓度。常用沉淀剂:聚乙二醇(PEG),盐(如硫酸铵)。另外一种方法:减小蛋白质分子间的排斥力或是增大他们之间
3、的吸引力。如加入有机溶剂,改变溶液的PH,温度等。,蛋白质的溶解性与盐浓度或其它参数关系的典型曲线。最好的晶体应该是在低于成核时过饱和度的条件下生长出来的。,蛋白质结晶方法,整批结晶法该方法的原理是瞬间将沉淀剂加入蛋白质溶液中,使溶液突然达到高度饱和状态。透析法,液液液扩散法气气相扩散法悬滴法坐滴法,气相扩散法,悬滴法使用带有空穴的盘子,蛋白质溶液的液滴悬挂在盖玻片的下方,盖玻片覆盖在密封有沉淀剂溶液的空穴上方。盖玻片的表面经过硅化处理以阻止液滴在玻璃表面的铺展。,这种方法是利用气相平衡的原理,使任何挥发性的组分在小液滴和大样品池间达到平衡,使蛋白质液滴中沉淀剂及蛋白质的浓度逐渐增加,达到过饱
4、和状态,最终析出晶体 非常适用于只有少量样品,却要筛选大量条件的情况。,蛋白质结晶步骤,样品准备纯化初步筛选条件优化以获得质量高的单晶蛋白质浓度沉淀剂的特性及其浓度 加入低浓度的一些影响结晶的特异性试剂。PH值及温度接种晶体!,晶体,晶体的X衍射及结构解析,1912年Von Laue, Friedroich及Knipping进行了著名的第一次X射线衍射实验 ,证明了晶体的根本特征即晶体内部质点在三维空间周期地排列。(衍射原理:将三维阵列作为天然光栅。)要研究晶体结构,首先要了解其几何性质,包括内部构造、晶面、对称性、空间群、不对称单位等。结构解析过程,晶体几何性质,点阵、晶胞、格子对称性晶面指
5、数不对称单位,晶体的点阵结构、晶胞、格子,点阵:为了更形象而简单的描述晶体内部物质点的周期性,把物质点抽象成几何点,称为结点,这些结点构成一个点阵。点阵是一组无限的点,连接其中任意两点可得一向量。将向量平移,当向量的一端落在任意一点阵点时,向量的另一端也必定落在点阵的另一个点上。点阵中的每一个点都具有相同的周围环境,每个点代表的具体内容(分子、原子、或离子)称为晶体的结构基元。,晶胞和晶格,从一个空间点阵结构中一定可以划出一个平行六面体,这一平行六面体称为晶胞。晶胞由晶体空间点阵中3个不平行的单位矢量a,b,c所规定,其大小形状用晶胞参数a,b,c,,表示。空间点阵按照确定的平行六面体单位划分
6、后,称为晶格。,晶格中的一个晶胞,晶格是晶胞在三维空间中的堆积,晶胞的分类、格子,根据晶胞参数的不同,我们可以划出七种基本晶胞。(每种晶胞根据其所含阵点个数的不同分为:素晶胞和复晶胞(又分为体心、面心和底心晶胞)。这样,所有的晶胞可分为14种不同的格子类型,称为布拉菲(Bravais)格子。,简单三斜aP简单单斜mP底心单斜mC(mA,mB) 简单正交oPC心正交oC(oA.oB)体心正交oI面心正交oF,R心六方hR 简单六方hP简单四方tP体心四方tI简单立方cP体心立方cI面心立方cF,晶体的对称性,对称理论几何学把具有对称形象的各个部分叫做等同图形,对称图形就是由两个或两个等同图形构成
7、的,并且很有规律的重复的图形。对称操作:对称图形中的等同部分通过一定的操作后与原图形重合。这些操作即为对称操作,如:旋转,倒反,反映,平移。对称元素:进行对称动作是所依据的几何元素(点、线、面等)。,七种对称操作和对称元素,(1)旋转操作旋转轴(2) 反映操作镜面(3) 反演操作对称中心(4) 旋转反演操作反轴(5) 平移操作点阵(6) 螺旋旋转操作螺旋轴(7) 反映滑移操作滑移面,旋转操作n旋转轴Ln,以一个假想直线为轴,绕此直线旋转一定的角度可使图形相同部分重合。直线称为对称轴,以L表示,分为n重旋转轴,其中n360/, 为旋转角度。受点阵结构的限制,晶体中只存在1,2,3,4,6几种旋转
8、轴,用L1, L2 ,L3, L4, L6 表示。,旋转轴 1.2.3.4.6重轴,垂直于图形平面方向具有三重对称轴的二维晶格 (每个黑三角表示一个三重轴),1,6,2,3,4,镜面m和倒反操作i,镜面:镜像关系 倒反:类似于相机(凸透镜)等大成像,旋转反演操作反轴Lin,旋转倒反,i,m,3i,3m,螺旋旋转操作螺旋轴nm,旋转平移(n为轴次,m为滑移量,mn),图:三重轴(左)和三重螺转轴(右);后者通过将一个分子旋转120后再平移半个晶胞距离与另一个分子相关联。,31,反映滑移操作滑移面g,反映平移,5种滑移面a,b,c,n,d,对称操作与对称元素总结,旋转轴,镜面,对称中心,反轴等对应
9、的对称操作至少有一个点不动,称为点操作。与点操作相应的对称元素能存在于无限结构中,也能存在于有限的晶体宏观外形中。因此宏观对称元素中只有七种最基本的对称元素。与点阵、螺旋轴、滑移面对应的对称操作每一个点都移动了,称为空间动作,只存在于无限的结构中,而不能存在于晶体的宏观外形中。,七个基本对称元素,对称中心(i)镜面(m)二重轴 2三重轴 3四重轴 4四重反轴 4六重轴 6,实际晶体中存在7种基本对称元素如下:,七个晶系,根据晶胞形状,也就是六个晶胞参数,以及晶胞中所容纳的特征对称元素,可以把不同的晶胞分成七个类型,即七个晶系。晶胞参数的特征是各个晶系的宏观表现,是区分七个不同晶系的必要条件但不
10、是充分的条件,只有特征对称元素是区分晶系的关键所在。,宏观对称元素32个点群,两个对称元素组合就会产生新的对称元素,在七个晶系中把特征对称元素与基本对称元素进行组合,就会产生32种不同的对称组合,就是32个点群。,微观对称元素、空间群,把所有类型的对称元素(7个宏观对称要素11种螺旋轴5种滑移面)与32个点群、14个格子,按照一定规则组合就可以得到230个空间群。,晶面指标,设有一平面点阵和3个坐标轴x,y,z相交,在3个坐标轴上的截数分别为r,s,t截数之比即可反映出平面点阵的方向。取h:k:l =1r:1s:1t,平面点阵的取向就用指标(hkl)表示。,晶体的空间点阵可划分为一组平行而等间
11、距的平面点阵。晶体外形中每个晶面都和一组平面点阵平行,可根据晶面和晶轴相互间的取向关系,用晶面指标标记同一晶体内不同方向的平面点阵族或晶体外形的晶面。,不对称单位,由于晶胞中有对称元素,所以不是整个晶胞内对象都是独立的,晶胞中最基本的独立单元叫不对称单位。不对称单位内的所有对象通过晶胞所具有的对称元素的操作可得到整个晶胞所包含的对象。一个晶胞可以有多种不同形状的不对称单位,但它们的体积是相等的,等于晶胞体积除以等效点数,几何晶体学总结:,结构解析,结构解析原理数据收集及初步处理结构修正结果分析,衍射数据,点阵信息,结构振幅分布信息,蛋白质序列,氨基酸的化学知识,结构相位信息,蛋白质三维结构,其
12、他信息,相位方法(Phasing Engineering),Fourier,Xray照射晶体获得衍射图,结构解析原理相位问题,用X衍射方法解晶体结构就是要知道晶胞中原子的分布也就是原子坐标。 Xray照射晶体获得衍射图;衍射图经denzo,scalepack处理我们可以直接得到: 蛋白质晶体的晶胞参数 衍射点的结构振幅但是相位信息不能直接得到。,结构因子的定义:就是一个不对称单位内各个原子对X_ray衍射贡献(包括相位差别)的和.用F表示结构因子是一个复数,具有振幅和相角;我们平常说的相位问题就是指结构因子的相角问题。,基本概念结构因子,从结构因子到电子密度图,结构因子的另一种表示方法:电子密
13、度的Fourier变换(与计算原子散射因子的方法一样)电子密度是结构因子的逆Fourier变换,Patterson函数,Patterson函数是电子密度分布的自卷积,可以由结构振幅来计算:Patterson函数可以用来对分子进行定位。(旋转搜索和平移搜索),Patterson函数,相位求解(Phasing)方法,同晶置换法(SIR/MIR)多波长反常散射法(MAD)分子置换法(MR)直接法,同晶置换法,同晶置换法,基本原理:,重金属原子结合到蛋白质晶体中有限的几个特异位点时将导致其衍射强度与母体蛋白质有一定的差别,利用这种差别,我们能够测定相位。,FPH = FP+FH,同晶置换法,使用同晶置
14、换法需要蛋白质晶体和至少一个和母体同晶的重原子衍生物晶体的X射线衍射图。 精确的同晶要求在母体晶体和衍生物晶体中蛋白质的构象和晶胞参数必须严格相同。这样,衍射图样和强度的差异就完全归结为附加的重原子的影响。 非同晶常表现为晶胞大小的改变或蛋白质分子由于重原子的结合而发生的构象变化。 重原子对晶胞大小的影响只要不超过dmin/4(dmin是分辨率),且衍射平均强度不随分辨率的变化而变化,就可以认为衍生物和母体同晶。,用同晶置换法解决相位问题,制备含重原子的蛋白质衍生物晶体收集母体蛋白和衍生物晶体的X射线衍射数据用Patterson函数确定重原子坐标修正重原子参数,计算蛋白质相角计算蛋白质电子云密
15、度*单对同晶置换法(Single Isomorphous Replacement Method, SIR),多波长反常散射法,反常散射简介,一般根据经典理论,假定入射线的频率远远大于原子的固有频率时,把原子中电子的束缚能看成很小,近似于自由电子。这对于大多数轻原子来说是正确的,但是对于重原子,特别是在入射线的波长靠近吸收限(absorption edge)时,由于原子中的电子具有束缚能,其散射能力与自由电子有差异。,修正:fanom. = f +f + if= f+if,反常散射法确定相角,多波长反常散射(MAD),Hendrickson证明对不大于150个残基的蛋白中存在一个Se元素(原子序
16、列34)对于成功地用MAD法解析结构已经足够(Hendrickson等,1990;Leathy等,1992) Hendrickson和他的同事(Hendrickson等,1988;Krishna Murphy等,1988)首先采用这种方法解得蛋白质结构(见Guass等,1988)基本原理:蛋白质晶体中反常散射的贡献是波长的函数,利用这种变化可以解决相位问题。,MAD的出现,许多波长可调的同步辐射光源被应用于多波长反常散射实验 蛋白晶体液氮(100K)低温技术的进展。这种技术进步一方面延长了晶体的寿命,使同晶性更好(所有数据的收集可以只用一个晶体);同时,又降低的对同步辐射光源的控制要求 重原子
17、衍生物的运用使得多波长反常散射法的应用范围扩大到晶体学的绝大部分领域 低背景、动力学范围高的CCD(Charge-coupled device)探测器的应用是数据收集过程更为有效,有实用的处理MAD数据的软件程序包,MAD应用概况 (截至1998年5月初),Met位点的引入,甲硫氨酸残基在蛋白中的平均出现频率为1/59。在某些情况下,甲硫氨酸位点太少,不能满足MAD或单对同晶置换解相角的需要。在计算假定的Se原子同晶或反常贡献之后,然后计算是否需要引入额外的甲硫氨酸位点。甲硫氨酸可以通过定点突变的方法引入到保守疏水位点。因为在自然界中,甲硫氨酸被亮氨酸和异亮氨酸替代的情况最为普遍,所它们可以作
18、为替代突变的目标,分子置换法,分子置换法,氨基酸序列同源的蛋白质,其多肽链有类似的折叠方式。分子置换法所要解决的问题是将已知蛋白质分子的结构从原来的结晶排列转移到结构未知的蛋白质晶体中去。 分子置换法对蛋白质序列同源性的要求一般要求大于30%,最好大于50%对于那些序列同源比较低,但结构同源很高的蛋白质家族,分子置换法任是有效的分子置换法包括两个步骤:选择一个好的模型分子旋转和平移。,旋转函数与平移函数,分子置换法,分子置换法中需要有一个已知的结构作为未知结构的模型分子。蛋白质序列的同源性是该模型是否合适的一种指标。旋转函数和平移函数的解不一定总能够直接得到。修饰模型可能是必要的,例如忽略侧链
19、或在模型中删除或增加一些结构,使用 X射线数据不同的分辨率范围。随着成功测定的蛋白质结构的数目急剧地增加,分子置换法成为蛋白质相角测定中极有效的技术。,相位质量的改善,溶剂扁平化方法(Wangs solvent flattening)分子平均化方法(Molecular Averaging),相位改善的指标:,能否产生一张可解释的电子密度图是判断相位是否得到改善的最好方法。,电子密度图的解释,电子密度图的计算和解释,5A分辨率的图可划分出分子边界,辨认螺旋,但一般很难跟踪肽链走向。中等分辨率的图上,可以跟踪肽链走向。辨认片层和芳香环侧链,根据一级结构建立分子模型。高分辨率的图,建立分子精细模型,
20、寻找水分子。,结 构 修 正,修正方法(refinement):刚体修正(rigid)立体化学制约的分子动力学修正模拟退火修正(stimulate annealing)最小二乘修正(minimize)计算约缺图(omit map),手工修正限制性温度因子修正各向同性、各向异性溶剂修正,修正的目标:调节初始模型,使按模型计算的结构因子振幅和实验测得的结构因子振幅尽可能的接近。用R因子表示 R(|Fo|-|Fc|) / (|Fo|) 大分子一般R在20以下就可以了,结构可靠性的检验,1.分子结构模型与电子密度图的符合情况,差值电子密度 没有突出的峰需要解释的2.R因子和Rfree3.立体化学偏差rms,键长0.015A、键角3以下,分子内 或分子间没有过近接触4.每个残基的值在Ramachandran图允许范围内5.残基的温度因子分布,侧链原子的平均温度因子大于主 链原子平均温度因子,处于表面的残基温度因子大于疏 水内核的残基温度因子。6.从luzzati图估计原子坐标误差,一般2A分辨率结构R因 子在20,原子坐标平均误差约在0.2A0.3A。,结 构 分 析,