1、第九章 DNA序列测定,第一节 概 述,一、DNA序列测定,即核酸DNA分子一级结构的测定,是现代分子生物学一项重要的技术。1963年,Sanger和Thompson等人第一次完成胰岛素51个氨基酸的序列测定,这在当时来说是一件了不起的大事。70年代后期,Sanger和Maxam-Gilbert等人又建立了核酸序列测定的方法,Sanger双脱氧末端终止法和Maxam-Gilbert化学裂解法将核酸序列测定技术推进到“直读”阶段,使核酸序列测定变得远比蛋白质氨基酸序列测定容易,这样人们可以通过核酸序列和遗传密码推导出蛋白质氨基酸的序列。,二、DNA序列测定工作原理,在四种反应体系中,寡聚核苷酸分
2、别终止于不同位置的A、T、G或C碱基,将待测DNA片段转变成一系列放射性核素标记的单链DNA片断,并使其一端为一固定的末端,而另一端由于长度不同,成为一系列相差1个碱基的连续末端。经电泳分离,放射自显影,可直接读出DNA的序列。,三、核酸序列分析的目的意义和策略(具体方法),(一)序列分析的目的,2种:1、确证性测序 通过测定对突变进行定位和鉴定,应用时测定野生型基因上同源区和突变体的相应序列直接在一张胶片上比较二者序列差异。(已知基因序列)2、从头序列 目的是提供一段DNA准确的核苷酸序列。(未知基因序列) (二)测定在生物医学领域相应应用,2个方面:1、对已知基因序列检查,特别是有遗传倾向
3、的病例检测相关基因有无突变,有助于阐明疾病发病机理及建立相应诊疗方案。2、对已经克隆的未知序列进行测定,从而阐明该基因的一级结构,如人类基因组计划中大量的工作是要阐明克隆片段的核苷酸的排列顺序。 (三)序列分析的策略(具体方案)测序目的不同或靶DNA片段大小有区别,则序列分析的具体方案有所不同,所以测序之前应根据相应情况制订序列测定的策略,这个问题在后面将涉及到,但由于学时限制,不可能完全展开来讲,请同学参看相关书籍。,四、测序的常用方法,DNA序列测定常用方法有如下3种:,不管是上述哪一种方法,测序基本过程如下:1、制备待测DNA序列模板;2、酶促或化学反应将其转变“等差数列”(n=1);3
4、、PAGE;4、读序。(P255,图10-2),五、测序的基本过程,六、测序技术的最近发展,1、商品化测序试剂盒 解决了质粒问题,节省了时间,但缺乏灵活性。2、自动化测序仪 以酶学测序反应或(和)放标测序产物为基础,微机处理。3、热循环测序 使极少数测序产物线性放大。4、测序商品化 60.-180.¥,搞定。,七、DNA序列测定的应用,分析基因组核苷酸排列序列 分析基因序列 基因定点诱变的基础 基因工程载体构建中DNA序列定位和排序的基础 确定DNA序列中蛋白质的编码区,第二节 Sanger双脱氧末端终止法,一、原 理,(一)DNA复制的4个基本条件1、ssDNA模板2、DDDP3、带有3-O
5、H末端的单链寡核苷酸引物4、4种dNTP (二)链终止剂(chain-reminator)-2,3-二脱氧核糖核酸酶当3-OH由于脱氧或被取代,下一个核苷酸不能通过5磷酸形成3,5磷酸二酯键,使链的延伸反应终止在这个异常的核苷酸处。如果用相同的4组引物-模板混合物,每一组加4种dNTP,其中1种用32P(或35S)标记,加1种ddNTP,每组将产生一种特异性的以ddNTP为末端的不同长度的核苷酸链,经PAGE分离,即可读出被测定的全部顺序(dNTP和ddNTP竞争结合底物)。(P255,图10-2),(三) Sanger双脱氧链终止法的原理,在DNA合成时,利用ddNTP与dNTP竞争掺入到新
6、生的DNA链上使链终止的原理。即在A、C、G、T 4种反应体系中,分别加入不同的ddNTP,其他试剂相同,经酶促合成反应,生成具有相同的5末端,而3不同的DNA片段的混合物。经电泳分离,放射自显影,直接读出DNA的核苷酸序列。,二、试 剂,(一)引物酶促测序反应中利用一个与模板特定序列互补的合成寡核苷酸作为DNA合成的引物。在许多情况下可将靶DNA片段克隆于M13噬菌体或噬菌粒载体,以取得单链DNA分子作为模板。也可用Sanger法测定变性双链DNA模板序列(如变性质粒DNA)。以上两种情况都可以采用能与位于靶DNA侧翼的载体序列相退火的通用引物,不必取得与未知DNA序列互补的引物。M13噬菌
7、体重组子的通用测序引物一般长15-29bp,与紧靠M13mp18多克隆位点区的HindIII或M13mp19多克隆位点区EcoRI位点的序列互补。这些引物同样也可用于PUC质粒的DNA进行“双链”测序,并且已经商品化。,(二)模板纯单链DNA和经过热变性或碱变性的双链DNA都可以用作Sanger法测定的模板。模板的质量和所用的DNA聚合酶的种类是至关重要的。通常采用M13噬菌体颗粒分离到的单链DNA模板效果最佳,用变性双链DNA作模板则难获此效果。小量制备质粒DNA常被寡核苷酸小分子,核糖核苷酸及DNA聚合酶抑制剂所污染,前两者可被用作随机引物,造成假象和强终止现象,使测序胶含糊不清。采用小量
8、制备质粒DNA测定未知DNA克隆片段的序列,并不可取,如果用CsCl-溴化乙锭梯度离心结果纯化质粒DNA,测序结果会好得多,但又耗费大量的人力和物力。,DNA序列测定模板制备方法因为DNA是相当大的分子,一般由几kb组成,最小的质粒和病毒也在1kb以上,而测序的最好方法,一次也只能测几百个bp(以300-500bp为好,300bp最佳),所以测序前,可以用2种限制酶消化待测DNA,使其降解成小片段,用琼脂糖凝胶电泳分离回收。回收片段,如果超过700-800bp,则进行第二次限制酶消化,再次分离回收。然后分别测定每个片段的顺序。由于两种限制酶在DNA链上的切点位置不同,产生的片段之间有交错重叠顺
9、序,据2片段的这种末端重叠现象,用计算机定出各片段的位置,而排出DNA的全部序列。在测序中,小片段DNA只需直接克隆到M13mp或者质粒载体中,进行双链或单链模板测序。现在常用的M13mp载体一般是成对设计,如M13mp18与M13mp19都有相同的多克隆位点,但方向相反。同一待测的DNA片段分别克隆到这两个载体中,用一通用引物进行测序。对于数kb大片段DNA分子,则有几种策略,如定向克隆,内部片段克隆,原位亚克隆,包含上述用2种限制酶消化DNA等。,1、用噬菌体M13克隆待测DNA片段1)噬菌体-是寄生在细菌的病毒。存在3种状态,有尾20面体,无尾20面体和丝状单链噬菌体(filamento
10、us),M13是一类雄性特异的大肠杆菌噬菌体,含单链环状的DNA。它感染细菌(宿主菌)呈溶原状态生长,在菌体内形成过渡阶段双链环状复制型DNA(Replicative form DNA,RF DNA),在适当的条件下,可以扩增至数百个拷贝。成熟的噬菌体成为单链(正链、RF则以正链为模板复制1条链,再以此链复制正链)分泌到培养液中。因此双链DNA(RF)可以按质粒提取方法从细菌细胞中制备,做为克隆所用的载体。从培养上清液提取成熟的单链DNA做为测序模板。在感染过程中,M13并不杀死细胞,但细胞的生长受到某种程度抑制。dsDNA复制又产生大量的ssDNA,它被1个外壳蛋白包装成成熟的噬菌体,在细胞
11、生长的过程中,子代噬菌体颗粒释放出来,这是M13不同于其他噬菌体的特点。每ml培养液沉淀的噬菌体可提取5-10mgssDNA,产量是很高的。用作克隆载体,M13有1个得天独厚的优点,即可产生大量含有外源DNA其中1条链的DNA分子,后者可在下列工作中充作模板:(1)末端终止法测序(2)制备“放标”单链用于杂交DNA探针(3)利用寡核苷酸进行定点诱变。,2)M13mp18和M13mp19载体(1)mp系列载体特点:都是从同一重组M13mp1改造而来。在基因II-IV(500bp,570bp左右)之间有1个多克隆位点(multiple cloning sites,MCS)可供外源基因插入。该区域(
12、MCS)插入了1小段Ecoli.DNA,有-半乳糖苷酶基因(LacZ)的调控序列及其N端146个aa编码信息,它与宿主菌(含LacZ)-互补,形成有活性的-半乳糖苷酶,使平板上底X-gal生色成蓝噬菌斑,当外源基因插入MCS,破坏了-互补,几乎无一例外生成无色(白)噬斑。这是一种非常有效的克隆筛选选择性标志。(2)M13mp18和M13mp19是一对载体,它们有相同的13个多克隆位点,但方向相反。(当RF DNA被两种限制酶切割后,M13mp18和M13mp19轻易不能重新环化,当连接混合液中含外源匹配末端dsDNA片段时方闭合成环,这一片段在二者中将以互为相反的两个方向插入。这样M13mp1
13、8正链中含有外源DNA的一条链,而在M13mp19正链中含外源DNA的另一条链)。所以M13mp18和M13mp19作为一对载体可用同一通用引物,(从所插入DNA片段任一端开始),测定互为相反两条链的DNA序列。(并可制备只与外源DNA任意1条DNA链互补的探针)。(分子克隆P202)。,2、定向连续次级克隆待测大片段DNA片段测定数kb的DNA序列时,可以建立一系列一端删切200-300bp的DNA片段次级克隆。对它们分别测序,就可以连续读出该大片段DNA的全部序列。核酸酶BAL31和核酸外切酶III,均可以达到连续删切的目的。核酸酶BAL31-是从乳白短杆菌(Brevibacterium
14、albidum)细菌中分离。它能以渐进的方式将线型DNA分子的3,5两端同时降解,形成小的寡核苷酸片段或单核苷酸。底物可以是带延伸末端的,也可以是平头末端的dsDNA,对3,5两端降解有同样性,此酶要求Ca2+作辅因子,以EDTA作螯合剂,可使该酶失活。BAL31还有较弱的单链特异内切酶活性,与核酸酶S1相似,降解ssDNA或ssRNA形成5磷酸末端的单或寡核苷酸酶片段,能从DNA片段中切除单链尾巴,产生平头末端。核酸酶S1是从米曲霉(Aspergillus Oryze)中分离的。外切核酸酶III-是一种从E.coli中分离,从dsDNA的3-OH末端降解产生5单核苷酸的外切酶。(此外,外核酸
15、酶III还有内核酸酶,RnaseH和3-磷酸酶的活性。,(三)DNA聚合酶 1、大肠杆菌DNA聚合酶I Klenow大片段Klenow大片段-DDDPI是由分子量109KD一条多肽链组成,此酶可被枯草杆菌蛋白酶分解成2个片段,1个片段分子量为76KD,有聚合酶,35外切酶活力,此片段称为Klenow片段,另一片段34KD,有5外切酶活力。此酶是末端终止法最早采用的酶,用它进行测序常常产生较高的本底和假带,催化链延伸反应的能力也较差,通常只能读出距引物250个核苷酸以内的序列。此酶价格便宜,容易获得,对于已知序列DNA次级克隆的鉴定仍有应用价值。 2、测序酶(Sequenase)测序酶是经过改造
16、的T7噬菌体DNA聚合酶,消除了35外切酶活性。活性非常稳定,具有很高的链延伸能力和极快的聚合反应速度,是测定较长DNA序列的首选酶。该酶及名称是HSB公司的专利。试剂盒已商品化。 3、TaqDNA聚合酶Taq酶用于序列测定,除具有很好的链延伸性能外,还可以在高温(70-80)进行反应的优点,因而能克服富含GC序列的模板形成自身二级结构对测定的影响,将PCR与末端终止法测序结合进行,只需少量模板。,(四)放射性同位素标记的dNTP传统32P-dNTP,由于32P衰变过程中产生高能的射线,导致放射自显影图谱条带扩散,分辨率低,限制了识读序列的数量。另外,由于32P对DNA样品辐射分解作用很强,通
17、常都在测序反应后24小时内上样电泳,否则无法得到满意的结果。-32S-dNTP近年来得到广泛使用,它解决了32P的两大缺点,具有很高的分辨率,较低的本底。测序反应产物-20保存一周并不明显影响反应结果。,(五)用于测序的变性凝胶电泳胶长40cm,厚度均匀48%丙烯酰胺7mol/L尿素,三、Sanger法测序主要反应(实习讲义P138),(一)制胶 (二)模板变性(双链) (三)测序反应1、模板引物退火2、链延伸、链标记、链终止反应3、上样电泳4、读片(序) (分子克隆P640)(必须经过实践才能获得技巧),四、大片段DNA的测序方法(一)随机法超声波处理:将DNA随机断裂成一组相互重叠的300
18、900bp片段,电泳回收300600bp片断作亚克隆DNaseI切割:将DNA随机切割成一组相互重叠的片段,作亚克隆限制酶消化:限制酶将DNA切割为含粘端的DNA片段,作亚克隆将上述含不同子片段的亚克隆扩增后进行测序,(二)嵌套缺失法,1、将待测DNA与M13mp载体相连,构成重组体。2、用两种限制酶从待测DNA片段的一端与载体序列之间将DNA切断,产生线性DNA,使近待测DNA片段的一端为5突出末端,近载体一端为3突出末端。3、外切核酸酶从5突出末端消化待测DNA,37C时,每分钟水解250个核苷酸4、核酸酶SI去除残余单链,自我环化,转化或转染宿主菌得到次级克隆。5、将各克隆用于测序。,(
19、三)引物延伸法,是一种定向测序法,从DNA的3依赖特定引物延伸测定一段DNA序列,再根据测得序列设计新的引物,作下一延伸反应的引物,如此向前推进,最终测得DNA的全长序列。,第三节 Maxam-Gilbert化学裂解法,化学裂解(直读,Sanger双脱氧末端法也是直读法)法是Maxam和Gilbert等人1977年创建的,用来测定DNA序列。化学法是用化学试剂在A、G、C、T处特定地裂解DNA片段,产生一簇各种长度的短链(等差数列 n=1),经过PAGE和放射自显影后,可以直接读出DNA的顺序。某些试剂能修饰或破坏DNA链上特定核苷酸的碱基进而使N-糖苷键断裂,暴露出的糖环以-消除反应,在3和
20、5位上断裂磷酸二酯键。使戊糖脱落,用于嘌呤环的试剂是硫酸二甲酯,而联氨可用于肼解嘧啶环。4种核苷酸的特异裂解和鉴别方法如下:,一、化学裂解法测序的原理,1、用放射性核素标记待测DNA一侧末端 2、将标记DNA分为G、A+G、C+T、C 4个反应体系 3、用不同的化学试剂处理不同反应体系,随机断裂DNA片段某种碱基中的任何一个,产生一组一端为放射线标记的末端,另一端为不同大小的DNA片段的混合物 4、电泳分离,放射自显影得到互相错落的梯形图谱,即可读出DNA序列,表-特异断裂4种脱氧核苷酸的方法,在4种反应体系中,化学试剂特异地断裂DNA的机制是:G反应-硫酸二甲酯(DMS)使GN7甲基化,其后
21、断开了C8-C9间的化学键,哌啶置换了被修饰鸟嘌呤与核糖的结合。G+A反应-(哌啶)甲酸使嘌呤环上氮原子质子化,削弱了嘌呤脱氧核糖核苷酸和腺嘌呤脱氧核糖核苷酸的糖苷键,然后哌啶置换了嘌呤。T+C反应-肼断开了嘧啶环,产生碱基片段被哌啶置换。C反应-在NaCl存在时,只有C才能与肼发生反应,随后,被修饰的胞嘧啶被哌啶置换。,二、碱基特异性修饰及裂解,(一)限制酶消化待测DNA,得到长度为100-200bp的一组片段,纯化回收每1个片段作为测序材料。 (二)碱性磷酸酶处理消除5磷酸。 (三)多核苷酸酶催32PdNTP标记(5-OH)末端。 (四)使标记片段变性为单链。 (五)分成4-5个反应体系,
22、按上述程序(表或4个机制)化学处理,严格控制反应条件。(使得平均每1个DNA分子只有1个位置被断裂,这种断裂是随机的,如G反应,则在DNA链上任意位置G断裂),DNA链上每50-100碱基只有1个被裂解,这样,每个反应中虽然都在同一核苷酸处断裂DNA链,但由于碱基位置不同,产生1组不同长度的DNA片段。其长度可由几个核苷酸到接近待测DNA全长。 (六)电泳 (七)放射自显影 (八)4个反应管统一阅读,DNA4个碱基每个位置都有一个相应的片段,待测DNA全部核苷酸序列就可直接读出。,二、化学法测序的基本步骤,(三、四略讲),三、化学法的优点,化学法没有末端终止法应用广泛,但有一个明显的优点,即所
23、测序列来自原DNA分子而不是酶促合成反应所产生的拷贝,因此利用化学法可以对合成的寡核苷酸进行测序,可以分析诸如甲基化等DNA修饰的情况,不能通过化学保护及修饰干扰实验来研究DNA二级结构及蛋白质与DNA的相互作用。,三、化学裂解法的特点不需酶催化5 和3 端均可标记,可从两方向测同一DNA操作繁琐、费时、分辨率较低,四、化学法读序,化学法测序放射自显影图谱的识读,较末端法更复杂一些,这是因为化学裂解反应并不完全是碱基特异性的,每组测序图谱为4或5条垂直的阶梯带,AC反应可以不做。该片从胶底部一个个向顶部读,G+A和C+T两列中含有所有相差一个碱基的DNA片段。如果G+A中出现1条带就看G列中是
24、否有同样大小的带,若有即为G碱基,无则为A碱基;同理,C+T中则检查C列中有无同样大小条带,有即为C,无则为T。在做了AC反应时,出现较深的带时,可以帮助确定为A碱基。化学法必须4或5个反应管统一阅读,DNA中4个碱基每个位置都有1个相应的片段,待测的DNA全部序列可直接读出。(专业技术人员)化学法测序采用32P标记DNA进行,条带会较末端法更模糊,更宽,由于分辨率不足,从单块凝胶上能得到可靠序列数量约为200-300bp以内。读序常见问题及解决办法参见分子克隆P665。末端法读序(分子克隆P640),第三节 DNA测序自动化和大规模测序,特点 原理同末端终止法 标记物为荧光染料 激光扫描自动测序 结果清晰、准确、分辨率高 测序速度快 200bp/h,DNA自动测序与手工测序的不同点,1、标记物不同:手工测序采用放射性核素标记,而自动测序采用4种荧光染料分别标记ddNTP或标记引物 2、加样方式不同:手工测序,一个样品的4个测序反应物分别在不同泳道进行,而自动测序可在一个泳道内电泳 3、检测手段不同:手工测序采用放射自显影,从4种寡聚核苷酸的梯子形图谱中读出DNA序列,而自动测序则采用激光扫描器同步扫描,计算机进行阅读和编辑,