1、DNA测序技术概述,DNA测序技术简介 DNA测序技术的发展 DNA测序技术的小结与展望,DNA测序简介,DNA是一种长链聚合物,组成单位为四种脱氧核苷酸。这些碱基沿着DNA长链所排列而成的序列,可组成遗传密码,指导蛋白质的合成。对于每个生物体来说,基因组包含了整个生物体的遗传信息。测序技术能够真实地反映基因组DNA上的遗传信息,进而比较全面地揭示基因组的复杂性和多样性,因而在生命科学研究中扮演了十分重要的角色。,测序技术最早可以追溯到20世纪50年代,早在1954年就已经出现了关于早期测序技术的报道,直至1977年Sanger等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法,
2、标志着第一代测序技术的诞生。此后三十几年的发展中陆续产生了第二代测序技术,这些技术都采用了合成测序法,只是在DNA阵列的排布、DNA簇扩增,以及基于酶的测序生化反应方面存在差异。,第一代DNA测序技术三测序方法的原理,第二代DNA测序技术三个测序平台的工作原理及操作步骤,第三代DNA测序技术单分子测序的特点及应用前景,DNA测序技术的历史,自沃森和克里克在1953年建立DNA双螺旋结构以来,整个测序技术的发展历程。,2011,2012,第一代DNA测序技术,成熟的DNA测序技术始于20世纪70年代中期。1977年Sanger发明了双脱氧链终止法。同一时期, Maxam 和Gilbert报道了通
3、过化学降解测定DNA序列的方法。20世纪90年代初出现的荧光自动测序技术将DNA测序带入自动化测序的时代。 这些技术统称为第一代DNA测序技术。,1.链终止法,利用DNA聚合酶和双脱氧链终止物测定DNA核苷酸顺序的方法,是由英国剑桥分子生物学实验室的F. Sanger等人于1977年发明的。,F. Sanger (1980年诺贝尔奖获得者),(The chain termination method),双脱氧链终止法,原理:核酸模板在DNA聚合酶、引物、4种dNTP 存在条件下复制时,在四管反应系统中分别按比例引入4种双脱氧核苷三磷酸( ddNTP) ,因为双脱氧核苷没有3 -OH,所以只要双
4、脱氧核苷掺入链的末端,该链就停止延长,若链端掺入单脱氧核苷,链就可以继续延长。如此每管反应体系中便合成以各自的双脱氧碱基为3 端的一系列长度不等的核酸片段。反应终止后,分4个泳道进行凝胶电泳,分离长短不一的核酸片段,长度相邻的片段相差一个碱基。经过放射自显影后,根据片段3端的双脱氧核苷,便可依次阅读合成片段的碱基排列顺序。,技术路线与要求,制备单链模板将单链模板与一小段引物退火加入DNA多聚酶4种脱氧核苷酸分别加入少量4种双脱氧核苷酸将4种反应产物分别在4条泳道电泳根据4个碱基在4条泳道的终止位置读出基因序列,A 克隆于质粒中DNA用碱或热变性 B M13克隆单链DNA C 噬粒克隆DNA D
5、 PCR产生单链DNA,A 高酶活 B 无53外切酶活性 C 无35外切酶活性,ddATP/ddCTP/ddGTP/ddTTP 的3碳原子连接的是氢原子,不是羟基,1、模板 有两类DNA可以用做Sanger法测序的模板:纯单链DNA和经过热变性或碱变性的双链DNA。采用从重组M13噬菌体颗粒中分离得到的单链DNA模板效果最佳 。,Sanger法DNA测序的试剂,2.引物 酶促测序反应中利用一个与模板链特定序列互补的合成寡核苷酸作为DNA合成的引物。,M13噬菌体重组克隆的通用测序引物一般长15个29个核苷酸,并可与紧靠M13mpl8噬菌体多克隆位点区的Hind 位点或M13mpl9噬菌体多克隆
6、位点区的EcoR位点的序列互补。这些引物同样也可用于对克隆于pUC质粒的DNA进行双链测序。此外,还有若干家公司出售一些引物,这些引物是为了对通过多种限制酶切位点克隆于不同质粒的靶DNA进行测序而设计的。,3、DNA聚合酶 通常用于双脱氧法序列测定的有几种不同的酶,其中包括大肠杆菌DNA聚合酶的K1enow片段、反转录酶、经过修饰消除了3一5外切酶活性的T7噬菌体DNA聚合酶测序酶(5equenase)和测序酶序酶2.0版,以及耐热DNA聚合酶(Taq DNA聚合酶)。,(1)大肠杆菌 DNA聚合酶Klenow 这种酶是最初用以建立Sanger法的酶,也是至今仍然广泛用于DNA序列测定的酶,通
7、常碰到的两个问题是:1)Klenow片段的持续合成能力低;2)这种酶对模板中的同聚核苷酸或其他含牢固二级结构的区域进行复制的效能很低;将聚合反应的温度提高到55,可以缓解但并不能彻底解决这一问题。,(2)反转录酶 尽管日常测序工作并不广泛使用反转录酶,但有时用这个酶来解决一些由于模板DNA中存在AT或GC同聚核苷酸区而引起的问题。,(3)测序酶(SequenaseTM)是一种经过化学修饰的T7噬菌体DNA聚合酶。该酶原来具有很强的3一5外切核酸酶活性,经过修饰后,这一活性大部分均被消除。测序酶2.0版完全缺失了3一5外切酶活性,极其稳定而且活性要比经化学修饰的测序酶高2倍。测序酶持续合成能力很
8、强,聚合速率很高,具有广泛的耐受性,它是测定长段DNA序列的首选酶。,4) Taq DNA聚合酶适用于测定在37形成大段稳定二级结构的单链DNA模板序列。这是因为Taq DNA聚合酶在70一75 活性最高,这一温度下即使GC丰富的模板也无法形成二级结构。有人报道,使用Taq DNA聚合酶进行测序,在放射自显影片上得到的连续数百个碱基条带始终清晰如一,表明这种酶的持续合成能力甚佳。,4放射性标记的dNTP a-32p dNTP被广泛地应用于DNA测序。然而32P发射的强粒子造成两个问题。首先由于发生散射,放射自显影片上的条带远比凝胶上的DNA条带更宽、更为扩散,因此将影响到所读取的序列正确性。其
9、次32P的衰变会引起样品中DNA的辐射分解,因此用32P进行标记的测序反应只能保存一两天,否则DNA将被严重破坏以至测序凝胶上模糊不清、真假难辨。,35sdATP的使用大大缓解了上述两方面的矛盾。由于35S的衰变产生较弱的粒子,其散射有所减弱,凝胶和放射自显影片之间在分辨率上相差无几,因此可以从一套反应中确切测定数百核苷酸的DNA序列。此外,35S的低能辐射所引起的样品分解比较轻微,因此,测序反应可在20保存至1周,而分辨率并不下降。,通过M13载体获得单链DNA以测序,M13噬菌体载体是专为得到单链DNA测序模板而设计的。,美国哈佛大学的Maxam和Gilbert于1977年发明的,化学降解
10、法主要用于测定短片段DNA的序列。 用化学试剂处理末端放射性标记的DNA片段,造成碱基的特异性切割。由此产生的一组具有各种不同长度的DNA链的反应混合物,经凝胶电泳和放射自显影后,直接读出待测DNA片段的核苷酸顺序。,2.化学降解法,化学降解法技术路线,将双链DNA样品变为单链每个单链的同一方向末端都用放射性同位素标记,以便显示DNA条带分别用不同方法处理,获得只差一个核苷酸的降解DNA群体电泳,放射自显影,读取DNA的核苷酸顺序,同时完成4组反应,A、G、C、T 链终止法:主流技术,易于机械化自动控制。 化学降解法:试剂含有毒性。,化学降解法的特点,重现性好,所用试剂简单,易于掌握; 所测长
11、度比Sanger法短一些,对放射性标记末端250个核苷酸以内的DNA序列效果较好; 序列来自原DNA分子而不是酶促合成反应所生成的拷贝;因此,不会出现误读、可对未克隆的片段、合成的寡核苷酸直接进行测序; 5 和3 端均可标记,可从两方向测同一DNA,保证准确性; 操作繁琐、费时、分辨率较低、试剂毒性大。,3、荧光自动测序技术,荧光自动测序技术基于Sanger原理,用四种不同的荧光混合物分别标记四种反应的产物,用四种反应物混合在一起进行电泳,在激光的激发下四种带有不同荧光染料标记物的ddNTP可以在同一反应管种进终止测序反应,并于变性的聚丙烯酰胺凝胶的同一泳道中进行电泳检测。当带有某种荧光素标记
12、的DNA片段电泳到激光探头的检测范围时,激光所激发的荧光信号被探测器接受,经计算机分析数据,自动排列出DNA序列。,第一代半自动测序示意图,第一代全自动测序 毛细管电泳测序,用毛细管电泳取代聚丙烯凝胶平板电泳,可使DNA的测序速度更为迅速。这种电泳装置有96个泳道,每次可同时进行96次测序,每轮实验不到2小时,1天可完成近千次反应。,毛细管电泳测序装置,第一代测序法的比较,第二代DNA测序技术,二代测序的核心思想是边合成边测序,即通过捕捉新合成的末端的标记来确定DNA的序列。第二代测序技术主要包括罗氏454公司的GS FLX测序平台、Illumina 公司的Solexa Genome Anal
13、yzer测序平台和ABI公司的SOLiD测序平台。,第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子进行序列测序,使得对一个物种的转录组测序或基因组深度测序变得方便易行。,1、 Roche 454GS FLX,454公司可谓新一代测序技术的奠基人。2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统Genome Sequencer 20 System,被Nature杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。后来,他们又推出了全新的GS FLX 系列试剂和软件的补充,让GS FLX的通量一下子
14、提高了5倍,准确性、读长也进一步提升。,Roche 454测序原理,原理:在DNA聚合酶、ATP硫酸化酶、荧光素酶和双磷酸酶的作用下,将每一个dNTP的聚合与一次化学发光信号的释放偶联起来,通过检测化学发光信号的有无和强度,达到实时检测DNA序列的目的。,样品处理主要是针对大片段的DNA分子,如基因组DNA、Fosmid或BAC质粒等,利用超声或氮气打断将这些DNA分子片段化,然后采用琼脂糖凝胶电泳回收或磁珠纯化,选择500-800bp的DNA片段。对于非编码RNA或PCR产物,则不需要这一步骤。,一、样品处理,454 (GS FLX)测序技术流程,二、文库制备,文库制备包括接头连接和磁珠纯化
15、两步,基因组DNA/cDNA片段经末端修复与特异性接头连接等修饰后变性处理回收单链的DNA 。 454的文库接头分A、B两种,各44bp,由20bp的PCR引物、20bp的测序引物及4bp(TCAG)的“key”碱基构成,其中B接头的5端带有生物素(Biotin)标记,用于磁珠纯化步骤。,三、连接微珠,一个DNA片段一个磁珠:单链DNA文库被固定在特别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的单链DNA片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。,四、emRCR,每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的
16、竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。,乳液PCR(emRCR),五、反应板准备、上机测序,454测序的反应板称为PTP(Pico Titer Plate),含有350万个由光纤组成的小孔,每个孔的直径为29m,而测序磁珠的直径为20m,因此每个孔中仅能容纳一个磁珠。,携带DNA的捕获磁珠随后放入PTP板中进行后继的测序。放置在单独的试剂瓶里的碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP硫酸
17、化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时释放出光信号。此反应释放出的光信号实时被高灵敏度CCD捕获到。,一个磁珠一条读长,Roche 454测序步骤,六、测序和分析,将磁珠与测序试剂加入PTP中,使之可用于上机测序。,GS FLX测序技术的优点,GS FLX系统的测序也是一种依靠生物发光进行DNA序列分析的新技术。在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将优点引物上每一个dNTP 的聚合与一次荧光信号释放偶联起来。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探
18、针,也不需要进行电泳; 特点:分析结果快速、准确、灵敏度高和自动化。,2.Illumina -Solexa Genome Analyzer,Solexa 系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3端粘性,继续聚合第二个核苷酸。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。,S
19、olexa测序技术路线:,Solexa测序技术的特点,通量高目前一台机器在两周内最高可产出360G 的数据; 准确率高高于98. 5% ,同时也有效地解决了多 聚重复序列的读取问题; 成本低低于传统Sanger 测序技术的成本;,DNA 序列的读取长度不断增加 可以进行Pair-end( PE) 双向测序PE 文库插入片段大小范围可由150 bp 到10 kb。正确选择插入片段长度有利于高重复序列含量基因组的组装,这进一步扩展了该技术的应用范围。但是读长错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。,3. ABI SOLiD测序技术,SOLiD的独特之处在于以四
20、色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序。就通量而言,SOLiD 3系统是革命性的,目前SOLiD 3单次运行可产生50GB的序列数据,相当于17倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性更让它从其他新一代测序平台中脱颖而出。,SOLiD工作流程,a. 文库制备 b. 乳液PCR/微珠富集 c. 微珠沉积 d. 连接测序 e. 数据分析,SOLiD优点,1.系统可扩展性 2.高通量3.灵活性 SOLiD系统已不再是一台单纯的测序仪,而是成为功能更全面的基因分析仪。除了测序和重测序,还能进行全基因表
21、达图谱分析、SNP、microRNA、甲基化等多种分析。,例子:,SNP分析 尽管绝大多数的人类遗传信息在所有人中都相同,但是研究人员通常更感兴趣的是研究个体之间微小的遗传差异。包括DNA片段的插入、缺失、倒位和易位等,可能对基因产生重要影响,并导致人类疾病的发生。,甲基化分析 甲基化是自然发生的DNA化学修饰的一种。已知抑癌基因的失活与DNA序列特定区域的甲基化有关。而去甲基化则可能导致基因组不稳定和表达模式变化。DNA甲基化区域可能作为基因在癌症过程中的标记。研究人员一直致力研究从正常到癌变过程中甲基化模式如何变化的,原癌基因异常甲基化模式在癌变过程中扮演怎样的角色。,三大测序平台的技术特
22、点和差异,第三代DNA测序技术,第二代测序技术在制备测序文库的时候都需要经过PCR扩增,而这一PCR过程可能引入突变或者改变样品中核酸分子的比例关系。另外,第二代测序的读长普遍偏短,在进行数据拼接时会遇到麻烦。为了克服这样的缺点,业界发展出了以单分子实时测序和纳米孔为标志的第三代测序技术。,2008年4月HelicoBioScience公司的Timothy等人在Science上报道了他们开发的真正的单分子测序技术,也被成为第三代测序技术。这项技术完全跨过了第二代测序技术依赖基于PCR扩增的信号放大过程,真正达到了读取单个荧光分子的能力。,1. Helicos公司 Heliscope单分子测序仪
23、基于边合成边测序的思想,将待测序列随机打断成小片段并在3末端加上Poly(A),用末端转移酶在接头末端加上Cy3荧光标记。用小片段与表面带有寡聚Poly(T)的平板杂交。然后,加入DNA聚合酶和Cy5荧光标记的dNTP进行DNA合成反应,每一轮反应加一种dNTP。 将未参与合成的dNTP和DNA聚合酶洗脱。 检测上一步记录的杂交位置上是否有荧光信号,如果有则说明该位置上结合了所加入的这种dNTP。用化学试剂去掉荧光标记,以便进行下一轮反应。经过不断地重复合成、洗脱、成像、淬灭过程完成测序。,Pacific Biosciences公司的SMRT技术基于边合成边测序的思想,以SMRT芯片为测序载体
24、进行测序反应。SMRT芯片是一种带有很多ZMW孔的厚度为100 nm的金属片。将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。与其他技术不同的是,荧光标记的位置是磷酸基团而不是碱基。,2. Pacific Biosciences公司,当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区并在激光束的激发下发出荧光,根据荧光的种类就可以判定dNTP的种类。此外由于dNTP在荧光信号检测区停留的时间(毫秒级)与它进入和离开的时间( 微秒级) 相比会很长,所以信号强度会很大。其它未参与合成的dNTP由于没进入荧光型号检测区而不会发出荧光。在下一个dN
25、TP被添加到合成链之前,这个dNTP的磷酸基团会被氟聚合物(fluoropolymer)切割并释放,荧光分子离开荧光信号检测区。,3. Oxford Nanopore Technologies公司Oxford Nanopore Technologies公司正在研究的纳米孔单分子技术是一种基于电信号测序的技术。他们设计了一种以-溶血素为材料制作的纳米孔,在孔内共价结合有分子接头环糊精。用核酸外切酶切割ssDNA时,被切下来的单个碱基会落入纳米孔,并和纳米孔内的环糊精相互作用,短暂地影响流过纳米孔的电流强度,这种电流强度的变化幅度就成为每种碱基的特征。,纳米孔测序技术,与NGS, SMRT等技术相
26、比,纳米孔测序不需修饰DNA或dNTP ,不需要酶和荧光基团、不需荧光检测系统等,具有直接测序和更低成本的潜能,是单分子测序领域的热点之一。纳米孔测序原理比较简单:在一块膜内嵌入一个直径约为1.5 nm的纳米孔,在纳米孔两端加上一定的电压,在电场力的作用卜,单链DNA分子会通过这个孔并引起电流变化,电流的特征用来标识碱基序列。,尽管有实验表明有些纳米孔系统可以检视出单碱基加成引起的特征电流变化,目前纳米孔DNA测序领域主要有两大障碍。第一,DNA链通过纳米孔的速度太快(约1个碱基/微秒),超出了现有检测器的检测范围。第二,纳米孔的厚度太厚导致单链DNA通过纳米孔时各碱基引起的电流差异特征不明显
27、(纳米孔中所有的核有酸对纵向电流的变化均有贡献)。,3.小结与展望,DNA测序技术日新月异,伴随其成本的降低,DNA测序技术的应用将更加广泛。临床上大多数疾病最终发现与基因相关,多个致病基因位点已被确定,对人群进行基因筛查将有助于发现更多致病基因位点,同时也将有助于更多疾病病因的确立;基因治疗是靶向纠正突变基因,从根本上对疾病进行治疗,将是未来疾病治疗的方向,而这些目标的实现都依赖于基因测序技术的改进。,随着新的测序技术的出现,大规模测序的成本迅速下降,花费1 000美元测一个人的基因组的目标相信很快就可以实现。届时,对于遗传病的诊治将变得简单、快速,并能从基因组水平上指导个人的医疗和保健,从而进入个人化医疗的时代。,展望,