1、第四节 DNA 序列测定目前应用的两种快速序列测定技术是 Sanger 等(1977 )提出的酶法(双脱氧链终止法)和 Maxam( 1977)提出的化学降解法。虽然其原理大相径庭,但这两种方法都同样生成相互独立的若干组带放射性标记的寡核苷酸,每组核苷酸都有共同的起点,却随机终止于一种(或多种)特定的残基,形成一系列以某一特定核苷酸为末端的长度各不相同的寡核苷酸混合物,这些寡核苷酸的长度由这个特定碱基在待测 DNA 片段上的位置所决定。然后通过高分辨率的变性聚丙烯酰胺凝胶电泳,经放射自显影后,从放射自显影胶片上直接读出待测DNA 上的核苷酸顺序。高分辨率变性聚丙烯酰胺凝胶电泳亦是 DNA 序列
2、测定技术的重要基础,可分离仅差一个核苷酸、长度达 300500 个核苷酸的单链 DNA 分子。DNA 序列测定的简便方法为详细分析大量基因组的结构和功能奠定了基础,时至今日,绝大多数蛋白质氨基酸序列都是根据基因或 cDNA 的核苷酸序列推导出来的。除传统的双脱氧链终止法和化学降解法外,自动化测序实际上已成为当今DNA 序列分析的主流。此外,新的测序方法亦在不断出现,如上世纪 90 年代提出的杂交测序法(sequencing by hybridization,SBH)等。一、双脱氧末端终止法测序 原理 双脱氧末端终止法是 Sanger 等在加减法测序的基础上发展而来的。1980 年他又因设计出一
3、种测定 DNA(脱氧核糖核酸 )内核苷酸排列顺序的方法而与 W吉尔伯特、P伯格共获 1980 年诺贝尔化学奖。桑格是第四位两次获此殊荣的科学家。其原理是:利用大肠杆菌 DNA 聚合酶,以单链 DNA 为模板,并以与模板事先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP )底物的 5-磷酸基团与引物的 3-OH 末端生成 3,5-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补 DNA 得以从 53延伸。Sanger 引入了双脱氧核苷三磷酸( ddTNP)作为链终止剂。ddTNP 比普通的dNTP 在 3位置缺少一个羟基(2,3-ddNTP) (图 7-4-1) ,可以通过
4、其 5三磷酸基团掺入到正在增长的 DNA 链中,但由于缺少 3-OH,不能同后续的dNTP 形成 3,5-磷酸二酯键。因此,正在增长的 DNA 链不再延伸,使这条链的延伸终止于这个异常的核苷酸处。这样,在 4 组独立的酶反应体系中,在4 种 dNTP 混合底物中分别加入 4 种 ddNTP 中的一种后,链的持续延伸将与随机发生却十分特异的链终止展开竞争,在掺入 ddTNP 的位置链延伸终止。结果产生 4 组分别终止于模板链的每一个 A、每一个 C、每个 G 和每一个 T 位置上的一系列长度的核苷酸链。通过高分辨率变性聚丙烯酰胺凝胶电泳,从放射自显影胶片上直接读出 DNA 上的核苷酸顺序。双脱氧
5、链终止法测序原理如图 7-4-2 所示。A,C,G or TOOOHPOOHPOOOHOHOHOOPH123 A,C,G or TOOHPOOHPOOOHOHOHOOPH123dNTPdNTP图 7-4-1 脱氧核苷三磷酸和双脱氧核苷三磷酸分子结构5GAGTCACACTTGAC 3待测单链DNA 3CTG 5引物、Klenow酶、dATP、dGTP、dCTP、dTTP和少量- 32P-dATP 加ddCTP反应3CAGTGTGAACTG 53CTCAGTGTGAACTG 5加ddGTP反应3GAACTG 53GTGAACTG 53GTGTGAACTG 5图 7-4-2 双脱氧链终止法测序原理
6、模板 有两种类型的 DNA 模板可以作为 Sanger 法测序的模板,即纯化的单链DNA 和经热变性或碱变性的双链 DNA。1单链 DNA 模板 在一般情况下,可将靶 DNA 片段克隆于 M13mp 载体,从重组克隆 M13mp 系列噬菌体颗粒中分离得到的单链 DNA 模板。这种单链模板效果最佳,只要细心掌握模板与引物的最佳比例,有经验的测序人员通过一次末端终止反应,能读取 500 个以上的核苷酸序列。2经热变性或碱变性的双链 DNA 模板 尽管采用变性双链 DNA 作测序模板显然简单且方便,但实际上很难获得单链模板那样的满意结果。利用双链质粒模板测序,其中有两个至关重要的因素,即模板的质量和
7、聚合酶的种类。GAGTCACACTT测序图谱识读变性凝胶电泳、放射自显影A TC G 5 3 加ddATP反应3ACTG 53AACTG 53AGTGTGAACTG 5加ddTTP反应3TGAACTG 53TGTGAACTG 53TCAGTGTGAACTG 5用小量制备的质粒 DNA 来测定未知序列的 DNA 克隆往往因为有污染而并不可取,高纯度的质粒最好采用氯化铯-溴乙锭梯度平衡超速离心法制备。其次是应采用高质量的聚合酶。一次末端终止反应亦可能读出 300 核苷酸序列。应该注意的是,适合做双链模板的质粒,最好具有较高的拷贝数并有插入失活的选择标志,有配套的通用引物结合区。最常用的载体系统是
8、pUC 系列、pGEM 系列及 Bluescript 系列等。双链模板测序最大的优势是对已知序列 DNA 的亚克隆进行鉴定,可省略再经 M13 载体亚克隆获取单链模板过程。 引物 酶法测序反应中都有一个与模板链特定序列互补的合成的寡核苷酸作为DNA 合成的引物。不管是将靶 DNA 片段克隆于 M13mp 载体获取的单链 DNA作模板,还是采用变性双链 DNA(如变性质粒 DNA)模板,都有可以与位于靶 DNA 侧翼的载体序列相退火的通用引物(universal primer)可用,而不必另行设计与未知 DNA 序列互补的引物。适合于 M13mp 系列载体的通用引物一般长 1529 个核苷酸,当
9、然这些引物也同样适用于那些克隆于 pUC 系列质粒的DNA 进行双链测序。这些测序用的通用质粒及其通用引物可直接从许多厂商购买到。4 DNA 聚合酶 如前所述,选用合适的 DNA 聚合酶进行测序反应也是保证测序质量的重要因素之一。常用于双脱氧末端终止法测序的有几种不同的酶:1大肠杆菌 DNA 聚合酶大片段(Klenow 片段) 此酶是最早用于建立Sanger 测序的酶。但通常会有两个问题: Klenow 片段的持续合成能力较低,通常只能得到约 250350 个核苷酸的序列,而且由于聚合酶随机从模板上解离而终止链延伸,通常会产生较高的本底和假带;对同聚核苷酸段或其他含牢固二级结构的区域复制效能低
10、下。但此酶价格便宜,对已知序列的亚克隆进行鉴定仍有应用价值。2测序酶(sequenase ) 该酶是一种经过化学修饰的 T7 噬菌体 DNA 聚合酶,其原来很强的 35外切酶活性,经化学修饰后大部分被消除。目前常用的测序酶大都是基因工程产品,完全缺失 35外切酶活性,具有活性非常稳定可靠、持续合成能力强和聚合速度高等优点,是测定较长 DNA 的首选酶。市售的各种以该酶为基础的测序试剂盒,效果甚佳。3耐热 DNA 聚合酶 PCR 技术的应用正在不断扩大,耐热 DNA 聚合酶应用于以 Sanger 双脱氧链终止法为基础的 DNA 测序方案,已发展成为被称为“循环测序”或“线性扩增测序”方法。在该类
11、测序方法中,由于使用了耐热DNA 聚合酶,与其他 DNA 聚合酶相比较具有二大优点。其一,由于采用热循环方法线性扩增模板 DNA,获得清晰可辨的序列梯带所需要的模板 DNA 量少;其二,由于,耐热 DNA 聚合酶可在 95高温下保持稳定,测序反应可以在高温(7080 )下进行。因而能克服富含 GC 序列的模板形成自身二级结构对测序的影响。因此,循环法可以方便地对 PCR 产物、质粒 DNA、DNA 和粘粒DNA 等双链模板进行序列测定,特别有利于对高 GC 碱基含量的模板测序。循环测序法利用了热循环仪的自动循环的高效能力。循环测序反应与普通PCR 反应有所不同。只需一条引物,通过单引物进行热循
12、环,模板 DNA 以线性方式被扩增,而不是标准 PCR 的指数方式扩增;反应底物除四种脱氧核苷三磷酸(dNTP)外,还加入了双脱氧核苷三磷酸( ddNTP) ,进行扩增时,链的延伸终止于掺入 ddNTP 的位置,产生分别终止于不同核苷酸的一系列不同长度的扩增片段。 放射性标记传统的 DNA 测序方法都采用 - 32P-dNTP 作为放射性标记物,但由于 32P发射的高能 射线,常会引起二个问题。首先是导致放射自显影图谱条带扩散、分辨率低,限制了识读序列的数量和准确性。其次是 32P 衰变会导致 DNA 样品分解,通常都应在测序反应后 24h 内进行电泳,否则无法获得好的结果。近年来 - 35S
13、-dNTP 被广泛采用,是由于 35S 产生较弱的 射线,克服了32P 的二大缺点。放射自显影图谱具有较高的分辨率和较低的本底,测序反应产物可在-20 保存一周,而分辨率并不下降。 关于 DNA 序列的识读DNA 序列的识读是一个熟能生巧的过程。注意几点技巧:在显影前后一定要注意标明模板名称、日期和测序人等,并标明各套反应位置;识读时从显而易见的特征序列开始,如连续的同聚核苷酸(如 TTTTT、AAAAA )或交替出现的嘌呤和嘧啶(如 GTGTGTGT) ,一旦找到这种序列,便可较快地确定目的序列的位置。二、Maxam-Gilbert 化学降解法测序几乎在双脱氧法发展的同时,1977 年 Ma
14、xam-Gilbert 等提出了化学降解法。自 Maxam-Gilbert 初次提出以来,其实验方案基本上没有变化。 原理 化学降解法与包括合成反应的链终止法不同,需要对原 DNA 进行化学降解。其基本原理是,首先对待测 DNA 末端进行放射性标记,再通过 5 组(也可以是 4 组)相互独立的化学反应分别得到部分降解产物,其中每一组反应特异性地针对某一种或某一类碱基进行切割。因此,产生 5 组(或 4 组)不同长度的放射性标记的 DNA 片段,每组中的每个片段都有放射性标记的共同起点,但长度取决于该组反应针对的碱基在原样品 DNA 分子上的位置。此后各组反应物通过聚丙烯酰胺凝胶电泳进行分离,通
15、过放射自显影检测末端标记的分子,并直接读取待测 DNA 片段的核苷酸序列。测序原理如图 7-4-3 所示。*GATCGGACCT*GATCGGACC*GATCGGAC*GATCGGA*GATCGG*GATCG*GATC*GAT*GA*GG G+A T+C CG 反应 G+A 反应 T+C 反应 C 反应5 *P-GATCGGACCT 3图 7-4-3 化学裂解法测序原理 待测 DNA 的末端标记化学降解法测序首先要制备单侧末端标记的待测 DNA 片段。DNA 片段的核素标记有三种方法:1利用 T4 噬菌体多核苷酸激酶和 - 32P-ATP 标记 DNA 的 5-末端 对于去 5- 磷酸化的 D
16、NA 片段,T4 噬菌体多核苷酸激酶可以通过正向反应将- 32P-ATP 的 -磷酸基转移至 DNA 的 5-末端;对于 5-磷酸化的 DNA 片段,在过量 ATP 条件下,该酶可以通过交换反应将 - 32P-ATP 的 -磷酸基与DNA 的 5- 末端磷酸基发生交换反应而标记。但对于双链 DNA 片段,由于DNA 的两侧均被标记,不能直接用于测序反应。需要经限制性内切酶切割,电泳分离二种不同大小的标记片段,或者直接用变性聚丙烯酰胺凝胶电泳分离二条单链,但这种分离方法比较困难,较少使用。2利用末端转移酶和 - 32P-ddNTP 标记 DNA 的 3- 末端 在二价阳离子存在下,末端转移酶催化
17、 dNTP 加入 DNA 分子的 3-羟基末端,如果作为底物的核苷酸经过修饰(如 ddNTP) ,则可以在 DNA 的 3-OH 上仅加入一个核苷酸。对于双链 DNA 片段,亦存在 DNA 的两侧均被标记问题,可通过上述同样的方法分离。方法 A:用两种不同的限制性内切酶切割 DNA 片段,且其中只有一种酶可产生 3凹末端。5 33 55 32pN 33 5- 32P-dNTPDNA 聚合酶Klenow 片段方法 B:用两种可产生不同 3凹末端的限制性内切酶切割 DNA。5GATC 33 TTAA5DNA 聚合酶Klenow 片段- 32P-dATP- 32P-dGTP图 7-4-4 对双链 D
18、NA 进行不对称标记的常用方法3利用 Klenow 片段和 - 32P-dNTP 对限制性内切酶产生的 3-凹进末端进行标记 这种方法能直接制备单侧末端标记的 DNA,但要求待测 DNA 能满足下列条件之一:DNA 两端的一侧为 3-凹进末端,而另一侧为平端或 3-凸出末端;两端虽均为 3-凹进末端但末端单链结构不同,这时可选择不同的 - 32P-NTP 来实现末端标记。这是对双链 DNA 进行不对称标记的常用方法,如图 7-4-4 所示。CS 载体系列(CS 是 chemical sequecing 的缩写)是专门为化学降解法测序进行末端标记而构建的一类克隆载体,如 pSP64CS 和 pS
19、P65CS。这类载体最重要的特点是,在待测 DNA 克隆片段的附近有两个可被限制性酶 Tth111 识别的典型位点(GACNNNGTC,不对称) ,能在克隆 DNA 片段两侧不同的 3-凹进末端,从而方便地实现对待测 DNA 的单侧标记。值得特别注意的是,化学降解法对标记的待测 DNA 纯度有较高的要求,因为盐浓度会干扰肼对胸腺嘧啶的修饰,也会抑制 A+G 反应中的去嘌呤过程。因此,标记的 DNA 一般要经酚/氯仿抽提、70%乙醇洗涤除盐,并用去离子水溶解而不用 TE 缓冲液。 碱基特异的化学切割反应 在化学降解法中,专门用来对核苷酸作化学修饰并打开碱基环的化学试剂主要有肼(hydrazine
20、)和二硫酸甲酯( dimethylsulphate) 。肼又叫联氨(NH 2-NH2) ,在碱性条件下,能作用于 T/C 的 C4 和/ 或 C6 原子位置,并同 C4-C5-C6 环化形成一种新的五元环。肼进一步作用释放出吡唑啉酮环。在六氢吡啶的作用下,通过 消除反应,该碱基两端的磷酸基团便会以磷酸分子形式从糖环上释放出来,从而导致在这个核苷酸位置上发生 DNA断裂如果在此反应体系中加入 1mol/L 浓度的盐,则肼同 T 的反应速率会下降,便可发生 C 特异的化学切割反应。因此,可以根据这一特点来区别 C 和 C+T这 2 种化学切割反应。化学反应过程如图 7-4-5 所示。GATC G3
21、2p TTAAGATC 32pA TTAA二硫酸甲酯(CH 3O)2SO2,能使 DNA 碱基环中的氮原子发生甲基化反应。在 DNA 测序分析中所涉及的甲基化位点是 G 的 N7 原子和 A 的 N3 原子。在中性 pH 环境中,这 2 种碱基的甲基化作用,都足以导致其糖苷键发生水解作用,而留下失去碱基的糖-磷酸骨架。再通过碱催化的 -消除反应水解无碱基糖环两端的磷酸二酯键,造成 DNA 在此位点发生断裂。同时,已知 DNA 中 G 的N7 原子甲基化速率比 A 的 N3 原子快 410 倍,故在中性条件下水解速率 G 位置也比 A 位置要快得多(差 46 倍) ,这是早期 Maxam-Gil
22、bert 化学降解法测序辨别 DNA 中 G 和 A 的基本依据。现行的化学裂解反应,都采用六氢吡啶与DNA 中的甲基化碱基反应,且这种反应对甲基化的 G 是特异的,因此这种DNA 链的断裂也仅发生在 G 残基位点。化学反应过程如图 7-4-6 所示。化学反应设有 5 组独立的反应:G 反应(在 G 残基上的裂解) 、A+G 反应(在嘌呤残基上的裂解) 、C+T 反应(在嘧啶残基上的裂解) 、C 反应(在 C 残基上的裂解)和 AC 反应(在 A 和 C 残基上的裂解) ,A C 反应也可以不做。NOOOOOHOP NHOCH3POOHONH2NH2535353OOOOOHOP OHNNH2P
23、OOHO5353OOOOHOP OHNNH2POOHO+NHNHNOOOOOHOP NH2O CH3OPOOHONHNHCHCHCHC N+CH2OH POOHOOH OOOHN+POOHPOOOHOPOOHOHO +53图 7-4-5 联氨和六氢吡啶在胸腺嘧啶残基位点切割 DNA 的化学过程NOOOOOHOPPOH OONNHNNH2O53NOOOOOHOPPOH OONNHN+NH2O CH353NHOOOOOHOPPOH OONNHNNH2O CH3CHO53SOOCH3CH3NHNH2NNH NNH2O CH3CHOOHOOOOHOPPOH OOCHN+OHN+CHCHCHCCH2 O
24、H+POOHOOH53POOHOHO +53图 7-4-6 硫酸二甲酯和六氢吡啶在鸟嘌呤残基位点切割 DNA 的化学过程 测序图谱的识读 对于测序电泳图谱的识读,化学降解法测序要比末端终止法较为复杂,因为化学裂解反应并非是完全绝对碱基特异的。每组测序图谱为 5 条或 4 条(AC 反应可以不做)泳道。需要通过从 C+T 泳道出现的条带中扣除 C 泳道的条带而推断 T 残基的存在。类似地,A 残基的位置也要通过从 A+G 泳道中扣除 G 泳道的条带推断出来。同时,如果 AC 泳道中出现较强的条带,则可确证 A 残基的存在。实际读片时从胶片底部一个个地向顶部读取。从下至上,一个一个地从G+A 泳道
25、和 C+T 泳道二个列中确定只相差一个碱基的条带。如果在 G+A 泳道中出现一条带,就看 G 泳道中是否有相同大小的带,如果有即为 G 碱基,如果没有则为 A 碱基;同样,在 C+T 泳道中出现的条带,就检查 C 泳道中有无同样大小的条带,如果有即为 C,无则为 T。如果做了 AC 反应,在该列中出现较强的条带时,可帮助 A 的确定。 化学降解法测序的优点 在化学降解法与链终止法问世之初,利用化学降解法进行测序不仅重复性更高,而且由于只需要简单的化学试剂和一般的实验条件,易为普通实验室和研究人员所掌握。而链终止法需要单链模板、特异的寡核苷酸引物和高质量的大肠杆菌 DNA 聚合酶大片段(Klen
26、ow 片段) ,这在二十世纪八十年代一般的实验室很难做到。但随着 M13mp 载体的发展、DNA 合成技术的进步及 Sanger法测序反应的不断完善,至今 DNA 测序已大都采用 Sanger 法进行。然而,Maxam-Gilbert 法可对合成的寡核苷酸进行测序,可以分析 DNA 甲基化修饰情况,还可以通过化学保护及修饰等干扰实验来研究 DNA 的二级结构和 DNA 与蛋白质的相互作用,这些仍然是 Maxam-Gilbert 法所独具的鲜明特点。当然,如同双脱氧终止法一样,化学降解法测序的主要限制因素也是测序凝胶的分辨能力。化学测序法一般都用 32P 标记,所以与用 32S 标记作标记的末端
27、终止法相比,它显示的条带较宽且有扩散现象,这限制了化学降解法在对较大 DNA 片段测序时的分辨能力。一般一块电泳胶上最多能读出 200250 核苷酸序列。然而,如果按 2 个相反的取向分别从 DNA 片段的两端进行测序,则可克服这一不足。三、DNA 序列分析的自动化双脱氧终止法和化学降解法自 1997 年提出并的逐渐完善,无疑是目前公认的二种最通用、最有效的 DNA 序列分析方法,Sanger、Maxam 和 Gilbert 等人也因此分享了 1979 年度诺贝尔化学奖。但实际操作中都存在一些共同的问题,如放射性核素的污染,操作步骤繁琐、效率低和速度慢等缺点,特别是结果判断的读片过程实在是费时
28、又乏味的工作。随着计算机软件技术、仪器制造和分子生物学研究的迅速发展,DNA 自动化测序技术取得了突破性进展,以其简单(自动化) 、安全(非同位素) 、精确(计算机控制)和快速等优点,已成为今天 DNA 序列分析的主流。DNA 序列分析的自动化包括两个方面的内容,一是指“分析反应”的自动化,更重要的一方面则是指反应产物(标记 DNA 片段)分析的自动化。虽然各种 DNA 自动测序系统差别很大,但 Sanger 法所采用的 DNA 聚合酶和双脱氧核苷酸链终止的原理,亦是现今自动化测序的最佳选择方案。即大都沿用Sanger 的双脱氧核苷酸链终止法原理进行测序反应,主要的差别在于非放射性标记物和反应
29、产物(标记 DNA 片段)分析系统。仅举例简介其基本原理: ALF 全自动激光荧光 DNA 测序系统ALF 自动 DNA 测序系统,是由德国海德堡欧洲分子生物学实验室(EMBL)等提出和设计的。该系统采用非放射性的单一 Cy5 荧光素标记测序引物。沿用双脱氧链终止法进行反应,分别生成 4 组终止于不同种类碱基、带有 Cy5 荧光素标记的 DNA 片段。A、G、C 和 T 四组反应物在变性凝胶上电泳,每个泳道都有一个由激光枪和探测器组成的检测装置,当 Cy5 荧光素标记的DNA 条带迁移至探测区并遇上激光时,荧光标记被激活并释放出光信号,光信号由光探测器接收;最后电脑将收集到的信号(原始数据)进
30、行处理,获得样品 DNA 的最终序列。ALF 系统包括电源、电泳系统、探测系统、驱控系统(计算机)和输出设备(绘图仪)等。与传统的手工操作测序相比,ALF 系统能直接获取原始数据并及时加以处理。该系统在仪器硬件和驱动软件的设计上都进行了不断的改进,近年推出了 ALF expressTM 全自动激光荧光 DNA 测序仪。该仪器设计独特,可提供快速可靠的核酸测序、片段分析和突变检测。目前广泛应用于人类基因组计划,在此种大规模序列测定中,该仪器起到了重要的初筛作用。 ABI 型全自动 DNA 测序仪ABI 测序仪是由 Perkin Elmer(PE 公司)推出的 DNA 自动化测序仪。其特点是采用专
31、利的 4 种荧光染料分别标记终止物 ddNTP 或引物,经 Sanger 测序反应后,反应产物 3端(标记终止物法)或 5端(标记引物法)带有不同的荧光标记。一个样品的 4 个测序反应产物可在同一泳道内电泳,从而降低测序泳道间迁移率差异对精确性的影响。通过电泳将各个荧光标记片段分开,同时激光检测器同步扫描,激发的荧光经光栅分光,以区分代表不同碱基信息的不同颜色的荧光,并在 CCD(charge-coupled device)摄影机上同步成像。电脑可在电泳过程中对仪器运行情况进行同步检测,结果能以电泳图谱、荧光吸收峰图或碱基排列顺序等多种方式输出。ABI 测序仪包括电泳系统、激光检测装置、pow
32、er Macintosh 型苹果电脑、HP1600CM 型彩色打印机、 DNA 序列分析软件以及 DNA 片段大小和定量分析软件(Gene ScanTM) 。该系统采用电脑单点控制整个 DNA 测序仪,包括电泳参数设置、数据收集、数据分析及结果输出等。目前 PE 公司已生产出377,373,310 和 3700 型 DNA 测序仪。377 型全自动 DNA 测序仪为最新产品,具有可一次测定多个样品(64 个以上) 、测序精确度高和每个样品判读序列长(约 700bp)等优点。测序速度高达 200bp/h,比 373 型效率提高了许多。ABI 测序仪在人类基因组测序和 cDNA 测序研究中应用最为
33、广泛。此外,亦可以使用各种辅助软件进行 DNA 定量分析和大小分析,故可广泛应用于基因突变分析(SSCP) 、DNA 指纹图谱分析、基因连锁图谱分析及基因表达水平分析等。四、测序策略尽管核酸序列测定方法越来越成熟、简便并且可以自动化,但事实上,对于一个片段较长、序列未知的待测核酸而言,仍然是一件耗时且繁琐的工作。对于一个待测 DNA 分子,要制定一个能够简捷准确的测定方案,一般可以从以下几个方面考虑: DNA 片段大小。 背景资料:是否清楚 DNA 限制性酶切图谱,是否有一段已知序列,是否具有重复序列等。 测序目的:测定未知序列;确定重组 DNA 的方向与结构;对突变(如点突变)进行定位和鉴定
34、;比较性研究,如比较同种病毒不同株系之间的基因差异。后 3 种测序目的称为确证性测序。 实验条件:如手工测序还是自动化测序,合成引物费用等。由于单套测序反应所能准确测定的 DNA 序列最长一般仅 400500bp。因此,在进行序列测定之前,必须首先考虑待测 DNA 分子的大小,其次是所要测定的序列范围以及要求的序列精确程度等,再结合实验室的条件选择切实可行的克隆及测序方案。 确证性测序策略多数情况下,测序是对已知序列的次级克隆进行鉴定和证实(即确证性测序) ,如次级克隆 DNA 的插入方向、定点突变的检测、删切产物的鉴定和待表达基因阅读框架的调整等。这类 DNA 片段通常较小,只需了解两端的部
35、分序列即可。所以只需直接克隆到 M13mp 或者质粒载体中,进行单链或双链模板测序。对于一个稍大的 DNA 片段的确证性测序,可以利用通用引物分别从两端开始双向测序,再通过中间重迭部分拼出全序列。对于更大的的 DNA 序列,可以在序列适当区段增加一个或数个测序引物,分别测序再拼出全序列。 未知 DNA 序列的测定策略未知 DNA 序列的测定是指确定一个未知序列的准确长度及核苷酸排列顺序。未知 DNA 序列的测定,复杂而费时。目前已发展了一些可行的策略。对于较小的目的 DNA 片段(如小于 400bp) ,可以利用直接利用 M13mp 或质粒系统(如 pUC18 等)克隆、测序。随着质粒 DNA
36、 序列测定技术的改进,目前其测序水平基本上已达到 M13mp 单链 DNA 测序水平,利用质粒载体系统具有显著的优势。因此,除非有特殊用途,如体外定点突变,都可以用 pUC 系统代替 M13mp 系统进行克隆测序。如果是数千个碱基的大片段未知序列 DNA,且要求精确测定其整个序列,就必需将其切割成适当大小的各个片段(300400bp)分别进行次级克隆再进行测序,最后拼出全序列。可以考虑以下几种方法:1 随机克隆法或称鸟枪法 这是一种传统的方法,即利用 DNase或超声波,将目的 DNA 大片段随机切割成小片段,并分别进行亚克隆,然后再测定亚克隆的序列,通过排列分析,可获得目的 DNA 的全序列
37、。但由于用于测序的克隆是随机挑选出来的,因此某些区段往往被重复测定,有时需要很长时间才能确定最后几个亚克隆的序列而拼出全序列。2限制性酶切片段亚克隆法 首先需要对目的 DNA 进行酶切分析确定其酶切图谱。再选择合适的限制性酶消化以制备各种不同长度的限制性酶切片段,并亚克隆到测序载体上建立亚克隆库。然后分别测定各个亚克隆的核苷酸序列,通过排列分析,即可获取目的 DNA 的全序列。但实际上应用此法相当不易,仅当目的 DNA 片段上限制性酶切位点分布较均匀、且片段不大情况下,可考虑用此策略。3定向连续次级克隆 大片段未知 DNA 序列片段的定向连续次级克隆法,亦称嵌套系列缺失突变体法,是目前常用的一种策略,此法具有节省工作量、便于拼读等优点。这些次级克隆具有其同的缺失起点(通常在目的 DNA 的一端) ,并逐步延伸到目的序列不同距离。从而使目的 DNA 中较远距离的序列逐渐地进入了通用引物的测序范围之内。目前,利用核酸外切酶和核酸酶 BAL31 构建连续次级克隆的方法比较成熟。