1、分子标记是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,是 DNA 水平遗传多态性的直接的反映。与其他几种遗传标记形态学标记、生物化学标记、细胞学标记相比,DNA 分子标记具有的优越性有:大多数分子标记为共显性,对隐性的性状的选择十分便利;基因组变异极其丰富,分子标记的数量几乎是无限的;在生物发育的不同阶段,不同组织的 DNA 都可用于标记分析;分子标记揭示来自 DNA 的变异;表现为中性,不影响目标性状的表达,与不良性状无连锁;检测手段简单、迅速。随着分子生物学技术的发展,现在 DNA 分子标记技术已有数十种,广泛应用于遗传育种、基因组作图、基因定位、物种亲缘关系鉴别、基因库构建、基因克
2、隆等方面。分子标记的概念有广义和狭义之分。广义的分子标记是指可遗传的并可检测的 DNA序列或蛋白质。狭义分子标记是指能反映生物个体或种群间基因组中某种差异的特异性DNA 片段。理想的分子标记必须达以下几个要求:(1) 具有高的多态性;(2) 共显性遗传,即利用分子标记可鉴别二倍体中杂合和纯合基因型;(3) 能明确辨别等位基因;(4) 遍布整个基因组;(5) 除特殊位点的标记外,要求分子标记均匀分布于整个基因组;(6) 选择中性(即无基因多效性);(7) 检测手段简单、快速(如实验程序易自动化) ;(8) 开发成本和使用成本尽量低廉;(9) 在实验室内和实验室间重复性好(便于数据交换 )。但是,
3、目前发现的任何一种分子标记均不能满足以上所有要求。一、基于分子杂交技术的分子标记技术此类标记技术是利用限制性内切酶解及凝胶电泳分离不同的生物 DNA 分子,然后用经标记的特异 DNA 探针与之进行杂交,通过放射自显影或非同位素显色技术来揭示 DNA 的多态性。 限制性片段长度多态性(Restriction Fragment Length Polymorphism,RFLP) 1974 年 Grodzicker 等创立了限制性片段长度多态性(RFLP)技术,它是一种以DNADNA 杂交为基础的第一代遗传标记。RFLP 基本原理:利用特定的限制性内切酶识别并切割不同生物个体的基因组 DNA,得到大
4、小不等的 DNA 片段,所产生的 DNA 数目和各个片段的长度反映了 DNA 分子上不同酶切位点的分布情况。通过凝胶电泳分析这些片段,就形成不同带,然后与克隆 DNA 探针进行 Southern 杂交和放射显影,即获得反映个体特异性的 RFLP 图谱。它所代表的是基因组 DNA 在限制性内切酶消化后产生片段在长度上差异。由于不同个体的等位基因之间碱基的替换、重排、缺失等变化导致限制内切酶识别和酶切发生改变从而造成基因型间限制性片段长度的差异。RFLP 的等位基因其有共显性特点。 RFLP 标记位点数量不受限制,通常可检测到的基因座位数为 14 个。RFLP 技术也存在一些缺陷,主要是克隆可表现
5、基因组 DNA 多态性的探针较为困难;另外,实验操作较繁锁,检测周期长,成本费用也很高。自 RFLP问世以来,已经在基因定位及分型、遗传连锁图谱的构建、疾病的基因诊断等研究中仍得到了广泛的应用。 数目可变串联重复多态性(Variable Number of Tandem Repeats,VNTR ) 数目可变串联重复序列又称小卫星 DNA (Minisatellite DNA),是一种重复 DNA 小序列,为 10 到几百核苷酸,拷贝数 10 一 10001 不等。VNTR 基本原理与 RFLP 大致相同,只是对限制性内切酶和 DNA 探针有特殊要求:(1)限制性内切酶的酶切位点必须不在重复序
6、列中,以保证小卫星或微卫星序列的完整性。(2)内切酶在基因组的其他部位有较多酶切位点,则可使卫星序列所在片段含有较少无关序列,通过电泳可充分显示不同长度重复序列片段的多态性。(3)分子杂交所用 DNA 探针核昔酸序列必须是小卫星序列或微卫星序列,通过分子杂交和放射自显影后,就可一次性检测到众多小卫星或微卫星位点,得到个体特异性的 DNA 指纹图谱。小卫星标记的多态信息含量较高,在 17 一 19 之间。缺点是数量有限,而且在基因组上分布不均匀,这就极大限制其在基因定位中的应用。VNTR 也存在实验操作繁琐、检测时间长、成本高的缺点。 二、基于 PCR 技术的分子标记技术(一) 、随机引物的 P
7、CR 标记所用引物的核苷酸序列是随机的,其扩增的 DNA 区域事先未知。随机引物 PCR扩增的 DNA 区段产生多态性的分子基础是模板 DNA 扩增区段上引物结合位点的碱基序列的突变,不同来源的基因组在该区段上表现为扩增产物有无差异或扩增片段大小的差异。随机引物 PCR 标记表现为显性或共显性。 随机扩增多态性 DNA (Random Amplified Polymorphism DNA,RAPD )RAPD 技术是 1990 年由 Wiliam 和 Welsh 等人利用 PCR 技术发展的检测 DNA 多态性的方法。基本原理:它是利用随机引物(一般为 810bp)通过 PCR 反应非定点扩增
8、DNA 片段,然后用凝胶电泳分析扩增产物 DNA 片段的多态性。扩增片段多态性便反映了基因组相应区域的 DNA 多态性。RAPD 所使用的引物各不相同,但对任一特定引物,它在基因组 DNA 序列上有其特定的结合位点,一旦基因组在这些区域发生 DAN 片段插人、缺失或碱基突变,就可能导致这些特定结合位点的分布发生变化,从而导致扩增产物数量和大小发生改变,表现出多态性。就单一引物而言,其只能检测基因组特定区域 DNA 多态性,但利用一系列引物则可使检测区域扩大到整个基因组,因此,RAPD 可用于对整个基因组 DNA 进行多态性检测,也可用于构建基因组指纹图谱。与 RFLP 相比,RAPD 具有以下
9、优点: (1)技术简单,检测速度快; (2) RAPD 分析只需少量 DNA 样品;(3)不依赖于种属特异性和基因组结构,一套引物可用于不同生物基因组分析;(4) 成本较低。但 RAPD 也存在一些缺点:(1) RAPD 标记是一个显性标记,不能鉴别杂合子和纯合子;(2)存在共迁移问题,凝胶电泳只能分开不同长度 DNA 片段,而不能分开那些分子量相同但碱基序列组成不同的 DNA 片段;(3) RAPD 技术中影响因素很多,所以实验的稳定性和重复性差。 任意引物 PCR (Arbitrarily Primed Polymerase Chain Reaction, APPCR) 在 APPCR 分
10、析中,所使用的引物较长(1050 bp) , PCR 反应分为两个阶段,首先寡核昔酸引物在低严谨条件下与模板 DNA 退火,此时发生了一些合成,以便稳定模板与引物之间相互作用。然后进行高严谨退火条件的循环,两个位点间那些序列在低严谨度退火条件下发生的引物延伸可继续在高严谨条件下扩增。采用变性聚丙烯酞胺凝胶电泳分析 PCR 产物,最终反应结果与 RAPD 类似。只要设计的引物在低严谨退火条件下能减少引物产生人为产物,应用成对组合的引物可以产生新的 APPC R 谱带,但引物配对组合使用时,得到的图谱与单引物单独使用时产生的图谱之和很不相同,这样,50 个引物能产生 1250 种不同指纹图谱。AP
11、PCR 方法不需预知序列资料,而且检测的基因组样本是任意的,还能够用于检测近等基因系(或同类系)中的多态性。APPCR 的缺点是每个新的多态性都必须经纯化才能进一步使用。另外,此方法在杂合体中仅可辨别长度多态性。 DNA 扩增指纹印迹(DNA Amplification Fingerprinting,DAF)DAF 是一种改进的 RAPD 分析技术,与 RAPD 技术不同的是,DAF 分析中所使用的引物浓度更高,长度更短( 一般为 5 一 8 bp),因此它所提供的谱带信息比 RAPD 大得多,如当使用 5 个核昔酸的引物时,引物和模板的组合大约可扩增出 10 一 100 个 DNA 片段。P
12、CR 扩增产物是在凝胶上进行分离,通过银染即可产生非常复杂带型。(二) 、特异引物的 PCR 标记 特异引物的 PCR 标记所用引物是针对已知序列的 DNA 区段而设计的,具有特定核苷酸序列(通常为 1824 bp) ,可在常规 PCR 复性温度下进行扩增,对基因组 DNA 的特定区域进行多态性分析。 序列标志位点(Sequence Tagged Sites,STS)STS 是对以特定对引物序进行 PCR 特异扩增的一类分子标记的统称。通过设计特定的引物,使其与基因组 DNA 序列中特定结合位点结合,从而可用来扩增基因组中特定区域,分析其多态性。利用特异 PCR 技术的最大优点是它产生信息非常
13、可靠,而不像RFLP 和 RAPD 那样存在某种模糊性。 简单重复序列(Simple Sequence Repeat ,SSR)简单重复序(SSR)也称微卫星 DNA,其串联重复的核心序列为 1 一 6 bp,其中最常见是双核昔酸重复,即(CA) n 和(TG) n 每个微卫星 DNA 的核心序列结构相同,重复单位数目 10 一 60 个,其高度多态性主要来源于串联数目的不同。SSR 标记的基本原理:根据微卫星序列两端互补序列设计引物,通过 PCR 反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用 PCR 的方法扩增出不同长度的 PCR 产物,将扩增产物进行凝胶电泳,根据分离片段的
14、大小决定基因型并计算等位基因频率。SSR 具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点; (2)微卫星呈共显性遗传,故可鉴别杂合子和纯合子;(3)所需 DNA 量少。显然,在采用 SSR 技术分析微卫星 DNA 多态性时必须知道重复序列两端的 DNA 序列的信息。如不能直接从DNA 数据库查寻则首先必须对其进行测序。 序列特异性扩增区(Sequencecharacterized Amplified Region,SCAR) SCAR 标记是在 RAPD 技术基础上发展起来的。SCAR 标记是将目标 RAPD 片段进行克隆并对其末端测序,根据 RAPD 片段两端序列设计特异引物
15、,对基因 DNA 片段再进行 PCR 特异扩增,把与原 RAPD 片段相对应的单一位点鉴别出来。 SCAR 标记是共显性遗传,待检 DNA 间的差异可直接通过有无扩增产物来显示。SCAR 标记方便、快捷、可靠,可以快速检测大量个体,结果稳定性好,重现性高。 单引物扩增反应(Single Primer Amplificatipn Reawtion,SPAR)SPAR 技术是与 RAPD 技术相似的一种标记技术,SPAR 也只用一个引物,但所用的引物是在 SSR 的基础上设计的。这些引物能与 SSR 之间的间隔序列进行特异性结合,然后通过 P(:R 技术扩增 SSR 之间的 DNA 序列,凝胶电泳
16、分离扩增产物,分析其多态性。另外,还有一种与 SPAR 技术非常相似的标记技术,即 ISTR ( Inverse Sequencetagged Repeat)技术, ISTR 所用的引物是在反向重复序列基础上设计的,PCR 扩增的是反向重复序列之间的 DIVA 序列。 DNA 单链构象多态性(Single Strand Conformation Polymorphism,SSCP)SSCP 是指等长的单链 DNA 因核昔酸序列的差异而产生构象变异,在非变性聚丙烯酞胺中的表现为电泳迁移率的差别。单链 DNA 构象分析对 DNA 序列的改变非常敏感,常常一个碱基差别都能显示出来。在 SSCP 分析
17、中,利用 PCR 技术定点扩增基因组 DNA中某一目的片段,将扩增产物进行变性处理,双链 DNA 分开成单链,再用非变性聚丙烯酞胺凝胶电泳分离,根据条带位置变化来判断目的片段中是否存在突变。SSCP 结果判定是通过多个样品之间对比,观察条带之间位置改变,从而显示出不同生物个体的 DNA 特异性,达到指纹分析目的。为了进一步提高 SSCP 的检出率,可将 SSCP 分析与其它突变检测方法相结合。其中与杂交双链分析(Heterocluplex analysis,Het) 法结合可以大大提高检出率。Het 法是用探针与要检测的单链 DNA 或 RNA 进行杂交,含有一对碱基对错配的杂交链可以和完全互
18、补的杂交链在非变性 PAG 凝胶上通过电泳被分离开。对同一靶序列分别进行 SSCP 和 Het 分析可以使点突变的检出率接近 100%,而且实验简便。 双脱氧化指纹法(Dideoxy Fingerprints,ddF )ddF 是将双脱氧末端终止测序法与 SSCP 结合起来的分析技术,对由双脱氧末端终止的长短不一的单链 DNA 进行 SSCP 分析。如果目的片段存在一个突变,则所有大于某一大小对应于突主变位置的双脱氧终止片段无野生型系统,对于每一个突有多次机会检测其迁移率改变,提高了检测突变的效率。ddF 方法克服了 SSCP 分析时因 DNA 长度影响SSCP 显示的困难,通过一种双脱氧核昔
19、酸生产特异性的单链 DNA,使其中长度合适的DNA 片段显示 SSCP 改变。三、基于限制性酶切和 PCR 技术的 DNA 标记 扩增片段长度多态性(Amplified Fragment Length Polymorphism,AFLP ) AFLP 是 1993 年荷兰科学家 Zbaeau 和 Vos 发展起来的一种检测 DN A 多态性的新方法。AFLP 是 RFLP 与 PCR 相结合的产物,其基本原理是先利用限制性内切酶水解基因组 DNA 产生不同大小的 DNA 片段,再使双链人工接头的酶切片段相边接,作为扩增反应的模板 DNA,然后以人工接头的互补链为引物进行预扩增,最后在接头互补链
20、的基础上添加 13 个选择性核苷酸作引物对模板 DNA 基因再进行选择性扩增,通过聚丙烯酰胺凝胶电泳分离检测获得的 DNA 扩增片段,根据扩增片段长度的不同检测出多态性。引物由三部分组成:与人工接头互补的核心碱基序列、限制性内切酶识别序列、引物 3端的选择碱基序列(110 bp) 。接头与接头相邻的酶切片段的几个碱基序列为结合位点。该技术的独特之处在于所用的专用引物可在知道 DNA 信息的前提下就可对酶切片段进行PCR 扩增。为使酶切浓度大小分布均匀,一般采用两个限制性内切酶,一个酶为多切点,另一个酶切点数较少,因而 AFLP 分析产生的主要是由两个酶共同酶切的片段。 AFLP 结合了 RFL
21、P 和 RAPD 两种技术的优点,具有分辨率高、稳定性好、效率高的优点。但它的技术费用昂贵,对 DNA 的纯度和内切酶的质量要求很高。尽管 AFLP 技术诞生时间较短,但可称之为分子标记技术的又一次重大突破,被认为是目前一种十分理想、有效的分子标记。 酶切扩增多态性序列(Cleaved Amplified Polymorphism Sequences,CAPS ) CAPS 技术又称为 PCRRFLP,它实质上是 PCR 技术与 RFLP 技术结合的一种方法。CAPS 的基本原理是利用己知位点的 DNA 序列资源设计出一套特异性的 PCR 引物(1927bp) ,然后用这些引物扩增该位点上的某
22、一 DNA 片段,接着用一种专一性的限制性内切酶切割所得扩增产物,凝胶电泳分离酶切片段,染色并进行 RFLP 分析。GAPS 标记揭示的是特异 PGR 片段的限制性长度变异的信息。CAPS 是一类共显性分子标记,其优点是避免了 RFLP 分析中膜转印这一步骤,又能保持 RFLP 分析的精确度。另外,由于很多限制性内切酶均可与扩增 DNA 酶切,所以检测到多态性机会较大。四、基于 DNA 芯片技术的分子标记技术核苷酸多态性(Single Nucleotide Polymorphism,SNP)SNP 标记是美国学者 Lander E 于 1996 年提出的第三代 DNA 遗传标记。SNP 是指同
23、一位点的不同等位基因之间仅有个别核苷酸的差异或只有小的插入、缺失等。从分子水平上对单个核苷酸的差异进行检测,SNP 标记可帮助区分两个个体遗传物质的差异。人类基因组大约每 1000 bp SNP 出现一次,已有 2000 多个标记定位于人类染色体,对人类基因组学研究具有重要意义。检测 SNP 的最佳方法是 DNA 芯片技术。SNP 被称为第三代 DNA 分子标记技术,随着 DNA 芯片技术的发展,其有望成为最重要最有效的分子标记技。第 3 代分子标记1.3.1 SNP 标记技术。单核苷酸多态性(Single nucleotidepolymorphism,SNP)被称为第 3 代 DNA 分子标
24、记,是指同一位点的不同等位基因之间个别核苷酸的差异,这种差异包括单个碱基的缺失或插入20,更常见的是单个核苷酸的替换 ,且常发生在嘌呤碱基(A 与 G)和嘧啶碱基(C 与 T)之间。SNP 标记可帮助区分两个个体遗传物质的差异,被认为是应用前景最好的遗传标记。目前,已有 2 000 多个标记定位于人类染色体上,在拟南芥上也已发展出 236 个 SNP 标记。在这些 SNP 标记中大约有 30%包含限制性位点的多态性。检测 SNP 的最佳方法是 DNA 芯片技术 ,最新报道的微芯片电泳(Microchip electrophoresis), 可以高速度地检测临床样品的SNP,它比毛细管电泳和板电
25、泳的速度可分别提高 10 和 50倍21。SNP 与第 1 代的 RFLP 及第 2 代的 SSR 标记的不同有2 个方面:其一,SNP 不再以 DNA 片段的长度变化作为检测手段,而直接以序列变异作为标记;其二,SNP 标记分析完全摒弃了经典的凝胶电泳,代之以最新的 DNA 芯片技术。1.3.2 EST 标记技术。表达序列标签 (Expressed sequenceTag,EST)是美国国立卫生研究院(National Institutes of Health,NIH)的生物学家 Venter 于 1991 年提出的22。随着人类基因组计划的开展,EST 技术首先被广泛应用于寻找人类新基因,
26、绘制人类基因组图谱,识别基因组序列编码区等研究领域,之后又被广泛应用于植物基因组研究23。EST 是指在来源于不同组织的 cDNA 文库中随机挑选克隆、测序,得到部分cDNA 序列,一个 EST 对应于某一种 mRNA 的 cDNA 克隆的一段序列 ,长度一般为150500 bp,只含有基因编码区域。EST 可代表生物体某种组织某一时间的一个表达基因,所以被称之为“表达序列标鉴”;而 EST 的数目则显示出其代表的基因表达的拷贝数,一个基因的表达次数越多,其相应的 cDNA 克隆越多,所以通过对 cDNA 克隆的测序分析可以了解基因的表达丰度24。目前构建 cDNA 文库一般都使用试剂盒,方法
27、成熟,而且飞速发展的 DNA 测序技术,也使得进一步降低大规模 DNA 序列测定成本成为可能25。【分子标记的应用领域】(一) 、基因组作图和基因定位研究长期以来,各种生物的遗传图谱几乎都是根据诸如形态、生理和生化等常规标记来构建的,所建成的遗传图谱仅限少数种类的生物,而且图谱分辨率大多很低,图距大,饱和度低,因而应用价值有限。分子标记用于遗传图谱构建是遗传学领域的重大进展之一。随着新的标记技术的发展,生物遗传图谱名单上的新成员将不断增加,图谱上标记的密度也将越来越高。建立起完整的高密度的分子图谱,就可以定位感兴趣的基因。(二) 、基于图谱克隆基因图位克隆(Mapbascd cloning)是
28、近几年随着分子标记遗传图谱的相继建立和基因分子定位而发展起来的一种新的基因克隆技术。利用分子标记辅助的图位克隆无需事先知道基因的序列,也不必了解基因的表达产物,就可以直接克隆基因。图位克隆是最为通用的基因识别途径,至少在理论上适用于一切基因。基因组研究提供的高密度遗传图谱、大尺寸物理图谱、大片段基因组文库和基因组全序列,已为图位克隆的广泛应用铺平了道路。(三) 、物种亲缘关系和系统分类中的应用分子标记广泛存在于基因组的各个区域,通过对随机分布于整个基因组的分子标记的多态性进行比较,就能够全面评估研究对象的多样性,并揭示其遗传本质。利用遗传多样性的结果可以对物种进行聚类分析,进而了解其系统发育与
29、亲缘关系。分子标记的发展为研究物种亲缘关系和系统分类提供了有力的手段。(四) 、用于疾病诊断和遗传病连锁分析1980 年,Bostein 等成功的将 PFLP 技术用于镰刀型贫血症的诊断分析,开创了基因诊断的先河。PFLP 是以孟德尔方式遗传,因此可以作为染色体上致病基因座位的遗传标志。目前,许多与相连锁的致病基因得以定位。小卫星和微卫星因其高度多态性而被广泛用于疾病诊断和遗传病的连锁分析。随着高通量 SNP 检测技术方法的出现,作为数量最多且易于批量检测的多态标记,SNP 在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的易感性研究中将发挥愈来愈重要的作用。