1、植物分子育种教案沈法富i目 录第一编 植物分子标记辅助育种(20 学时)第一章遗传标记概述(3 学时)第一节 遗传标记的发展第二节 遗传标记的种类(一) 形态标记(二) 细胞学标记(三) 蛋白质标记(四) DNA 标记第二章 DNA 标记技术(3 学时)第一节 DNA 杂交的分子标记(一) RFLP 技术(二) VNTR 技术第二节 PCR 技术的分子标记(一) 随机引物的 PCR 标记(二) 特异引物的 PCR 标记第三节 限制性酶切和 PCR 的分子标记(一) AFLP 标记(二) CAPS 标记第四节 单核苷酸多态性的 DNA 标记第三章 分子图谱的构建(4 学时)第一节 作图群体的建立
2、第二节 图谱构建的理论基础第三节 DNA 标记分离数据的数学处理第四节 DNA 标记图谱的完善第五节 比较作图第四章 质量性状的分子标记(3 学时)第一节 近等基因系分析法第二节 分离体分组混合分析法第五章 数量性状的分子标记(3 学时)第一节 数量性状基因的初级定位第二节 数量性状基因的精细定位第六章 分子标记辅助选择技术(4 学时)第一节 质量性状的标记辅助选择技术第二节 数量性状的标记辅助选择技术第三节 标记辅助选择技术的应用研究第四节 分子标记辅助选择的发展策略第一编 转基因植物育种(20 学时)第一章 转基因育种的基础(4 学时)第一节 目的基因的克隆与表达载体的构建第二节 植物遗传
3、转化技术第三节 转基因植物的筛选与鉴定第四节 转基因植物的遗传规律第二章 转基因植物与优质育种(3 学时)第一节 改变植物贮藏蛋白的品质第二节 调节碳水化合物的合成第三节 改善植物油脂的品质第四节 改良棉花纤维品质ii第三章 转基因抗病育种(3 学时)第一节 植物抗病基因的克隆第二节 抗植物病毒基因工程第三节 抗真菌植物基因工程第四章 转基因抗虫育种(3 学时)第一节 Bt 毒蛋白基因第二节 其他抗虫基因第三节 植物转基因抗虫研究的进展第五章 转基因抗非生物逆境育种(4 学时)第一节 植物耐盐基因工程第二节 耐旱基因工程第三节 抗除草剂基因工程第四节 抗寒冷基因工程第六章 转基因作物的安全性及
4、其对策(3 学时)第一节 转基因作物的潜在风险第二节 转基因作物作为食品的安全性问题3第一章 遗传标记概述遗传标记是指可以明确反映遗传多态性的生物特征。在经典遗传学中,遗传多态性是指等位基因的变异。在现代遗传学中,遗传多态性是指基因组中任何座位上的相对差异。遗传标记可以帮助人们更好地研究生物的遗传与变异规律。在遗传学研究中遗传标记主要应用于连锁分析、基因定位、遗传作图及基因转移等。在作物育种中通常将与育种目标性状紧密连锁的遗传标记用来对目标性状进行追踪选择。在现代分子育种研究中,遗传标记的应用已成为基因定位和辅助选择的主要手段。纵观遗传学的发展历史,每一种新型遗传标记的发现,都大大推进了遗传学
5、的发展。第一节 遗传标记的发展19 世纪后半叶,孟德尔(G. . Mendel)以豌豆为材料,利用七对外部形态特征差异明显、易于识别的相对性状,对杂种后代的不同个体依性状表现进行归类分析,提出了“遗传因子”假说,并发现了生物遗传的分离规律和独立分配规律,即著名的孟德尔定律。1910 年,摩尔根(T.H. Morgan)在哥伦比亚大学的实验室发现一种奇特的果蝇,它的眼色不是野生型的红色而是白色,摩尔根用白眼雄蝇与野生型杂交,发现在 F1 代中白眼为隐性性状,在 F2 代中红眼与白眼的遗传符合孟德尔分离规律。但是在按雌雄性别分别记数时发现了异常现象,雌蝇全部为红眼,雄蝇中一半为红眼一半为白眼。由此
6、发现决定眼色的基因与决定性别的基因是连锁遗传的,从而产生了著名的摩尔根遗传学说。果蝇白眼遗传标记的发现成为近代遗传学研究的一个里程碑。1913 年,A. H. Sturtevant 通过连锁遗传分析成功地在果蝇的 X 染色体上定位了 5个基因,从此确定了遗传学的染色体理论和遗传作图的基本原理。1910 年以后,摩尔根将孟德尔“遗传因子”的行为与染色体的行为结合起来进行研究,证实了“遗传因子”是染色体上占有一定位置的实体,由此导致了细胞遗传学的诞生。通过对不同物种染色体形态、数目和结构的研究,发现各种非整倍体、染色体结构变异以及各种异形染色体等都有其特定的细胞学特征,可以作为一种遗传标记来测定基
7、因所在的染色体及其相对位置,或通过染色体代换等遗传操作进行基因定位。这种能明确显示遗传多态性的细胞学特征,通称为细胞学标记。1941 年,美国遗传学家 G. W. Beadle 和生化学家 E. L. Tatum 通过研究红色面包霉的生化突变型,对一系列营养缺陷型进行遗传分析,提出了“一个基因一个酶”的假说,创立了生化遗传学。50 年代许多科学家发现同一种酶可具有多种不同的形式。同时由于淀粉凝胶电泳技术的发展和组织化学染色剂的使用,使这种酶的多种形式成为肉眼可辩的带型酶谱。1959 年,C. L. Markert 和 F. Moller 根据对几种动物乳糖脱氢酶的多种形式的研究,提出了用同工酶
8、(isozyme)一词来描述具有同一底物专一性的不同分子形式的酶,并证实了同工酶具有组织、发育及物种的特异性。通过同工酶的电泳谱带可以清楚地识别同工酶的基因型,因此可以作为一种遗传标记加以利用,并且可以将编码酶的基因通过遗传分析定位在染色体上。同工酶标记是建立在生化遗传学基础上的,所以又称为生化标记或蛋白质标记。蛋白质标记是一种分子标记,但仍是以基因表达的结果(表现型)为基础的,是对基因的间接反映。1953 年,J. D. Watson 和 F. H. C. Crick 提出了 DNA 分子结构的双螺旋模型,圆满地解释了 DNA 就是基因的有机化学实体,宣布了分子遗传学时代的到来。现代基因概念
9、的发展使直接利用 DNA 分子中核苷酸序列的变异作为遗传标记成为可能。1980 年,人类遗传学家 D.R.L. Botstein 等首先提出了 DNA 限制性片段长度多态性(RFLP)可以作为遗传标记的思想,开创了直接应用 DNA 多态性发展遗传标记的新阶段。RFLP 标记的诞生大大加速了各种生物遗传图谱的建立和发展,同时也提高了基因定位的精度和速度。1985 年,DNA 多聚酶链式反应(PCR)技术的诞生,使直接体外扩增 DNA 以检测其多态性成为可能。1990年,J.G.K. Williams 等和 J. Welsh 等两个研究小组应用 PCR 技术同时发展了一种新的 RAPD 分子标记。
10、随后,基于 PCR 技术的新型分子标记不断涌现,使得 DNA 标记走向商业化、实用化。由形态标记向分子标记逐步发展的过程,体现了人类对于基因由现象到本质的认识发展过程。在这一过程中,传统的形态标记和细胞学标记始终是遗传标记发展的基础,而蛋白质标记和 DNA 标记则是遗传学、生物化学和分子生物学的发展导致遗传标记发展的必然结果。随着科学技术的不断进步,新型的分子标记还将不断涌现,新近发展的基于 DNA 测序和 DNA 芯片技术的 SNP 标记已为 DNA 标记技术的发展展示了美好的前景。4第二节 遗传标记的种类一、形态标记形态标记是指那些能够明确显示遗传多态性的外观性状,如株高、穗形、粒色或芒毛
11、等的相对差异。典型的形态标记用肉眼即可识别和观察。广义的形态标记还包括那些借助简单测试即可识别的某些性状如生理特性、生殖特性、抗病虫性等。由自发突变或物理化学诱变均可获得具有特定形态特征的遗传标记材料。例如在组织培养及诱变育种过程中经常出现的大量变异材料,其中不乏在形态特征或生理特性上具有特殊表型的个体,经过选择,就可获得稳定遗传的形态标记材料。形态标记材料多数仅带有一个标记基因,但有的则带有多个标记基因。后者用于基因连锁分析时,可同时分析几个标记性状。形态标记材料在遗传研究和作物育种上都有重要的应用价值,因此对形态标记材料的收集、保存和利用历来受到各国研究者的重视。在水稻中,目前已有的形态标
12、记材料,大多是经过精心选育获得的。国际水稻所和日本系统地收集了大量的形态标记材料,并作为重要的种质资源加以保存。在水稻中已有多达 300 多个形态标记材料。在番茄中已发现的形态标记也有 300 多种,其中苗期无花色素标记与抗烟草花叶病毒病的 Tm-2 基因连锁,叶状腺的大小与抗桃霉病基因连锁。在大豆中也积累了大量的形态标记材料,其中部分标记基因已定位在相应的连锁群上(表 1.1) 。形态标记基因的染色体定位最初是通过经典的二点、三点测验进行的。通过判断不同性状间的遗传是否符合独立分配规律,来确定控制这些性状的基因是否连锁。采用这种方法把相互连锁在一起的基因定为一个连锁群,并与染色体相对应,以性
13、状间重组率作为这些基因在染色体上的相对距离,并确定其毗邻关系。1910 年,摩尔根领导的实验室根据对果蝇六个形态性状的分析,发现了连锁遗传现象,并根据研究性状与形态标记的连锁关系,构建了生物中第一张遗传连锁图,开创了利用已知染色体相对位置的标记基因定位未知基因的先例。1928 年,赵莲芳根据 8 个水稻品种的杂交资料,研究了茎、叶和颖花等器官的颜色、护颖长度、谷粒外形等 12 种性状的遗传,由其中 9 个基因的相互关系,确定了水稻的三个连锁群。借助于这种方法在一些栽培物种中确定了许多质量性状基因的连锁关系及其在染色体上的相对位置,并绘制出较为完整的遗传连锁图谱。以形态标记为基础的连锁群的建立为
14、生理、生化性状的遗传研究奠定了基础。由于形态标记数量少、可鉴别标记基因有限,因而难以建立饱和的遗传图谱。另外,许多形态标记还受环境、生育期等因素的影响,使形态标记在植物育种中的应用受到一些限制。5表 1.1 大豆部分形态标记性状及标记基因(Shoemaker and Olson 1993)标记性状 标记基因(括号内数字表示所在连锁群)色素花色 W1,w1(8)茸毛色 T,t (1)荚色 L1, l1( 5) ;L2 ,l2种皮 G,g(3)种脐 R,r-m(2) ;I ,i-i ,I-k ,i(7)双色 K1;K2;K3子叶色 D1(3) ;D2;Cyt-G,Y3叶小叶数目 L-f1,l-f2
15、叶形 ln(4) ;Lo,lo; l-w1,l-w2;l-b1 ,l-b2;落叶性 A叶绿素缺失 V1; y3;y4; y20茸毛类型 Pa1, pa1;Pa2 ,pa2;P1,p1(2) ;P2,p2(4) ;Pb,pb(14) ;Pc,pc;Pd1,pd2;Ps,ps茎扁化茎 f(11)节间长度 S,s短叶柄 Lps,lps矮杆 df2(6) ;df3;df4;df5(1)花花序长短 Se, se开花和成熟 E1, e1(1) ;E2,e2;E3,e3 ;E4 ,e4;E5,e5无限结荚习性 Dt1,dt1 ( 5) ;Dt2,dt2种子种皮健全度 De,de种皮泥膜 B1; B2; B3
16、根根部荧光 fr1(12) ;fr2 ;fr4;Fr3根瘤菌反应 rj1(11) ;Rj2;Rj3;Rj4雄性不育染色体联会突变 st2;st3;st4 ;st5(8)花药开裂不良 Ft花丝伸长不良 fs1;fs2雄性不育突变体 P2( 4) ;ms1(8) ;ms2;ms3;ms4;ms5;ms6(8)抗病性大豆灰斑病 Rcs1;Rcs2大豆霜霉病 Rpm白粉病 Rmd大豆疫根腐病 Rps(10)大豆锈病 Rpp1;Rpp2;Rpp3细菌性斑点病 Rpg1细菌性斑疹病 Rxp大豆花叶病毒病 Rsv1(13 ) ;Rsv2大豆孢囊线虫病 rhg1;rhg2;rhg3 ;Rhg4;二、细胞学标记
17、细胞学标记是指能明确显示遗传多态性的细胞学特征。染色体的结构特征和数量特征是常见的细胞学标记,它们分别反映了染色体结构上和数量上的遗传多态性。染色体结构特征包括染色体的核型和带型。核型特征是指染色体的长度、着丝粒位置和随体有无等,由此可以反映染色体的缺失、重复、倒位和易位等遗传变异;带型特征是指染色体经特殊染色显带后,带的颜色深浅、宽窄和位置顺序等,由此可以反映6染色体上常染色质和异染色质的分布差异。染色体数量特征是指细胞中染色体数目的多少,染色体数量上的遗传多态性包括整倍性和非整倍性的变异,前者如多倍体,后者如缺体、单体、三体、端着丝点染色体等非整倍体。用具有染色体数目和结构变异的材料与染色
18、体正常的材料进行杂交,其后代常导致特定染色体上的基因在减数分裂过程中的分离和重组发生偏离,由此可以测定基因所在的染色体及其相对位置。因此,染色体结构和数目的特征可以作为一种遗传标记。在玉米中利用 B-A 易位系,水稻中利用易位系,小麦中利用端着丝点染色体,大麦中利用端着丝点三体,棉花中利用易位和单体等非整倍体,番茄中利用各种三体,烟草中利用单体,已成功地将许多质量性状基因定位于染色体上,并建立了相应的连锁群。染色体结构和数量变异常具有相应的形态学特征,在多倍体植物中广泛用于基因定位研究。在小麦中,利用每条染色体的模式图、C-分带的带型、缺失断点的位置及分子标记在缺失间隔区的定位,构建了整个小麦
19、基因组的物理图谱。由于染色体结构和数量变异常具有相应的形态特征,因此,培育这样的细胞学标记材料,可以在杂种后代中直接对相应的形态标记进行选择,不必进行染色体鉴定就可确定其细胞学特征,从而提高细胞学标记的利用效率。表 1.2 给出了二倍体籼稻品种 IR36 的 12 条染色体的初级三体的形态特征。根据这些形态特征,在一般情况下可将这些初级三体与 IR36 区别开来。表 1.2 水稻 IR36 初级三体的形态特征(Khush et al. 1984)染色体 三体名称 特征1 三体 1(草状) 生长缓慢,高度不育,籽粒较细长且稍呈三角形,叶窄,与草相似2 三体 2(矮生) 小穗短,护颖较长,自交高度
20、不育,叶片短且基部附近常扭曲3 三体 4(不育) 植株最矮,叶片短厚呈革质,中脉凸出,穗伸出不完全,自交完全不育4 三体 12(高秆) 植株最高,叶片下垂,叶舌长,育性正常5 三体 5(叶片扭曲) 叶片短且扭曲,有密生茸毛,穗短,小穗着生紧密,结实率高6 三体 3(有芒) 籽粒有芒,叶片厚而半卷,叶舌长,自交高度不育7 三体 7(窄叶) 叶片窄而半卷,穗稍疏松,不完全伸出,部分可育8 三体 8(卷叶) 叶片窄卷,叶舌短,籽粒短而粗,部分可育9 三体 9(粗壮) 叶片厚而浓绿,茎秆短,小穗最大,百粒重最高10 三体 10(短粒) 叶舌有毛,叶片直立,育性正常11 三体 11(拟正常) 形态与二倍
21、体姊妹系无法区别,育性正常,需作细胞学鉴定12 三体 6(丛生) 外型呈丛生草状,穗部顶端小穗退化,育性高细胞学标记克服了形态标记易受环境影响的缺点,但这种标记材料的产生需要花费大量的人力物力进行培养选择。有些物种对染色体结构和数目的变异的耐受性较差,难以获得相应的标记材料。某些物种虽然已有细胞学标记材料,但这些标记常常伴有对生物有害的表型效应,或有时观察和鉴定比较困难,从而限制了细胞学标记的应用。三、蛋白质标记许多生物大分子或生物化合物都具有作为遗传标记的潜力。酚类化合物、黄酮类化合物、花色素苷及糖苷类分子曾被用作为分子标记(Mckee 1973) 。但由于分离和检测这些分子的技术和手段通常
22、比较复杂,而且费时费钱,使之很难适合于大群体的常规检测,因此这类生化物质作为遗传标记是不理想的。与此相反,许多蛋白质分子分析简单快捷,是有用且可靠的遗传标记。用作遗传标记的蛋白质通常可分为酶蛋白质和非酶蛋白质二种。在非酶蛋白质中,用得较多的是种子贮藏蛋白,这些蛋白质可以通过一维或二维聚丙烯酰胺凝胶电泳技术进行分析,根据电泳显示的蛋白质谱带或点,确定其分子结构和组成的差异。种子贮藏蛋白在小麦、大麦、玉米、水稻等作物上的研究工作比较深入,如小麦种子贮藏蛋白中醇溶蛋白和谷蛋白约占蛋白质总量的 90%,对其遗传分析表明,它们是极为重要的生化遗传指标,并已被广泛地应用于7小麦的遗传学研究。酶蛋白质通常利
23、用非变性淀粉凝胶或聚丙烯酰胺凝胶电泳及特异性染色来检测,根据电泳谱带的不同来显示酶蛋白在遗传上的多态性。蛋白质的多态性,可能是由于基因编码的氨基酸序列的差异引起的,也可能是由于蛋白质后加工的不同引起的,如糖基化能导致蛋白质分子量的变化。酶作为遗传标记是在 Markert 和 Moller(1959)提出了同工酶的概念后迅速发展起来的。同工酶是指具有相同催化功能而结构及理化性质又不同的一类酶,其结构的差异来源于基因类型的差异,因此并不一定是同一基因的产物。每一个酶的不同电泳酶谱表现型可能是由于不同的基因座引起的,也可能是同一基因座上的不同的等位基因引起的。为了易于区别,又将后一类同工酶称为等位酶
24、(Allozymes) 。由于等位基因的差异,等位酶在氨基酸组成上或多或少也有差异。同工酶不但已被用来标记某些重要的质量性状,如番茄的线虫病抗性,而且还用于标记复杂的数量性状,如种子大小、产量等。编码同工酶的基因可以通过遗传分析定位于染色体或连锁群上。在一些重要农作物中,如水稻、大豆等,已定位了许多同工酶基因(表 1.3,) 。蛋白质是基因表达的产物,与形态性状、细胞学特征相比,数量上更丰富,受环境影响更小,能更好地反映遗传多态性,因此蛋白质标记是一种较好的遗传标记,已被广泛应用于物种起源和进化研究、种质鉴定、分类和抗病性筛选等领域。但蛋白质标记仍然存在诸多不足,如每一种同工酶标记都需特殊的显
25、色方法和技术;某些酶的活性具有发育和组织特异性;局限于反映基因组编码区的表达信息等。最关键的不足是其标记的数量还比较有限。虽然至今已经发展了 57 种酶系统(Vallegos and Chase 1991) ,大约可以鉴定 100 个左右的基因座位,但在某个特定的作物群体中,仅有 1020 种同工酶,大约 3040 个等位基因可表现出多态性。这样的数目还不能满足标记辅助育种的需要。8表 1.3 水稻同工酶标记同工酶 基因 染色体酸性磷酸酶 Acp-1 12Acp-2 12Acp-3 7乙醇脱氢酶 Adh-1 11氨基肽酶 Amp-1 2Amp-2 8Amp-3 6Amp-4 8-淀粉酶 -Am
26、y-1 7过氧化氢酶 Cat-1 6内肽酶 Enp-1 6酯酶 Est-2 6Est-3 9Est-5 1Est-7 7Est-9 7谷氨酸脱氢酶 Gdh-1 3天门冬氨酸氨基转移酶 Got-1 1Got-2 6异柠檬酸脱氢酶 Icd-1 1苹果酸脱氢酶 Mal-1 1过氧化物酶 Pox-1 5Pox-2 12Pox-5 6M-Pox-1 5磷酸葡萄糖异构酶 Pgi-1 3Pgi-2 6磷酸葡萄糖脱氢酶 Pgd-1 11Pgd-2 6四、DNA 标记DNA 分子标记是 DNA 水平上遗传多态性的直接反映。DNA 水平的遗传多态性表现为核苷酸序列的任何差异,哪怕是单个核苷酸的变异。因此,DNA
27、标记在数量上几乎是无限的。与以往的遗传标记相比,DNA 标记还有许多特殊的优点,如无表型效应、不受环境限制和影响等。目前,DNA 标记已广泛地应用于种质资源研究、遗传图谱构建、目的基因定位和分子标记辅助选择等各个方面。理想的 DNA 标记应具备以下特点:(1)遗传多态性高;(2)共显性遗传,信息完整;(3)在基因组中大量存在且分布均匀;(4)选择中性;(5)稳定性、重现性好;(6)信息量大,分析效率高;(7)检测手段简单快捷,易于实现自动化;(8)开发成本和使用成本低。目前已发展出十几种 DNA 标记技术,它们各具特色,并为不同的研究目标提供了丰富的技术手段。但还没有一种 DNA 标记能完全具
28、备上述理想特性。依据对 DNA 多态性的检测手段,DNA 标记可分为四大类:第一类为基于 DNA-DNA 杂交的 DNA 标记。该标记技术是利用限制性内切酶酶解及凝胶电泳分离不同生物体的 DNA 分子,然后用经标记的特异 DNA 探针与之进行杂交,通过放射自显影或非同位素显色技术来揭示 DNA 的多态性。其中最具代表性的是发现最早和应用广泛的 RFLP 标记。第二类为基于 PCR 的 DNA 标记。PCR 技术问世不久,便以其简便、快速和高效等特点迅速成为分子生物学研究的有力工具,尤其是在 DNA 标记技术的发展上更是起到了巨大作用。根据所用引物的特点,这类 DNA 标记可分为随机引物 PCR
29、 标记和特异引物 PCR 标记。随机引物 PCR 标记包括 RAPD 标记、ISSR 标记等,其中 RAPD 标记使用较为广泛。随机引物 PCR 所扩增的 DNA 区段是事先未知的,具有随机性和任意性,因此随机引物 PCR 标记技术可用于对任何未知基因组的研究。特异引物 PCR 标记包括9SSR 标记、STS 标记等,其中 SSR 标记已广泛地应用于遗传图谱构建、基因定位等领域。特异引物 PCR所扩增的 DNA 区段是事先已知的明确的,具有特异性。因此特异引物 PCR 标记技术依赖于对各个物种基因组信息的了解。第三类为基于 PCR 与限制性酶切技术结合的 DNA 标记。这类 DNA 标记可分为
30、二种类型,一种是通过对限制性酶切片段的选择性扩增来显示限制性片段长度的多态性,如 AFLP 标记。另一种是通过对 PCR扩增片段的限制性酶切来揭示被扩增区段的多态性,如 CAPS 标记。第四类为基于单核苷酸多态性的 DNA 标记。如:SNP 标记。它是由 DNA 序列中因单个碱基的变异而引起的遗传多态性。目前 SNP 标记一般通过 DNA 芯片技术进行分析。以上四大类 DNA 标记,都是基于基因组 DNA 水平上的多态性和相应的检测技术发展而来的,这些标记技术都各有特点。表 1.5 和图 1.1 分别描述了一些主要的 DNA 标记的特点和遗传多态性的分子基础。任何 DNA 变异能否成为遗传标记
31、都有赖于 DNA 多态性检测技术的发展,DNA 的变异是客观的,而技术的进步则是人为的。随着现代分子生物学技术的迅速发展,随时可能诞生新的标记技术。DNA 标记的拓展和广泛应用,最终必然会促进作物遗传与育种研究的深入发展。RFLP VNTR RAPD ISSR SSR AFLP基因组分布 低拷贝编码序列 整个基因组 整个基因组 整个基因组 整个基因组 整个基因组遗传特点多态性共显性中等共显性较高多数显性较高显性/共显性较高共显性高显性/共显性较高检测基因座位数 1-3 10-100 1-10 1-10 多数为 1 20-200探针/引物类型 gDNA 或 cDNA特异性低拷贝探针DNA 短片段
32、9-10bp随机引物16-18bp特异引物14-16bp特异引物16-20bp特异引物DNA 质量要求 高 高 低 低 中等 高DNA 用量 2-10 g 5-10 g 10-25ng 25-50ng 25-50ng 2-5 g技术难度 高 中等 低 低 低 中等同位素使用情况 通常用 通常用 不用 不用 可不用 通常用可靠性 高 高 低/中等 高 高 高耗时 多 多 少 少 少 中成本 高 高 较低 较低 中等 较高第二章 DNA 标记技术生命的遗传信息存储于 DNA 序列之中,高等生物每一个细胞的全部 DNA 构成了该生物体的基因组。基因组 DNA 序列的变异是物种遗传多样性的基础。尽管在
33、生命信息的传递过程中 DNA 能够精确地自我复制,但是许多因素也能引起 DNA 序列的变化,造成个体之间的遗传差异。单个碱基的替换、DNA 片段的插入、缺失、易位和倒位等都能引起 DNA 序列的变异。利用现代分子生物学技术揭示 DNA 序列的变异(遗传多态性) ,就可以建立 DNA 水平上的遗传标记。从 1980 年人类遗传学家 J. G. K. Botstein 等首次提出 DNA 限制性片段长度多态性作为遗传标记的思想及1985 年 PCR 技术的诞生至今,已经发展了十多种基于 DNA 多态性的分子标记技术,这些 DNA 标记技术综合起来可分为以 DNA 杂交为基础的和以 PCR 为基础的
34、以及 PCR 技术和限制性酶切技术相结合的几种类型。显然,检测 DNA 水平上的遗传变异最精确的方法是直接测定 DNA 序列,通过对测定的 DNA 序列进行分析比较,即可揭示生物体间在单个核苷酸水平上的遗传多态性。基于这一原理,最近发展了 SNP 标记,即单核苷酸多态性标记。尽管在植物分子标记研究中还未见这一技术的应用报道,但其应用前景是十分美好的。因此,本章在最后一节对这一新技术作了简要阐述。第一节 基于 DNA-DNA 杂交的 DNA 标记基于 DNA-DNA 杂交的 DNA 标记主要包括 RFLP 标记和 VNTR 标记。这类标记是利用限制性内切酶酶解不同生物体的 DNA 分子后,用同位
35、素或非同位素标记的随机基因组克隆、cDNA 克隆、微卫星或小卫星序列等作为探针进行 DNA 间杂交,通过放射自显影或非同位素显色技术来揭示 DNA 的多态性。VNTR 多态性是由重复序列数目的差异性产生的,而 RFLP 多态性主要是由于 DNA 序列中单碱基的替换、DNA 片段的插入、缺失、易位和倒位等引起的。RFLP 标记是发现最早、应用广泛、具有代表性的 DNA标记技术。10一、RFLP 标记技术RFLP 即限制性片段长度多态性。这种多态性是由于限制性内切酶酶切位点或位点间 DNA 区段发生突变引起的。限制性内切酶是一种能识别 DNA 上特定碱基组成的序列并在这些序列位点上切断 DNA 分
36、子的酶。这些特定碱基组成的 DNA 序列叫做相应内切酶的识别位点或限制性位点,长度一般在 4 至 8 个碱基对之间。如 Pst的限制性位点是(其中箭头表示被切开的位置):5 C TGCAG 33 GACGT C 5通常 DNA 上存在大量的限制性内切酶酶切位点。因此,限制性内切酶能将很长的 DNA 分子酶解成许多长短不一的小片段,片段的数目和长度反映了 DNA 分子上限制性酶切位点的分布。特定的 DNA限制性内切酶组合所产生的片段是特异的,它能作为某一 DNA(或含有该 DNA 的生物)的特有“指纹” ,这种“指纹”在 DNA 分子水平上直接反映了生物的遗传多态性。图 2.1 给出了产生 RF
37、LP 的原理示意图。如果某一个限制性位点发生了突变,这个限制性内切酶将不再识别这个位点,不再进行酶切反应,产生片段的大小将由最邻近的限制性酶切位点决定。由于植物基因组很大,某种限制性内切酶的酶切位点很多,经酶解后会产生大量大小不一的限制性片段,这些片段经电泳分离形成的电泳谱带是连续分布的,很难辨别出某一限制性片段大小的变化,必须利用单拷贝的基因组DNA 克隆或 cDNA 克隆作为探针,通过 Southern 杂交技术才能够检测到。可见,要进行 RFLP 分析首先要分离单拷贝的基因组 DNA 克隆或 cDNA 克隆,才能进行多态性分析。一些作物如玉米、水稻、番茄等已有覆盖整个基因组的克隆,很容易
38、从有关单位或商家索取或购买到。但大多数作物还没有覆盖整个基因组的克隆,仍需要研制特异探针。由于具有大量的酶和探针组合可供选配,因此任何一种作物都具有大量的 RFLP 标记数量。RFLP 标记具有共显性、信息完整、重复性和稳定性好等优点。但 RFLP 技术的实验操作过程较复杂,需要对探针进行同位素标记,即使应用非放射性的 Southern杂交技术,仍然是个耗时费力的过程。图 2.1 RFLP 标记多态性的分子基础11二、VNTR 标记技术许多生物体的 DNA 存在含有大量的串联重复序列的高变异区。通常将以 1575 个核苷酸为基本单元的串联重复序列称为小卫星(Minisatellites) ,以
39、 26 个核苷酸为基本单元的简单串联重复序列称为微卫星(Microsatellites)或简单序列重复(SSR) 。小卫星和微卫星也常常称作重复数可变串联重复(VNTR )标记。VNTR 标记产生的多态性是由同一座位上的串联单元数量的不同而产生的。图 2.2 为 VNTR 变异的原理示意图。利用 VNTR 标记可进行分子定位和作图的研究工作。图 2.2 VNTR 变异的原理示意图. A、B 、C 分别表示不同基因型为了使 VNTR 成为有用的 DNA 标记,需发展一种能够快速鉴定 VNTR 座位的技术。理想的途径之一是利用 PCR 进行扩增,所得 PCR 产物通过电泳即可比较其长度变异。但是许
40、多小卫星序列太长,无法通过 PCR 扩增获得满意的结果。因此,仍需利用 DNA Southern 杂交和放射性标记探针来检测。而微卫星序列常常比较短,利用 PCR 扩增可以获得满意的检测效果。鉴于上述原因,本书中将微卫星标记归类于基于PCR 技术的 DNA 标记。本节中的 VNTR 标记主要是指小卫星标记。利用小卫星中的重复单元作为杂交探针是获得 VNTR 信息的最快捷的途径。在动物基因组中存在大量的小卫星标记,目前人类小卫星序列和噬菌体 M13 蛋白 III 基因序列已成为研究小卫星的常用探针。这些探针与植物基因组有较高的同源性,因此可以用于植物基因组的小卫星研究。利用 DNA Southe
41、rn 杂交技术可以产生许多多态性条带。这些丰富的DNA 带谱用于 DNA 指纹研究是非常有用的,但由于带谱复杂,现有技术分析起来比较困难,不太适合作图研究。第二节 基于 PCR 技术的 DNA 标记PCR 技术是一种利用酶促反应对特定 DNA 片段进行体外扩增的技术,该技术只需非常少量(通常在纳克级范围内)的 DNA 样品,在短时间内以样品 DNA 为模板合成上亿个拷贝。经过电泳分离、染色或放射自显影,即可显示出所扩增的特定 DNA 区段。PCR 技术以短核苷酸序列作为引物,并使用一种耐高温的 DNA 聚合酶(Taq 酶) 。典型的 PCR 技术通常进行 2550 个循环,每个循环包括三个步骤
42、。第一步为DNA 变性,通常将温度升至 94,使模板 DNA 变成单链;第二步为 DNA 复性,依据引物序列的长度及其与样品 DNA 中目标序列的同源性程度等因素,将温度控制在 2565,使引物与模板上的同源序列结合;第三步为 DNA 合成,所用温度应选择最适合 DNA 聚合酶活性的温度,通常为 72。经过这样一个循环,目标 DNA 片段即被复制一次。随着循环数的增加, DNA 扩增产物呈指数增加。PCR 技术具有快捷、简易、灵敏等优点,已被广泛地应用于分子克隆、遗传病的基因诊断、法医学、系统分类学、遗传学和育12种学等方面,在 DNA 标记技术的发展上起到了巨大的作用。根据所用引物的类型不同
43、,基于 PCR 的DNA 标记可分为随机引物的 PCR 标记和特异引物的 PCR 标记。一、随机引物的 PCR 标记随机引物 PCR 标记的特点是,其所用引物的核苷酸序列是随机的,其扩增的 DNA 区段是事先未知的。应用这种标记技术可在基因组中寻找未知的多态性座位作为新的 DNA 标记。随机引物 PCR 扩增的 DNA区段产生多态性的分子基础是模板 DNA 扩增区段上引物结合位点的碱基序列发生了突变。因此,不同来源的基因组在该区段(座位)上将表现为扩增产物有无的差异或扩增片段大小的差异(图 2.3) 。其中第一种情况较为常见,因此随机引物 PCR 标记通常是显性的,但有时也会表现为共显性,即扩
44、增片段大小的差异。目前,常用的随机引物 PCR 标记主要有可分为 RAPD、AP-PCR、DAF、ISSR 等。(一)RAPD 标记RAPD 标记所用的引物长度通常为 910 个碱基,大约只有常规的 PCR 引物长度的一半。使用这么短的 PCR 引物是为了提高揭示 DNA 多态性的能力。由于引物较短,所以在 PCR 中必须使用较低的退火(DNA 复性)温度,以保证引物能与模板 DNA 结合。RAPD 引物已经商品化,可以向有关供应商直接购买,不需要自己合成。商品化的 RAPD 引物基本能覆盖整个基因组,检测的多态性远远高于 RFLP。RAPD 标记的优点是,对 DNA 需要量极少,对 DNA
45、质量图 2.3 随机引物 PCR 产物多态性的分子基础. 类型 1 为显性标记,是最常见的多态性,类型 2、3、4 为共显性标记,但较少见13要求不高,操作简单易行,不需要接触放射性物质,一套引物可用于不同生物的基因组分析,可检测整个基因组。在 RAPD 标记分析中,通常每次 PCR 反应只使用一种引物。在这种情况下,只有两端同时具有某种 PCR 引物结合位点的 DNA 区段才能被扩增出来。如果将 2 种引物组合使用,则还可扩增出两端分别具有其中一种引物的结合位点的 DNA 区段,产生新的带型,找到更多的 DNA 分子标记。在实验材料多态性程度较低时,可考虑用这种将不同引物组合使用的方法。RA
46、PD 标记的不足之处是,一般表现为显性遗传,不能区分显性纯合和杂合基因型,因而提供的信息量不完整。另外,由于使用了较短的引物,RAPD标记的 PCR 易受实验条件的影响,结果的重复性较差。不过,只要扩增到的 RAPD 片段不是重复序列,则可将其从凝胶上回收并克隆,转化为 RFLP 和 SCAR 标记,以进一步验证 RAPD 分析的结果。(二)DAF 标记DAF 标记原理上与 RAPD 标记相似,但它所使用的引物比 RAPD 标记的更短,一般为 58 个核苷酸,因而与模板 DNA 随机结合的位点更多,扩增得到的 DNA 条带也更多,检测多态性的能力更强。在多态性程度比较低的作物如小麦上,DAF
47、技术是一种很有用的寻找 DNA 分子标记的手段。但由于 DAF 使用了更短的引物,因而其 PCR 稳定性比 RAPD 更低。(三)AP-PCR 标记AP-PCR 标记原理上也与 RAPD 相似,但所使用的引物较长,通常为 1824 个碱基。因此,其 PCR反应条件与常规一样,稳定性要比 RAPD 好,但揭示多态性的能力要比 RAPD 低。(四)ISSR 标记简单序列重复间区(ISSR)DNA 标记技术是由 Zietkiewicz 等(1994)提出的,该技术检测的是两个SSR 之间的一段短 DNA 序列上的多态性。利用真核生物基因组中广泛存在的 SSR 序列,设计出各种能与SSR 序列结合的
48、PCR 引物,对两个相距较近、方向相反的 SSR 序列之间的 DNA 区段进行扩增。一般在引物的 5或 3端接上 24 个嘌呤或嘧啶碱基,以对具有相同重复形式的许多 SSR 座位进行筛选,使得最终扩增出的 ISSR 片段不致太多。ISSR 技术所用的 PCR 引物长度在 20 个核苷酸左右,因此可以采用与常规PCR 相同的反应条件,稳定性比 RAPD 好。ISSR 标记呈孟德尔式遗传,具显性或共显性特点。在动植物基因组中存在大量的双核苷酸重复序列,因此,大多数 ISSR 标记所用 PCR 引物是基于双核苷酸重复序列的。近年来,ISSR 标记技术已应用于植物遗传分析的各个方面,如品种鉴定、遗传关
49、系及遗传多样性分析、基因定位、植物基因组作图研究等。Kojima 等(1998)的研究表明,(AC) n 双核苷酸重复序列非常适合小麦的染色体作图,并成功地定位了一系列 ISSR 标记。Tsumura 等(1996)研究发现,基于(AG)n 和(CT) n 序列的 ISSR 标记在柏树和松树中是最有用的。方宣钧博士实验室利用商业化的 ISSR 引物进行大豆孢囊线虫病抗性基因的遗传分析和基因定位,获得了与大豆孢囊线虫病抗性基因紧密连锁的 ISSR标记,并定位在大豆的 G 连锁群上。二、特异引物的 PCR 标记特异引物 PCR 标记所用的引物是针对已知序列的 DNA 区段而设计的,具有特定核苷酸序列,引物长度通常为 1824 核苷酸,故可在常规 PCR 的复性温度下进行扩增,对基因组 DNA 的特定序列区域进行多态性分析。根据引物序列的来源,主要可分为 SSR 标记、 SCAR 标记、STS 标记及 RGA 标记等。(一)SSR 标记SSR 的基本重复单元是由几个核苷酸组成的,重复次数一般为 1050。同一类微卫星 DNA 可分布在基因组的不同位置上。由于基本单元重复次数的不同,而形成 SSR 座位的多态性(图 2.4) 。每个 SSR 座位两侧一般是相对保守的单拷贝序列,因此可根据两侧序列设计一对特异引物来扩增 SS