1、第六讲分子进化与系统发育学 Molecular evolution and phylogenetics,老山发现大型西汉王陵墓北京晚报 2000年03月18日,老山汉墓考古发掘进入核心部分人民日报 (2000年08月20日,Begin with a story STORY 1:,墓主(西汉诸侯王后)尸骨,鉴定为女性,年龄约30岁,身高约1.60米,老山汉墓走出西域美女 汉墓女主人头像复原记 (北京青年报,2001年4月20日),?,此次头像复原品的作者纪元“在我国单个人体复原领域中是首屈一指的专家。他所在的单位公安部物证鉴定中心也是目前我国人体复原最具权威的机构。”纪元介绍说:此次所采用的是颅
2、骨面貌复原技术。这项技术已经有100多年的历史,其科学依据是人体头面部的解剖学规律,且在单体复原方面具有较高的精确度。世界上第一次运用它是为著名艺术家巴赫进行头像复原并取得了成功。目前在我国这项技术主要运用于破案之中。,2002年10月,吉林大学文学院考古系边疆考古研究中心与北京市文物研究所合作,对该尸骨进行体质人类学、古代DNA和颅像复原三个方面的研究,其中DNA研究工作是由吉大生命科学学院副院长、边疆考古研究中心考古DNA实验室主任周慧教授负责完成。,DNA证实老山汉墓女主人是中原人 2003-05-15 新华网,吉林大学边疆考古研究中心今天正式宣布:他们完成的一项研究结果表明,北京老山汉
3、墓女主人的DNA序列属于亚洲M谱系,代表了东亚地区现代人群的某种祖先类型的遗传学性状。,据周慧教授介绍,由于老山汉墓女主人的骨骼保存状况欠佳,因此运用分子生物学的方法对其线粒体进行提取、扩增、测序和分析是这项综合性研究计划中的一个重点和难点课题。其人骨样本中DNA降解严重、含量很少,提取工作很不顺利。为此研究人员考虑了三套方案,即分别从其肢骨、牙齿和颅腔中偶然保存下来的一块干燥脑组织中提取DNA。,由于样本的肢骨、牙齿的保存情况欠佳,未能提取出DNA。最后经过课题组成员坚韧不拔的努力和反复实验,终于分别从干燥脑组织的三个不同部位成功得到了古DNA模板,并扩增测序。实验结果表明,三个不同部位所得
4、序列一致,同一抽提产物的平等测序结果相同,该序列真实地反映了老山汉墓女墓主的遗传信息。,古代DNA是指从田野考古发掘中出土的古代人类和动物遗骸以及古生物化石中提取的古代生物分子。随着现代生物技术、有机地球化学理论和实验技术的不断发展,人们对古代DNA的研究也不断深入。把古代DNA数据与现代基因库中的数据资料相结合,便可以构建出某一生物门类的系统发育树,从而进一步探讨人类的演化与迁移等重大问题。,古分子系统学、分子系统学古生物遗体、化石保存的三种信息: 1、形态学信息 2、化学信息(生物的代谢产物和一般的生物化学分子) 3、遗传信息(保存的一级结构生物大分子,即基因产物和基因片段)分子系统学(M
5、olecular Systematics):从生物大分子(氨基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统树(谱系)的形式表达出来。古分子系统学:利用古代DNA保留的遗传信息进行分子系统学研究,6.1生物进化的分子基础,Darwin, Charles (1809-1882),The Origin of Species (1859),化石证据(Fossil) 比较形态学证据(Comparative morphology) 比较生理学证据(Comparative physiology),经典的进化研究方法,比较形态学证据(Comparative morphology),普适性由4种核酸组成
6、分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、蛋白质结构的演化可比较性比较不同物种的有关DNA序列 建立DNA序列的演化模型、氨基酸序列的演化模型(数学模型)蛋白质结构的演化模型(形态、性状的演化模型?)基因组编码信息的丰富与形态、性状包含的信息相比,基因组序列包含更多、更复杂的信息结构,进化学的分子途径,分子系统发育学 Molecular Phylogenetics 分子系统学 Molecular Systematics,What can we do for molecular evolution?序列比较:源于同一祖先DNA/氨基酸序列的两条DNA/氨基酸序列,考察二者的差异。序
7、列差异:进化过程中分子突变的痕迹分子进化:以累计在DNA/氨基酸分子上的历史信息为基础,研究分子水平的生物进化过程和机制。,分子系统学为生物分类问题提供了许多崭新的见解。,基因突变,1、核苷酸替代、插入/缺失、重组 2、基因转换,固定在生物个体 以及物种内,遗传漂变,自然选择,传递给后代,产生新的形态、性状,分子系统学是研究进化机制的一个重要工具。,生物进化的分子机制,性状改变,DNA分子的改变,核苷酸替代substitution,核苷酸缺失 deletion,核苷酸插入 insertion,核苷酸倒位 invertion,DNA序列的突变,Thr Tyr Leu Leu ACC TAT TT
8、G CTG,ACC TCT TTG CTGThr Ser Leu Leu,替代,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TAC TTT GCT GThr Tyr Phe Ala,插入,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TAT TGC TG-Thr Tyr Cys -,缺失,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TTT ATG CTGThr Phe Met Leu,倒位,核苷酸替代的几种分类,转换 (transition) 嘌呤 嘌呤 嘧啶 嘧啶,颠换 (transvertion) 嘌呤 嘧啶
9、 嘧啶 嘌呤,在大多数DNA片段中,转换出现的概率高于颠换出现的概率。,DNA序列突变对氨基酸序列的影响,同义(沉默)替代(synonymous / silent substitution) 仍然为同义密码子的核苷酸替代 如: TAT TACTyr Tyr,非同义替代(nonsynonymous substitution) 导致产生非同义密码子的核苷酸替代 如: TAT AATTyr Asn,无义突变(nonsense mutation) 导致产生终止密码子的核苷酸突变 如: TAT TAATyr STP,问题:假设所有密码子以同一概率出现,上述三种突变的比例 25%,71%,4%,密码子使用
10、频率(codon usage),密码子使用频率的偏倚性: 编码同一个氨基酸的多个同义密码子具有不同的使用频率,例:E. coli的RNA聚合酶缬氨酸Val GTT GTC GTA GTG55 21 34 34精氨酸Arg CGU CGC CGA CGG89 46 1 0,为什么会出现密码子使用频率的偏倚性?与同功能tRNA的丰度有关?突变压力与进化选择双重控制?,Open problem,基因组进化的分子基础: 突 变 重 组 转 座,突 变 突变的机制 自发性损伤(复制中的损伤、碱基的自发性化学改变、细胞的代谢产物对DNA的损伤) 物理因素引起的损伤(电离辐射、紫外线、热诱变等) 化学因素引
11、起的损伤(烷化剂、碱基类似物、嵌入试剂等),突变的效应 突变对基因组的影响同义突变:没有改变产物氨基酸序列的密码子错义突变:碱基序列的改变引起了氨基酸序列的改变 (中性突变、渗漏突变) 无义突变:碱基的改变使代表某种氨基酸的密码子变 为蛋白合成的终止密码子连读突变:与终止突变正好相反,终止密码子变成指令某一氨基酸的密码子,使翻译继续进行,重 组,同源重组 位点专一性重组,转 座,转座: 是基因进化的一种重要方式,它不是重组,但利用了重组的过程,它是一段DNA或其拷贝从基因组的一个位置转移到另一位置,并在插入位点两测产生1对很短的正向重复序列 根据转座机制可分为2个大的范畴:DNA转座子以DNA
12、区段作为转座成分又可分为复制转座和保守转座逆转录转座子以RNA为中介,6.2系统发育树 (Phylogenetic tree),Tsar Nicholas II Establishing the identity of Anna Anderson Manahan,真假公主 1917年俄国末代王朝被推翻,贵族与侍卫全部逃走,而沙皇可怜的儿子老少一个都没走脱,并于1918年被全部处决。但民间却流传着沙皇的小女儿死里逃生,远走他乡的故事。为了得到俄国沙皇的一千万遗产,许多人绞尽脑汁寻找安娜公主,终无所获。俄国贵族后裔布丁将军终于找到一位外貌气质酷似安娜公主的女子,于是训练她皇室的各种礼仪及相关的人和
13、事,安娜公主过关斩将。顺利和皇太后相认,就在太后要宣布安娜公主为遗产继承人并与保罗定婚时,安娜公主与布丁悄然消失,结局出人意料,STORY 2:,STORY 3:,极端厌氧的产甲烷菌,高温下生活的嗜热菌,美国黄石公园内有许多温泉,水温从20到100,其中生活着一些喜欢热的微生物,用显微镜观察,这些微生物呈杆状。,1964年生物学家托马斯布罗克在黄石公园的温泉源头发现了微生物,第二年夏天又发现了在60摄氏度的水中生活的水藻,还有在82摄氏度的水温下生存的微生物。,基于16S/18S核糖体RNA序列比对得到的古细菌系统发育树 (Ettema等,2005),生命三界: 细菌(Eubacteria)
14、古细菌(Archaebacteria) 真核(Eukaryotes) (Woese and Fox, 1977),http:/www.sciencexpress.org / 1 May 2003/Page 7/10.1126/science.1085952,STORY 4:,拓扑结构:有根树:反映时间顺序无根树:反映距离,理论上,一个DNA序列在物种形成或基因复制时,分裂成两个子序列,因此系统发育树一般是二歧的。一般考虑二歧的树结构:二歧树,分支: 内部分支 外部分支,节点: 内部节点 外部节点,系统发育树的种类 有根树、无根树,考虑4个分类群时,共有15种可能的有根树,a,b,c,d,a,c
15、,b,d,a,d,b,c,考虑4个分类群时,共有3种可能的无根树,考察类群数为 m ( m 3 )的系统树,其可能的拓扑结构数目为:,有根树,无根树,m=10: 34,459,425种,m=10:2,027,025种,当 m较大时,选出真实树的拓扑结构十分困难。,分支数目:,有根树,无根树,内部分支数目:,有根树,无根树,内部节点数目:,有根树,无根树,物种树:代表一个物种或群体进化历史的系统发育树两个物种分歧的时间:两个物种发生生殖隔离的时间基因树:由来自各个物种的一个基因构建的系统发育树(不完全等同于物种树),表示基因分离的时间。,系统发育树的种类 基因树、物种树,期望树:一个用无限长的序
16、列或每一分支的期望替代数构建的树,理论上:假设所研究的序列无限 长,从中随机抽样进行 统计分析。,实际情况:所研究的序列是短序列, 统计得到的替代数目存 在大量随机误差。,现实树:建立在实际替代数基础上的树,重建树,构树方法,系统发育树的种类 期望树、现实树和重建树,构建系统发育树的数据1、特征数据(character data):提供了基因、个体、群体或物种的信息2、距离数据(distance data)或相似性数据(similarity data):涉及的则是成对基因、个体、群体或物种的信息。 距离矩阵,距离数据可以由特征数据计算得到。 反之?,系统发育树的构建,构造系统发育树的主要方法距
17、离法 根据每对物种之间的距离直接计算得到。所生成的树的质量取决于距离尺度的质量 简约法 通过寻求物种间最小的变更数来完成的 似然法 通过标准的统计推断建立系统发育的概率模型 其它方法:神经网络方法、Hadamard结合法,构建系统发育树的主要过程1、拓扑结构的判别(从大量的拓扑结构中搜寻、判别) 2、一个既定拓扑结构的分支长度的估计,最优原则,6.3生物进化理论与分子进化的讨论,1、进化理论概述,“一个半世纪以前,Charles Darwin可能没有意识到他所给予科学的是一件从未有过的强大武器,即他的进化理论。科学家用这把坚利之剑斩断了无知、迷信和傲慢,这些束缚人类对亿万年来的生命的了解的镣铐
18、。”美国自然博物馆成立125周年纪念专刊前言,Charles Darwin (1809-1882),Darwinian进化理论告诉了什么?1、遗传和变异一切生物都能发生变异,至少有一部分变异能够遗传给后代2、自然选择繁殖过剩:任何生物产生的生殖细胞或后代数目要远远多于可能存活的个体数目;而在所产生的后代中,那些最具有适应环境条件的有利变异的个体有较大的生存机会,并繁殖后代,从而使有利变异可以世代积累,不利变异被淘汰。“选择”不是超自然的上帝的作用。3、性状分歧;种的形成、绝灭;系统树性状分歧原理在同一个种内,个体之间在结构、习性上越是歧异,则在适应不同环境方面愈是有利,因而将会繁育更多的个体,
19、分布到更广的范围。由此一个种会逐渐演变为若干变种、亚种乃至新种。新种的形成、种间的竞争、种的绝灭、外界环境的作用系统树由于性状分歧和中间类型的绝灭,新种不断产生、旧种不断绝灭,种间差异不断扩大,形成时间、空间上的物种系统树。,Darwinian进化理论的三次修正第一次:“新Darwinian主义”1900s,Weismann等,消除Lamarck的“获得性遗传”学说、Buffon的“环境直接作用”学说,强调“自然选择”为进化的主要因素;第二次:“现代综合论(Modern synthesis)”1930-40s,遗传学、生物系统学、古生物学的重大贡献:对“自然选择”、“物种变异”等概念的新认识。
20、适应:繁殖的相对优势适应度:个体或基因型对后代或后代基因库的相对贡献适应和选择:繁殖或基因传递的相对差异 达尔文主义的科学基础,第三次:NOW原因:现代分子生物学、古生物学的发展。宏观(对生物进化实际过程的了解):古生物学揭示生命进化的规律、进化速度、进化趋势、物种的形成和绝灭微观:现代分子生物学揭示生物大分子的进化规律和携带遗传信息的物质基础及其复杂结构新的认识: 1、生物进化过程并非“匀速”、“渐变”的,而是“快速进化”与“进化停滞”相间; 2、生物进化与分子进化都显示出相当大的随机性,自然选择并非总是进化的主要因素; 3、遗传系统本身具有某种进化功能,进化过程中可能存在内因的“驱动”和“
21、导向”。Continuing,进化理论围绕的三个主题1、进化的动力是什么?2、进化是否有一定的方向?3、进化的速度是否恒定?是渐近的还是跳跃的?分子进化理论同样必须回答上述三个问题。,2、分子进化的两个特点,生物大分子进化速率的相对恒定分子进化速率生物大分子随时间的改变主要表现为核苷酸、蛋白质的一级结构的改变,即分子序列中核苷酸、氨基酸的替换不同物种同源大分子的分子进化速率大体相同例子:比较不同物种血红蛋白氨基酸序列差异人、马0.810-9/AA.a人、鲤鱼0.610-9/AA.a分子进化速率远远比表型进化速率稳定原因?序列的核苷酸或氨基酸替换是否随机过程?,生物大分子进化的保守性保守性功能上
22、重要的大分子或大分子的局部在进化速率上明显低于那些在功能上不重要的大分子或者大分子局部。(引起表型发生显著改变的突变发生的频率要低于无明显表型发生显著改变得突变发生的频率。)氨基酸例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率是内区进化速率的10倍。核苷酸例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核苷酸替代频率较高。生物大分子进化并非完全随机存在某种制约因素,存在某种机制?,3、分子进化中性论,Neutral theory of molecular evolution (Kimura & Ohta, 1968, 1971) (King & Jukes, 1969
23、) 提出分子层次上的“non-Darwinian evolution”“在生物分子层次上的进化改变不是由自然选择作用于有利突变而引起的,而是在连续的突变压之下由选择中性或非常接近中性的突变的随机固定造成的。中性突变是指对当前适应度无影响的突变。”中性突变、连续突变压、随机固定否认自然选择在分子进化中的作用,认为生物大分子的进化主要因素是机会和突变压力。,分子进化中性论的若干依据分子层次上的大多数变异是选择中性的蛋白质和核苷酸分子的进化速率高且相对恒定突变压在分子进化中的作用得到研究证实按照群体遗传学的数学模型,自然选择的代价太高,分子进化中性论的讨论1、中性论是解释分子层次的进化现象自然选择只
24、作用于表型,并不直接作用于分子。衡量尺度的区别:分子的显著性改变并不意味着表型的显著性改变。中性论只涉及生物大分子一级结构单元的替换,并不包含和解释分子层次的全部改变(如蛋白质三级结构、功能的改变)2、分子进化的保守性表明选择仍然起作用可能之一负选择的存在:任何发生在重要功能的大分子或大分子保守区的突变,由于造成适应度的下降而被选择淘汰。(随机作用)可能之二存在某种机制阻止功能重要的大分子或大分子保守区的突变产生。(非随机作用),3、选择中性突变的复杂调控系统中性突变的可能原因:复杂的调控机制。基因表达受到内外因素的制约。决定中性突变的调控系统受到自然选择的影响。4、选择在分子的适应进化中起作
25、用在分子层次上可能存在两种进化形式:中性进化(导致分子多样性)适应进化(通过选择实现,导致分子适应),能否打倒的Darwinian进化论,?,4、分子钟(Molecular Clock),分子钟根据分子系统学研究与古生物学资料相结合,建立推论生物进化事件发生的时间表。,假定分子进化速率r恒定,则分子进化改变量(替代数目或替代率)与进化时间成正比。以两条序列为例: d = 2 r t 其中,t是进化时间,d是这两条序列每个位点的替代数目。,分子钟成立的先决条件:分子进化速率恒定。,分子钟成立的证据:1、至少某些生物大分子(如珠蛋白)的进化速率在相当长的地质时间内的相对稳定、均匀; 2、许多不同物
26、种的多种同源大分子在相当长时间内的平均进化速率近似恒定。,建立分子钟的大致步骤1、选择所要比较的生物大分子种类根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率大小合适、分布范围能涵盖各待比较物种的生物大分子。2、选择所要比较的物种,确定各比较组合及其所代表的进化事件3、获得生物大分子一级结构的资料4、获得有关的代表性进化事件发生的地质时间数据5、通过比较大分子一级结构,选择合适的数学模型,计算得到进化产生的分子差异d,通过回归分析等统计方法得到大分子的进化速率r(t)6、由此可以推断未知进化事件的发生时间,关于分子钟的讨论和争议1、对长期进化而言,不存在以恒定速率替换的生物大分子一级结构;(基因功能的改变、基因数目的增加)2、不存在通用的分子钟;3、争议:分子钟的准确性中性理论(分子钟成立的基础),5、基因组计划与分子进化,基因组计划为许多生物进化关键问题的研究提供了基础1、基因组计划产生的大量数据为分子进化研究提供了新的素材人类基因组计划、模式生物基因组计划2、可以从生物大分子层次研究进化的机制进化机制:基因重复、拷贝?(低等生物高等生物)多基因家族的一致进化?提供有关重复基因、DNA缺失插入、基因易位、转座子插入等信息,为分子系统学研究提供更多的研究对象。,