收藏 分享(赏)

系统发育树.ppt

上传人:无敌 文档编号:369380 上传时间:2018-04-02 格式:PPT 页数:21 大小:253.43KB
下载 相关 举报
系统发育树.ppt_第1页
第1页 / 共21页
系统发育树.ppt_第2页
第2页 / 共21页
系统发育树.ppt_第3页
第3页 / 共21页
系统发育树.ppt_第4页
第4页 / 共21页
系统发育树.ppt_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、系统发育树,民大生科,内容提要,系统发育树的介绍系统发育树的构建方法及原理系统发育树的构建软件,1.系统发育树的定义: 在研究生物进化和系统分类中,常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形成为系统发育树(phylogenetic tree)。,系统发育树的介绍,2.系统发育树分类,有 根 树,1,2,3,4,1,2,3,4,1,2,4,3,无 根 树,共同祖先,共同祖先,二者区别: 有根树是具有方向的树,包含唯一的节点,将其作为树中所有物种的共同祖先,反映了树上物种或基因的时间顺序。 无根树只是指明了种属的相互关系,没有确认共同祖先或进化途径。,3.系统

2、发育树的结构及含义,节点,树枝,1,2,3,4,根,根用来表示共同的祖先,由该点通过唯一途径可产生其他节点; 节点表示序列1和2、3和4分别来自同一个祖先序列,1/2和3/4来源于最低水平的祖先。树枝长度表示节点到下一水平分离前出现的序列变化数或者该分枝进化过程中变化的程度。所以系统发育树所估计的是1/2节点与1或2之间序列变化数,若1/2节点与1之间的分支长度和1/2节点与2之间的分支长度相等,则表明物种进化是同一速率的。,系统发育树的构建方法及原理,1.选择一个相关序列集,2.得到多个序列比对,3.是否具有显著的序列相似性?,是,最大简约法,否,4.是否可清晰分辨序列相似性?,是,距离法,

3、否,最大似然法,三 大 方 法,步骤:,1.相关序列:可以是DNA或蛋白质序列:每一类型 有不同的程序选项,作为进化相关性指标。2.序列比对:通过在序列中搜索一系列单个性状或性状模式来比较2个或多个序列的方法。3.相似性:在序列比对中,同一或者相似性状置于一列,非同一性状作为一个错配或者对应一个间隔,得到一个最优排列,使得同一或相似性状垂直对齐。在此条件下,容易排列的序列被认为是相似的。,系统发育树构建方法一最大简约法。 定义:根据信息位点提供的各序列间的替换情况,在所有可能的树中寻找含最小替换数的树的方法。 所谓的信息位点指那些至少存在2个不同序列且每个不同序列至少出现两次的位点。,4个类群

4、共有3种进化树,每个序列有9个位点,序列对比得到:5、7、9为信息位点,分别计算3种进化树信息位点替换数得到最小替换数的一组为系统发育树。,优点:适用于序列非常相似以及序列数目较小的发育树构建。 缺点:需检查所有与一组序列相关的树,非常耗时,当数据中包括大量序列或者序列变异较大时不适用。,系统发育树构建方法二距离法。,定义:距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系 。,计算距离软件:DNADIST-计算所输入核酸序列间的距离。 PROTDIST-计算蛋白质序列

5、的距离。从而获得距离矩阵。,一种距离矩阵:,由进化距离构建进化树的方法常见有:1.Fitch-Margoliash Method(FM法)2. Neighbor-Joining Method (NJ法/邻接法)3. Neighbors Relaton Method(邻居关系法)4.Unweighted Pair Group Method (UPGMA法),得到距离矩阵后,输入PHYLIP软件中距离分析程序即可估计系统树: 1.KITSCH用于F-M法估计系统树。 2.NEIGHBOR用于邻接法或UPGMA法来估计系统发育树。,系统发育树构建方法三最大似然法,最大似然法是由样本观测值估计总体参数

6、的一种常用方法。最大似然法是选择最高概率的树。 优点:对多重序列排列的每一列进行分析,将考虑所有可能的树,对其序列变化数进行分析,变化数越多则树越不像,类似最大简约法。正是如此,其可以通过不同谱系的突变率差异来评价树,可以用于探索远源序列的关系,因而强于最大简约法。 缺点:计算过于复杂!,PHYLIP软件包中包括2个最大似然分析程序:1.DNAML:用于对核苷酸序列估计系统发育关系。2.DNAMLK:与DNAML不同在于假设存在分子钟(分支上进化速率恒定)。,系统发育树的构建软件,1.PHYLIP是一个包含了大约30个程序的软件,基本囊括了系统发育分析的所有方面,而且是免费软件,如上面提到的D

7、NADIST和PROTDIST。其处理DNA序列的软件和处理蛋白质序列的软件不同:用最大节约法构建进化树时,DNA序列采用DNADIST软件,蛋白质采用PROTPARS软件;用距离法构建树时,DNA采用DNADIST软件,蛋白质采用PROTDIST软件;用最大似然法构建树时,DNA采用DNAML、DNAMLK,蛋白质采用PROTML或PROTMLK软件。,2.PAUP为发育系统提供一个简单的,带有菜单页面程序。PAUP3只建立于最大简约法构建发育树,PAUP4可以针对核苷酸进行距离方法和最大似然法进行建树。,在构建发育树时,相同的数据用不同的系统发育软件构建的发育树可能是不同的,在实际中处理数

8、据时,比较多种方法构建进化树后做出分析比只用一种构建方法更有说服力。,节点上的数字是Bootstrap value,即自展支持率,或者自展值,是用来检验进化树分支可信度的。自展值,是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如果没出现就给0分,这样经过你给定的repetitions次(至少1000次)重排构树打分后,每个分枝就都得出分值,计算机会给你换算成bootstrap值。重排的序列有很多组合,值越小说明分枝的可信度越低,最好根据数据的情况选用不同的构树方法和模型。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报