收藏 分享(赏)

蛋白质网络中的模块.ppt

上传人:j35w19 文档编号:6373054 上传时间:2019-04-09 格式:PPT 页数:72 大小:3.47MB
下载 相关 举报
蛋白质网络中的模块.ppt_第1页
第1页 / 共72页
蛋白质网络中的模块.ppt_第2页
第2页 / 共72页
蛋白质网络中的模块.ppt_第3页
第3页 / 共72页
蛋白质网络中的模块.ppt_第4页
第4页 / 共72页
蛋白质网络中的模块.ppt_第5页
第5页 / 共72页
点击查看更多>>
资源描述

1、A network of transcriptionally coordinated functional modules in Saccharomyces cerevisiae 酿酒酵母中功能性模块的转录性调控网络,Allegra A. Petti1 and George M. Church1 Genome Res. 2005.15: 1298-1306,摘要,最近的计算和实验工作表明功能模块是细胞生理的基础,并且,从系统生物学的角度看,是细胞组织的有用单位。模块之间的相互作用可产生高水平的细胞功能必需的性能,系统生物学将来的工作有必要对这些相互作用进行完整了解。本文介绍了一种计算方法来系统

2、地识别和分析那些活性调控在转录水平上的功能模块,我们用这种方法:Search for Pairwise Interactions(SPIN)去全面了解酿酒酵母中功能模块的联通性和这种协同下的生物机制,同时以更高的分辨率检测了通过这个全局网络来得到特定的两个模块之间相互作用的详细信息。例如,糖酵解和脂类代谢的可能的转录性协同之间由TFGcr1p调控,并进一步揭示了糖酵解和磷酸肌醇信号路径可能相互调控。,单细胞组织的表型是一个由参与相互调控关系的基因,蛋白质和代谢物整合的网络决定的。创立对这个网络的一种定量描述对于理解,预测和控制细胞行为十分必要。第一步就是解释网络的连通性,即他的元素之间相互作用

3、的形式,考虑到这样做的复杂性,整合的网络通常被看做是叠加的子网,包括基因调控,蛋白质和代谢网络。,自然会想到应该先判断网络的拓扑结构能否反映组织原则。用逻辑网络with relatively well-characterized connectivity对网络拓扑结构进行定量分析发现这些网络是模块化的。一些节点之间的连接比与其他类的节点之间连接更密集,从而被聚为一类。 在自然和人造系统中,模块性是一个功能性设计原则,这样各组分就可以通过共同的物理的,调控的或功能特点来化分。在生物当中,模块的准确意义取决于所研究的网络,例如,蛋白质网络中的模块通常有直接的物理解释静态分子复合体(比如核糖体),或

4、者动态信号路径(如MAPK信号级联 )。,相反,基因调控网络一般呈现的是调控模块,其中每一个基因在相同的环境条件下都由相同的TF控制。这两种网络都呈现出了功能模块,定义为参与一个共同的亚细胞过程的一组基因,蛋白质和其他分子。从系统生物学的角度看,功能模块是一个细胞最重要的组织性单位,越来越多的研究也支持这样的观点:这些模块是大多数细胞生理过程的基础。,对于一个自然的或者人造的系统来说,模块的相对独立性对于系统控制有重要意义:一个模块可以有选择性的改变而不会扰乱系统其他部分的行为。然而,模块间协调出现的更高层次的特性通常对于系统作为一个整体的行为来说至关重要。保证每个模块中只有少数分子与其他模块

5、重合,这样便可减少模块整合 时的麻烦。模块中有部分节点与其他模块孤立。即模块包含大量的内部节点不与其他模块有关系。而且有小部分节点(有输入和/或输出)与其他模块有关系。,大多数的功能模块研究曾经定义过模块元素,许多数据库用已发表的文献来将酿酒酵母的每个基因按照其细胞功能聚类。然而,许多研究发现了模块之间有物理的或调控作用的例子。例如,发现Gal4p(一个与半乳糖代谢有关的TF),调控与尿嘧啶代谢有关的基因,比如尿嘧啶转运基因FUR4,对功能性相互作用的更全面的了解对系统生物学的研究进展是必不可少的,比如预测由微生物的基因调控产生的细胞表型,并且可以设计出细胞功能的精确的计算模型。帮助回答关于模

6、块间调控关系是怎样在细胞中分布的等更广泛的问题。一个可能是细胞中大多数的细胞功能均由一个中心模块协调,连接是在模块间均匀分布。,这些考虑激发了我们发现酿酒酵母中潜在的有共调控的功能模块对,这种共调控可以通过一系列机制实现,包括酶反应,共享代谢物和协同转录等。我们关注转录,促进其他机制协调所需要的生物化学组分的共存,可能代表了共调控的最基本的层次。着眼于一个TF可以通过调控两条路径中的基因来协调这两条路径的实验证据,我们开发了一个算法,SPIN(Search for Pairwise INteractions ),来检测来自于两个功能模块的基因,并使用表达数据来估计一个给定的TF转录调控两个模块

7、中基因的可能性。,为了在特定的水平上得到模块协调的全面认识,对72个模块的所有可能的结合对应用SPIN,这72 个模块是根据MIPS 数据库二级分类得到的。对于每一个模块对,转录性协调的程度是由四个微阵列表达数据决定的,每个有175个TFs,结果显示了功能模块之间大量的共调控。SPIN也能发现了以前未知的功能性相互作用和调节他们的TFs。,结果,单个TF分析 包括一个TF结合位点数据库,一个基因表达数据库和两个基因集合(每一个都预定义为功能模块),对于每一个TF,SPIN决定这个TF是否与两个模块中的基因结合,如果是,就用基因表达数据来决定这个TF是否授予(confer)这些目标基因与那些功能

8、类基因一致或不同的表达谱 (Fig. 1A)。 SPIN的输出是统计显著的三元组,两个功能性模块和一个协调这两个模块中基因的TF。我们只考虑每个模块至少包含4个目标基因的三元组。,(A) General approach.,Petti A A , Church G M Genome Res. 2005;15:1298-1306,2005 by Cold Spring Harbor Laboratory Press,Each node represents a module. Node color represents the corresponding top-level MIPS categ

9、ory (see legend). Edge color represents the expression data set in which the interaction was identified: purple = cell cycle, gray = diauxic shift, turquoise = environmental stress, green = MAPK.,为了产生下面的结果,我们将TFBS 和基因表达数据结合。175个TFs的TFBS 信息取自两个预存在的数据集:一个是MSA(多序列比对:Multiple Sequence Alignment ),是用序列比对

10、算法AlignACE 和模式匹配算法ScanACE得到的,分别用来检测TF结合motif和他们的基因位点。第二个数据集是Chip2,是用ChIP-chip技术得到的,所以包含试管内直接的物理证据。因为假定MSA集合中每一个DNA结合motif代表一个同源TF的结合位点,“TF”或“TFBS”今后也代指DNA motif衡量细胞周期,两阶段过程( diauxic shift ),环境应激反应和MAPK信号路径期间的mRNA表达谱的四个微阵 列数据集。,功能模块是根据MIPS数据库的二级分类定义的。然而,SPIN 可以用任何功能分类机制。这是必要的,因为,模块的定义不可避免地会随着酵母基因组注释的

11、变化而变化。 为了在这个水平上对模块协调有个全面的认识,我们对所有MIPS功能模块对使用SPIN,用每个TFBS和每个表达数据集。对于每个数据集联合,表1总结了这些数据 (完整结果在Supplemental Figs. S2, S3).,34个TFs调控316个相互作用,关联了55个功能模块,那些由至少一个TF调控,在至少一个表达数据集中的在figure1 B中。由Chip2得到的结果包括36个类的102个对相互作用,由25个TF调控的。其中48%的相互作用也在MSA 结果中发现了(Supp fig.S5)总之,这些结果包含了丰富的数据集,用这些数据集可以从不同水平研究模块间的共调控。o,在低

12、分辨率下,我们可以认为结果就是对模块联通性的全面认识,解释了细胞活性的控制被中心化的程度和处于什么样的条件下每个模块都是激活的。对于两个模块来说,模块连通性的分布(the distribution of module connectivity :这个模块与被共同调控的其他模块的个数)不是均匀的( Fig. 2A )。那些与基因信息的储存与传递有关比如mRNA,细胞周期,tRNA, 核苷酸,分化和DNA模块在高度连接之中(表2),虽然没有证据证明单个的模块作为细胞“中央处理单位”,这些模块表现出对细胞行为产生特别强烈的影响。,简称,这与蛋白质相互作用网络中有物理相互作用的模块数据是一致的。功能模

13、块连通性分布表明了模块大小和partner modules个数之间的普通关系( Pearson 相关系数=0.87Chip2, 0.64MSA),一般的关联是正常的,因为中心细胞过程(1)会关联许多模块,(2)与其他过程会有一些交叉。由表达数据集得到的联通性分布却没有那么好的结果( Supplemental Fig. S6AC),用环境应激表达数据得到的的相互作用只有少数是显著的,数据集中的条件引出了大量的转录性反应被认为是环境应激反应environmental stress response (ESR) ,但是或许会以不同于ESR的方式影响少数功能模块。,从TF的角度来看,TF的联通性分布是

14、非均匀的(一个给定的TF调控的相互作用个数)类推到模块的联通性分布( Fig. 2A ),这支持这种观点:一些TF(如mRRPE,PAC和SFF)相对常见所以参与许多过程,而其他一些模块却更具特异性。例如, MCB,它的目标基因在细胞周期的G1阶段处于激活状态,研究发现它调控与细胞周期和转录有关的许多相互作用,这些都是由细胞表达数据得到的。,此外,经常会发现那些协同发生的TFs( act synergistically )调控相同的相互作用。例如,许多由mRRPE,PAC调控的(协同调控rRNA转录基因表达)相互作用关联一个或多个模块rRNA, tRNA和Amino-acyl tRNA合成,可

15、用两阶段表达数据推测出。这可能反应了伴随着两阶段过程的发生,核糖体生物反应的下降。 虽然完整的网络太大并且高度连接,能反映转录调控的详细信息,我们也可以提取感兴趣的子网增加研究详细水平,比如,所有通过MSA TF与细胞周期有共同调控的模块在Supplemental Figure S7列出了,特殊的模块对会在下面讨论。,Each node represents a module; see color key in Fig. S4. Edge color represents the expression data set in which the interaction was identifi

16、ed, as in Fig. S4. Each edge is labeled with the TF that mediates the interaction (TF color corresponds to the expression data set with which the interaction was identified), as follows: 186 = PAC; 192 = MCM1; 193 = SFF; 195 = mRRPE3; 196 = RPN4; 197 = SFFp; 200 = GCR1; 201 = MCB; 202 = mMERE11; 207

17、 = MATALPHA2; 209 = STREp; 211 = CSRE; 220 = REB1; 235 = ECB; 237 = SCB; 238 = SWI5.,MSA 和 Chip2结果的交叉,要识别生物学上最显著的那些结果,我们选择统计上显著的对关系,这些关系是由两种结合位点数据集得到的。过滤后得到的结果包含22个模块之间的29个对关系,由39个motif(即TF)调节( Fig. 3; Supplemental Fig. S8 )。其中许多相互作用和调控他们的TF有充分的生物学依据,但是也发现了一些预测性差点的关系。至于前者,有一个clique(派系)包括细胞周期,DNA , m

18、RNA和分化模块。 clique中的每一个相互作用由MBP1( Chip2 )和MCB(MSA)调控,这两个均对应于TF Mbfp( MBP1 and SWI6 相互作用形成Mbfp 复合体,然后与MCB DNA motif结合,在细胞周期期间通过START调控通路)。,Duplicated interactions.,Petti A A , Church G M Genome Res. 2005;15:1298-1306,2005 by Cold Spring Harbor Laboratory Press,其他可预见的关系包括蛋白质复合体的组装与离子内环境稳态 和线粒体运输。 TFs HA

19、P4 (Chip2) 和 HAP2/3/4 (MSA)( 代表由HAP2, HAP3 and HAP4组成的复合体)调控所有的关系。他们与HAP5一起形成了调控在非发酵条件下编码TCA循环和电子传递链组分基因的TF复合体。发现ABF1 (MSA) 和 HAP2/3/4 (MSA)协调蛋白质复合体的组装和离子内环境稳态,是另一个协同的TF调控相同关系的例子。 一个新的关系是细胞周期和碳(Cell cycle with Carbon)由几个TFs包括SWI5, CIN5, NDD1, NRG1 (all Chip2) 和mMERE11 (MSA)。,TF pairs(TF对) 许多TFs的活性和特

20、异性通过他们与其他TF结合而增加。从而将对功能性模块的协调用单一TF方法扩展为鉴别协同作用来调控各功能性模块活性的TF对。,类推到单个TF分析,对MSA数据集中的所有TF对和所有表达数据集,所有模块对之间的协调用SPIN分析。使用严格的筛选标准,26对TFs,包含13个单个的TF,调解23个不同模块间的32个对关系。这个TF-pair相互作用网络包含了少量在single-TF分析中没有识别出的模块关系。连接度最高的模块与那些用single TFs识别出的模块有微小差别,包括Carbon, mRNA, Cell cycle, Cell Sensing and Response Different

21、iation。,在这26对不同的TF中,以前的文献说明其中11对有协同作用。 大多数的TF combinations包含TFs SFF, SFFp (an SFFvariant), or MCM1-short (an MCM1 variant)中的一个。 我们要求每个模块中包含一些基因作为两个TF的目标基因可能会使我们的结果对于那些有大量目标基因的TFs有误差。拥有最多additional motifs的SFF(Supplemental Fig. S13)或许能解释为什么在单一TF分析中能调控许多模块对。,Analysis of module coregulation with respect

22、 to individual transcription factors,关于单个TF的模块共调控的分析 除了概括了解,我们还详细研究了若干模块对之间的调控关系。正是在这个层次上的分析产生了最多实际的生物学见解:SPIN能够有效的复制以前研究的结果,提供了一些新的信息使我们能将已知的和新的结果整合成改进的,更完整的生物假设。这里,我们讨论“碳化合物和碳水化合物代谢”(Carbon) 和“脂质,脂肪酸代谢”( Lipids )。,葡萄糖和类脂代谢(每个过程都会产生另外一个过程的中间产物)之间的关系已经得到了确认。然而,最近发现的葡萄糖和类脂代谢之间物理上和信号关系说明这些过程由一些还未完全了解的

23、更精细,多水平的调控机制进一步调控着。为了在转录水平上研究这种调控,我们将算法应用到功能模块对Carbon 和 Lipids, Glycolysis 和Lipids.,用严格的和宽松的筛选标准( Methods ),发现Carbon 和 Lipids的活性是由若干TFs协调的。不同的TF以condition-specific(条件特异性)的方式在每个过程中协调不同的基因集。 例如,用MAPK表达数据,发现SWI4在与细胞壁合成有关的每个过程中协调基因。然而,用细胞周期数据, 发现GCR1 (MSA) 协调CarbonLipids关系。我们关注这个结果的原因是,相比于调控这个关系的其他TFs,

24、GCR1对糖分解基因更有特异性。,GCR1是糖分解酶的转录激活剂,但是以前没有在类脂,脂肪酸或类异戊二烯代谢中出现,然而GCR1与脂肪有关的6个基因有关(Fig. 4) 。这些基因与肌糖和磷酸肌醇的合成有关,比如信号分子PI(4,5)P2 (MSS4 and INM1),脂肪酸合成(ELO1),麦角固醇合成(FPS1),甘油输入(ERG20)和其他磷脂合成基因(UME6)的肌糖依赖性转录调控。,这些结果将最近的一些研究集中了起来,每一个从不同角度反映了糖分解和脂肪代谢之间的关系。用酵母蛋白质组芯片,发现一些糖分解酶和葡萄糖转运蛋白与磷酸肌醇结合,这与报道中提到的“大多数的糖分解酶位于细胞壁”一

25、致。其他研究显示葡萄糖通过磷酸肌醇PI(4,5)P2和INM1的转录刺激分裂和随后的信号转导。,这些数据说明了磷酸肌醇可能会与糖酵解和PI(4,5)P2合成和葡萄糖诱导的PI(4,5)P2信号。这提高了磷酸肌醇和磷酸肌醇调控的信号转到在反馈环中调控糖分解酶活性的可能性。葡萄糖和脂肪代谢的通过GCR1的转录性协调使得两个过程的组分能够同时存在。,讨论,最近的计算和实验性工作产生 了大量证据:细胞由功能模块-一组基因,蛋白质和其他分子完成特定的细胞功能。虽然每个模块表现的与细胞其他组分相对孤立,模块之间的协同和相互作用出现的特点可能对于细胞生存至关重要。系统生物学中更深入的研究使得有必要更完整地了

26、解这些相互作用。SPIN算法帮助找出了那些活性被转录性协调的功能模块,从而产生了那些模块间关系的定性信息。我们详细分析了几个模块相互作用,并讨论了Carbon 和Lipids的例子。,发表的实验结果这些模块间多种相互作用,但是他们的关系没有被系统地研究过。我们的结果说明了TF可能参与协同作用,TF影响协同作用的环境条件和作用在模块交界处的基因,所有这些构成了相互作用关系的机制和原理。例如,carbon 和 lipid代谢之间相互作用的分析 ,整合并印证了以前的说法: 糖酵解可能会发生在细胞壁上,而糖酵解会调控磷酸肌醇信号。接下来的实验要验证是否磷脂会激活或抑制糖分解酶。PI(4,5)P2信号能

27、否影响糖分解,是否糖分解对于葡萄糖对PI(4,5)P2信号的影响是必需的。,除此之外,为了在特定水平上理解调控在细胞中是如何分布的,我们实行了全面的分析。对72个模块的所有对应用SPIN算法,结果在55个模块中产生了大量的协同作用,其中许多与至少一个模块有相互作用,通过至少一个TF或在至少一种实验条件下。模块连通性的分布不是均匀的。虽然没有发现单个主要的调控模块,与基因信息的储存和转运有关的过程如mRNA, Cell cycle, tRNA, Nucleotides, Differentiation, and DNA是高度连接的(然而,如果用不同的表达数据会得到不同的度分布)。这说明这些基本的

28、过程对于细胞行为的谐调起着中心作用。然而在相关研究中,许多在酿酒酵母中共表达的模块在其他物种中就不共表达了。将模块协同的全基因组分析扩展到其他物种或许会发现复杂细胞网络中相互作用的演化。,方法,综述: SPIN 是由实验证据“模块可以通过一个诱导一些与这个模块有关的基因共表达的TF来协同调控”而激发的。给定两个基因集(每一个对应于一个模块),一个TFBS数据集和一个微阵列表达数据集,算法遍历每个TF来识别每个包含相应的TFBS的模块中的基因。用表达数据打分来评估这个TF影响这些目标基因表达的证据。如果这个TF的目标基因(至少4个)在每个模块中的共表达比在模块中的非目标基因更一致,两个模块就叫做

29、通过一个特定的TF协同调控。输入数据集,得分矩阵和评估统计显著性的方法在下面讨论。,功能性模块( Functional module )的定义 每个功能性模块被定义为在MIPS (Munich Information Center for Protein Sequences)酿酒酵母基因数据库中分配给一个特定的功能类的一些基因。用已发表的信息,MIPS以分层的方式将基因聚类,每个基因可被分到不同的类中。SPIN分析来自相同水平上的功能类中的对。虽然任何水平都可使用,我们把结果定位在对应到生物过程的第二层(如细胞周期,核糖体合成,TCA循环和细胞内信号转导)上。类名用斜体字,表2 列出了一些经常

30、用到的名字的简称。,基因组序列数据,上游区域序列数据从AlignACE Web site和酿酒酵母基因组数据(SGD)下载。这些数据包含5018个上游序列,代表了6186个非线粒体基因。,TF结合数据 我们使用两种不同的TF结合数据集,每一个都是一个矩阵,如果基因i的启动子包含TF j的结合位点,其中元素(i,j)是1,如果不包含就是0 (Supplemental Figs. S14, S15 )。MSA数据集包含62个TF DNA结合motif,表示为位点特异性权重矩阵。是由文献和多序列比对算法AlignACE得到的。每个motif 在每个启动子上的位置是由模式匹配程序ScanACE决定的

31、,识别并给每个一致的motif打分。,一个motif 被认为在promoter上是存在的,如果its match in the promoter得分等于或者在低于平均分一个标准偏差的范围内,“Chip2”数据包含113个TF的位点数据,他们在6270个启动子上的结合位点是由染色质免疫沉淀法决定的,用微阵列杂交(ChIP-chip)技术。每对模块被分析两次,一次用一种TFBS数据,比对两个数据集得到的结果,综合考虑形成对模块间协调的一个综合认识。,表达数据集,对于每一个TFBS数据集,SPIN在四个微阵列表达数据集上运行,一个细胞周期(cell cycle)在15个点上的时间序列,两阶段(dia

32、uxic shift)时间序列是在7个时间点上,42个实验条件( environmental conditions ),PH值,氧化作用,盐和渗透压和56个探索MAPK信号转导路径的条件。,Scoring metric terminology and rationale,给定一对模块,一个TFBS数据集,一个表达数据集,SPIN依次遍历每个TF来识别在每一个包含同源结合位点的功能类中的基因。这些基因被叫做“目标基因”,而那些不包含TFBS的基因被叫做“非目标基因”。任何两个功能类和一个TFBS叫做一个“三元组”。“集合目标/非目标基因”(Aggregate target /non-target

33、 genes )指来自两个功能类的重叠的目标(非目标)基因 。“解体(disjoint)目标(非目标)基因” 是指两个功能类中非重叠的目标(非目标)基因集。,因为启动子中TFBS的存在并不能保证TF调控下游基因,如果一个TF影响他的目标基因的表达,在一个模块中,他们的表达谱会与非目标基因不同,这与生物事实一致,目标基因会与其他模块作用,而非目标基因不会。我们用两种基于表达的度量来调节一对模块之间不同类型的协同调控。一方面,可能会有这样的条件,集合目标基因(输入/输出节点)在模块之间会紧密共表达。但是参与模块特异性过程的非目标基因集合(内部节点)在其中不会明显共表达(Fig. 5A) 。,表达谱

34、一致得分“Expression ProfileConvergence”(C)决定了目标基因是否比非目标基因高度共表达。另一方面,非目标基因也有可能是共表达的,只不过是以一种不同于目标基因的方式(Fig. 5B)。“表达谱差异性得分”(D)衡量目标基因的表达谱与非目标基因的不同程度。,两种打分方法是基于两种简单的衡量一些表达谱一致性的度量“Expression Coherence Within” (Ew) 和“Expression Coherence Between” (Eb) 得分。考虑一组基因N, Ew是所有成对表达谱相关系数超过data set-specific相关阈值的部分,由Ew(N)

35、指定。它衡量了一组基因共表达的紧密程度。考虑两组基因 N and M, Eb(N, M) 是|N| * |M|对表达谱相关系数超过data set-specific相关阈值的部分。,Coherence of target gene expression profiles.,Figure5 Petti A A , Church G M Genome Res. 2005;15:1298-1306,2005 by Cold Spring Harbor Laboratory Press,Coherence of target gene expression profiles. (A) Distinct

36、ness of target gene expression profiles. The cube represents a three-dimensional expression space. Each dot represents a gene from functional module 1 (blue) or functional module 2 (red), and the location of the gene on an axis represents the expression level of the gene at the time point or conditi

37、on represented by the axis. The distance that separates two genes is inversely proportional to the “coherence” of their expression profiles. Target genes are shown as regulated by the TF (arrow). This distribution of genes represents a hypothetical scenario in which the intermodule coherence between

38、 target genes is higher than that between non-target genes. (B) Notation as in A. This distribution of genes represents a hypothetical scenario in which target genes and non-target genes have very different expression profiles, even though the intermodule coherence between target genes is similar to

39、 that of non-target genes.,(C) Triplet scoring notation. M1 = genes in module 1; T = genes in genome containing binding site for TF T; m1 = genes in M 1containing binding site for T (“target genes”); M1= genes in M1 that do not contain a binding site for T (“non-target genes”); randomly selected gen

40、es from M1; M2, m2, M2defined analogously. Aggregate target genes = (m1 m2) or (m1m2IT) ; aggregate non-target genes =(M1 M2) or (M1 I M2); I and IT represent non-target and target genes, respectively, that are present in both modules. (D) Quartet scoring notation. Variables are analogous to those i

41、n C, but here there are two TFs, X and Y. Tx = genes in genome containing binding site for X; Ty = genes in genome containing binding site for Y. B, X, Y, and N represent module components that are targets of both X and Y, X only, Y only, or neither TF, respectively:,只计算来自不同集合中的基因相关系数。它衡量了两组基因共表达的紧密

42、程度。对一个特定的表达数据集,相关阈值是达到所有此数据集中相关系数95% 的值(the value of the correlation coefficient at the 95th percentile of all pairwise correlation coefficients for that data set )。,对于一个包含Q个 TFS的TFBS数据集来说,随机划分重复(3*Q/0.05)-1次(Edgington 1995)来保证p-value为0.05。 表达谱差异性得分D,比较分子coherence within the target genes和分母between t

43、he target genes and non-target genes(fig.5 B,C, Supplemental Fig. S19),它包含分配给两个功能类的基因,D分的统计显著性是通过控制FDR保证的。要得到D分的p-value,两个模块中的所有基因被随机的分配到了相同大小的 和 ,重新计算D:给定Q个TFs,随机化重复(3*Q/0.05)-1次。,类比于三元组,定义了quartet,是一对modules和一对motifs(即TFs),对于每一个quartet来说,基因集之间的交集确定了。定义了Convergence得分 和Distinctness得分 ,并用来比较了double-t

44、arget 基因(即为两个TF靶点的基因)之间的表达一致性。 这些得分与他们在单一TF分析中的结果不同在于:对于TF对,随机化只在目标基因中,不包括非目标基因,为了确定由TF对授(conferred by)的表达谱显著不同于单个TF 授予的表达谱这种修改是必要的。,Motif combinations,选择显著协同调控的模块,1.严格的标准一对模块被称为是由一个或一对特定的TFBS对共同调控,当D和C的q-value值至多是0.15时,因为这两个得分的显著性可以以一种 的方式结合q-value值低于0.15. 2.宽松的标准以上的标准是高度保守的:(1)要求两种不同的得分统计上显著。(2)那些得分的显著性是由保守的随机化程序计算得到的。(3)要求每一个三元组在每个模块中至少有四个目标基因。因为生物显著性作为统计显著性不总是显然的。有可能假阴性中的标准越结果严格,在上面的分析中,我们经常会考虑一些三元组和四元组,他们的其中一个分数的q-value小于等于0.15,另外一个分数的p-value小于等于0.05。用这种宽松的标准得到的结果在supplement figure S2,S3(三元组)和S10(四元组)的完整列表中。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 网络科技 > 网络与通信

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报