收藏 分享(赏)

DAVID使用方法介绍.pdf

上传人:精品资料 文档编号:9062173 上传时间:2019-07-22 格式:PDF 页数:23 大小:1.80MB
下载 相关 举报
DAVID使用方法介绍.pdf_第1页
第1页 / 共23页
DAVID使用方法介绍.pdf_第2页
第2页 / 共23页
DAVID使用方法介绍.pdf_第3页
第3页 / 共23页
DAVID使用方法介绍.pdf_第4页
第4页 / 共23页
DAVID使用方法介绍.pdf_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、DAVID 使用说明文档 一、 DAVID 简介 DAVID ( the Database for Annotation, Visualization and Integrated Discovery)的网址 是 http:/david.abcc.ncifcrf.gov/。 DAVID 是 一个生物信息数据库 ,整合了生物学数据 和分析工具,为大规模的基因或蛋白列表(成百上千个基因 ID 或者蛋白 ID 列表)提供系统 综合 的生物 功能注释 信息 ,帮助用户从中提取生物学信息 。 DAVID 这个工具在 2003 年发布, 目前版本是 v6.7。 和其他类似的分析工具,如 GoMiner,

2、GOstat 等一样,都是将 输入列表中的基因关联到生物 学注释上,进而 从统计的层面 ,在数千个关联的注释中, 找出 最 显著富集的生物 学 注释。最主要是功能注释和信息链接。 二、 分析工具 : DAVID 需要用户提供感兴趣的基因列表,在基因背景下,使用提供的分析工具, 提取该列表中含有的生物信息。这里说的基因列表和背景文件的选取对结果至关重要。 1. 基因列表: 这个基因列表可能是上游的生物信息分析产生的基因 ID 列表。 对于富集分析而言,一般情况下,大量的基因组成的列表有更高的统计意义,对富集程度 高 的 特殊 Terms 有更高的敏感度。富集分析产生的 p-value 在相同或者

3、数量相同的基因列表中具有可比性。 DAVID 对于基因列表的格式要求为每行一个基因 ID 或者是基因 ID 用逗号分隔开。基因列表的质量会直接影响到分析结果。这里定性给出好的基因列表应该具有的特点,一个好的基因列表至少要满足以下的大部分的要求: ( 1) 包含 与 研究目的相关的大部分重要的基因( 如 标识基因) 。 ( 2) 基因的数量不能太多或者太少,一般是 100 至 10000 这个数量级 。 ( 3) 大部分基因可以较好的通过统计筛选,例如,在控制组和对照组样品间选择显著差异表达基因时,使用的 t-test 标准: fold changes =2 & P-values =0.05。

4、( 4) 大部分是上下调的基因 都涉及到特定的某一生物过程,而不是随机的散布到所有 可能的生物过程中。 ( 5) 一个好的基因列表比起随机产生的一个基因列表,应该含有更丰富的生物信息。 ( 6) 在同样的条件下,列表具有 高 度可重复性 。 ( 7) 高通量数据的质量能够被其他独立的实验证实。 以上( 2),( 3),( 6) &( 7)是来自上游的数据标准, DAVID 会自动检查其余的各项要求,即( 1),( 4) &( 7)。 2. 基因背景:在一项研究中,如果一个生物过程不正常,那么通过高通量筛选技术,对该过程共同作用的基因有更大的可能性被选为相关的一组。富集分析正是以此为基础。 为检

5、测富集的程度,必须选取一个背景来进行对比。 基因背景的选取有一个指导原则,就是必须构建一个足够大的,研究者可能涉及的所有基因的集合。 用户使用默认的背景文件(默认为该物种的所有基因),或者是上传一个基因列表文件作为基因背景。 3. DAVID 为实现各项功能分析, 提供了 以下 4 个分析内容(共 6 个 分析工具 ) : ( 1) Gene Name Batch Viewer 这个工具能够实现 将基因 ID 迅速翻译成基因名称 ,从而给研究者对于基因 ID 列表一个直观的印象,初步判断基因列表是否符合要求目的。 图 1 中显示了该工具的 分析 结果,具体说明图 1 中 标注 。 图 1 Ge

6、ne Name Batch Viewer 的分析结果 ( 2) Gene Functional Classification 这个工具是 Gene Name Batch Viewer 工具 的延伸。由于基因名称并不能显著 体现 基因的功能,所以我们需要更加有效的功能分类工具。该工具 基于它们共同的注释信息,而不是基因名称 ,采用全新的模糊聚类算法, 能够实现将功能 相关的基因聚到一起作为一个单元,在生物学网络水平上去研究这些基因群 。 对聚类结果打分, 分值越高,代表该组内的基因在基因列表中越重要 。同时还提供了 2-D View,以热图形式展现聚类到同一组的基因和该组内各个 Term 之间的

7、关系。 结果 见 图 2, 将列表中的基因 ID 作为聚类对象,将功能相关的基因分组显示 。 图 3 是以热图形式展示的 gene-term 关系 。 图 2 Gene Functional Classification 的分析结果 图 3 2-D View 展示 gene-term 关系 ( 3) Functional Annotation 该工具 是 DAVID 最核心的分析内容, 包含了三个子工具: Functional Annotation Chart 该工具提供 gene-term 的富集分析。 相比于其他富集分析软件而言, DAVID 在该功能上最显著的特点是,注释范围的可扩展性

8、:从最初的 GO 注释,扩展到现在超过 40 中的注释种类,包括 GO 注释, KEGG 注释,蛋白相互作用,蛋白功能区域,疾病相关,生物代谢通路,序列特点,异构体,基因功能总结,基因在组织里的表达和论文等。用户可以根据需要选择其中的某些或者所有种类的注释信息。 结果中 以 基因列表中 富集的 Terms 为对象 ,将信息 按照 DAVID 计算出来的 p-value 排列, 同时 链接指向更多的信息 ,见图 4。 图 4 Functional Annotation Chart 的分析结果 Functional Annotation Clustering 该工具使用类似于 Gene Funct

9、ional Classification 工具的模糊聚类方法, 基于注释共同出现的程度作聚类, 对被 注释 上的 Terms 做聚类 ,即 Terms 被分成多组,并将给出聚类的分值。 分值越高,代表该组内的 基因在基因列表中越重要 。同时还提供了 2-D View, 以热图形式展现聚类到同一组的基因和该组内各个 Term 之间的关系 。 结果中 (见图 5) ,即 被注释上的 Terms 作为聚类对象,用户可以根据 聚类的分值 找到重要的 Terms。 图 5 Functional Annotation Clustering 的分析结果 Functional Annotation Table

10、 该工具实现了基因的功能注释, 将 输入列表中每个基因 在选定数据库中的 注释 以表格形式呈现 。 结果见图 6。 . 图 6 Functional Annotation Table 的分析结果 ( 4) Gene ID Conversion 该工具实现 不同数据库的基因标识间的转换。包含 NCBI, PIR 和 Uniprot/SwissProt 等重要数据库的基因标识信息。 结果如 图 7 所示 , 左边的表格 显示转换的情况, 右边表格 以列表呈现转换结果,和基因名称注释 等 。 图 7 Gene ID Conversion 分析结果 总结: 对于以上 6 项分析工具 各有偏重点,下面给

11、出一个指示图 (见图 8) ,帮助用户选择 DAVID 的各项分析工具。 图 8 DAVID 各项分析工具的选择指示图 三、 使用步骤 : hightly recommendedrecommendedGene ID ConversionToolGene Number BatchViewerGene FunctionalClassificationFunctional AnnotationChartFunctional AnnotationClusteringFunctional AnnotationTableConvert gene IDs from one type to anotherRe

12、ad all annotation contents associated with a geneHighlight protein functional domains and motifsRedirect to related literaturesList interacting proteinsCluster redundant and heterozygous annotation termsSearch other functionally similar genes in genome,but not in listSearch other annotation function

13、ally similar to one of my interestsDiagnose and fix problems of gene IDsExplore gene namens in batchDicover enriched functionally-related gene groupsDisplay relationship of many-genes-to-many-terms on 2-D viewInitial glance of major biological functions associated with gene listIdentify enriched (ov

14、er-represented) annotation termsVisualize genes on BioCarta & KEGG pathway mapsLink gene-disease associations1. 向 DAVID 网站提交一个基因列表。 首先 登录到网站 http:/david.abcc.ncifcrf.gov/ 的首页 (见图 9) 。 点击 页面顶端的“ Start Analysis” 在弹出页面 的左边有一个面板 “Gene List Manager”,在该面板的 “upload”标签下提交基因列表(基因列表的格式为每行一个基因或者行内的多个基因以逗号分隔,可以

15、将基因列表黏贴到输入窗口或者以文件形式上传);接着选取输入基因列表的 ID 类型;最后确定列表的类型,是基因列表还是作为背景文件。点击 use,进入分析 。 图 9 网站首页 上传的数据可以供所有的 分析模块共享 ,而不需要重复上传。基因列表文件可以选取如图 10 中所示的 Demolist1 和 Demolist2。 本文中使用 DAVID 提供的 Demolist1 作为基因列表。 附件一是人的血瘀和正常样品之间的显著差异表达基因 列表 ,可供使用 。 如果你要做的是全基因组背景或者是接近全基因组背景的研究,就不需要上传那个 背景文件,网站会自动根据上传的基因列表类型,选择对应物种的所有基

16、因作为背景文件。 如果你要自己设定背景,也可以在“ upload”标签中上传,然后在“ Background”标签中选定所需的列表作为背景。 本文中选取默认的背景文件,即人的全基因作为背景。 图 10 上传数据 窗口 在“ List”标签中,可以看到所有上传的列表。在图 11 所示的右侧中,选择分析项。 图 11 Lsit 标签和分析工具选择窗口 ( 1)选择 Gene Name Batch Viewer 这项分析,弹出的窗口显示分析结果,即基因 ID 和对应的基因名称、相关基因以及所属物种。用户可以据此初步判断,列表中是否含有感兴趣的基因(见图 12)。 Species 栏指向物种相关的 n

17、cbi 信息网页。 图 12 Gene Name Batch Viewer 分析结果 点击 Related Genes 栏中的 RG,将会出现跟该行基因功能相关的基因列表,如图 13 所示的结果。 图 13 功能相关基因列表 ( 2) 选择“ Gene ID Conversion Tool”这项分析工具,在弹出窗口(见图 14)中,选择目的标识类型,然后点击“ Submit to Conversion Tool”, 弹出结果窗口 ,详细说明 见 图 15。 (参照网页 http:/david.abcc.ncifcrf.gov/helps/conversion.html#result) 图 14

18、 Gene ID Conversion Tool 窗口 图 15 Gene ID Conversion Tool 结果说明文件 ( 3 ) 选 择 “ Gene Functional Classification ” 这 项 分 析 工 具 , 弹 出 的 结 果 和 具 体 说 明 见 图 16 ( 具 体 说 明 参 照 网 页http:/david.abcc.ncifcrf.gov/helps/functional_classification.html#textmode)。 图 16 Gene Functional Classfication ( 3 ) 选 择 “ Functiona

19、l Annotation Tool ” 这 项 分 析 工 具 , 会 弹 出 图 17 所 示 窗 口 ( 具 体 说 明 参 照http:/david.abcc.ncifcrf.gov/helps/functional_annotation.html#summary)。 图 17 Functional Annotation Tool 界面 点击页面底部的三个选项“ Functional Annotation Clustering”、“ Functional Annotation Chart” 、“ Functional Annotation Table” : 选择 Functional A

20、nnotation Clustering 这一项分析, 可以对被注释上的 Terms 做聚类, 弹出结果见图 18, 图中绿色的图标可以显示2-D view 热图( 详见之前 提到)。 图 18 Functional Annotation Clustering 分析结果 选择“ Functional Annotation Chart “ 这一 项分析 , 可 以实 现 Terms 的 富集 分析 。 结果 见图 19 ( 具 体说明 见网页http:/david.abcc.ncifcrf.gov/helps/functional_annotation.html#E3) 。 图 19 Functional Annotation Chart 结果 展示 选择 “ Functional Annotation Table “这项分析,可以实现对基因的所有选定数据库注释。 具体结果见图 20。 图 20 Functional Annotation Table 页面解说 参考文献 : Systematic and Integrative Analysis of Large Gene Lists Using DAVID Bioinformatics Resources 发表在 Nature Protocols。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报