收藏 分享(赏)

医学PPT课件大全蛋白质和蛋白质组分析.ppt

上传人:微传9988 文档编号:3231082 上传时间:2018-10-08 格式:PPT 页数:109 大小:12.41MB
下载 相关 举报
医学PPT课件大全蛋白质和蛋白质组分析.ppt_第1页
第1页 / 共109页
医学PPT课件大全蛋白质和蛋白质组分析.ppt_第2页
第2页 / 共109页
医学PPT课件大全蛋白质和蛋白质组分析.ppt_第3页
第3页 / 共109页
医学PPT课件大全蛋白质和蛋白质组分析.ppt_第4页
第4页 / 共109页
医学PPT课件大全蛋白质和蛋白质组分析.ppt_第5页
第5页 / 共109页
点击查看更多>>
资源描述

1、蛋白质和蛋白质组分析,孙明明 ,主要内容,数据库与检索工具 UniProt, Genbank, RefSeq, IPI,Ensembl, PDB,DIP,et al. 蛋白质数据分析 基本物理化学性质分析 序列相似性比较 特征序列分析 翻译后修饰分析 功能域分析 亚细胞定位分析,Go功能分类与富集分析Pathway分析相互作用与网络分析,IPI,Gene ontology,TRANSFAC,DATABASE,BLAST,Pfam,.,HMMER,BLAST2GO,GENEGO,EMBOSS,Interproscan,psort,.,TOOLS,Output,常见数据,GI:120407068,

2、XP_001604088.1,NP_000537.3,IPI00025087.2,P53_HUMAN,P04637,ENSP00000269305,Q9EX73,AAF36358.1,主要蛋白质序列检索工具,NCBI Entrez,KEGG DBGET,UNIPROT,IPI,Ensembl,主要内容,数据库与检索工具 UniProt, Genbank, RefSeq, IPI,Ensembl, PDB,DIP,et al. 蛋白质数据分析 基本物理化学性质分析 序列相似性比较 翻译后修饰分析 功能域分析 组织分布 编码基因在染色体上的分布 亚细胞定位分析,Go功能分类与富集分析Pathway

3、分析相互作用与网络分析,蛋白质基本物化性质分析,EMBOSS Pepstats Pepinfo Pepwindow Octanol ,ExPASy(Expert Protein Analysis System) ProtParam Compute pI/MW ProtScale ,分子量 等电点 残基数 氨基酸组成 ,http:/ - pepstats,在线工具:http:/www.ebi.ac.uk/Tools/emboss/pepinfo/ 本地下载:http:/ - ProtParam,http:/us.expasy.org/tools/protparam.html,计算多种理化指标,序

4、列相似性比较,两序列比较 主要工具:BLAST 常用数据库:NCBI NR,SWISSPROT 命令示例: blastall i input.seq d nr p blastp e 1e-3 b 10 o blast.out 多序列比对 Clustalw/clustalx (http:/www.clustal.org/)等,翻译后修饰分析,翻译后修饰是调节蛋白质功能的重要方式,对蛋白质翻译后修饰的研究可以帮助阐明和了解蛋白质功能及其功能变化,翻译后修饰的预测和分析也日渐成为生物信息学蛋白质序列分析中的重要的研究内容。 磷酸化、糖基化、甲基化、泛素化和羟基化等等,翻译后修饰数据库,翻译后修饰预测

5、软件,一、蛋白质功能域数据资源,蛋白质功能域分析,二、蛋白质功能域搜索工具,HMMERINTERPROSCANrpi-blast,HMMER,HMMER HMMER 是用 “隐马尔可夫模型”(HMM)进行数据库搜索的一个应用程序包。 http:/hmmer.janelia.org/#download免费下载 HMMER 应用程序包。 Hmmpfam 库文件:ftp:/ftp.sanger.ac.uk/pub/databases/Pfam/current_release/Pfam-A.hmm.gz 命令行:hmmpfam Pfam-A.hmm sequence_file output_file,

6、InterproScan,http:/www.ebi.ac.uk/Tools/InterProScan/,本地下载安装:ftp:/ftp.ebi.ac.uk/pub/databases/interpro/iprscan,rpi-blast,应用方法:rpsblast -i input_seqs.txt -d cdd -p T o out_result CDD库下载:ftp.ncbi.nih.gov/pub/mmdb/cdd/ 详细信息: http:/www.ncbi.nlm.nih.gov/staff/tao/URLAPI/rpsblast.html,亚细胞定位分析,大部分蛋白质都是先分布到不

7、同亚细胞位置再行使功能的 蛋白质的功能与其亚细胞定位有很强的关联,亚细胞定位数据资源,亚细胞定位预测工具,PSORT,http:/www.psort.org/ 在线工具: http:/psort.hgc.jp/,主要内容,数据库与检索工具 UniProt, Genbank, RefSeq, IPI,Ensembl, PDB,DIP,et al. 蛋白质数据分析 基本物理化学性质分析 序列相似性比较 特征序列分析 翻译后修饰分析 功能域分析 亚细胞定位分析,Go功能分类与富集分析Pathway分析相互作用与网络分析,GO(Gene Ontology)分类,Gene Ontology介绍 GO o

8、ntologies的描述 GO annotation的介绍 GOslim分类统计 BLAST2GO 富集与缺少分析,什么是GO?,随着多种生物genome的相继解码,使得annotation的工作量和复杂度大大增加。大多数基因在不同真核生物中拥有共同的主要生物功能,通过在某些物种中获得的基因或者蛋白质的生物学信息,可以用以解释其他物种中对应的基因或蛋白。 Gene Ontology(简称GO)由上述的想法而诞生,用来将所有的蛋白质功能进行分类,Gene OntologyTM (GO) Consortium,http:/www.geneontology.org/,The structure,Hi

9、erarchicalDirected Acyclic Graph terms have one or more parentsis-a and part-of relations,Cellular Componente.g. nucleus, ribosome,Three Ontologies,Molecular Functione.g. DNA binding, catalysis of a reaction,Biological Processe.g. metabolism,OBO - Open Biological Ontologies,http:/www.geneontology.or

10、g/ontology/gene_ontology.obo,GO term各字段的说明,id: GO:0006094 name: gluconeogenesis namespace: process def: The formation of glucose from noncarbohydrate precursors, such as pyruvate, amino acids and glycerol. exact_synonym: glucose biosynthesis is_a: GO:0006006 is_a: GO:0006092,unique GO ID,term name,d

11、efinition,synonym,parentage,ontology,Ontology Structure,Terms 可能有一个以上的父Term,或者一个以上的子Term Terms的连接关系 is-a part-of ,Ontology Structure,membrane,is-a,Mitochondrial membrane,nucleus,cell,part-of,nucleus part_of some cell,GO Annotation,电子注释(Electronic annotation) 量大但质量低并且没有经过校验 人工注释(Manual annotation) 来自

12、文献 花费时间长但质量高,GO Annotation,ISS Inferred from Sequence/Structural Similarity IDA Inferred from Direct Assay IPI Inferred from Physical Interaction TAS Traceable Author Statement NAS Non-traceable Author Statement IMP Inferred from Mutant Phenotype IGI Inferred from Genetic Interaction IEP Inferred fr

13、om Expression Pattern IC Inferred by CuratorIEA Inferred from electronic annotation,Accessing annotations to the Gene Ontology1. Downloads Annotations gene association file( ftp:/ftp.geneontology.org/pub/go/gene-associations/ ) 2. Web-based accessAmiGO (http:/www.godatabase.org),Gene Association Fil

14、e,Calcyclin IPI00027463 protein taxon:9606 20040426 UniProtCalcyclin IPI00027463 protein taxon:9606 20030721 UniProtCalcyclin IPI00027463 protein taxon:9606 20030721 UniProt,UniProt P06703 S106_HUMAN GO:0008083 GOA:spkw IEA F UniProt P06703 S106_HUMAN NOT GO:0007409 PMID:12152788 NAS P UniProt P0670

15、3 S106_HUMAN GO:0005515 PMID:12577318 IPI UniProt:P50995 F,DB DB_Object_ID DB_Object_Symbol Qualifier GOid DB:Reference Evidence With Aspect,DB_Object_Name DB_Object_Synonym DB_Object_Type taxon Date Assigned by,GO 分类统计,什么是GO Slim? GO Slim是GO ontologies的缩减版 如何做分类统计 Map2slim.pl (Go-perl) gene_ontolog

16、y.obo Slim文件,如goslim_generic.obo GO Annotation Files,Map2slim.pl,前提条件是安装Perl Go-perl包可从CPAN免费获取,gene_ontology.obo,http:/www.geneontology.org/GO.downloads.ontology.shtml,Slim文件下载,http:/www.geneontology.org/GO.slims.shtml,GO Annotation Files,运行方法,根据已有的Accession列表去GO Annotation Files文件中寻找对应的GO ID. Map2

17、slim t c goslim_generic.obo gene_ontology.obo gene_associations_file go_slim.out http:/search.cpan.org/cmungall/go-perl/scripts/map2slim,找不到程序 or不会使用perl,BLAST2GO,首先安装JRE(Java Runtime Enviroment) Blast2Go的Web启动地址:http:/www.blast2go.de/,Blast2GO的工作流程,富集分析和缺失分析,主要内容,数据库与检索工具 UniProt, Genbank, RefSeq,

18、IPI,Ensembl, PDB,DIP,et al. 蛋白质数据分析 基本物理化学性质分析 序列相似性比较 特征序列分析 翻译后修饰分析 功能域分析 亚细胞定位分析,Go功能分类与富集分析Pathway分析相互作用与网络分析,KEGG Pathway(KEGG: Kyoto Encyclopedia of Genes and Genomes),KEGG的六个大类 Metabolism Genetic Information Processing Environmental Information Processing Cellular Processes Human Diseases Dru

19、g Development,http:/www.genome.jp/kegg/pathway.html,http:/www.genome.jp/kegg/pathway/map/map01100.html,代谢分类(Metabolism),碳水化合物代谢(Carbohydrate Metabolism) 能量代谢(Energy Metabolism) 脂代谢(Lipid Metabolism) 核酸代谢(Nucleotide Metabolism) 氨基酸代谢(Amino Acid Metabolism) 其它的氨基酸代谢(Metabolism of Other Amino Acids) 多糖

20、合成和代谢(Glycan Biosynthesis and Metabolism) 多酮类和非核糖体多肽类的生物合成(Biosynthesis of Polyketides and Nonribosomal Peptides) 辅助因子和维生素代谢(Metabolism of Cofactors and Vitamins) 次生代谢物的生物合成(Biosynthesis of Secondary Metabolites) 异生素生物降解和代谢(Xenobiotics Biodegradation and Metabolism),Pathway的各元素的连接,Pathway - KO KEGG

21、ontology Pathway - ENZYME Pathway - REACTION Pathway - Compound Pathway - GENE eg. Has:000001,磷酸化,去磷酸化,泛素化,糖基化,甲基化,激活,抑制,非直接影响,状态改变,绑定/关联,分裂,复合物,基本流程,序列,ID,标准ID (KO,KEGG GENE),KEGG 工具,画图,blast,convert,KEGG MAPPER,http:/www.genome.jp/kegg/tool/color_pathway.html,KAAS (KEGG Automatic Annotation Server

22、),http:/www.genome.jp/kegg/kaas/,Complete or Draft Genome - KAAS job request (BBH method),Partial Genome - KAAS job request (SBH method),ESTs - KAAS job request (BBH method) - KAAS job request (SBH method),KEGG API,访问KEGG系统应用程序接口 检索和计算生物化学途径,用户程序 (Perl, Java, Ruby, Python),KEGG Web Server,API,调用,执行,

23、计算返回结果,KEGG API应用准备之Perl篇,必需的Perl模块 SOAP Lite (推荐0.60版) MIME-Base64 LWP URI 确保能访问KEGG网站,http:/www.genome.jp/kegg/soap/doc/keggapi_manual.html,Quick Start,#!/usr/bin/env perl use SOAP:Lite; # 调用库 $wsdl = http:/soap.genome.jp/KEGG.wsdl; #wsdl文件路径 $serv = SOAP:Lite-service($wsdl); #建立一个服务 $offset = 1;

24、#参数定义 $limit = 5; #参数定义 $top5 = $serv-get_best_neighbors_by_gene(eco:b0002, $offset, $limit); #调用get_best_neighbors_by_gene,获取与基因eco:b0002比对的最好的基因,从第一个开始,取5个 foreach $hit ($top5)print “$hit-genes_id1t$hit-genes_id2t$hit-sw_scoren“; #-输出结果,Pathway Mapping,主要内容,数据库与检索工具 UniProt, Genbank, RefSeq, IPI,E

25、nsembl, PDB,DIP,et al. 蛋白质数据分析 基本物理化学性质分析 序列相似性比较 特征序列分析 翻译后修饰分析 功能域分析 亚细胞定位分析,Go功能分类与富集分析Pathway分析相互作用与网络分析,蛋白质相互作用,相关概念 蛋白质相互作用数据库 蛋白质相互作用的预测方法 蛋白质相互作用的分析 相关软件介绍,生物学背景知识,从DNA到蛋白质:,蛋白质是由多种氨基酸按特定的排列顺序通过肽键连接成有一定结构的高分子化合物。,概念,蛋白质A,蛋白质B,结合,剪切,修饰,直接的物理相互作用,蛋白质A,蛋白质B,基因,转录调控作用,蛋白质A,蛋白质B,反应1,反应2,代谢通路中的蛋白质

26、相互作用,蛋白质组相互作用数据库,数据库比较之数据量,Suresh Mathivanan An evaluation of human protein-protein interaction data in the public domain. BMC Bioinformatics 2006,7,数据标准 PSI-MI,Proteomics Standards Initiative(PSI) 定义蛋白质组的数据表示方式 简便数据的比较、交换和检验 XML格式 参考文档:http:/ (Human Protein Reference Database),来自于文献而且有实验证据 相关信息 pos

27、t-translational modifications, subcellular localization protein domain architecture, tissue expression Association with human diseases 除了蛋白质之间的相互作用 蛋白质与核酸的相互作用 蛋白质与小分子的相互作用 数据格式PSI-MI Proteomics Standards Initiative Molecular Interactions,http:/www.hprd.org/,数据检索(HPRD),DIP,人工从文献中获取的 两两相互作用和复杂相互作用,ht

28、tp:/dip.doe-mbi.ucla.edu/,IntAct,有相互作用的详细说明信息,实验方法,文献来源 提供了初级和高级的数据检索界面 数据格式为PSI-MI (version 1.0 和version2.5) http:/www.ebi.ac.uk/intact/main.xhtml,提纲,相关概念 蛋白质组相互作用数据库 蛋白质相互作用的分析,蛋白质相互作用研究技术及方法,大规模蛋白质相互作用测定技术主要有:酵母双杂交串联亲和纯化质谱分析蛋白质芯片噬菌体显示,酵母双杂交系统,His, -gal,软件列表,Cytoscape简介,Cytoscape是是一种开源式的互作网络分析及 可视

29、化的软件。它主要功能是展示和检索网络,可视化的方式整合指定数据所对应的网络。其中在连接protein-protein, protein-DNA, and genetic interactions等大型数据库方面很强大。 软件拥有插座式结构,可以将所需要的功能以 ”插头”的形式插入软件实现功能。 Graph(网络) Nodes(分子) edges(interactions),Cytoscape,菜单栏,File:网络文件操作,I.导入网络Import Network (multiple file types)Import Network from table(Text/MS Excel)Impo

30、rt Network web services,2. Import Network from table(Text/MS Excel),3. Import Network from web services,目前,Cytoscape主要支持一下四个web服务器 注:使用WEB服务器必须去manage plugins中安装服务器客户端 IntAct: an open source database of protein interaction data, hosted at EMBL-EBI. Pathway Commons: an open source portal, providing a

31、ccess to multiple integrated data sets, including: Reactome, IntAct, HPRD, HumanCyc, MINT, the MSKCC Cancer Cell Map, and the NCI/Nature Pathway Interaction database. NCBI Entrez Gene: a public database of genes, including annotation, sequence and interactions. Biomart: an open source biological dat

32、abase engine. Useful for ID/Name mapping.,Web service1: 利用IntAct服务器检索蛋白质互作网络,Web service2: 利用NCBI Entrez EUtilities服务器检索蛋白质互作网络,Web service3: 利用Pathway Commons服务器检索蛋白质互作网络,Web service4: 利用WIKIPathways 服务器检索蛋白质互作网络, http:/www.wikipathways.org,II.导入网络属性,Cytoscape允许增加node、edge和network的任意信息作为它 们本身的属性,并可

33、以在可视化的网路中用各种方法进行标记 例如,不同的颜色,形状等等 Node属性文件的格式(.noa)FunctionalCategory 这一行不能有空格YAL001C = metabolism 用=连接node和它的属性YAR002W = apoptosisYBL007C = ribosome Edge属性文件格式()InteractionStrength YAL001C (pp) YBR043W = 0.82 YMR022W (pd) YDL112C = 0.441 YDL112C (pd) YMR022W = 0.9013,1). Import-Node Attributes.Impor

34、t-Edge Attributes. 点击导入,找到属性文件的位置,即可导入,可在data panel中 查看2).Import-Attribute from Table (text/MS Excel).,文件格式和操作方法类似,网络管理控制面板,面板共分为四大部分 Network Vizmapper Editor Filters,Part1:Network,在这个栏目下可以查看、修改、删除网络,创建/删除网络视图,查看网络的结点和边的数目,查看/变换网络视图(面板最下面),Part2:Vizmapper,在这个栏目下可以对结点,边的颜色、形状、大小、字体等等细节进行设置 还可以对网络视图的背

35、景等颜色方案进行设定,Example3:Discrete Mapper,Part3:Editor,在Editor栏目中我们可以建立和修改网络 增加结点:ctrl+鼠标单击即可创建一个新结点 增加边: ctrl+鼠标单击选中一个结点,这时会出现一条线,然后鼠标单击另一个结点即可添加一边新边 可以对新增加的结点和边进行详细的编辑,在视图面板我们将给予讲解 增加一组互作:双击视图面板,会有一个提示输入互作名字的对话框出现,输入互作名称,如:A pp B,则在网络上建立了一对PP互作,Part4:Filters,Filters allow you to quickly select multiple nodes or edges of interest by comparing node and edge attributes to properties you specify.,非常感谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医学治疗 > 医学现状与发展

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报