收藏 分享(赏)

生物序列的数据库信息检索.pdf

上传人:精品资料 文档编号:11083073 上传时间:2020-02-06 格式:PDF 页数:74 大小:4.01MB
下载 相关 举报
生物序列的数据库信息检索.pdf_第1页
第1页 / 共74页
生物序列的数据库信息检索.pdf_第2页
第2页 / 共74页
生物序列的数据库信息检索.pdf_第3页
第3页 / 共74页
生物序列的数据库信息检索.pdf_第4页
第4页 / 共74页
生物序列的数据库信息检索.pdf_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、生物信息学 第五章:生物序列的数据库信息检索 本章内容提要 1,序列数据库 2,序列家族分类及功能数据库 3,检索系统 4,双序列 Blast比对实例 5,序列数据信息检索实例 1, 序列数据库 核酸序列数据库 国际三大核酸序列数据库: GenBank, EBML, DDBJ dbEST: Expressed Sequences Tags数据库 UniGene等 RefSeq: The Reference Sequence Database 蛋白质序列数据库 UniProt (Swiss-prot 详尽的注释信息,包括基因在基因组的定位,基因名称、蛋白质名称,基因结构等; 基因的命名主要来自权

2、威命名委员会的官方符号以及 Refseq记录中的基因名,由 NCBI工作人员进行数据收集并注释。 NLM的索引部门对基因功能进行阐述。 沿用人类孟德尔遗传网( OMIM)中的疾病名称并与 NCBI其他数据库形成交互链接。 NCBI Gene http:/www.ncbi.nlm.nih.gov/sites/entrez?db=gene UniProt Universal Protein Resource: Swiss-prot(TrEMBL), PIR两大蛋白数据库的整合体; 收录蛋白质序列目录最广泛、功能注释最全面的数据库; 包含三个子库: UniProtKB( UniProt Knowle

3、dgebase) UniRef( UniProt Reference Clusters) UniParc( Uniprot Archive) http:/www.uniprot.org 2,序列家族分类及功能数据库 蛋白质序列分类数据库 - Pfam 蛋白质序列功能位点数据库 PROSITE Gene Ontology ( GO) 相互作用的蛋白质数据库 DIP 转录调控区数据库 TRRD 蛋白质序列分类数据库 - Pfam Pfam:使用基于隐马尔可夫模型的多序列比对方法对蛋白质序列进行家族分类。 分为 Pfam-A与 Pfam-B两个库 Pfam-A:包含经人工编辑,有完整注释的高质量记录

4、条目 Pfam-B:计算机工具自动编辑,除 Pfam-A外的条目,质量较低 http:/pfam.sanger.ac.uk/ PROSITE 收集了生物学有显著意义的蛋白质位点和序列模式; 序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等; 根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族; PROSITE http:/www.expasy.ch/prosite/ InterPro protein sequence analysis cellular component; biological p

5、rocess; Gene Ontology http:/www.geneontology.org/ 相互作用的蛋白质数据库 DIP 收集了由实验验证的蛋白质蛋白质相互作用; 包括蛋白质的信息、相互作用的信息和检测相互作用的实验技术三个部分; 用户可以根据蛋白质、生物物种、蛋白质超家族、关键词、实验技术或引用文献来查询DIP数据库; http:/dip.doe-mbi.ucla.edu/ 转录调控区数据库 TRRD 在不断积累的真核生物基因调控区结构功能特性信息基础上构建; 每一个 TRRD的条目里包含特定基因各种结构功能特性:转录因子结合位点、启动子、增强子、静默子、以及基因表达调控模式等;

6、http:/wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/ 3, 检索系统 NCBI: Entrez EBI: SRS ExPASy NCBI: Entrez 检索规则 逻辑运算符(大写): AND , OR, NOT 运算过程由左至右,()部分优先 空格分隔默认逻辑关系为 AND 多个单词短语加双引号 模糊检索使用 * 用 限定字段,如限定基因名称为 ATG1的检索 : ATG1GENE EBI-SRS: Sequence Retrieval System 欧洲生物信息研究所( EBI)开发的基于WEB的数据库检索及导航系统; http:/srs.ebi.ac.uk/

7、ExPASy Expert Protein Analysis System; 瑞士生物信息研究所 SIB下属的蛋白质分析专家系统; ExPASy的 Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。 http:/www.expasy.org/ 4,双序列 Blast比对实例 PDGF-related-transforming protein sis (Woolly monkey sarcoma virus) MTLTWQGDPIPEELYKMLSGHSIRSFDDLQRLLQGDSGKEDGAELDLNMTRSHS

8、GGELESLARGKRSLGSLSVAEPAMIAECKTRTEVFEISRRLIDRTNANFLVWPPCVEVQRCSGCCNNRNVQCRPTQVQLRPVQVRKIEIVRKKPIFKKATVTLEDHLACKCEIVAAARAVTRSPGTSQEQRAKTTQSRVTIRTVRVRRPPKGKHRKCKHTHDKTALKETLGA Platelet-derived growth factor subunit B (Homo sapiens) MNRCWALFLSLCCYLRLVSAEGDPIPEELYEMLSDHSIRSFDDLQRLLHGDPGEEDGAELDLNMTRSHSGGELESLARGRRSLGSLTIAEPAMIAECKTRTEVFEISRRLIDRTNANFLVWPPCVEVQRCSGCCNNRNVQCRPTQVQLRPVQVRKIEIVRKKPIFKKATVTLEDHLACKCETVAAARPVTRSPGGSQEQRAKTPQTRVTIRTVRVRRPPKGKHRKFKHTHDKTALKETLGA BCNI: Blast http:/blast.ncbi.nlm.nih.gov/

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报