收藏 分享(赏)

GenBank数据库检索.ppt

上传人:11xg27ws 文档编号:8693455 上传时间:2019-07-07 格式:PPT 页数:67 大小:4.84MB
下载 相关 举报
GenBank数据库检索.ppt_第1页
第1页 / 共67页
GenBank数据库检索.ppt_第2页
第2页 / 共67页
GenBank数据库检索.ppt_第3页
第3页 / 共67页
GenBank数据库检索.ppt_第4页
第4页 / 共67页
GenBank数据库检索.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、GenBank数据库检索及其应用 Entrez检索功能,NCBI网站网址: http:/www.ncbi.nlm.nih.gov,简介,检索入口,基本检索功能,特征栏辅助检索,检索结果的显示,GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。,GenBank数据库的数据来源有三种: 1、直接来源于测序工作者提交的序列; 2、与其它数据机构协作交换的数据; 3、美国专利局提供的专利数据。,简介,检索界面,简介,1、基本检索界面,Nucleotide 数据库分为三个子数据库:,EST :表达序列标记数据库GSS :基因组测序序列数据库CoreNucleotide

2、 :包含所有未被以上两个子数据库收录的核苷酸序列,检索界面,简介,1、基本检索界面,2、跨库检索界面,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,(二)特殊标志符检索,(四)范围检索,(三)序列长度检索,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,rasGENE,检索限定词:,1、基因名称的检索限定词:GENE or GENE NAME 2、生物体名称的检索限定词:ORGN or ORGANISM 3、作者姓名的检索限定词:AUTH or AUTHOR,获取所需要的基因序列,显示方式,序列号,物种信息,作者信息,选择显示模式为FASTA,序列信息,保存序

3、列信息,点击send选择file,格式为FASTA,选择显示方式为Graphics,编码蛋白质的序列信息,点击显示蛋白质编码序列,蛋白质氨基酸序列,简介,检索界面,基本检索功能,(二)特殊标志符检索,(一)字段限制检索、强制短语检索,特殊标志符的格式(核酸序列):,2、GenBank/EMBL/DDBJ序列接受号:(1) 1个字母+5个阿拉伯数字e.g.:U12345(2) 2个字母+6个阿拉伯数字e.g.:AY123456,Af123456,1、序列辨认号 (GI):一串阿拉伯数字e.g.:19440733,(1)mRNA 记录(NM_*):e.g.: NM_000492 (2)基因组的DN

4、A重叠群(NT_*):e.g.: NT_000347 (3)完整的基因组或染色体(NC_*):e.g.: NC_000907 (4)基因组的局部区域(NG_*):e.g.: NG_000019 (5)从人类基因组注释、加工得到的序列模型(XM,XP,or XR_*):e.g.: XM_000483,特殊标志符的格式(核酸序列):,3、RefSeq(Reference Sequence)序列接受号:,特殊标志符的格式(核酸序列):,4 、 PDB序列接受号:个阿拉伯数字个字母e.g.:TUP,序列接受号的检索限定词为ACCN or ACCESSION,简介,检索界面,基本检索功能,(一)字段限制

5、检索、强制短语检索,(二)特殊标志符检索,(三)序列长度检索,序列长度的检索限定词:SLEN,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,(二)特殊标志符检索,(四)范围检索,(三)序列长度检索,范围检索:中间用冒号连接,1、序列接受号范围检索:AF114696:AF114714ACCN2、序列长度范围检索:3000:4000SLEN3、日期范围检索:2005/01:2006/09/26MDATorPDAT,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),高级检索(Advanced Search),检索史管理(History),剪贴板管理(Clipb

6、oard),详细匹配过程(Details),限制检索,高级检索,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),限制基因位点,限制序列片段的显示,限制数据来源,限制数据发布日期,限制数据修订日期,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),高级检索(Advanced Search),预检索输入框,添加检索词,索引检索,预检索结果,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),高级检索(Advanced Search),检索史管理(History),简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits)

7、,高级检索(Advanced Search),检索史管理(History),剪贴板管理(Clipboard),简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),高级检索(Advanced Search),检索史管理(History),详细匹配过程(Details),剪贴板管理(Clipboard),简介,检索入口,基本检索功能,特征栏辅助检索,检索结果的显示,序列相似性搜索,启动相似性搜索,输入序列号,选择搜索的数据集,点击开始搜索,相似性序列信息,GenBank记录中特性表中的主要关键词:,GenBank记录中特性表中的限定词:,GenBank和PubMed(序列数据)检索的比较:,1、GenBank的检索结果是序列及其注释信息;PubMed的检索结果是与序列数据相关的文献信息。 2、GenBank数据更新早于PubMed,GenBank数据库的检 全率高于PubMed。 3、GenBank可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于PubMed。,课后练习,用 GenBank 数据库搜索 ”SARS coronavirus BJ01” 的全基因组序列信息并下载保存,查询该基因所产生的蛋白质序列信息。用BLAST模块对该基因序列进行相似性搜索。,谢 谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报