1、GenBank数据库检索及其应用 Entrez检索功能,重庆医科大学图书馆 李 轶,NCBI网站网址: http:/www.ncbi.nlm.nih.gov,GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。,GenBank数据库的数据来源有三种: 1、直接来源于测序工作者提交的序列; 2、与其它数据机构协作交换的数据; 3、美国专利局提供的专利数据。,简介,检索界面,简介,1、基本检索界面,Nucleotide 数据库分为三个子数据库:,EST :表达序列标记数据库GSS :基因组测序序列数据库CoreNucleotide :包含所有未被以上两个子数据库收
2、录的核苷酸序列,检索界面,简介,1、基本检索界面,2、跨库检索界面,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,(二)特殊标志符检索,(四)范围检索,(三)序列长度检索,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,ras,rasGENE,检索限定词:,1、基因名称的检索限定词:GENE or GENE NAME 2、生物体名称的检索限定词:ORGN or ORGANISM 3、作者姓名的检索限定词:AUTH or AUTHOR,简介,检索界面,基本检索功能,(二)特殊标志符检索,(一)字段限制检索、强制短语检索,特殊标志符的格式(核酸序列) :,1、序列
3、辨认号(GI):一串阿拉伯数字e.g.:19440733,特殊标志符的格式(核酸序列) :,2、GenBank/EMBL/DDBJ序列接受号:(1)1个字母+5个阿拉伯数字e.g.:U12345(2)2个字母+6个阿拉伯数字e.g.:AY123456,Af123456,1、序列辨认号(GI):一串阿拉伯数字e.g.:19440733,(1)mRNA 记录(NM_*):e.g.:NM_000492 (2)基因组的DNA重叠群(NT_*):e.g.:NT_000347 (3)完整的基因组或染色体(NC_*):e.g.:NC_000907 (4)基因组的局部区域(NG_*):e.g.:NG_0000
4、19 (5)从人类基因组注释、加工得到的序列模型(XM,XP,or XR_*):e.g.:XM_000483,特殊标志符的格式(核酸序列):,3、RefSeq(Reference Sequence)序列接受号:,特殊标志符的格式(核酸序列):,4 、 PDB序列接受号:个阿拉伯数字个字母e.g.:TUP,序列接受号的检索限定词为ACCNorACCESSION,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,(二)特殊标志符检索,(三)序列长度检索,序列长度的检索限定词:SLEN,1510SLEN,简介,检索界面,基本检索功能,(一)字段限制检索、强制短语检索,(二)特殊标志符检
5、索,(四)范围检索,(三)序列长度检索,范围检索:中间用冒号连接,1、序列接受号范围检索:AF114696:AF114714ACCN2、序列长度范围检索:3000:4000SLEN3、日期范围检索:2005/01:2006/09/26MDATorPDAT,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管理(History),剪贴板管理(Clipboard),详细匹配过程(Details),限制检索,检索史管理,预检索/索引检索,剪贴板管理,详细匹配过程,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Lim
6、its),限制检索范围,限制检索范围,ras,排除某种类型的序列,限制分子类型,限制分子类型,限制基因位点,限制基因位点,限制序列片段的显示,限制序列片段的显示,限制数据来源,限制数据来源,限制数据发布日期,限制数据发布日期,限制数据修订日期,限制数据修订日期,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),预检索输入框,索引检索输入框,hepatitis b,序列特性关键词索引,rasGENE,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管
7、理(History),简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管理(History),剪贴板管理(Clipboard),简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管理(History),详细匹配过程(Details),剪贴板管理(Clipboard),penicillin-binding,“mycobacterium tuberculosis”,penicillin-binding AND “mycobacterium tuberculosis”ORGN,简介,检索入口,基本检索功能,特征栏辅助检索,检索结果的显示,GenBank记录中特性表中的主要关键词:,GenBank记录中特性表中的限定词:,GenBank和PubMed(序列数据)检索的比较:,1、GenBank的检索结果是序列及其注释信息;PubMed的检索结果是与序列数据相关的文献信息。 2、GenBank数据更新早于PubMed,GenBank数据库的检 全率高于PubMed。 3、GenBank可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于PubMed。,谢 谢!,