1、如何在 genbank 中查找一基因的序列GenBank 是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注 释的 DNA 或 RNA 片段。这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成这 些序列数据的技术方法划分。目前 GenBank 中所有的记录均来自于最初作者向 DNA 序 列数据库的直接提交。这些作者将序列数据作为论文的一部分来发表,或将数据直接公开。GenBank 由位于马里兰州Bethesda 的 美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA 数据库(DDBJ)以及欧洲生
2、物信 息研究院的欧洲分子生物学实验室核苷酸数据库(EMBL)一起,都是国际核苷酸序列数据库合作的成员。所有这三个中心都可以独 立地接受数据提交,而三个中心之间则逐日交换信息,并制作相同的充分详细的数据库向公众开放(虽然格式上有细微的差别,并且所使用的信息系统也略有不同)。GenBank 数据库格式的详细说明http:/www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html1、在 GeneBank 中查找基因序列只要输入 accession 号就可以了,如果你没有accession 号,可以把你手头的编号用 source 等信息源转换成 accession
3、号。2、关于在 GeneBank 中查找序列我有几点体会:最直接、最简单的方法是手头有基因的 accession 号;如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名) ,基因名称尽可能详细,避免搜出一些不相关的信息;搜索的时候建议先用 NCBI 的 Gene 数据库搜索,这样得到的 accession 号是属于 NCBI 工作人员重新整理过的 Refseq 的序列,这样会比较可靠;. 其他值得考虑的是,对于真核生物最好找注释为全长的 mRNA 序列,原核生物最好有起始密码子和终止密码子;3、 如何在 genbank 查找某个细菌的基因序列?输入这个细菌的名字直接查
4、,一般就会找到,而且一般第一个会是全基因组序列。进入 ncbi 的首页,database 选 nucleotide,输入你的关键词,如果库里收录里就会找到。4、如何查找基因序列?在 Genbank 中寻找目的基因的实例 (1) 根据文献如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank 中的 ID 号,那就好办了,直接打开 http:/www.ncbi.nlm.nih.gov ,在 Search 后的下拉框中选择 Nucleotide,把 Genbank ID 号输入 GO 前面的文本框中,点“GO” ,就可以找到他了。举例说明,例如:在 2003 年 JBC 的文
5、章(Conditional Knock-out of Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了 “calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入 GO 前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息) 。在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586 就可以看到基因的相关信息了.(呵呵,是不是有点太easy 了
6、)这里需要指出一下,在显示基因的页面右侧有一个 Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。(2)点击 AY047586 后出现的界面如下:如果只想获得序列(例如去设计 PCR 引物的时候) ,那就可以选择 FASTA,这样就得到了 FASTA 格式的序列文件,没有其他数字和格式的干扰。 这就是 FASTA 格式的序列: 如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名称是人的 VEGF 基因,那么怎么在 Genbank 中找到它呢?打开 http:/www.ncbi.nlm.nih.gov/在 search
7、 后面的下拉框中选择 Gene,然后在中间的文本框中输入基因名称“VEGF”,点击 GO搜索结果出来了总共 689 条,哪一条是我想要的基因呢?点击箭头所指的 LimitsLimits 的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能大大精简查询结果。我们接着来,在 Limits 这个界面,先选择查询的限定范围。我们要找什么基因来着?想起来了,是人的 VEGF 基因,那就开始选择:先选 Gene name(基因名称);然后再选择 Limit by Taxonomy(生物分类限定)中的 Homo sapiens(人类) ,然后再点击“GO”,只有一个结果这就是我们要找的基因了。直接点击基因名称“VEGFA”就可以看到有关基因的信息了。需要指出的是,在 Genbank 中,基因有很多别名(Aliases ) ,和 Genbank 中记录的名称有可能不一致。比如在这里,VEGFA 是 Genbank 中记录的基因名称,而它还有很多别名,比如 MGC70609, VEGF(这就是我们要找的基因名称 ), VEGF-A, VPF;