收藏 分享(赏)

信息生物学.ppt

上传人:hskm5268 文档编号:8139350 上传时间:2019-06-10 格式:PPT 页数:45 大小:1.84MB
下载 相关 举报
信息生物学.ppt_第1页
第1页 / 共45页
信息生物学.ppt_第2页
第2页 / 共45页
信息生物学.ppt_第3页
第3页 / 共45页
信息生物学.ppt_第4页
第4页 / 共45页
信息生物学.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、现代生物学实验技术 生物信息与数据处理,毛理凯,本课件在安装微软雅黑字体后有最好效果 【详细说明见jiaoan.htm】,2 ,机房注意事项,不得做课堂以外的事情,一经发现,立刻驱逐并记录通报。 严禁随意设置、升级系统。 将自己产生的垃圾带走;爱护机房设备。 有问题通报老师。 部分鼠标不好使,下面垫张白纸就可以了。 注意脚不要踢到下面的线。 仔细阅读教案,提问前先在本教案上找答案。,3 ,电脑操作相关事项,登录 开机自动进入Ubuntu系统(Linux的一个版本)后,输入用户名“owner“和密码“buxudong!“登录。 复制教案(可选) 点击菜单栏上的“Places/Home Folde

2、r”打开文件查看器(File Browser; 相当于Windows的资源管理器),如果没有看到jiaoan.ppt(或jiaoan.htm)文件,按照下列步骤复制。,4 ,如何复制教案(可选),打开终端窗口(双击桌面上的或单击菜单栏上的黑色Terminal按钮)。 在终端窗口输入“scp 192.168.0.1:/home/owner/jiaoan.htm .”后回车(注意最后有个点号),将拷贝教案文件(如有提示则按要求输入密码)。注意:在终端窗口输入密码不会有任何显示!(实际上密码已经输入,输完后回车即可)。 回到文件查看器,找到并双击jiaoan.htm即可打开教案(或者先打开Firef

3、ox浏览器,从File/File Open菜单中找到该文件再打开)。,5 ,本课目录,生物数据查询 分子进化与系统分析,6 ,一、生物数据查询,7 ,网上查资料,Google (“谷歌”)http:/ ,Google查询结果,9 ,查中文生物文献,10 ,查英文生物文献,PubMed (),可编程,11 ,关键词的选择,不是特殊情况,尽量使用名词原形,不使用复数、所有格等 尽量使用专业用语,不使用the, of, and, research等常用词作为关键词 为了减少遗漏,使用尽可能少而精的关键词,12 ,PubMed查询结果(1) 所有文章,13 ,PubMed查询结果(2) 综述文章,保存

4、搜索结果,查看该文摘要,14 ,增加搜索选项,15 ,精确使用PubMed查找(高级搜索),标签(tag),字段(field),关键词(keyword),操作符(operator),检索条件(search terms),16 ,查找帮助(1),17 ,查找帮助(2),18 ,NCBI,美国国家生物技术信息中心(National Center for Biotechnology Information) 前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(National Library of Medicine/NLM) 管理着许多著名数据库,如G

5、enBank、Medline、dbSNP、COG、OMIM等 提供Entrez、BLAST等服务 http:/www.ncbi.nlm.nih.gov,19 ,国际核苷酸序列数据库联盟,International Nucleotide Sequence Database Collaboration (INSDC)包括 GenBank美 http:/www.ncbi.nlm.nih.gov/Genbank EMBL欧 http:/www.ebi.ac.uk/embl/ DDBJ日 http:/www.ddbj.nig.ac.jp/ 每天这三个数据库作数据同步操作 在任何一个数据库操作(查找、投递

6、数据等)是等效的,20 ,GenBank 主页,可编程,21 ,GenBank结构,GenBank包括三个子数据库 CoreNucleotide dbEST dbGSS 其中CoreNucleotide还分为更小的BLAST数据库 nr htgs wgs env_nt,22 ,GenBank查询(1),已知收录号(accession number)的情况,选数据库,输入收录号,查询结果摘要,点击查看详细结果,不知收录号时,如要搜索人体中的解旋酶,可以在下拉框中选择“Nucleotide”后,输入“helicase AND humanorgn”(不要输入引号),23 ,作业,【作业一般性的要求参

7、见附录一,本作业具体的要求见下。】 题目 用PubMed搜索你感兴趣的课题相关的 序列 或 综述文献(review)。 要求 将搜到的文献/序列的基本信息(文献包括标题、杂志名、卷、期、页码、时间、作者,注意不要摘要;序列只要简单注释)上交。 文献总篇数/序列总条数限制在20以内。如果超过20不列出超出的部分,只列出实际的总数。 在步骤中说明你选择 关键词 和 限制条件 的理由。,24 ,二、分子进化与系统分析,25 ,FASTA序列格式,也叫Pearson格式 简单 使用最多 例子(单序列),Name of the sequence ctgcgagNcgcgcgatgatagMMM-NNNn

8、nnnatgancgcggcgagcatgtagcatgcta gctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc,“-”表示间隔,26 ,多序列FASTA,sequence1, E. coli ctgcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgcta gctgtcgcgagcactUgaURRRrrrtrrrcggccgagatcaggcg

9、atgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgcc sequence2, B. subtilis ctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgcta gctgtcgcgagcactUctURRRrrrcrrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgcc sequence3, B. nat

10、to ctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgcta gctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcaggga gcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc,27 ,FASTA序列格式中的核苷酸表示法,28 ,FASTA序列格式中的氨基酸表示法,29 ,如何用PubMed找蛋白(BLAST第一步),选Protein,输入关键词,选一个蛋白,30 ,blastp (1) BLAST主页

11、,点此进入blastp起始页,31 ,blastp (2) blastp起始页,在这里输入要搜索的蛋白质的收录号(accession number)或序列,点此开始搜索,如果要限制搜索的物种(如水稻),可在“Organism“处输入“Oryza sativa“(水稻的拉丁名),32 ,点此看结果,blastp (3) 提交后页面,33 ,blastp (4) 结果页(1.基本信息),34 ,blastp (5) 结果页(2.比对图),35 ,blastp (6) 结果页(3.高分序列),36 ,blastp (7) 结果页(4.高分序列详细结果),consensus,37 ,比对(MEGA),

12、38 ,比对,39 ,比对,40 ,建树(MEGA),关闭比对窗口后自动弹出对话框,41 ,建树,42 ,作业,【作业一般性的要求参见附录一,本作业具体的要求见下。】 搜索你所感兴趣的蛋白及其同源物的序列(序列不超过20条),分析这些序列之间的进化关系,建立系统树。将树输出为(File/Export;相当于另存为)Newick格式,将输出的nwk文件的内容(例子见下)复制在作业正文内(不要贴图)。并对结果进行解释。【Newick树例子】 (gi|42673|emb|CAA23618.1|_recA_gene_pr.,gi|86449963|gb|ABC96175.1|_RecA_prote.)

13、0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche.,gi|86449965|gb|ABC96176.1|_RecA_prote.)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote.);,43 ,附录一 作业一般性的要求,请严格按照要求(包括一般性和具体要求)做作业,这些要求将作为打分的重要依据。 任选以上作业之一上交。 作业要包括详细完成步骤,其中的所有引用或用到的网页/文献请注明网址或出处。 作业请在第8周(4月19日)之前在上交。,44 ,附录二 常见问题集,什么是文件的扩展名?怎样才能看到扩展名? 扩展名是文件名末

14、尾点号(.)后面的部分,如文件“实验报告.doc“的扩展名是doc。缺省情况下,Windows XP会(Linux一般不会)隐藏已知的文件扩展名。要想看到扩展名,打开资源管理器,点击菜单项“工具/文件夹选项“,选择“查看“标签,去掉“隐藏已知文件类型的扩展名“复选框即可。 什么是纯文本文件?什么是二进制文件? 纯文本文件一般也叫文本文件。一个简单的判断文本文件的方法:用记事本(Windows下)或gedit(Linux下)打开这个文件,能够阅读的为纯文本文件,不能阅读的为二进制文件。另一个方法,由扩展名判断。常见的纯文本文件有:文本文件(txt)、网页文件(htm, html)等;常见的二进制文件有:Word文件(doc)、PowerPoint文件(ppt)、Excel文件(xls)、图形文件(jpg, gif, png, )、音频文件(wav, mp3, )、视频文件(avi, wmv, rm, rmvb, mov, )、可执行文件(exe)等。 Linux下如何编辑纯文本文件? 在终端窗口输入命令“gedit &“(不要引号),再回车即可。,45 ,完,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报