收藏 分享(赏)

RepeatMasker网页版使用说明(中文翻译版).doc

上传人:精品资料 文档编号:8459898 上传时间:2019-06-28 格式:DOC 页数:7 大小:1.48MB
下载 相关 举报
RepeatMasker网页版使用说明(中文翻译版).doc_第1页
第1页 / 共7页
RepeatMasker网页版使用说明(中文翻译版).doc_第2页
第2页 / 共7页
RepeatMasker网页版使用说明(中文翻译版).doc_第3页
第3页 / 共7页
RepeatMasker网页版使用说明(中文翻译版).doc_第4页
第4页 / 共7页
RepeatMasker网页版使用说明(中文翻译版).doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、RepeatMasker 网 页 版 使用说明(中文翻译版)引用自 Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr Protoc Bioinformatics. 2009 Mar;Chapter 4:Unit 4.10. doi: 10.1002/0471250953.bi0410s25.RepeatMasker是一款广泛应用于基因鉴定、分类和 mask repetitive elements,包括低复杂度序列和散布重复序列。Repe

2、atMasker 通过将数据库如:Repbase 中已知的重复序列与输入的基因组序列比对来搜素重复序列。在此我们描述两个基础协议,它对如何运用RepeatMasker去分析基因组序列的重复元件提供细节上的指导,而不论是通过网络界面还是通过 Unix/Linux命令系统。在 RepeatMasker中的序列比较通常经过 cross-match程序的序列比对来实现,对于较大序列这一过程需要大量处理时间。交替协议描述的是通过应用诸如 WU-BLAST这样的选择性比对程序来怎样减少处理时间。而且 RepeatMasker的优势、局限和已被发现的漏洞将在此进行讨论,最后提供理解其处理结果的指南。在新的

3、RepeatMasker程序包中添加了鉴定蛋白质序列的重复原件的程序。要运行 RepeatMasker,首先要选择重复库文件(repeat library files),这一文件包含重复元件共有序列。目前,Repbase Update是最大的商业性(商购)重复库(free for academic use)并且包含了相当数量的包括人、啮齿动物、斑马鱼、果蝇以及拟南芥在内的生物体。生物体的库文件中没有 Repbase Update时,库文件会用 RECON (Bao and Eddy, 2002; http:/selab.janelia.org/recon.html)或 RepeatScout

4、(http:/bix.ucsd.edu/repeatscout/; Price et al., 2005)从头产生。最新版本的 RECON v.1.06已经发布并且可以从 http:/www.repeatmasker.org/RepeatModeler.html.中获得RepeatModeler程序包。RepeatMasker 的序列比较常通过 Phil Green改进的 cross-match (http:/www.phrap.org/consed/consed.html#howToGet)来实现,另外也可以为了快速程序来用 WU-BLAST (http:/info.cchmc.org/he

5、lp/wublast.html; see Alternate Protocol)来代替 cross-match。通过网络界面运用 RepeatMaskerRepeatMasker可通过 http:/www.repeatmasker.org/cgibin/WEBRepeatMasker来获得,它不像命令行版本的 RepeatMasker,网络版 RepeatMasker的核苷酸序列长度限制在100kb,不能分析长度超过 100kb的序列(提示会在窗口中显示) 。短于 100kb的序列可以用网络版 RepeatMasker来分析,其花费的时间与序列的长度相关。对于北美以外的快速服务有在德国、以色列

6、和澳大利亚的 RepeatMasker镜像网站。另外,如果常规分析大片段序列,最好是下载并本地运行命令行版本。重要的是,如果需分析的序列超过 100kb,唯一的选择就是下载 RepeatMasker并在本地运行。必需资源硬件:任意一台联网的计算机。软件:浏览器 如 IE或火狐浏览器文件:FASTA 文件或能通过网络界面处理的收集的 FASTA文件。1. 点击网页浏览器,进入 http:/www.repeatmasker.org/cgi-bin/WEBRepeatMasker.通过序列名或浏览文件下载 FASTA序列文件(最大 100kb) ,或者粘贴 FASTA序列(最大100kb)到指定的文

7、本框。如果输入的序列包含非 DNA符号或者序列太长,RepeatMasker 会提示错误信息。2. 从单选框下的“return format”来选择结果的格式:“html”或“tar file” 。如果选择“html” ,那么结果会以一个超文本标记语言(html.)文件输出。如果选择“tar file”,那么结果会打包为用 Unix系统“tar”协议的文档。3. 从“return method”下两个单选按钮选择会送结果的方法,即:“html”或“email”。如果选择这一步和上述第 2步都选择“html” ,那么所有的结果会通过窗口显示,如果过这步选择“html” ,而第 2步却选择“tar

8、 file” ,那么结果会在窗口内提供链接。如果选择“email” ,那么需要填写电子邮件地址,以确保结果可以通过电子邮件发送。这里以“html”为例。4. 目前,可以选择点击提交序列的按钮来运行 RepeatMasker,同时可选择其他选项来设置默认值。如果系统默认值不能满足需要,可继续第 5到 8步并按第 9步提交序列。设置其他选项设置默认值后点击提交序列,结果会在窗口中展示,如图4.10.2,4.10.3,4.10.4和 4.10.5.为理解结果的细节可以看参考。5. 通过点击 Speed/Senitivity下的四个单选按钮来调整速度:“rrush” , “quick”,“defaul

9、t”,或“slow” 。注意速度和敏感度相关。比如选择“default” ,为了便于理解结果可以看参考。6. 在下拉菜单中选择“DNA source”的次选项,每一项等同于不同的重复原件库。比如这里的例子,其默认值是人,选择人是因为其序列来自于人类的基因组。注意如果待测序列所来自的生物体在菜单中没有,那么就必须本地运行命令行版本的RepeatMasker了,而且需要选用来自 Rebase中的合适的副本文件。如果 Rebase中不含合适的副本文件,那么 RECON(Bao and Eddy,2002; Stein et al., 2003)或RepeatScout(http:/bix.ucsd.

10、edu/repeatscout/; Price et al.,2005)会从头建立重复文件。7. 在下拉菜单的一系列功能中,单选按钮和 Lineage Annotation Options下的检查框(check boxes)来选择合适的选择项。这些选项不需要说明,比如选择 Comparison Species,与所选物种相关的世系特异性重复就会通过 RepeatMasker输出。8. 在高级选项(Advance Option)的下拉菜单中,选择合适的选项。这些选项同样简单明了。比如,如果想在 Masking Option的两个选项间选择,则要么选择模糊特性,诸如“N”或“X”此类的隐藏,要么选择小写字母,这更适合于序列比对。这些细节解释和附加选项可通过右边的下拉菜单中获得。9. 点击提交序列按钮运行 RepeatMasker。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报