1、Muthor分析atpD过程记录,2012-11-22,Mothur软件分析OTU或将序列归为不同的种类,可相似性来分(前半部分,第2到15张ppt),或按是否完全一样来分(最后的4张ppt)。,1.用Mothur确定OTU,也就是将序列相似性97%的定为一个OTU。如果按Plos One上提出的三个基因的相似性为准,那么就能定出OTU了。,如何在dos环境下运行mothur?,(1) 文件准备:将目标序列保存为fasta格式; (2) 将mothur.exe与x.fasta放在同一文件目录下:,(3) 打开mothur,注意在英文输入法下打开mothur,否则会造成程序不响应。,(4) 调用
2、dist.seqs指令,产生距离矩阵;,输入完后按enter,calc以不同方式处理gap:onegap指把所有把对偶排列中出现的所有连续缺失的碱基当做一个 gap;nogap按实际缺失的碱基数对待;默认为onegap; countends: 用以处理末端gap的罚分,=F,指对末端gap不罚分;=T指对末端gap进行罚分; cutoff:OTU的分界阈值 Output: lt (指low triangle)或square, 指输出距离矩阵为下三角还是矩形,运行之后产生一个输出文件: 注意文件格式:xxx.phylip.dist,该文件位于同一个目录下,见下页。,生成的文件:atpD_Alig
3、ned-fasta.phylip.dist,说明:与Mega5中形成的距离值类似。,用记事本打开生成的文件:atpD_Aligned-fasta.phylip.dist,如下,为距离值,(5)读入距离矩阵,用cluster进行OTU聚类(PS: mothur的早期版本此处要用read.dist先读入距离矩阵,最新版本将其与cluster指令整合在一起),Method有三种选择:,回车,屏幕显示如下结果:,(7) 输出OTU的分类结果,用bin.seqs指令,xxx.phylip.fn.0.01.fasta文件对应于序列相似为99%的OTU (cutoff=0.01); xxx.phylip.f
4、n.0.03.fasta文件对应于序列相似为97%的OTU (cutoff=0.03)这个上面的输出中没有,是举个例子,来自于原始的文件,用记事本打开atpD_Aligned-fasta.phylip.fn.unique文件,即可看出将每个序列归到不同的种类里去,即OTU。从中可看出,12个序列共有7个OTU。这与Mega5中聚树结果是一致的。,给出独特的序列:7个OTU, 99%相似性以上的:5个OUT,输出的文件见相应的名字。,打开文件如下,将序列归类,与前面的一致,但是没有了序列,只有序列号名字。如果为unique,则表示某一个序列与其它的全一样,或全不一样。并将其中一个序列定为代表序列
5、,如atpD_15644。,或如下,有0.01,则将99%以上相似性的序列归到一起。并将其中一个序列定为代表序列,如atpD_15644。,这张片子在我处理的数据中没有,因为没有低于97%的序列,因此没有出现这种情况。,一篇博士论文中提到的Unique.seq也应与前面的原理一样。可以试着做一下。,测试成功!见下面的片子!,使用unique.seqs分析独特的序列类型,在Mothur中输入:Unique.seqs(fasta=XXX.fasta),回车。 即能计算出来。如我分析的atpD序列,共12个序列,产生7个独特的序列。并产生两个文件。两个文件的内容见下页。,输入的命令,产生的结果,12条序列,7个独特 的序列,产生的两个文件,打开后见下页。,新生成的文件,文件格式为xxx.names和xxx.unique.fas,如上图所示。,打开文件,第一个文件(上图)将序列归类,并给出代表菌株;第二个文件(下图)将代表序列给了出来。,