收藏 分享(赏)

蛋白质组学数据分析.ppt

上传人:精品资料 文档编号:9616957 上传时间:2019-08-18 格式:PPT 页数:74 大小:5.71MB
下载 相关 举报
蛋白质组学数据分析.ppt_第1页
第1页 / 共74页
蛋白质组学数据分析.ppt_第2页
第2页 / 共74页
蛋白质组学数据分析.ppt_第3页
第3页 / 共74页
蛋白质组学数据分析.ppt_第4页
第4页 / 共74页
蛋白质组学数据分析.ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、实习5:蛋白质组学数据分析,系统生物学平台 浙江加州国际纳米技术研究院(ZCNI),邱庆崇 刘 杰 李 超 刘 振,1.蛋白质组学质谱分析背景介绍2.蛋白质组学数据库检索软件GPM(X!tandem)3.蛋白质组学数据统计分析软件TPP,课程内容:,蛋白质组学质谱分析背景介绍,Tandem MS,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,http:/www.expasy.ch/tools/peptidecutter/,粘贴蛋白序列:PGYRNNVVN TMRLWSAKAPNDFNLKDFNVG,选择“Only the following selection of enzymes

2、and chemicals”,并选择胰酶Trypsin酶切,点击Perform,蛋白质组学质谱分析背景介绍,APNDFNLK,肽段离子碎片示意图,蛋白质组学质谱分析背景介绍,具体数值,对应后页中离子质量,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,?面对如此多的质谱谱图和理论图谱我们将如何进行比对,蛋白质组学数据库检索软件 GPM(X!tandem),蛋白质组学数据库检索软件,X!Tandem 优点: 运算速度快 免费,并行集群计算成本低 开源可自行修改代码 缺点: 应用范围尚不广泛 后期统计软件接口尚未成熟,蛋白质组学数据库检索软件,硬件要求: 当前主

3、流电脑配置即可胜任小规模数据检索,Download GPM Cyclone XE: ftp:/ftp.thegpm.org/projects/gpm/gpm-xe-installer/,蛋白质组学数据库检索软件,蛋白质组学数据库检索软件,数据库、结果 程序等核心内容,运行程序,质谱原始数据,解压缩:,蛋白质组学数据库检索软件,输出结果目录,数据库,参数,工作流程: 将 *.raw 文件转变为 *.mzXML 文件(练习文件为肝癌蛋白质组学数据) 2. 编辑参数 3. 运行 GPM中的X!Tandem 4. 查看结果 5. 使用自己的数据库,蛋白质组学数据库检索软件,1. 将 *.raw 文件转

4、变为 *.mzXML 文件,开始运行输入“cmd” 开启命令行窗口,Download:http:/ 编辑参数,双击打开,选择程序X!Tandem,选择需要搜索的质谱数据 DTA, PKL, MGF, mzData, mzXML or Tandem BIOML,选择数据库,数据检索输出阈值,二级谱中片段离子理论与实际差异最大允许值,一级谱中片段离子理论与实际差异最大允许值,搜索的离子为b离子与y离子,(|0|/M0)X10(ppm) 为离子质量的实测值; 为离子质量的理论值;,氨基酸残基的修饰,完全修饰,潜在的修饰 氧化,磷酸化等等,快速搜索可能的修饰,酶切位点;,酶切非特异性,3.运行程序,点

5、击运行,运行界面,4. 查看结果,结果可靠性的统计指标以及强度,蛋白的覆盖率,蛋白检索号,对应肽断总数,蛋白分子质量,唯一对应肽断数,将结果保存为excel,查看检索参数,可保存为excel,5.替换数据库,下载蛋白数据库存放到fasta文件夹 (所使用fasta数据库为所研究种属的蛋白数据库,可从ftp:/ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/proteomes/下载得到),用记事本打开,编辑文件,在GPM界面,数据库的下拉菜单中添加一个名为mydatabase的选项,将新数据库的mydatab

6、ase.fasta.pro添加到GPM中, 保存文件,重新选择数据库运行程序。,参考文献:,http:/thegpm.org/http:/thegpm.org/GPM/gpm_install_faq.html,蛋白质组学数据统计分析软件 Trans-Proteomics Pipeline (TPP),Trans-Proteomic Pipeline (TPP)是用于LC/MS/MS蛋白质组学数据分析的软件.TPP包含一系列蛋白质鉴定和定量分析的模块, 能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.,蛋白质组学数据统计分析软件,Trans-Prote

7、omic Pipeline,蛋白质组学数据统计分析软件,蛋白质组学数据统计分析软件,sp|P02754|LACB_BOVIN BETA-LACTOGLOBULIN PRECURSOR (BETA-LG) (ALLERGEN BOS D 5) - Bos taurus (Bovine). MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCLVRTPEVDDEALEKFDKALK

8、ALPMHIRLSFNPTQLEEQCHI,TPEVDDEALEK : p = 0.96,PTPEGDLEILLQK : p = 0.81,LSFNPTQLEEQCHI : p = 0.65,P = 1 (1-0.81)(1-0.96)(1-0.65) = 0.99,蛋白质组学数据统计分析软件,TPP的安装与配置,从http:/ TPP_Setup_v4.7.1.exe 。安装过程中选择附带安装Apache(安装TPP4.2要求系统已安装ActivePerl-5.8.8.*以上版本,可从http:/网站上下载)。安装完成后,将会生成TPP的图标,安装完后,桌面上生成了TPP图标,使用TPP,点

9、击桌面上的 TPP Web Tools ,将会出现TPP的登陆界面.,UserName: guest Password: guest,TPP Web Interface的欢迎界面,样本数据分析,准备工作: 确保C盘至少1G的空闲的硬盘空间. 将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件ZCNI_No1.RAW至ZCNI_No6.RAW,以及Sequest参数文件sequest.param放到目录: C:InetpubwwwrootISBdataZCNI_training下 3. 将数据库文件ipi.HUMAN.fasta放到目录:C: databas

10、e中,操作流程,将质谱RAW文件转换成mzXML文件 ; 以Sequest结果文件和参数文件转换成xml文件; 运行PeptideProphet,得到pepXML文件; 以上步得到的pepXML文件运行ProteinProphet,得到最终结果;,1.将RAW转换成mzXML文件,点击Analysis Pipeline选择mzXL/mzMXL,在Input File Format中选择 Thermo Raw,在Specify File to convert to mzXML中添加RAW文件,在Conversion Options中选择Centroid, 然后选择Concert to mzMXL

11、 instead of mzML, 最后点击Convert to mzML,程序运行界面,2.由.out文件整合成pepXML文件,点击“Analysis Pipeline”, 然后点击pepXML,出现如图所示的界面。,选择需要转换成pepXML的.out文件夹,提交sequest检索时所用参数文件,选择所有文件夹,选择sequest的参数文件,其他参数选择默认,点击Convert to PepXML,即可以将文件夹中的所有.out文件整合成pepXML文件,程序运行界面,3.运行PeptideProphet,选择RUN PeptideProphet,其他参数为默认.,点击RUN Xinte

12、ract,即可作 PeptideProphet分析.,PeptideProphet分析,在IE中打开的PeptideProphet的结果,在pick columns选项中选中xcorr、deltcan、sprank三个sequest的参数,选择Update Page,4.运行ProteinProphet,点击Analysis Pipeline,选择Analyze Proteins,点击,添加文件,选择经PeptideProphet后生成的 Interact.pep.xml文件,其他为默认,点击Run ProteinProphet!,其它参数为默认,点击Run ProteinProphet,即可

13、运行ProteinProphet程序,运行ProteinProphet完成后生 成的interact-prot.shtml 文件可由IE打开.,在IE中输入http:/localhost/ISB/data/ZCNI_training/interact.prot.shtml,看到经ProteinProphet后的结果为:,7.数据的过滤筛选和将结果保存成Excel文件,在min probability填上0.9,选择export To excel,然后点击Filter/Sort/Discard Checked entries,即可将结果过滤并生成Excel文件.,过滤筛选后生成的excel文件,肽段的氨基酸序列,过滤筛选后生成的excel文件,Thank You!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报