1、表 1 蛋白质相互作用分析相关数据库及网站网站 资源类型 网址DIP 蛋白质相互作用 http:/dip.doe-mbi.uda.eduINTERACT 蛋白质相互作用 http:/bioinf.man.ac.uk/interactpr.htmProNet 蛋白质相互作用 http:/ 蛋白质相互作用 http:/www.mips.biochem.mpg.de/proj/yeast/tables/interactoin/index.htmProteome 蛋白质相互作用 http:/Bind 蛋白质相互作用 http:/www.binddb.orgString 基因共定位 http:/www.
2、bork.embl-heidelberg.de/string/CoGs 种系发生谱 http:/www.ncbi.nlm.nih.gov/CoG/蛋白质序列分析和结构预测 【实验目的】 1、掌握蛋白质序列检索的操作方法; 2、熟悉蛋白质基本性质分析; 3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于 motif、结构位点、结构功能域数据库的蛋白质功能预测; 4、了解蛋白质结构预测。【实验内容】 1、使用 Entrez 或 SRS 信息查询系统检索人脂联素(adiponectin)蛋白质序列; 2、使用 BioEdit 软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析;
3、3、对人脂联素蛋白质序列进行基于 NCBI/Blast 软件的蛋白质同源性分析;4、对人脂联素蛋白质序列进行 motif 结构分析; 5、对人脂联素蛋白质序列进行二级结构和三维结构预测。【实验方法】 1、人脂联素蛋白质序列的检索: (1)调用 Internet 浏览器并在其地址栏输入 Entrez 网址( http:/www.ncbi.nlm. nih.gov/Entrez) ; (2)在 Search 后的选择栏中选择 protein; (3)在输入栏输入 homo sapiens adiponectin; (4)点击 go 后显示序列接受号及序列名称; (5)点击序列接受号 NP_0047
4、88 (adiponectin precursor; adipose most abundant gene transcript 1 Homo sapiens)后显示序列详细信息; (6)将序列转为 FASTA 格式保存(参考上述步骤使用 SRS 信息查询系统检索人脂联素蛋白质序列) ; 2、使用 BioEdit 软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析: 打开 BioEdit 软件将人脂联素蛋白质序列的 FASTA 格式序列输入分析框点击左侧序列说明框中的序列说明点击 sequence 栏选择 protein点击Amino Acid Composition查看该
5、蛋白质分子质量和氨基酸组成; 或者选择protein 后,点击 Kyte & Doolittle Mean Hydrophobicity Profile查看该蛋白质分子疏水性水平; 3、人脂联素蛋白质序列的蛋白质同源性分析: (1)进入 NCBI/Blast 网页; (2)选择 Protein-protein BLAST (blastp ) ; (3)将 FASTA 格式序列贴入输入栏; (4)点击 BLAST; (5)查看与之同源的蛋白质;4、人脂联素蛋白质序列的 motif 结构分析: (1)进入 http:/hits.isb-sib.ch/cgi-bin/PFSCAN 网页; (2)将人
6、脂联素蛋白质序列的 FASTA 格式序列贴入输入栏; (3)点击 Scan; (4)查看分析结果(注意 Prosite Profile 中的 motif information) ;5、人脂联素蛋白质序列的二级结构预测: (1)进入下列蛋白结构预测服务器网址 http:/www. embl-heidelberg.de/predictprotein/predictprotein.html (The PredictProtein Server) ; (2)在 You can 栏点击 default; (3)填写 email 地址和序列名称; (4)将人脂联素蛋白质序列的 FASTA 格式序列贴入输
7、入栏点击 Submit; (5)从 email 信箱查看分析结果; 6、人脂联素蛋白质序列的三维结构预测: (1)进入 http:/www.expasy.org/swissmod/SWISS-MODEL.html (SwissModel First Approach Mode)网页; (2)填写 email 地址、姓名和序列名称; (3)将人脂联素蛋白质序列的 FASTA 格式序列贴入输入栏; (4)点击 Send Request; (5)从 email 信箱查看分析结果(注:需下载软件入 rasmol 查看三维图象)。【作业】 1、提交使用上述软件对人脂联素蛋白质序列进行基本性质分析、同源性
8、分析、motif 结构分析以及二级结构和三维结构预测的结果; 2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。蛋白质序列分析pfam http:/pfam.sanger.ac.uk/蛋白质结构域预测smart http:/smart.embl-heidelberg.de/ 蛋白质结构域预测BLOCKS http:/blocks.fhcrc.org/ 蛋白质家族的序列保守区域 CluSTr http:/www.ebi.ac.uk/clustr/ 将 SWISS-PROT+TrEMBL 蛋白自动归类 InterPro http:/www.ebi.ac.uk/inter
9、pro/ 蛋白质家族、结构域和位点的集成信息资源 PIR-ALN http:/www-nbrf.georgetown.edu/pirwww/dbinfo/piraln.html 蛋白质序列联配 PRINTS http:/www.bioinf.man.ac.uk/dbbrowser/PRINTS/ 分层的基因家族指纹 PROSITE http:/www.expasy.ch/prosite/ 具有生物学意义的蛋白模式和轮廓 ProtoMap http:/protomap.cornell.edu/ 对 SWISS-PROT 蛋白质进行自动分类 SBASE http:/hydra.icgeb.trie
10、ste.it/kristian/SBASE/ 注释了的蛋白质结构域序列 SYSTERS http:/systers.molgen.mpg.de/ 基于多种资源对蛋白质序列进行分类 Emotif http:/motif.stanford.edu/emotif 蛋白质序列模体查询 Iproclass http:/pir.georgetown.edu/iproclass/ 注释了的蛋白质分类数据库 PFSCAN www.isrec.isb-sib.ch/software/PFSCAN_form.html 蛋白质序列的(profile)分析Compute pI/Mw- http:/www.expasy
11、.ch/ch2d/pi_tool.html 蛋白质序列的理论等电点、分子量的计算 CATH- http:/www.biochem.ucl.ac.uk/bsm/cath 通过自动、手动方式进行蛋白质结构相关性的系统分类,CATH 是以下四个单词的第一个字母的组合Class(类) - 源于二级结构的最高级别的分类Architecture(构造) -独立于拓扑结构的二级结构排列描述。 Topology(拓扑结构)-参照已知的折叠及观测的结构进行拓扑分析Homology(同源)-结构间相同的拓扑布局、不同的二级结构(与功能相似性相关)描述 CRASP http:/wwwmgs.bionet.nsc.r
12、u/Programs/CRASP/default.htm 蛋白质序列的相关分析 FPAT http:/www.ibc.wustl.edu/fpat/-an 检索分子序列数据库模式的简易方法 Hydropathy Plot (GIF image) http:/www.bmb.psu.edu/nixon/webtools/hydro/ default.htm 绘制亲疏水图 MOTIF http:/www.genome.ad.jp/SIT/MOTIF.html- 蛋白质序列模式检索 RandSeq http:/www.expasy.ch/sprot/randseq.html- 随机的蛋白质序列生长子
13、 REPRO- http:/www.embl-heidelberg.de/repro/repro_info.htmlA 蛋白质重复片断识别服务器 paralign http:/www.paralign.org/ 蛋白质、核酸序列相似性检索 SignalP http:/www.cbs.dtu.dk/services/SignalP/ 在不同的物种中预测信号肽及酶切位点 SIM- http:/expasy.hcuge.ch/sprot/sim-prot.html 由用户定义的最佳两序列对比 TMpred http:/ulrec3.unil.ch/software/TMPRED_form.html
14、- 蛋白质跨模区预测、定位,该方法基于统计学结果,通过权重矩阵打分进行预测分析 Coils http:/ulrec3.unil.ch/software/COILS_form.html 对比分析具有双股卷曲结构的序列同源性打分,进而计算适于采用该结构的序列的几率 GuessProt http:/www.expasy.ch/www/guess-prot.html 选择 SwissProt 蛋白的等电点、分子量 MassSearch http:/cbrg.inf.ethz.ch/subsection3_1_3.html- 蛋白质消化后的聚集检索Phospepsort http:/genome.eer
15、ie.fr/gcg/phospepsort-query.html- 磷酸化位点分类 SAPS http:/ulrec3.unil.ch/software/SAPS_form.html- 蛋白质序列统计分析 Sleuth http:/ du/pub/sleuth/data- 氨基酸构象及可及性分析 PEDANT-http:/pedant.mips.biochem.mpg.de/frishman/pedant.html 蛋白质提炼PROVE http:/www.ucmb.ulb.ac.be/%7Ejoan/survol/form.html 蛋白质原子体积计算 Naccess (ASA for proteins)http:/www.ls.manchester.ac.uk/research/themes/ bioinformatics/ 利用 Lee & Richards 方法描述分子表面性质的计算程序,能够计算蛋白质的表面准确地将已知的蛋白质序列转化成 DNA 序列 根据物种在 swissprot 里面翻转http:/ Codon Usage Database,然后将你要的物种的拉丁文名输入QUERY Box for search with Latin name of organism ,点击 submit,然后就可以看到各个物种的一个密码子列表。然后替换那个大肠杆菌就可以了