收藏 分享(赏)

一种基于边聚集系数的关键蛋白质预测方法#.doc

上传人:tangtianxu1 文档编号:2746427 上传时间:2018-09-26 格式:DOC 页数:8 大小:1.53MB
下载 相关 举报
一种基于边聚集系数的关键蛋白质预测方法#.doc_第1页
第1页 / 共8页
一种基于边聚集系数的关键蛋白质预测方法#.doc_第2页
第2页 / 共8页
一种基于边聚集系数的关键蛋白质预测方法#.doc_第3页
第3页 / 共8页
一种基于边聚集系数的关键蛋白质预测方法#.doc_第4页
第4页 / 共8页
一种基于边聚集系数的关键蛋白质预测方法#.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、http:/- 1 -中国科技论文在线一种基于边聚集系数的关键蛋白质预测方法 # *基金项目:国 科 61003124 ; 科 科 (20090162120073 作者简介: 1986- 通信联系人: 1978- . E-mail: 5(中南大学 信息科学与工程学院,湖南 长沙 410083)摘要:在网络水平上的关键蛋白质识别往往只注重于节点的拓扑特性,而忽略了边与关键蛋白质的相关性。鉴于此,本文提出一种基于边聚集系数的关键蛋白质预测方法SoECC,该方法有效地结合了蛋白质网络边和点的特性。SoECC首先计算网络中每条边的边聚集系数,然后将每个节点各边的边聚集系数加和,作为节点的一个新的测度参

2、数。在酵母蛋白10质网络上的实验结果表明,SoECC在关键蛋白质识别率方面明显优于其他6种节点中心性拓扑参数。其中,相较于BC和CC两种方法,SoECC均有20%的提升。关键词:关键蛋白质;蛋白质网络;拓扑;中心性测度;边聚集系数中图分类号:TP31115 A new method for predicting essential proteins based on edge clustering coefficientWANG Huan, LI Min, WANG Jian-xin, DUAN Gui-hua(School of Information Science and Enginee

3、ring, Central South University, Changsha 410083)Abstract: The identification of essential proteins in the network level tended to focus only on 20 topology of the nodes, but ignored the relevance of the edges and essential proteins. In view of this, we propose a new method for predicting essential p

4、roteins in this paper based on edge clustering coefficient, named as SoECC, which binds characteristics of edges and nodes of the protein interaction network effectively. Our approach is to calculate the edge clustering coefficient of each edge firstly, then sum the edge clustering coefficient of al

5、l edges of each node as a new measure. 25 The SoECC method was applied on the yeast protein interaction network. The experimental results show that, SoECC is obviously higher than other six centrality measures in the prediction accuracy of essential proteins. Especially, compared to BC and CC, SoECC

6、 is 20% higher in the prediction accuracy.Key words: essential protein; protein interaction network; topology; centrality measure; edge 30 clustering coefficient0 (null mutation) 35 1 2 在 中 RNA 40 http:/- 2 -中国科技论文在线技 3 在 在 中 4 中 中 45 中 (degree centrality)5 中 H.Jeong 5 “中 - ” (centrality-lethality r

7、ule) 中 Joy 6 中 Manimaran 750 中 中 中 中 K.Park 8 中 Estrada9 中 中 中 中 在 55 中 在 中 文 SoECC 在 中 SoECC 在 100 中 78% 100 中 57% 60 1 中 中 在 中 中 中 中 中 65在 中 中 中 5 中 6 中 10 中 11 中 12 中 13 中 中 9 中 (Degree Centrality, DC) i 中 70 中 (betweenness centrality, BC) i 中 中(1)itsiBCst ,)()(中 s t s t (,)st (,)t中 i 中 在 中 75 中

8、(closeness centrality, CC) i 中 中http:/- 3 -中国科技论文在线(2)jidNiC),(1)(中 i j N 中 (,)dij80 中 (subgraph centrality, SC) i 中 (3)ejNjilSC120)(!)()(中 i l ()li 12,.)N85 N 线 i 12,.N(jij中 (eigenvector centrality, EC) i 中 i (4)()(maxiEC90 中 imaxmax()iax中 (information centrality, IC) i 中 i (5)1)(jiINiIC95 A D J 1

9、N 1()ijCcJ1()ijijijIciI 0i2 中 在 中 He 14 100 中 在 “中 - ” 文 (Edge Clustering Coefficient, ECC)15 中 G(V,E) 中 Ei,j i j 105 中 k i,j 在 Ei,k Ej,k Ei,j Ei,j (6)1,min(),(jidzjiCzi,j 中 di dj i j http:/- 4 -中国科技论文在线110 在 1中 E1,4 min(1,)jdn1 n4 4 中 E1,4 min(41,)32 1,5,6图 1 115 Fig.1 Example of solving the edge c

10、lustering coefficienti (Sum of Edge Clustering Coefficient, SoECC(i) (7)iNjjECSo).()(中 Ni i SoECC 120 中 在 16 在 中 在 17 Hart 18 125 文 3 中 在 中 SoECC 130 6 中 3.1 DIP19 4746 15166 MIPS20 SGD21 DEG22 SGDP23 1285 MIPS 135 中 4746 中 1130 3328 288 3.2 140 中 (Sensitivity, SN) http:/- 5 -中国科技论文在线(8)FNTPS(Specif

11、icity, SP) (9)145 (Positive Predictive Value, PPV) 中 (10)FPTV(Negative Predictive Value, NPV) 中 150 (11)NF- (F-measure, F) (12)PVSF2(Accuracy, ACC) 中 (13)NTAC155图 2 Fig.2 Number of essential proteins detected by different methodshttp:/- 6 -中国科技论文在线160 3.3 “ ” SoECC 6 中 SoECC 6 在 1%, 5%, 10%, 15%, 20

12、%, 25% 中 2 165 2 SoECC 6 中 在 (Top 1%, Top 5%, Top 10%, Top 15%, Top 20%, Top 25%) SoECC BB CC 中 20% 中 (SC, SC, EC, IC, IC, DC) SoECC 5.9%, 15.2%, 12.4%, 10.3%, 7.3%, 3.0% 170 文在 (SN) (SP) (PPV) (NPV) F- (F) (ACC) SoECC 6 中 在 中 中 1130 3328 288 在 1130 3616 175 1 SoECC 6 中 SoECC 表 1 SoECC 6 在SN SP PPV

13、NPV F ACC Table 1 Comparsion the results of SN, SP, PPV, NPV, F, and ACC of SoECC and other six methodsSN SP PPV NPV F ACCDC 0.441 0.813 0.445 0.811 0.443 0.719 BC 0.388 0.798 0.395 0.793 0.392 0.694 CC 0.386 0.801 0.397 0.793 0.391 0.696 SC 0.414 0.811 0.427 0.803 0.420 0.710 EC 0.418 0.811 0.429 0

14、.804 0.423 0.711 IC 0.443 0.814 0.447 0.812 0.445 0.720 SoECC 0.468 0.824 0.475 0.820 0.471 0.734 180 文 SoECC 中 14 中 Eee(u,v) Enn(u,v) 185 Een(u,v) 表 2 SoECC DC 在 100 中 Table 2 Number and percentage of three kinds of edges in the networks composed by the top100 proteinsidentified by SoECC and DC res

15、pectivelynumber percentageSoECCEee(u,v) 243 0.666http:/- 7 -中国科技论文在线Enn(u,v) 12 0.033Een(u,v) 110 0.301Eee(u,v) 107 0.405Enn(u,v) 39 0.148DCEen(u,v) 118 0.447190 SoECC SoECC DC 在 100 100 中 3 SoECC 100 中 DC 中 2 中 195 (a) SoECC (b) DC图 3 SoECC DC 在 100 Fig.3 The top100 proteins in the yeast protein in

16、teraction network identified by SoECC and DC respectivelylight-colored nodes and dark-colored nodes denote essential proteins and non-essential proteins respectively 2004 论文 SoECC 中 SoECC 中 205 SoECC 中 BC CC SoECC在 20% 参考文献 (References)http:/- 8 -中国科技论文在线1 Winzeler E A, Shoemaker D D, Astromoff A, e

17、t al. Functional characterization of the S. cerevisiae genome by gene deletion and parallel analysisJ. Science, 1999, 285(5429): 901-906.210 2 Jeong H, Oltvai Z, Barabsi A L. Prediction of protein essentiality based on genomic dataJ. ComPlexUs, 2003, 1(1): 19-28.3 von Mering C, Krause R, Sne B, et a

18、l. Comparative assessment of large-scale data sets of protein-protein interactionsJ. Nature, 2002, 417(6887): 399-403.4 Barabsi A L., Oltvai Z N. Network biology: understanding the cells functional organizationJ. Nat Rev Genet, 215 2004, 5(2): 101-113.5 Jeong H, Mason S, Barabsi A L, et al. Lethalit

19、y and centrality in protein networksJ. Nature, 2001, 411(6833): 41-42.6 Joy M P, Brock A, Ingber D E, et al. High-betweenness proteins in the yeast protein interaction networkJ. Journal of Biomedicine and Biotechnology, 2005, 2005(2): 96-103.220 7 Manimaran P, Hegde S R, Mande S C. Prediction of con

20、ditional gene essentiality through graph theoretical analysis of genome-wide functional linkagesJ. Molecular BioSystems, 2009, 5(12): 1936-1942.8 Park K, Kim D. Localized network centrality and essentiality in the yeast-protein interaction networkJ. Proteomics, 2009, 9(22): 5143-5154.9 Estrada E. Vi

21、rtual identification of essential proteins within the protein interaction network of yeastJ. 225 Proteomics, 2006, 6(1): 35-40.10 Wuchty S, Stadler P F. Centers of complex networksJ. Journal of Theoretical Biology, 2003, 223(1): 45-53.11 Estrada E, Rodrguez-Velzquez J A. Subgraph centrality in compl

22、ex networksJ. Phys. Rev. E., 2005, 71(5), 056103.12 Bonacich P F. Power and centrality: A family of measuresJ. American Journal of Sociology, 1987, 92(5): 230 1170-1182.13 Stevenson K, Zelen M. Rethinking centrality: Methods and examplesJ. Social Networks, 1989,11(1): 1-37.14 He X, Zhang J. Why do H

23、ubs tend to be essential in protein networks?J. Plos Genetics, 2006, 2(6): 0826-0834.15 , . J. , 2009, 26(3): 858-859.235 16 , , , . J. 中 科 , 2010, 41(2): 560-565.17 Gavin A C, Krause R, Grandi P, et al. Functional organization of the yeast proteome by systematic analysis of protein complexesJ. Natu

24、re, 2002, 415(6868): 141-147.18 Hart G T, Lee I, Marcotte E. A high-accuracy consensus map of yeast protein complexes reveals modular 240 nature of gene essentialityJ. BMC Bioinformatics, 2007, 8(1): 236.19 Xenarios I, Rice D W, Salwinski L, et al. DIP: the database of interacting proteinsJ. Nucleic

25、 Acids Res. 2000, 28(1): 289-291.20 Mewes H W, Frishman D, Mayer K F, et al. MIPS: analysis and annotation of proteins from whole genomes in 2005J. Nucleic Acid Research, 2006, 34(1): 169-172.245 21 Cherry J M, Adler C, Ball C, et al. SGD: Saccharomyces Genome DatabaseJ. Nucleic Acid Research, 1998, 26(1): 73-79.22 Zhang R, Lin Y. DEG 5.0, a database of essential genes in both prokaryotes and eukaryotesJ. Nucleic Acid Research, 2009, 37(1): 455-458.23 SGDP: Saccharomyces Genome Deletion ProjectEB/OL. http:/www-250 sequence.stanford.edu/group/yeast_deletion_project/deletions3.html, 2007.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报