1、基于聚合信息量的本体 语义相似性度量,姓名: 学号: 指导教师:,答辩提纲,课题背景 工作内容 算法设计 算法实现 算法评估,课题背景,基因本体(Gene Ontology,GO) 语义相似性(Semantic Similarity) 信息量(Information Content,IC),基因本体(GO),信息量(IC),freq t =annotation(t)+ ichild(t) freq(i) p(t)=freq(t)/freq(root)IC(t)= log p(t ),工作内容,AIC SI,算法过程,AIC算法与SI算法,AIC算法: SI算法:,AIC算法,sim GO (a
2、,b)= t T a T b 2SW(t) SV(a)+SV(b) 测量蛋白质相似性:sim AVE g 1 , g 2 = average t 1annotation g 1 t 2 annotation g 2 sim( t 1 , t 2 ),SI算法,GO条目相似性:Sim A,B = SV A, T A,B +SV(B, T A,B ) SV A, T A +SV(B, T B ),SI算法,AIC算法实现,AIC算法评估,Resnik方法:S Resnik a,b = max (,) () Jiang方法:sim Jiang a ,b = 1 1+ Dis GO a,b,AIC算法评估,Lin方法:sim Lin a,b = 2 max (,) () IC a +IC(b) Wang方法:sim Wang a,b = t T a T b S a t + S b (t) SV a +SV(b),AIC算法GO语义相似性评估,AIC算法GO语义相似性评估,比较不同层但距离 相同的两组数据,ACI基因相似性算法评估,测试结果:,蛋白质相似性评估,ROC AUC PPI MIPS 平均法(AIC)测蛋白质,蛋白质相似性评估,谢谢各位答辩老师 的指导!,