1、生物质谱的信号处理和质量控制,杨芃原教授复旦大学生物医学研究院 复旦大学化学系 2007年8月19日广州南方医科大学,那些是有用的信号, 那些是没有用的信号,(1)95%置信限时的鉴定蛋白质数据库搜索的得分大于HLPP规定的下限,和 (2)被鉴定蛋白质的可信性和检索数据库总容量以及被检索蛋白质长度成负相关, 并符合HLPP规定的标准,和 (3)被鉴定蛋白质的可信性和其肽段串联质谱(氨基酸序列谱)的数据库搜索后的匹配肽段数成正相关,并至少不低于HLPP规定的标准-2个匹配肽段;或等同于(3)的(4)被鉴定蛋白质的可信性和其肽段质谱(肽谱)的数据库搜索后的匹配肽段数成正相关,并至少不低于HLPP规
2、定的标准99%置信限时的5个匹配肽。, 1 mil counts, 1 bil counts, 1 bil counts,二项式分布,珀松分布,高斯分布,蛋白质/肽的质谱信号测量,信号测量的误差,噪音分布,信号分布,噪音的平均值A,噪音的近似值B,信号和噪音完全分辨,信号和噪音不完全分辨, 统计学变得重要,信号和噪音的分辨定义,信号置信限高, 置信度也高,假阳性率低,信号置信限高, 置信度差, 假阳性率高,增加信噪比,蛋白质长度决定的假阳性的概率Prand,,氨基酸序列的随机匹配,反转库搜索减少假阳性率,蛋白质数据库的大小 而产生的新的置信限 Ndb为数据库序列的数目,正常的氨基酸序列信号,M
3、H,酸性条件 MNa,MK,盐体系 MNH4,铵盐缓冲体系 MX,X溶剂或缓冲液阳离子 2MH,高浓度时形成的二聚体 MHS,溶剂的添加物,分子重排,当为偶电子离子时,电荷不会转移。偶电子碎片反应时氢会发生重排,b, y 离子的产生和控制,蛋白质修饰,MyoglobinGLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG,测几个肽段的序列?,肽段的选择,肽含有足够的长度 肽有特异性 肽处于头20个AA 位置 肽容易带电荷 肽容易断裂,谢谢,