1、药物靶点与信息学,药物基因组教研室 卞秀森,Company Logo,生物芯片与药靶,分类器预测药物靶点,Company Logo,药物靶点的相关知识,药 靶,1.定义,2.分类及分布情况,3.单一靶点与多靶点药物,4.研究意义,Company Logo,药物靶点的定义,药物靶标药物靶标是指体内具有药效功能并能被药物作用的生物大分子,如某些蛋白质和核酸等生物大分子。,酶,受体,Company Logo,选择药物作用靶标要考虑两个方面,1. 靶标的有效性,即靶标与疾病确实相关,并且通过调节靶标的生理活性能有效地改善疾病症状。 2. 靶标的副作用,如果对靶标的生理活性的调节不可避免地产生严重的副作
2、用,那么将其选作药物作用靶标是不合适的。,Company Logo,靶标发现与确证的一般流程,1. 寻找疾病相关生物分子线索:利用基因组学、蛋白质组学以及生物芯片技术获取疾病相关的生物分子信息,并进行生物信息学分析,获取线索。 2. 对相关的生物分子进行功能研究,以确定候选药物作用靶标。 3. 候选药物作用靶标,设计小分子化合物,在分子、细胞和整体动物水平上进行药理学研究。 验证靶标的有效性。,Company Logo,各种大分子在药靶中的分布情况,现有药物中,以受体为作用靶点的药物超过50%,是最主要和最重要的作用靶点 以酶为作用靶点的药物占20%之多,特别是酶抑制剂,在临床用药中具有特殊地
3、位; 以离子通道为作用靶点的药物约占6%; 以核酸为作用靶点的药物仅占3%; 其余近20%药物的作用靶点尚待研究发现,Company Logo,核酸作为靶点(“斩草除根”型 ),核酸包括DNA和RNA,是指导蛋白质合成和控制细胞分裂的生命物质以核酸为作用靶点的药物主要包括一些抗生素、抗病毒药、喹诺酮类抗菌药、抗肿瘤药等,Company Logo,这类药物干扰或阻断细菌、病毒和肿瘤细胞增殖的基础物质核酸的合成,就能有效地杀灭或抑制细菌、病菌和肿瘤细胞,Company Logo,以DNA作为靶点的药物:包括喹诺酮类抗菌药,作用机制是阻断DNA的合成;抗病毒药阿昔洛韦、碘苷等,作用机制是干扰DNA的
4、合成;抗肿瘤药甲氨蝶呤、顺铂等,作用机制是破坏DNA的结构和功能,Company Logo,Company Logo,以RNA作为靶点的药物:包括利福霉素类抗生素,作用机制是影响RNA的合成;抗肿瘤药阿糖胞苷、普卡霉素等,作用机制是抑制RNA的合成,Company Logo,Company Logo,离子通道作为靶点(“通道疏导”型 ),离子经过通道内流或外流跨膜转运,产生和传输信息,成为生命活动的重要过程,以此调节多种生理功能。现有药物主要以+、a+、Ca2+等离子通道为作靶点,Company Logo,Company Logo,受体作为靶点 (“两情相悦”型 ),受体是一类介导细胞信号转导
5、的功能性蛋白质,可以识别某种微量化学物质并与之结合,通过信息放大系统,触发后续的生理或药理效应,Company Logo,Company Logo,受体的类型主要包括: ()蛋白偶联受体,是鸟苷酸结合调节蛋白的简称,大多数受体属于此种类型。诸多神经递质和激素受体需要蛋白介导细胞作用,Company Logo,Company Logo,()门控离子通道型受体,存在于快速反应细胞膜上,受体激动时导致离子通道开放,细胞膜去极化或超极化,引起兴奋或抑制。 ()酪氨酸激活型受体,例如上皮生长因子、血小板生长因子和一些淋巴因子等。 ()细胞内受体例如甾体激素、甲状腺素等,Company Logo,酶作为靶
6、点(“催化剂”型 ),酶是由活细胞合成的对特异底物高效催化的蛋白质,是体内生化反应的重要催化剂,Company Logo,由于酶参与一些疾病的发病过程,因此酶成为一类重要的药物作用靶点。 此类药物多为酶抑制剂,全球销量排名前20位的药物,就有50%是酶抑制剂。酶抑制剂一般对靶酶具有高度的亲和力和特异性。 酶抑制种类繁多,药理效应各异,Company Logo,单一靶点药物,根据疾病发病机制,发现和鉴定的靶标分为单一靶标和多靶标。单一靶标药物主要针对单一分子靶点,而且一部分这样药物在临床中发挥出显著疗效,Company Logo,单一靶点药物的缺陷,但是,针对单一靶点发现的活性化合物,存在着成药
7、性不好或副作用大等许多问题,单一靶点药物依然有其不合理性。比如在多数情况下,特别是中枢神经系统疾病,其病因、病理机制及疾病进展过程非常复杂,通常是多因素的,包括许多危险因子和缺陷蛋白质彼此失去平衡的信号通路,Company Logo,如果药物只作用在单个靶点上,那么治疗的成功率是极低的。此外,一个药物可靶向具有多种生理功能的多效性的细胞因子或其他蛋白,会导致多个正常的细胞通路同时受到影响,Company Logo,多靶点药物,“寻找多靶点药物是当今的趋势” 一个好的药物不是选择性地作用在一个靶点上的,而是作用于多靶点,应靶向对病因、病理机制和疾病进展起作用的几种异常蛋白或对某些因素的重新平衡起
8、作用的蛋白,Company Logo,目前,在临床上使用的不少老药其实都是作用于多靶点的,实际效果很好。以抗心律失常药为例说明,尽管人们研发了钠通道阻滞剂、钾通道拮抗剂等多种药物,但最后发现最有效的其实还是胺碘酮,后者作用于多靶点,Company Logo,杨宝峰教授提出“抗心律失常药物作用最佳靶点假说”,他认为:“在心律失常发生发展中起主导作用的通道,称之为抗心律失常药物作用的最佳靶点。换言之,一个理想的抗心律失常药物应对最佳靶点有作用,且至少对两种或两种以上的离子通道有作用 为验证上述假说,杨宝峰教授等人在动物模型上研究表明,胺碘酮等西药对几个离子通道靶点有不同程度的调控作用,故临床疗效较
9、好,Company Logo,多靶点药物不等于复方药,有人提出,既然这样,那把三五种药吃下去,让它们作用于不同靶点不就行了吗?其实,多靶点药物并不等同于复方药,其结果并不一样。复方药中的三五种药都有其特殊的血浆蛋白结合能力,每一种药都选择性地竞争一种肝药酶去进行代谢,这些结合和代谢过程会互相产生影响,Company Logo,而多靶点药物是一个分子里面不同的基团同时作用在不同靶点之上,其自身的理化特点是单一的,不会影响其他药物,Company Logo,药学科技工作者要拓宽药物研发的思路,结合当今的前沿学科(信息学的技术与手段)设计自己的研究方案。,Company Logo,药物靶点挖掘的意义
10、,当前国际上药物研究的竞争,主要集中体现在药物靶点的研究上。因为药物作用的新靶点一旦被发现,往往会成为一系列新药发现的突破口,Company Logo,于是,在寻找新的药物靶点上,各国科研人员不遗余力,药企也纷纷投入重金进行各种试验,以期能够通过找到一个新的药物靶点而研发出能够超越对手的新药,Company Logo,从某种程度上分析,新的药物靶点对于一个企业的前途至关重要,堪称“一个靶点成就一个产业”,Company Logo,因此,有效药物作用靶点的筛选与鉴定是现代新药研发的中心内容之一。其中,人类基因组和一批重要模式生物体基因组的全序列测定,更是为医药工业提供了一个全新的突破方向,Com
11、pany Logo,药物靶点挖掘的技术手段,1. 生物芯片在药物靶点发现中的作用,Company Logo,药物靶点发现与药物作用机制研究是生物芯片技术在药物研发中应用最为广泛的一个领域。在药物靶点发现和药物作用机制研究中所使用的生物芯片主要是指DNA芯片,Company Logo,在DNA芯片的表面,以微阵列的方式固定有寡核苷酸或cDNA。使用DNA 芯片可以对研究者感兴趣的基因或生物体整个基因组的基因表达进行测定,Company Logo,人体是一个复杂的网络系统,疾病的发生和发展必然牵涉到网络中的诸多环节。当今严重威胁人类健康的心脑血管疾病、恶性肿瘤、老年性痴呆症和一些代谢紊乱疾病都是多
12、因素作用的结果,往往不能归结于单一因素的变化。,Company Logo,应用一些基因寻找策略如 PCR等虽然为发现新的功能基因提供了一些线索,但还是有相当的局限性 而DNA芯片可以从疾病及药物2个角度对生物体的多个参量同时进行研究以发掘药物靶点并同时获取大量其他相关信息,Company Logo,因此可以说,在这种情况下,任何一元化的分析方法均不及 DNA芯片这种集成化的分析手段更具有优势,Company Logo,DNA芯片在药物研究中的作用,DNA芯片在药物靶点发现与药物作用机制研究中的应用具体表现在以下几个方面 :,Company Logo,1.正常不同组织细胞中基因的表达模式,基因的
13、表达模式给它的功能提供了间接的信息。例如只在肾脏中表达的基因就不大可能与精神分裂症有关。一些药物的靶点是在整个身体中分布广泛的蛋白质,这类药物的不良反应往往比较大,Company Logo,而选择只在特异组织中才表达的蛋白作为药物筛选的靶点,可以减少药物对整体产生的不良反应,因而更引起人们的关注,Company Logo,例如骨质疏松症(osteoporosis)与破骨细胞(osteoclasts)的功能有关,破骨细胞可以破坏并吸收骨质,当骨质的形成与破坏出现不平衡的时候,就会导致骨质疏松症。如果破骨细胞的功能得到抑制,那么就可以控制骨质疏松症的发生和发展。利用DNA芯片技术,可以容易地得到只
14、在破骨细胞中进行表达的基因如 cathepsink基因,它编码半胱氨酸蛋白酶,Company Logo,以 cathepsink基因作为靶标,筛选对它有抑制作用的药物,就有可能得到治疗骨质疏松症的药物,Company Logo,2.正常组织与病理组织基因表达差异,正常组织在病变的过程中,往往伴随着基因表达模式的变化。基因表达水平的升高或降低,可能是病变的原因,也可能是病变的结果。若基因表达的变化是病变的原因,则以此基因为靶点的药物就可能逆转病变;若基因表达的变化是病变的结果,则以此基因为靶点的药物就可能减轻病变的症状,Company Logo,DNA芯片技术可以在病理组织与正常组织之间一次比较
15、成千上万个基因的表达变化,找出病理组织中表达异常的基因 利用DNA芯片来寻找疾病相关基因的策略尤其适用于病因复杂的情况,Company Logo,流程图,正常组,疾病组,显著改变基因研究,Company Logo,例如,恶性肿瘤的发生常常是多基因共同作用的结果,DNA芯片技术在肿瘤细胞基因表达模式及肿瘤相关基因发掘中具有重要的作用,Company Logo,将一些看家基因、细胞因子及受体基因、细胞分裂相关基因及其他一些癌基因共5766个基因的cDNA探针固定在芯片上,对正常卵巢组织及卵巢癌组织的mRNA进行分析,发现二者之间30基因表达相差2倍以上,9相差3倍以上,其中上调较为明显的有CD9上
16、皮糖蛋白(ep ithelial glycoprotein)、p27及HE蛋白激酶抑制物等 这些显著改变的基因可能成为癌症治疗及药物筛选的新靶点,Company Logo,3.研究药物处理细胞后基因表达变化,药物与细胞(特别是敏感细胞)相互作用,将引起细胞外部形态及内部正常代谢过程的一系列变化。其内部生理活动的变化可集中表现在其基因表达的变化上。通过测定分析药物对细胞的基因表达的影响,可推测药物的作用机制,评价药物活性及毒性,进而确证药物靶点或者发现新的药物靶点,Company Logo,意义,通过DNA芯片测定药物诱导的细胞基因表达变化来进行药物筛选与研究,对那些用常规方法很难追踪监测的药物
17、或需要很长时间才能得到药物临床实验结果时,显得尤为有用通过监测阳性药物处理前后组织细胞基因表达变化情况可以获得许多十分有价值的信息。,Company Logo,意义,首先,经药物处理后表达明显改变的基因往往与发病过程及药物作用途径密切相关,很可能是药物作用的靶点或继发事件,可作为进一步药物筛选的靶点或对已有的靶点进行验证;其次,药物处理后基因表达的改变对药物作用机制研究有一定的提示作用,Company Logo,流程图,正常细胞,药物刺激后细胞,显著改变基因研究,Company Logo,药物挖掘信息学手段,2.分类器预测药物靶点,Company Logo,SVM,支持向量机(SVM)是数据挖
18、掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,Company Logo,SVM的关键在于核函数。低维空间向量集通常难于划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题,Company Logo,也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。在SVM理论中,采用不同的核函数将导致不同的SVM算法核函数: linear, polynomial and radial basis function (RBF),Company Logo
19、,支持向量机核心思想,支持向量机实现是通过某种事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间中构造最优分类超平,Company Logo,支持向量机核心思想,我们使用使用SVM进行数据集分类工作的过程首先是通过预先选定的一些非线性映射将输入空间映射到高维特征空间,Company Logo,Company Logo,使得在高维属性空间中有可能对训练数据实现超平面的分割,避免了在原输入空间中进行非线性曲面分割计算,Company Logo,SVM数据集形成的分类函数具有这样的性质:它是一组以支持向量为参数的非线性函数的线性组合,因此分类函数的表达式仅和支持向量的数量有关
20、,而独立于空间的维度。在处理高维输入空间的分类时,这种方法尤其有效,Company Logo,SVM工作原理图,Company Logo,SVM分类器处理数据面临的困难,(1)SVM算法对大规模训练样本难以实施由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本的个数),当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间,Company Logo,(2)用SVM解决多分类问题存在困难经典的支持向量机算法只给出了二类分类的算法,而在数据挖掘的实际应用中,一般要解决多类的分类问题。可以通过多个二类支持向量机的组合来解决,Company Logo,主要有一
21、对多组合模式、一对一组合模式和SVM决策树;再就是通过构造多个分类器的组合来解决。主要原理是克服SVM固有的缺点,结合其他算法的优势,解决多类问题的分类精度。如:与粗集理论结合,形成一种优势互补的多类问题的组合分类器,Company Logo,SVM分类药靶范例,文章名称Prediction of potential drug targets based on simple sequence properties 主要的工作就是将当今存在的药物靶点的蛋白特征作为训练集,构建一个分类的模型。然后用这个构建好的分类的模型去预测可能成为潜在的药物靶点的蛋白,Company Logo,特征集,使用蛋白
22、质的序列信息 包括:疏水性,极性,极化度,电荷,易溶型等,Company Logo,Kernel function selection,在Kernel function的选择上我们检验三个常用的linear, polynomial and radial basis function (RBF)。,Company Logo,Training set selection,we have constructed five additional training sets,training set (2) (6), in which the ratios of the number ofpositiv
23、e samples to negative ones became 1:2, 1:4, 1:6,1:8, 1:10 instead of 1:1 in the training set (1).,Company Logo,The same strategy used in training set (1) was applied to these fivetraining sets,Company Logo,The six ROC curves are almost overlapping and the area under the curve (AUC) varies between 0.900 and 0.920, which demonstrates that the performance of the SVM model does not change signifi-cantly with the increase of negative samples in the training set,Company Logo,ROC curves,Company Logo,预测结果,Thank You !,