1、生物信息学在医学领域的应用研究现状摘要 生 物 信 息 学 是 研 究 生 物 信 息 处 理 (采 集 、 管 理 和 分 析 应 用 ),并 从 中 提 取 生 物 学新 知 识 的 一 门 科 学 ,它 连 接 生 物 数 据 和 医 学 科 学 研 究 。 生 物 信 息 数 据 库 几 乎 覆 盖 了 生命 科 学 的 各 个 领 域 , 截 止 至 2010 年 , 总 数 已 达 1230 个。生 物 信 息 学 已 不 断 渗 透 到 医学 领 域 的 研 究 中 。 生 物 信 息 学 在 医 学 领 域 中 主 要 应 用 于 医 学 基础 研 究 、 临 床 医 学 、
2、药物 研 发 和 建 立 与 医 学 有 关 的 生 物 信 息 学 数 据 库 。关键词 生 物 信 息 学 , 医 学 , 应 用前言 据统计,生物学信息正以每 14 个月翻一倍的速度增长。随着基因组及蛋白质序列数据库的快速增长,以及从这些序列中获取最大信息的需求,生物信息学(bioinformatics)作为一门独立学科应运而生。简言之,生物信息学就是利用计算和分析工具去收集、解释生物学数据的学科。生物信息学是一门综合学科,是计算机科学、数学、物理、生物学的结合。它对于管理现代生物学和医学数据具有重大意义,其研究成果将对人类社会和经济产生巨大推动作用。生物信息学的基础是各种数据库的建立和
3、分析工具的发展。数据库迄今为止,生物学数据库总数已达 500 个以上。归纳起来可分为 4 大类:即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子三维空间结构数据库,以及以上述 3 类数据库和文献资料为基础构建的二级数据库。生物信息学在临床医学上的应用 1. 疾病相关基因的发现:很多疾病的发生与基因突变或基因多态性有关。发现新基因是当前国际上基因组研究的热点,使用生物信息学的方法是发现新基因的重要手段。目前发现新基因的主要方法有多种:(1)基因的电脑克隆:所谓基因的“电脑克隆”, 就是以计算机和互联网为手段,发展新算法,对公用、商用或自有数据库中存储的表达序列标签(express sequ
4、ence tags,EST)进行修正、聚类、拼接和组装, 获得完整的基因序列, 以期发现新基因。(2) 通过多序列比对从基因组 DNA 序列中预测新基因1:从基因组序列预测新基因,本质上是把基因组中编码蛋白质的区域和非编码蛋白质的区域区分开来。(3)发现单核苷酸多态性2:现在普遍认为 SNPs 研究是人类基因组计划走向应用的重要步骤。这主要是因为 SNPs 将提供一个强有力的工具 ,用于高危群体的发 现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等。2. 新的药物分子靶点的发现和确立:目前,新的药物分子靶点的发现和确立已离不开生物信息学的工作。目前药物开发的关键是如何在大量的潜在
5、靶点中筛选出最有可能获得成功并应用于临床的靶点。这使得生物信息学研究的焦点从对靶点的推测转移到了对靶点的识别与确定上。生物信息学可以帮助人们在药物开发过程中更早、更快地找到更佳的药物作用靶点,减少研发时间和所需临床试验的数量。发现候选药物作用靶点的方法主要有表达序列标签数据库搜寻、综合分子特征方法和结构生物学方法等。发现候选药物作用靶点后,还必须对靶点蛋白质 进行功能验证,并确定其是否在疾病发生过程中起关 键作用。基本思路是研究功能的获得与丧失分析。方法有基因敲除、转基因动物模型、蛋白组学方法、核 酸酶法及免疫化学方法等。3. 药物设计:创新药物的研究具有重要的社会效益和经济效益。然而新药的研
6、发是一项高投入、高风险、效率低下的工作。主要难点有两个:一是疾病相关的靶点生物大分子的发现及确认;二是具有生物活性的生物小分子的设计和发现。传统新药发现方式 缺乏理论指导,主要依赖大量的随机筛选,时间长,耗 资巨大。人类基因组计划和蛋白组计划的实施、大量疾病相关基因及作用靶点的发现、生物信息学的兴起,为新药设计提供了新的理论和思路。针对疾病相关的靶标生物大分子的直接药物设计已逐渐成为药物设计的主要方法。直接药物设计方法可分为两类:(1)全新药物设计3,4 :即根据靶点分子与药物相结合的活性部位的几何形状和化学特性,设计出与其相匹配的全新结构的药物分子。(2)数据库搜寻:将化合物 三维结构数据库
7、中分子与靶标分子逐一对接,同时优化小分子化合物的取向及构象,寻找小分子与靶标大分子作用的最佳构象,计算其相互作用及结合能,从而找出化合物三维结构库中与靶标生物大分子作用的最佳小分子。4. 基因芯片:基因芯片,又称 DNA 微阵列, 是由大量 DNA 或寡核苷酸探针密集排列所形成的探针阵列,其基本原理是通过杂交检测信息。基因芯片是分子生物学和微电子学及信息学相互结合所形成的新型技术。利用基因芯片,可以实现基因信息的大规模检测。这一技术的成熟和应用将给遗传研究、疾病诊断和治疗、新药发现和环境保护等生命科学相关领域带来一场革命。生物信息学在基因芯片研究与应用中起着重要的作用。总结与展望生物信息学的研
8、究结果不仅具有重要的理论价值,也可直接应用到医疗实践当中去。因此,生物信息学相关的分析与应用算法、软件和数据库,都具有重要的经济价值,最终都会转化为商品,获得经济和社会效益。在当前,一些基本的生物信息学工具已经应用于临床,为临床诊断、预防、治疗、临床疗效评估提供了有力的武器。如 GeneBank 数据库、OMIM 数据库被临床医生广泛应用于搜寻病原体或人类疾病相关基因信息,并通过生物软件设计特异引物、探针,用于临床基因的诊断、分型、定量、耐药基因的鉴定,在感染性疾病、遗传病、肿瘤的预防、早期诊断、治疗、预后判 断上发挥重要作用。 在近期,作为人类基因组计划的生物信息学分析成果,更多疾病相关基因
9、将被发现和鉴定,同时新的药物分子靶点将被发现和确立。生物信息学将有助于鉴定疾病易感基因、阐明疾病发生的分子机理,从而有机会发展针对疾病关键发生途径的治疗手段。在远期,整合了基因组学、病原学和临床实验数据的生物信息分析结果通过简单的基因测试将揭示潜在的个体耐药反应。最终,药物基因组学将导致个体化用药时代的来临,患者将携带包含自身独一无二遗传图谱的基因卡寻医问药,而医生将根据患者基因特征开出针对个体治疗和无副作用的靶点药物。参考文献1 Read TD, Salzberg SL, Pop M , et al.Comparative genome sequencing for discovery of
10、 novel polymorphisms in Bacillus anthracis.Science, 2002, 296(5575):2028-2033. 2 Gale CP, Grant PJ.The characterisation and functional analysis of the human glyoxalase-1 gene using methods of bioinformatics. Gene, 2004, 340( 2):251-260. 3 Douguet D, M unier-Lehmann H, et al.LEA3D: a computer-aided ligand design for structure-based drug design. J Med Chem, 2005, 48( 7):2457-2468. 4 Rig olet P, Xi XG, Rety S, et al. T he structural comparison of the bacterial PepX and human DPP-IV reveals sites for the design of inhibitors of PepX activity.FEBS J , 2005, 272( 8):2050-2059.