1、 简述生物信息学基因芯片在医药领域的发展 摘要本文主要简述生物信息学基因芯片在几个具体医学方面的研究进展。主要是根据药理学、毒理学以及其他与药物的结构、作用和反应相关的研究,通过数学、计算机科学等理论方法对生物信息进行整理和分析,然后将结果应用于药物的设计、优化和开发的过程。关键词:生物信息学,医学,基因芯片目录简述生物信息学基因芯片在医药领域的进展1摘要11. 引言.31.1 生物信息学的定义和类型31.2 基因芯片31.2.1 基因表达谱芯片.42. 应用形式.42.1 常用数据库和工具42.2 生物信息学与医学的联系43医药领域中的针对性研究.53.1 在肝病方面的相关研究53.1.1
2、慢性乙型肝炎血液相关基因筛选.53.1.2 肝细胞癌发生中肝硬化差异基因.53.2 口腔医学相关研究63.3 胰腺癌相关研究64.结语6参考文献7设计说明书-简述生物信息学基因芯片在医药领域的发展学院:生物与农业工程学院专业:生物工程姓名:郭兴月学号:45110627日期:2014 年 6 月 23 日1引言1.1 生物信息学的定义和类型研究生物信息的采集、管理和分析应用,并从中提取生物学新知识的科学称为生物信息学。同源性、相似性是生物信息学的两个最基本的概念,同源性是指在进化起源上来自同一祖先,同源基因的表达产物一般表现为相同或相似。相似性指的是在进化起源上来自于不同祖先,但因趋同进化而形成
3、的共同结构或功能特征。生物信息学伴随基因组研究而产生,并随基因组及相关研究的发展而拓展,它由数据库、计算机网络和应用软件三大部分组成。计算机软件平台技术和创新算法在促进高通量生物学研究方法和技术持续发展的同时,也使生物信息学的数据和数据库得到持续不断的扩展和完善。生物信息包括多种类型的数据,如核酸、蛋白翻序列和结构、基因组、細图谱和疾病数据等。由实验获得的核酸蛋白序列和三维结构数据等构成初级数据,由此构建的数据库称初级数据库。由初级数据分析得来的诸如二级结构、疏水位点、结构域(domain) ,由核酸序列翻译来的蛋白质及预测的二级、三级结构,称为二级数据 1-2。本文参照了多篇研究性资料讲述几
4、种生物信息学在医药领域具有针对性的研究。1.2基因芯片基因芯片又称寡核苷酸芯片,广泛应用于各个领域,尤其是医药方面,常常用来做基因表达分析、基因诊断和新基因发现等。利用核酸碱基之间的互补配对原理,通过几百甚至几万个 DNA 片段密集排列固定到硅片、玻璃片、聚丙烯等固相支持物上,检测已知核酸序列(探针)分子的杂交信号强度进而获取样品(靶 DNA)分子的数量和序列信息。基因芯片可分为三种主要类型:1)固定在聚合物基片(尼龙膜,硝酸纤维膜等)表面上的核酸探针或 cDNA 片段,通常用同位素标记的靶基因与其杂交,通过放射显影技 术进行检测。这种方法的优点是所需检测设备与目前分子生物学所用的放射显影技术
5、相一致,相对比较成熟。但芯片上探针密度不高,样品和试剂的需求量大,定量 检测存在较多问题。2)用点样法固定在玻璃板上的DNA 探针阵列,通过与荧光标记的靶基因杂交进行检测。这种方法点阵密度可有较大的提高,各个探针在表面 上的结合量也比较一致,但在标准化和批量化生产方面仍有不易克服的困难。3)在玻璃等硬质表面上直接合成的寡核苷酸探针阵列,与荧光标记的靶基因杂交进行 检测。该方法把微电子光刻技术与 DNA化学合成技术相结合,可以使基因芯片的探针密度大大提高,减少试剂的用量,实现标准化和批量化大规模生产,有着十分 重要的发展潜力。 基因芯片的工作原理源于核酸分子杂交方法,使用已知核酸序列作为探针与互
6、补的靶核苷酸序列进行杂交,通过信号检测获得高密度杂交点阵图像,用图像分析软件,提取各杂交点图像吸光度值、面积和吸光度比值等荧光信号数据,并转化成基因表达矩阵,然后进行定性或定量的比对分析。具有筛选差异表达相关基因的有效手段,具有高通量和快速测量等优点 3-4。1.2.1 基因表达谱芯片基因表达谱是指通过构建处于某一特定状态下的细胞或组织的非偏性cDNA 文库, 大规模 cDNA 测序,收集 cDNA 序列片段、定性、定量分析其mRNA 群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱。基因表达谱芯片已广泛应用于肿瘤发生机制、早期诊断、肿
7、瘤基因分型、指导治疗及评估预后等研究领域。芯片表达谱数据的分析主要包括前期的实验设计、数据预处理和后期的详细分析等步骤 5。2 应用形式2.1常用数据库和工具常用的数据库有:有美国生物、技术信息中心(National Center for Biotechnology,NCBI)的核苷酸序列数据库(GenBank),欧洲的核苷酸序列数据库(EMBL-Bank),以及 DDBJ (DNA Data Base of Japan)。在这三种数据库中我们都可以找到常用的工具。比如说 BLAST 工具或FASTA 工具作为进行序列的相似性搜索的重要的生物信息学应用工具常用来鉴定序列片段,而获得大量差异表达
8、的序列片段的方法有:mRNA 差异显示、抑制性差减杂交、cDNA 微阵列、基因表达系列分析(SAGE)等。除此之外,利用Linux 操作系统,借助 Phrep, Phrap, consed 系列软件和核酸序列数据库,可以实现大批量差异基因片段从测序峰图到核酸序列的转换和序列的拼接,通过序列比对等系列过程的全自动化分析,可以发现某种疾病,如肿瘤中的差异表达序列。Genefinder,GeneScan 等软件可以帮助预测新基因的存在。多种工具不仅仅为医药领域,发挥着巨大的作用 6。2.2生物信息学与医学的联系临床生物信息学(clinical bio-informatics)是一门新兴的科学,其定义
9、为生物信息学的临床应用,利用相关的科学技术以了解人类疾病的分子机制和潜在的治疗方式,有助于发现特定疾病的标志物及促进个体化医学的发展。疾病的发生发展与特异基因的改变有关,我们常常根据基因诊断的方式来通过查找特异基因的方法,发现疾病的发病原因,现在已经发现许多与肥胖、糖尿病、髙血压、哮喘、心脑血管病、肿瘤等相关的致病基因。人类一切疾病都与基因有关。生物信息学伴随着人类基因组计划而产生,人类基因组数据库(GDB)是关于人类基因图谱和疾病的数据库,其中有人类基因组区域、人类基因组图谱、人类基因组内的变异等。另外,孟德尔人类遗传学数据库(OMIM)提供了人类遗传病的临床及其表型等信息,描述了各种遗传病
10、的基因及其产物,基因的表达和定位,对遗传病的鉴别诊断特别有用。转基因/靶基因突变数据库(TBASE)、蛋白质突变数据库(PMD )、蛋白质疾病数据库(PDD)等对疾病诊断、治疗和预防的研究非常有用 7-8。3医药领域中的针对性研究3.1 在肝病方面的相关研究3.1.1 慢性乙型肝炎血液相关基因筛选慢性乙型肝炎是由乙型肝炎病毒(HepatitisB vims,HBV)引起的一种世界性疾病,也是我国当前流行最为广泛、危害性最严重的一种传染病。HBV 主要通过肝细胞内 DNA 复制干扰肝脏功能。因此通过控制基因控制乙肝病毒的意义重大,因此生物信息学发挥了重要作用。国内相关研究曾利用三步方法筛选出了慢
11、性乙肝炎基因。第一步收集慢性乙型肝炎患者及未患病志愿者血液标本。运用了 Human Genome U133 Plus 2.0 Array 基因表达谱芯片,通过荧光信号图像比对两者基因的差异。第二步,运用了芯片数据分析软件 BRB-ArrayTools 4.2.1,对获得的数据进行生物信息学分析,探讨基于基因表达谱的途径筛选肿瘤发病相关基因。第三步,该研究运用网络对慢乙肝发病相关基因的蛋白质相互作用进行相关分析。该研究在芯片实验基础上,最后得到的结论是成功筛选到 11 个慢性乙型肝炎异常表达的结点基因,6 个与差异表达基因密切联系的蛋白质。目前国内外研究充分运用了生物信息学工具,初步筛选出了相关
12、基因,为进一步对乙肝病毒的分析,以及从根本上治疗做了很大的基础 9。3.1.2 肝细胞癌发生中肝硬化差异基因在癌症的治疗方面,技术在全球范围内尚未成熟。而每年因癌症致死的病人数量不在少数。肝癌,肝癌在我国肿瘤相关死亡中位居第二位,仅次于胰腺癌。肝硬化是最终形成肝癌的过渡阶段,成熟运用肝硬化的发生机制对于治疗改善肝癌有着重要的作用。寻找肝硬化的发病机制离不开对基因的研究,因此熟练的掌握生物信息学相关知识可以为日后肝癌治疗的进一步研究提供重要的基础。肝癌的发生发展是由一个多基因参与的多步骤、多阶段并受体外因素影响的复杂过程。相关研究同样利用对特意基因和正常基因之间的比对,来寻找根源,首先采用 QI
13、AGEN 的 RNeasy mini kit 提取了肝组织的 RNA,应用 Agilent 2100 Bioanalyzer 检测了肝组织 RNA 的表达,并进一步应用了 Aligent human genome 4x44 microarrays 检测了肝硬化和肝正常对照组间的基因表达,一方面证明了在肝组织中存在大规模的基因表达,另一方面进一步深入地研究了肝组织中基因表达的状况,为肝硬化分子靴标的蹄选,以及肝硬化的早期诊断与肝癌发生分子机制提供了积极的和重要的分子基础。该研究最后通过相关软件对基因芯片表达谱做了分析得出,肝硬化上调蛋白中有 577 个与之匹配的 PPI 对,肝硬化下调蛋白中有
14、539 个与之匹配的 PPI 对。构建的网络属于无标度网络,涉及的核心蛋白有 ATM、ITGB4、KRT18、MDFI、CSF2RB 、DCTNK ING1、LRP1、PDLIM7、VHL 等。这些蛋白质在肝硬化相关蛋白质 PPI 网络中有至关重要的作用。对进一步提取出的核心蛋白质进行生物学功能验证,以及扩大样本量对这些核心蛋白进行验证做了坚实的基础 10。3.2口腔医学相关研究可能有些人认为基因对于牙齿的影响不会很大,反而后天影响会偏多,其实一些关键基因和调控因子在牙齿发育中起着重要作用。赫尔辛基大学创建了牙齿发育数据库,收录了牙组织发育中的基因特征、结构及表达情况等。Hubbard 等初步
15、构建了口腔牙组织的蛋白数据库,为口腔内组织蛋白的鉴定提供了重要的研究范本。Jevnaker 等利用基因芯片技术以整个牙胚作为研究对象,首次构建了小鼠牙胚在不同时期的微小 RNA 表达谱,从基因调控机制上研究了牙齿的生长发育。在口腔医学应用中,利用生物信息学方法比较基因组学和蛋白质组学,能够高效率、高通量地筛选口腔肿瘤,比如说口腔鳞状细胞癌,涎腺腺样囊性癌的相关基因和蛋白,寻找肿瘤的诊断标记和治疗靶点。在现实生活中,牙周炎往往困扰着人们的生活。Steinberg 等使用具有上皮细胞特异性的 DNA 芯片研究了白细胞介素对口腔角质形成细胞 1 的作用,确定了与牙周炎相关的几个基因。Vardar-S
16、engul 等通过 DNA 芯片在 1 次实验中同时分析出了超过 40 000 个基因,得到了类似的结果。 Beikler 等构建了重度慢性牙周炎患者的牙周组织中的一些免疫和炎症基因的表达谱。Covani 等利用生物学实验及生物信息学算法,鉴定出参与或可能参与牙周炎的 61 个基因,其中 5个是主导基因,并完全建立起 2 个主导基因的牙周炎模型 11。3.3胰腺癌相关研究由于胰腺癌有起病隐匿、症状不典型、淋巴结转移早、恶性程度高、进展迅速等特点,临床确诊时多为中、晚期,手术切除率不高,预后差。导致胰腺癌患者预后极差的原因很大程度上与缺乏可靠的早期诊断方法有关。林连捷等应用高分辨率的 SNP 基
17、因芯片和分析软件 CNAG,可以检测全基因组范围内的胰腺癌纯合性缺失,可筛查到很小的缺失位点,这些纯合性缺失区域可能含有新抑癌基因。蒋业贵等对用 cDNA 芯片技术筛选出的一条全长胰腺癌相关新基因进行测序和生物信息学分析,应用 RT-PCR 和 northern blot 方法检测该基因在例胰腺癌和癌旁正常胰腺组织以及种胰腺癌细胞株中的表达情况,RTPCR 检测结果显示新基因在例胰腺癌组织和种胰腺癌细胞株中均有表达,而在癌 旁正常胰腺组织中未见表达,northern blot 分析得到相同的结果,认为新基因与胰腺癌的发生、发展密切相关,可作为胰腺癌诊断和基因治疗的分子靶标 12。4结语生物信息
18、学在医学研究中的应用远不止如此。它以数学和计算的方法,研究数据挖掘和模式识别的算法,或利用临床数据库和基因结构三维建模研究生物医学和进行基因体功能分析,使人们能够从各生物学科众多分散的观测资料中获得对生物学系统和过程运作机制的理解,最终达到自由应用于实践的目的。它已广泛地渗透到医学的各个研究领域中,在疾病相关基因的发现、临床诊断、个体化治疗、新的药物分子靶点的发现、创新药物设计以及基因芯片的设计与数据处理等研究方面将发挥重要作用。大多数疾病是由多基因决定的,人类在疾病的易感性与抗性方面的差别与遗传和环境有关,基因型与疾病表型之间的关系是极其复杂的。不断完善的生物数据与数据库的海量信息在生物科学
19、研究中的作用十分重要,这不仅要求掌握生物相关学科的前沿知识和技术,而且要学会运用生物信息学知识,科学地揭示生命的本质。参考文献1孙啸,陆祖宏,谢建明.生物信息学基础M.北京:清华大学出版社,2010.2 AL Barabasi,N Gulbahce,J Loscalzo.Network medicine: a network-based approach to human diseaseJ. Nature Reviews Genetics . 2011 .3 徐兆华. 基因芯片数据统合分析方法的若干拓展D. 浙江大学 2010 4 刘峰. 基因芯片技术筛选和鉴定结直肠癌腹膜种植转移相关基因D.
20、 南方医科大学 2012 5 王建明. 基于基因表达谱芯片确定前列腺癌致病有关基因及其功能D. 山东大学 2012 .6 贾栋, 贾小云, 马瑞燕 .生物信息学数据库及查询N,山西农业大学学报(自然科学版),2013(06).7 孙红,殷作群,孙妍,等.生物信息学在医药学领域中的应用J.医学信息,2011, 24 ( 9) : 604 - 606.8 陈文聪,胡朝阵,朱庆义.生物信息学的进展及其在分子微生物学研究中的应用J.分子诊断与治疗杂志,2011, 3(3): 207 - 210.9 Sinclair M,Roberts S, Kemp W,et al .Epidemiology of
21、hepatitis b-associated hepatocellular carcinoma in VictoriaJ, Internal medicine,2013.43(5):501-506.10 陈建,肝细胞癌发生中肝硬化差异基因表达谱的生物信息学研究D,基因工程研究所,南方医科大学,广州,2013.11 冉金梅综述 张凌琳 李伟审校,生物信息学在口腔医学研究中的应用J,国际口腔医学杂志 ,2013,40(4).12 天亮,钟宁,周小艳,等胰腺癌蛋白表达谱的生物信息学分析中华肿瘤防治杂志,20106:423-426.13 林大伟,邱伟华.生物信息学在胰腺癌中的应用J,国际消化病杂志,2014,34(1).