1、构象性蛋白质芯片的制造原理 周建军 1,2 、吴才宏 1、丰美福 21 北京大学生命科学学院生物膜与膜生物工程国家重点实验室 (100871) 2 中国科学院动物所生物膜与膜生物工程国家重点实验室(北京,100080) 摘要:本文简单回顾了生物芯片的一般原理和现状,沿着生物文库、阵列的思路线索,着重讨论了构象性蛋白质芯片研制的必要性、可能性和原理线条。认为这种蛋白质芯片是一个崭新的技术方向,将会改观生物学的研究,为疾病的准确快捷诊断奠定基础。 人们在与疾病的抗争中创造了许多杰出的诊断和治疗方法,其中正确及时的诊断是取得正确及时治疗的必要前提和可靠保证。所以在生物医学界,人们总是有一个梦想,用一
2、小片试纸、一小块芯片,从一滴血(体液)里就能得出关于被试者健康状况的必要信息。生物技术与计算机技术的融合使我们逐渐看到了这个希望。DNA 芯片和蛋白质芯片芯片是这方面的最明显的迹象。 背景: 生命科学的信息化是目前自然科学界最明显的趋势。一个例子就是目前已经完成工作草图的人类基因组计划(Human Genome Project,HGP), 最终要搞清人类全部基因组的 30 亿左右碱基对的序列,这将是多达上百万页印刷符号的的巨著(3000w/p)。除了人的遗传信息以外,还有其它生物尤其是模式生物(Model Organism)已经或正在被大规模测序解密,如大肠杆菌,啤酒酵母,美丽隐杆线虫,以及中
3、国和日本科学家攻关的水稻基因组计划。光拿到生物基因组一级结构还远远不够,还必须了解其中基因是怎样组织起来的,又是怎样随发育调控和微环境因素的影响而在特定的时空域中展开其表达谱的,即我们正由结构基因组时代迈入功能基因组时代。随着这些基本的基因组学问题的提出 1,2(后基因组时代,蛋白组学),涌现出许多功能强大的研究方法和研究工具,最突出的就是细胞蛋白质二维凝胶电泳(及相应的质谱法测蛋白分子量)和生物芯片(Biochip)技术 3。它们的应用将提供更为巨量的而且更生动形象的生命活动数据和图景。 生物芯片,简单地说就是根据研究目的的不同,在一块指甲大小的硅或膜片上将生物分子探针以大规模阵列的形式排布
4、,形成可与目的分子相互作用,并行反应的固相表面,通过信号收集,计算机分析数据结果最后即生物学模型建立。目前最成功的且形成一定商业市场的是 DNA 芯片,即将无数预先设计好的寡核苷酸或cDNA 在芯片上做成点阵,与样品中同源核酸分子杂交 4。其实理论上允许几乎所有种类的生物分子作芯片上的探针,比如蛋白、糖、脂类和其它小分子。这种技术的特点是微量化、大规模、并行化和高度自动化处理感兴趣的生物样品,精细地研究组织细胞基因表达情况,了解各种状态下分子结构变异和分子病理过程,并为寻找合适的医药或疫苗,提供了极大的便利。多种高技术的融合最终使 DNA 芯片走出设想,走向实用化,逐渐成为象计算机芯片对于计算
5、机科学家那样对于实验生物学家不可缺少的工具。 基因表达谱是特定组织特定状态在基因组水平基因差异表达。有关 DNA 芯片的文章一经出现就在描述此方面的应用上展示了诱人的魅力 5。其实验结果是表达基因组在发育或病理活动中动态功能信息的,因此理论上,有 10,000 个基因的人类基因组可在一张芯片上、一次杂交反应中观察到其在目的细胞的实际表达状态,包括表达与否,表达丰度,而且两种相关细胞的实验可在同一张片子上同时做出来,便于在最小实验误差情况下比较二者细微差异。这样将具体的分子信息与细胞的生理特征改变联系起来,极有可能以前所未有的速度揭示生命活动过程的精细机制,并成批地进行功能克隆新基因或将“孤儿基
6、因“与确定的生物学功能联系起来;另一方面为临床诊断、预后评价提供全新的标准和模式,为新药设计提示准确的靶分子而且提供快速廉价的分析手段。 蛋白质芯片: 真正研究基因表达谱必然要在两个层次上进行,mRNA 和功能性蛋白质,分别对应于中心法则的两个阶段。DNA 芯片是在 mRNA 层次研究,mRNA 的转录情形却与基因的终末产物蛋白质的翻译情形不见得一致,更不要说复杂的翻译后修饰(糖基化,磷酸化及乙酰化等关系细胞生命活动中快速响应的过程)了,而事实上从最终决定组织细胞生理病理状态的蛋白组却缺乏相应的快速、并行、高度特异的方法,而且一直没有诞生象 PCR 大量扩增核酸一样等价的多肽扩增技术。应用大规
7、模排阵和分子杂交的思想成功地制造出 DNA 芯片,应用类似的思想也可以制造蛋白质芯片(protein chip),联合 DNA 芯片可以完整地检测特定组织细胞基因的表达情况。 然而由于活性蛋白质对构象的高度依赖性,protein chip 一直只是 Biochip中的一个设想。现在 DNA 芯片的研究正如火如荼,利用此高通量手段,研究者可以方便地研究众多的基因在 mRNA 水平上在某种特定情况下的转录变化。但是这方法因不能与最终发挥生物学功能的蛋白质直接关联而显得局限,高密度蛋白质微阵列才是人们真正追求的目标。可喜的是今年 9 月 8 日 Gavin MacBeath and Stuart S
8、chreiber 在 Science 上首先报道了利用蛋白质微阵列研究蛋白质相互作用及与小分子作用的研究 6。蛋白质微阵列象 DNA 微阵列一样制备时精确排列,结果能快速获取进而数据的计算机分析,而且保持蛋白质识别结合的天然性。他们在点样溶液中加入 40甘油以防止蛋白变性。在膜表面覆盖一层与氨基反应的试剂使之通过与蛋白质的氨基末端或赖氨酸残基交联反应而固定于膜上。每个位点中蛋白质都会以多种多样的取向定位于膜上,保证于靶分子结合的有效性。然后用 BSA 进行封闭,降低膜上的背景,这样就可以与蛋白质进行杂交。这几位先锋科学家利用这些简单的手段制成了每平方厘米有 1600 个点的蛋白质微阵列。他们用
9、荧光标记蛋白,ATP标记的激酶底物,都可与膜上的蛋白进行反应。这些都是用小部分的膜进行实验的。最终他们将一个有 1 万个点的芯片与一个 FRB(FKBP12-rapamycin binding protein)结合蛋白和 G 蛋白结合蛋白的探针进行杂交。发现在一大片 G 蛋白点的中央,单独的一个 FRB 的点可以被区别出来。可以想象,等待已久的蛋白质芯片将很快会被商业化开发,进入分子生物学实验室。 另外,抗原抗体反应是目前所知生物识别最特异的类型,基于抗体的免疫测定(最简单如 ELISA)已经使用了许多年,作为一种很有效的诊断工具,在全世界一片 Array 的狂潮中,人们自然会想到将抗体排成阵
10、列。有人这么想,就有人这么做。Carl A.K. Borrebaeck 所在的瑞典 Lund 大学免疫技术系正从事着这方面的工作,期望从这里找到突破 7。 构象性蛋白质芯片: 但是还应该有另一种途径来制造蛋白质芯片,而且更适合于模具的制备和终端产品的大规模生产,特别是更易与计算机技术偶联起来,最终在蛋白质组学研究上代替或淘汰现有的二维凝焦电泳偶联生物质谱的通用方法 5。这就是构象性蛋白质芯片。应该说这种芯片原理与 99 年一篇 Nature 文章提到的模板印记技术特异识别蛋白质的思想相关 8。 Buddy D.Ratner 最近创造的模板印迹的纳米级结构表面技术为将蛋白质特异识别应用于蛋白质芯
11、片制造提供了可能。首先是选择蛋白吸附的固相基质云母,因为云母表面非常之平,达原子级光滑,这样才能保证最后做成的印迹模表面准确地反映模板分子的空间拓扑结构,避免自身表面的起伏噪声对构象依赖的蛋白质识别的影响;且由于其表面天然的亲水性和电负性,有利于保持蛋白构象。将云母劈裂,造成这样一个表面环境,在云母片上根据事先的设计定位和排阵,分别吸附不同的已知蛋白。然后将二糖包被在吸附蛋白表面,因为糖是多羟基物质,可与蛋白质形成氢键,造成一个糖壳,保护蛋白质不在制片过程中变性,使模板分子的结构信息完整保留下来,这样才可能最终以印迹穴的形式体现出来。接下来是等离子体喷镀处理(radio-frequency g
12、low-discharge plasma deposition),向其上喷镀C3F6 之类的多聚氟化物,相互交联并与喷镀表面的有机成分交联,产生一个光滑的而且在化学上和机械上稳定的膜。随着膜厚度的增加,这层喷镀膜将从云母片上剥离下来;等离子体膜-云母界面用碱性溶液洗脱包被的吸附蛋白,暴露出有蛋白印迹的纳米穴表面,一种最恰似的模板蛋白的镜象,其与混合蛋白溶液中配体的识别和结合是高度特异的,即假如我们将 Array 的概念注入到这个技术中,我们可以以此为基础来设计制造出基于构象识别的蛋白质芯片,也就是构象性蛋白质芯片。 当然可以有两种情形的构象性蛋白质芯片的制造途径,一个就是上述的从实际蛋白质(天
13、然蛋白和基因工程蛋白)出发的表面印记法;另一种可能看起来更吸引人,就是基于 PDB 数据库中蛋白质三维构象的芯片表面蚀刻微处理技术,整个蛋白质的在芯片(云母)光滑表面的加工过程不涉及生物分子的参与,完全是把数据库中的蛋白质的结构信息化为计算机精密控制的纳米“雕琢“过程。后者的优越之处在于,除了实现实在的已经获得蛋白质结构的蛋白在芯片上的印记,还可以引入人为的结构印记(信息),就象寡核苷酸设计和基因工程对核酸序列一级结构成功的改造一样,基于构象的表面蚀刻技术造就的构象性蛋白质芯片完全能够实现在高级结构上人工改造,这尤其在探索蛋白质的折叠、蛋白质的动态行为上有着莫大的优势。因此构象性蛋白质芯片将在
14、另一个层面上融合纳米技术、半导体技术、计算机技术和分子生物学技术。 结果的检测可有几种考虑。首先是原子力显微镜(atomaticforce microscopy,AFM)表面扫描技术实现,采用触击模式(tapping-mode)的 AFM 使其针尖在印迹表面移动,在它的分辨率内(原子级)可以直接绘出印迹膜的表面信息,从而了解目的蛋白与印迹穴的精确结合信息,作为定性定量获得蛋白表达情况的基础。也可以应用灵敏的荧光染色。以 Biocore 为代表的生物传感技术也可以用来感知蛋白质芯片上特定“穴位“(位点)于样品混合物中目标蛋白的结合细节,而且可以实现实时监控。 表面增强激光解吸附/离子化技术(su
15、rface enhanced laser desorption/ionisation,SELDI) 也许是最有前途的一项技术 9,10,在美国加州Palo Alto 的 Ciphergen Biosystems, Inc.已开始使用它于自己开发的ProteinChip? array system。这个过程的第一步是从样品池中特异性捕捉目标蛋白,然后是简单的洗涤以去除非特异性吸附的蛋白,然后就是可以将保留到靶点的特异性蛋白解吸附下来,借助于 SELDI 生物质谱测的蛋白分子片断的分子量最终断定解吸附蛋白的化学性质。 总之最终我们可以用这样一张膜或片子来并行检测任意组织细胞的任意基因表达产物,包括
16、在不同情况下释放在培养上清中的细胞因子谱。我们还可以将它应用在临床检验中,真正实现用一小片试纸、一小块芯片,从一滴血(体液)里判断患者者疾病状况的梦想。 结语: 在现代生命科学研究中,有两个概念其实是居于底层,极端重要而又少为人提,孵化出一批又一批的经典生物学技术。第一个是“库“的概念,第二个则是如何把库有序化,这就是“阵列“(数学上矩阵)的概念。现在很难想象如果没有文库(无论是基因组文库,cDNA 文库,还是产生新一代抗体工程的抗体库),现代生物学会是个什么状况;同样,实现了“库“的有序化、微型化、可方便检测的 Array 又是怎样引起了或将要引起整个生物界的震撼甚至进而整个社会面貌的改观。
17、 DNA 芯片已经造就了 Affymetrix、Incyte 等新崛起的巨型生物高科技公司,蛋白质芯片也在造就象 Ciphergen Biosystems 这样的新型企业。每一项技术的突破不仅会给基础研究带来莫大的进展,而且在 21 世纪的现代会立刻诞生难以估量的产业。构象性蛋白质芯片要最终产品化、实用化,需要联合几种跨学科的尖端技术,具体技术问题还要一步步落实和整合,这里仅初步给出了在设计上的一般性原理。构象性蛋白质芯片是一项完全崭新的设计和技术方向,相信经过今后的努力,它会在生命科学的研究中发挥重大的作用。 参考文献: 1 Aris Persidis.1998.Nature Biotech
18、nology.16:393-394. 2 Proteomics in drug discovery Jack H. Wang and Rodney M. Hewick Drug Discovery Today March 1, 1999;4(3):129-133 3 Andrew R.,et,al.1998. Nature Biotechnology.16:520-521. 4 Aris Persidis.1998.Nature Biotechnology.16:981-983. 5 Schena M. et al. Science.1995,270:467-470. 6 MacBeath,
19、G. & Schreiber, S. L. Printing proteins as microarrays for high-throughput function determination. Science 289, 1760-1763 (2000)。 7 Carl A.K. Borrebaeck Antibodies in diagnostics - from immunoassays to protein chips IMMUNOLOGY TODAY Vo l .2 1 N o.8 3 7 9-382。 8 Buddy D.Ratner,et al.Template-imprinti
20、ng nanostructured surfaces for protein recognition. Nature 1999,398:593-597. 9 Gerald Walter, Konrad Bssow , Dolores Cahill , Angelika Lueking and Hans Lehrach, Protein arrays for gene expression and molecular interaction screening,Current Opinion in Microbiology 2000, 3:298-302。 10 Kathryn Senior,Fingerprinting disease with protein chip arrays, MOLECULAR MEDICINE TODAY, AUGUST 1999 (VOL. 5),326-327。