1、lncRNA 的研究背景及其与疾病的关系长链非编码 RNA(lncRNA)是一类转录本长度超过 200nt 的 RNA 分子,它们并不编码蛋白,而是以 RNA 的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。lncRNA 起初被认为是基因组转录的“噪音”,是 RNA 聚合酶 II 转录的副产物,不具有生物学功能。然而,近年来的研究表明,lncRNA 参与了 X 染色 体沉默,基因组印记以及染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,lncRNA 的这些调控作用也开始引起人们广泛的关注。哺乳动物 基因组序列中 4%9%的序列产生的转录本是 lnc
2、RNA(相应的蛋白编码 RNA 的比例是 1%),虽然近年来关于 lncRNA 的研究进展迅猛,但是绝大部分的 lncRNA的功能仍然是不清楚的。生物学功能许多 lncRNA 都具有保守的二级结构,剪切形式以及亚细胞定位,这种保守性和特异性表明它们是具有功能的。但 lncRNA 的功能相对于 microRNA 和蛋白质的功能来说更加难以确定,因为目前并不能仅根据序列或者结构来推测它们的功能。根据它们在基因组上相对于蛋白编码基因的位置,可以将其分为(1) sense, (2) antisense, (3) bidirectional, (4) intronic, (5) intergenic这
3、5 种类型。这种位置关系对于推测 lncRNA 的功能有很大帮助。图 1. 根据 lncRNA 在基因组上的位置,可将其分为 5 种类型:1. sense, 2. antisense, 3. bidirectional, 4. intronic, 5. intergenic。图中编码 RNA和非编码 RNA 外显子分别用蓝色和红色表示。近年来通过对已发现的 lncRNA 的研究表明,lncRNA 能够在多种层面调控基因的表达水平,其调控机制开始为人们所揭示(图 2)。图 2. lncRNA 的作用机制。根据今年来所发现的 lncRNA 的作用机制,lncRNA主要可能具有以下几个方面的功能:1
4、)通过在蛋白编码基因上游启动子区 (桔)发生转录,干扰下游基因(蓝)的表达(如酵母中的 SER3 基因)。2)通过抑制 RNA 聚合酶 II 或者介导染色质重构以及组蛋白修饰,影响下游基因 (蓝)表达(如小鼠中的 p15AS)。3)通过与蛋白编码基因的转录本形成互补双链(紫),进而干扰 mRNA 的剪切,从而产生不同的剪切形式。4)通过与 蛋白编码基因的转录本形成互补双链(紫),进一步在 Dicer 酶作用下产生内源性的 siRNA,调控基因的表达水平。5)通过结合到特定蛋白质 上,lncRNA 转录本(绿)能够调节相应蛋白的活性。6)作为结构组分与蛋白质形成核酸蛋白质复合体。7)通过结合到特
5、定蛋白上,改变该蛋白的胞质定 位。8)作为小分子 RNA,如 miRNA,piRNA 的前体分子转录(Jeremy E. Wilusz et al, 2009, Genes Dev.)。一般来说,lncRNA 主要从以下三种层面实现对基因表达的调控:1. 表观遗传学调控lncRNA 招募染色质重构复合体到特定位点进而介导相关基因的表达沉默。例如来源于 HOXC 基因座的 lncRNA HOTAIR,它能够招募染色质重构复合体 PRC2并将其定位到 HOXD 位点,进而诱导 HOXD 位点的表观遗传学沉默。同样,Xist,Air,Kcnq1ot1 这些 lncRNA 都能够通过招募相应的重构复合
6、体,利用其中的甲基转移酶如 Ezh2 或者 G9a 等实现表观遗传学沉 默。2. 转录调控lncRNA 能够通过多种机制在转录水平实现对基因表达的沉默,表现在如下几个方面:lncRNA 的转录能够干扰临近基因的表达。例如在酵母中,SER3 基因会受到其上游 lncRNA SRG1 的转录的干扰;lncRNA 能够通过封阻启动子区域来干扰基因的表达。例如,DHFR 上游的一个 lncRNA 能够和 DHFR 的启动子区域形成 RNA-DNA3 螺旋结构,进而抑制转录因子 TFIID 的结合,从而抑制 DHFR 的基因表达;lncRNA 能够与 RNA 结合蛋白作用,并将其定位到基因启 动子区从而
7、调控基因的表达。例如,CCND1 启动子上游一个 lncRNA 能够调节 RNA 结合蛋白TLS 的活性,进而调控 CCND1 的表达;lncRNA 能 够调节转录因子的活性,里例如 lncRNA Evf2 能够与转录因子 Dlx2 形成转录复合体从而激活 Dlx6 的表达;lncRNA 也能够通过调节基本转录因子来实现调控基因的表达。例如,Alu RNA能够通过抑制 RNA 聚合酶 II 来实现广谱的基因抑制。3. 转录后调控lncRNA 能够在转录后水平通过与 mNRA 形成双链的形式调控基因的表达。例如,Zeb2 antisense RNA 能够和 Zeb2 mRNA 内含子 5剪切位点
8、区域形成双链,从而抑制该内含子的剪切。而该区域含有对于 Zeb2 蛋白表达所必须的核糖体结合位点,Zeb2 antisense RNA 通过这种方式,能够提高 Zeb2 蛋白的表达量。LncRNA 与疾病大量的研究表明,在肿瘤细胞中,某些特定的 lncRNA 的表达水平会发生改变。这种表达水平的变化能够作为癌症诊断的标志物(有时是非常灵敏的诊断标志物,如前列腺癌中的 DD3,表 1)和潜在的药物靶点(图 3)。图 3 近来在对阿兹海默症的研究中找到的一个 lncRNA,BACE1AS,它编码 分泌酶基因的反义链 RNA。 分泌酶能够产生 淀 粉样蛋白,后者的累积是阿兹海默症的主要诱因。作为 B
9、ACE1 反义链的 BACE1AS 能够在各种外界压力刺激条件下,增加 BACE1 mRNA 的稳定性(通过防止 BACE1 受到核酸酶降解的方式),从而导致更多的 淀粉样蛋白累积,并促进 BACE1AS 的表达,这个正反馈循环将会加速阿 兹海默症的发展。但是,当使用了特异性针对 BACE1AS 的 siRNA 降低 BACE1AS 的表达水平后, 淀粉样蛋白的表达水平也同时下降了,这表明 BACE1AS 是一个非常理想的治疗阿兹海默症的药物靶点(Mohammad Ali Faghihi, et al. 2008. Nature Medicine)。表 1. 与疾病相关的一些 lncRNA(K
10、annanganattu V. Prasanth, et al. 2007. Genes Dev.)LncRNAs 疾病类型 Disease/disorder 参考文献与癌症相关的 lncRNABC1 多种癌组织中均发生上调 Chen et al. 1997a; Iacoangeli et al. 2004BCMS B 细胞瘤 Wolf et al. 2001DD3 前列腺癌 Bussemakers et al. 1999H19 肝癌和乳腺癌 Looijenga et al. 1997; Lottin et al. 2002HIS-1 骨髓性白血病 Askew et al. 1994HOST2
11、 卵巢癌 Rangel et al. 2003MALAT-1 非小细胞肺癌,肝癌等 Ji et al. 2003; Lin et al. 2006; Yamada eta al. 2006NC612 前列腺癌 A.P. Silva et al. 2003OCC1 结肠癌 Pibouin et al. 2002PCGEM1 前列腺癌 Srikantan et al. 2000SRA 乳腺癌 Lanz et al. 1999与神经系统疾病相关的 lncRNABC200 阿兹海默症 Lukiw et al. 1992DISC2 精神分裂症 Millar et al. 2000, 2004; Blac
12、kwood et al. 2001IPW Prader-Willi 综合症 Wevrick et al. 1994PSZA11q14精神分裂症 Polesskaya et al. 2003RAY1/ST7 自闭症 Vincent et al. 2002ZNF127AS Prader-Willi 综合症 Jong et al. 1999与其它类型疾病相关的 lncRNA22k48 DiGeorge 综合症 Pizzuti et al. 1999COPG2IT1 Russell-Silver 综合症 Yamasaki et al. 2000DGCR5 DiGeorge 综合症 Sutherland
13、 et al. 1996H19 Beckwith-Wiedemann 综合症 Sparago et al. 2004LIT1 Beckwith-Wiedemann 综合症 Niemitz et al. 2004MESTIT 1 Russell-Silver 综合症 T. Li et al. 2002; Nakabayashi et al. 2002; Sonkoly et al. 2005展望相对于蛋白编码序列以及小分子 RNA,lncRNA 的研究还仅仅只是处于起步阶段,其功能与调控机制仍有待进一步阐明。目前研究成果所展现出的 lncRNA繁多的分子生物学功能,如调节转录模式,调控蛋白活性,改变 RNA 的剪切模式等等,为人们提出了一个从未涉足的调控领域。当下 lncRNA 的主要研究方向仍然是通过原位杂交技术,过表达技术,siRNA介导的基因沉默技术来发现更多新的 lncRNA,为目前的调控模式提供更 多的支持和完善。这种传统的手段固然精确,然而却缺乏效率,随着更多高通量筛查技术的发展,如 Microarray 芯片杂交技术,新一代高通量测序技术, 结合生物信息学的预测工具,人们将能够更快更有效率的发现那些具有重要调控功能的 lncRNA。