1、1第十一章 RNA 的生物合成(转录)转录(transcription):以 DNA 为模板合成 RNA 的过程。转录和复制过程都是酶促核苷酸聚合过程,有许多相似之处。转录与复制的异同点相同点:都以 DNA 为模板;都以核苷酸为原料,合成方向是 53,核苷酸之间以磷酸二酯键相连;服从碱基配对原则;都需依赖 DNA 的聚合酶,产物是很长的多核苷酸链。不同点:复制的原料是 4 种 dNTP,而转录的原料是 4 种 NTP,即ATP、GTP、CTP、UTP;复制过程中碱基配对关系是 A-T、G-C,而转录过程中碱基配对关系是 A-U、G-C;在复制过程中催化聚合反应的酶是 DNA 聚合酶,而在转录过
2、程中催化聚合反应的酶是 RNA 聚合酶(RNA-pol ymerase); 产物不同:在复制时,DNA分子的两条多核苷酸链都能作为模板,产物是与模板等长的整体分子,带有基因组的全套遗传信息而转录一种 RNA 分子时只利用 DNA 分子中的一条链为模板,而且只是从一个基因或一个操纵子转录,转录模板上的位置和数量随细胞的生活状态而改变,因此,不同时间里产物的数量、性质和大小都不相同。DNA 复制需要引物,而转录成 RNA 不需要引物。1.转录模板:储存 RNA 和蛋白质肽链序列信息的结构基因与指导转录起始部位的序列(启动子)和转录终止的序列(终止子)共同组成转录单位(transcription u
3、nit) 。在原核生物中,一个转录单位(操纵子)中可以有一个、几个或十几个结构基因。真核生物的一个转录单位是一个基因,由一个结构基因和相应的顺式调控元件组成。一个转录单位只有一个结构基因。2.RNA 聚合酶(RNA-pol):原核生物的 RNA 聚合酶:原核生物细胞中只有 1 种 RNA-pol,它兼有合成mRNA, tRNA 和 rRNA 的功能。目前了解最清楚的是大肠杆菌 RNA 聚合酶,该酶是五聚体,全酶是 2 , 组成。其中 因子没有催化活性,但能识别并结合于启动子,是细菌基因的转录起始因子。 亚基二聚体的结合位点处于启动子上游的调节序列,它和转录频率(即启动子的强弱)直接相关。 ,
4、亚基主要结合于 DNA 的模板链,是酶与模板结合时的主要部位。 亚基能与底物 NTP 结合,并催化形成磷酸二酯键。原核生物 RNApol 都受一种抗生素的抑制。真核生物的 RNA 聚合酶有三型,分别称为 RNA 聚合酶(A ) 、(B )和(C) ,这三型 RNA 聚合酶因识别不同的启动子而分别负责转录不同的基因。RNA 聚合酶定位在核仁,转录产物是 45S-rRNA,经剪接修饰生成除 5S-rRNA 外的各种rRNA(5.8S、18S 、28SrRNA) ;RNA 聚合酶定位在核浆,主要转录编码生成 hnRNA和 mRNA;RNA 聚合酶 定位在核浆,其转录产物都是小分子量的2RNA(tRN
5、A 、 snRNA、5S-rRNA) 。鹅膏素碱是真核生物 RNA 聚和酶的特异性的抑制剂,三种 RNApol 对其反映不同。原核生物转录过程:转录过程分为起始、延长和终止三个阶段。1、起始阶段 RNA 聚合酶全酶中的 因子(factor)识别基因或操纵子中的启动子,并与之结合形成复合物,使局部 DNA 发生构象改变,结构变得较为松散,特别是在与核心酶结合的 TATA 盒附近,双链暂时打开约 17 个碱基对,展示出 DNA 模板链,有利于 RNA 聚合酶进入转录泡(transcription bubble),催化 RNA 的聚合。转录的起始不需要引物,两个相邻的模板配对的核苷酸,直接在起点上被
6、 RNA 聚合酶催化形成磷酸二酯键。其第一核苷酸多为 GTP 或 ATP,即 5- 端为 pppG 或 pppA,以 pppG 更常见。第二个核苷酸有游离的 3-OH,可以继续加入 NTP,使 RNA 链延长下去。当几个核苷酸加入后, 因子应从全酶解离出来,至此完成了转录起始阶段。RNA 聚合酶全酶-DNA -pppGpN, -OH 结构在转录起始阶段至关重要,故被称为转录的起始复合物。2、延长阶段 当第一个磷酸二脂键形成后,全酶释放 因子, 剩余 4 个亚基称为核心酶(core enzyme) ,核心酶沿模板链的 35方向滑行,一面使双股 DNA 解链,一面催化 NTP 按模板链互补的核苷酸
7、序列逐个连接,使 RNA 按 53方向不断延伸。转录生成的 RNA 暂时与 DNA 模板链形成 DNA-RNA 杂交体,杂交钵中的 DNA与 RNA 之间结合不紧密,当 RNA 链的长度超过 12 个碱基时,RNA 的 3端仍与 DNA形成杂交体,但 RNA 的 5端很容易脱离 DNA 模板链,于是被转录过的 DNA 区段又重新形成双螺旋。mRNA 延长的速度大约为每秒 45 个核苷酸,rRNA 合成速度约为mRNA 的 2 倍。3、终止阶段 在 RNA 延长过程中,当 RNA 聚合酶行进到模板的终止子部位时,由于终止子中有 GC 富集区组成的反向重复序列,转录生成的 RNA 可形成发夹结构(
8、hairpin),这种结构可以影响 RNA 聚合酶的行进,使 RNA 聚合作用停止。在终止阶段,新合成的 RNA 链首先从 DNA 模板上解离出来,继而与核心酶分离,核心酶与双链DNA 解离。此时 因子又能与核心酶聚合,开始另一次转录过程。有一些 RNA 转录终止阶段依赖于 因子。当 RNA 聚合酶移动至终止子部位时, 因子与其结合,并发挥 ATP 酶和解链酶活性,使 RNA 与 DNA 分离,转录过程终止。真核生物:转录过程也分为起始、延长和终止三个阶段。转录起始和终止较原核生物更为复杂。RNA 聚合酶有三型,各自催化合成不同的 RNA,所催化的转录起始和终止阶段又各有特点,对转录起始阶段了
9、解较多,而对终止阶段知之甚少。1、起始阶段 真核生物转录起始时必须有一些蛋白质因子参与,这些因子称为转录因子(transcription factors) 。RNA 聚合酶、的转录起始过程各不相同,所需转录因子也不一样。RNA 聚合酶的转录起始,RNA 聚合酶的转录产物是 mRNA 前体。RNA 聚合酶的转录因子有 TFA、TFB、TFD、TFE、TFF、TFH、TFJ 等多种,因为3它们是所有 RNA 聚合酶转录所必需,故属于通用转录因子(或普遍转录因子) 。TFD由 1 个 TATA 盒结合蛋白(TBP)和多个 TBP 结合因子(TAF)组成。TFF 由两个亚基构成,大亚基有解链酶活性,小
10、亚基与细菌 因子有同源性。TFB 有解链酶、ATP 酶和蛋白激酶活性,它能使 RNA 聚合酶最大亚基的羧基端功能域(CTD)磷酸化。RNA 聚合酶转录起始时,TFD 先与 TATA 盒结合,然后 TFA 以及 TFB 识别并结合于 TFD,随后,RNA 聚合酶在 TFF 的辅助下与 TFB 结合。RNA 聚合酶就位后,转录因子 TFE、TFH、及 TFJ 加入,形成起始复合物并开始转录。RNA 聚合酶的转录起始:RNA 聚合酶转录的产物是 rRNA。人 rRNA 基因的启动子包括核心启动子和上游调控元件(UCE)两部分,前者转录起始的效率很低,后者能增强转录的起始,两部分序列都富有 GC 碱基
11、对。RNA 聚合酶的转录因子有上游结合因子(upstream binding factor,UBF1)和选择因子 1(selectivity factor1, SL1) 。SL 1由 4 个亚基组成,其中 1 个是 TBP,另 3 个是 TBP 结合因子。RNA 聚合酶转录起始先由 UBF1与核心启动子及 UCE 中的 GC 丰富序列结合,使这两部分靠拢,然后 SL1加入并与 UBF1结合,组成转录起始前复合物,随后RNA 聚合酶和 SL1中的 TBP 结合形成起始复合物并起始转录。RNA 聚合酶的转录起始:RNA 聚合酶的转录产物是 tRNA 和 5S rRNA。 tRNA 基因的启动子包括
12、 A 盒和 B 盒两部分,分别位于+10+20 和+50+60 的区域。转录起始时,先由转录因子C(TFC)识别并结合 B 盒,同时延伸到 A 盒,随后转录因子B 结合在转录起始点周围,RNA 聚合酶就位,形成起始复合物并起始转录。2、延长阶段 真生物基因转录延长的机制与原核生物基本一致。当转录起始复合物形成后,在位的 RNA 聚合酶即开始依碱基配对关系,按模板链的碱基序列,从53方向逐个加入核糖核苷酸。3、终止阶段 真核生物转录终止的机制尚知之甚少。 RNA 聚合酶转录出 rRNA前体 3末端后,继续向下游转录超过 1000 个碱基,此处有一个 18bp 的终止序列,在辅助因子的辅助下转录终
13、止。内切核酸酶再切割产生 rRNA 前体的 3末端。RNA 聚合酶转录模板的下游存在一个终止子,该终止子是位于 GC 丰富序列之中的 TTTT(编码链) 。RNA 聚合酶有内源性的转录终止功能,能识别终止子,使转录终止。终止位点一般在第二个 T,但也可能在第三或第四个 T,因此 RNA 聚合酶催化合成的 RNA 前体 3端有 U 序列。真核生物 mRNA3端有多聚腺苷酸(polyA)尾巴,这是转录后才加进去的,因为在模板链上没有相应的 polyT 序列。在结构基因最后一个外显示子的 3端,常有一组共同序列 AATAAA,其下游还有相当多的 GT 序列。这些序列称为转录修饰点。当 RNA 聚合酶
14、转录出 AAUAAA 后,聚腺苷酸特异因子(CPSF)能识别它并与它结合。在 CPSF 以及切割活化因子(CstF)等因子的指导下,特异的内切核酸酶在 AAUAAA 下游 11-30 核苷酸处切断 RNA 链,mRNA 前体(hnRNA )的转录即告终止。真核生物转录产物的加工41.mRNA 前体的加工 真核生物 mRNA 的加工包括 5端加帽、3端加poly(A)尾、剪接以及编辑等。5端帽子结构的形成:mRNA 前体的 5端为 pppNp-,在成熟过程中,经磷酸酶催化水解,释放出 Pi ,成为 ppNp-,然后在鸟苷酸转移酶催化下,与另一分子三磷酸鸟苷反应,末端成为 GpppNp-。继而在甲
15、基转移酶催化下,由腺苷蛋氨酸(SAM)供给甲基,首先在鸟嘌呤的 N-7 上甲基化,然后在连于鸟苷酸的第一个(或第二个)核苷酸2, -OH 上进行甲基化,最后成为 m7GpppmNp-,这就是 mRNA 5末端的帽子结构。连于鸟苷酸的第一个核苷酸 2, -OH 被甲基化,称为型帽子结构,若第二个核苷酸 2, -OH 也被甲基化则称为型帽了结构。帽子结构的加入是在细胞核内完成,而且是在RNA 链开始合成后即被加入。3端多聚腺苷酸的加入:mRNA 3端的 poly(A )尾是在细胞核内形成的,而且是与转录的终止同时进行的。当转录中的 mRNA 前体在 AAUAAA 下游 11-30 个核苷酸处被特异
16、内切核酸酶切断后,随后在 poly(A)聚合酶的催化下,以 ATP 为底物,发生聚合反应形成 3末端 poly(A)尾。一般真核生物在细胞质中出现的 mRNA 其poly(A)长度在 100200 个核苷酸之间。也有少数例外,如组蛋白基因的转录产物,无论是初级的或成熟的都没有 poly(A)尾。mRNA 前体的剪接:真核生物的结构基因转录时,内含子和外显子一同被转录,形成前体 RNA,前体 RNA 需要经过剪接(splicing)加工,以除去内含子序列,并将外显子序列连接成为成熟的有功能的 mRNA 分子。内含子按基因类型可分为四类,第 I 类内含子主要存在于线粒体叶绿体及某些低等真核生物的
17、RNA,第 II 类发现于线粒体,叶绿体,但转录产物是 mRNA;第 III 类为套结后剪接的内涵子,大多数的 mRNA 有此类内含子;第 IV 类是 tRNA 的基因及初级转录产物中的内含子。切除和外显子的连接偶联进行,整个剪接过程分 2 个阶段进行。第一阶段为剪接体( spliceosome)的形成:从低等到高等真核生物内含子都是以 GU 开始,以 AG 结束,整个分子中含有 3 个保守序列:内含子 5端起始序列:由 GUAAGU 组成,称为“5端剪接点” ;内含子 3端末尾序列:由(Py)nNPyAG 组成,Py 指嘧啶,n 大约为 10 个,N 为任意碱基,称为“3端剪接点” ;在 3
18、端上游 18-40 个核苷酸处也有一个保守序列,称为“分支点” ,在酵母细胞是由 UACUAAC 组成,保守性极强,哺乳动物分支点序列保守性极差。在mRNA 剪接过程中至少有 5 种细胞核小 RNA(U 1、U 2、 U4、U 5 和 U6 snRNA)参与。这些 sn RNA 分别与特异蛋白质结合成细胞核小分子核糖核蛋白颗粒(snRNP) ,参与 mRNA 前体的剪接过程。在剪接体形成时,首先由 U1snRNP 识别并结合于 5端剪接点,U2snRNP 识别并结合于分支点,形成一个复合体,然后 U4、U 6 和 U5snRNP 聚合体加入其中,形成剪接体。剪接体经过结构调整,先后发生 U1s
19、nRNP 释放、U 5snRNP 移位及U4snRNP 释放,最终 U2 和 U6snRNP 形成催化中心,催化磷酸酯键转移反应。第二阶段磷酯键转移反应:在剪接体上进行的剪接作用,既无水解反应,又无磷酸二酯键数目的改变,它们实质上是两次转酯反应。首先是内含子分支点中 A 的 2, -OH 亲核攻击内含5子 5端与外显子交界处,内含子 5端的 G 与分支点 A 的 2, -OH 形成 2, ,5-磷酸二酯键的转酯化合物(称套索 RNA 结构) 。第二步是外显子的 3-OH 亲核攻击内含子的3端与另一外显子的交界处,内含子套索 RNA 结构被游离,两个外显子以 3,5-磷酸二酯键相连。化学修饰:真
20、核生物 mRNA,除在 5端帽子结构中有 13 个甲基化核苷酸外,分子内部尚含有 1-2 个 m6A,它们都是在 mRNA 前体的剪接之前,由特异甲基化酶催化修饰后产生的。RNA 的编辑:RNA 编辑(RNA editing)是通过隐蔽基因(cryptogene)转录产生的 mRNA 中的外显子加工,使遗传信息在 mRNA 水平上发生改变。隐蔽基因的编码序列与 mRNA 的相应序列有差异,转录产物上需插入、删除或取代一些核苷酸才能生成有翻译功能的 mRNA 分子。2、tRNA 前体的加工 真核生物 tRNA 前体的加工包括剪接去除内含子、剪切 5端先导序列、添加或修复 3端 CCA 以及碱基化
21、学修饰等。tRNA 前体的剪接:真核生物多数 tRNA 前体分子内含有内含子,也需通过剪接作用才能变成成熟 tRNA。tRNA 前体的剪切作用与 mRNA 不同,是在两种不同酶的完成的,即先由内切核酸酶催化进行剪切反应再由连接酶将外显子连接起来。RNA 连接酶催化的连接反应也要消耗 ATP。添加或修复 3端 CCA 序列:与原核细胞一样,真核细胞 tRNA 前体在 tRNA 核苷酰基转移酶催化下,将 3端除去两个 U 后,换上 tRNA 分子中统一的-CCA-OH 末端,形成柄部结构。稀有碱基的生成:真核生物 tRNA 前体的加工也存在着化学修饰反应,如通过甲基化反应使某些嘌呤生成甲基嘌呤;通
22、过还原反应使某些尿嘧啶还原为双氢尿嘧啶(DHU) ;通过核苷内的转位反应使尿嘧啶转变为假尿嘧啶核苷() ,通过脱氨反应使腺苷成次黄嘌呤核苷酸。3、rRNA 前体的加工 真核生物的 rRNA 基因属于丰富基因(redundant gene)族的DNA 序列,即染色体上一些相似或完全一样的纵列串联基因单位的重复。这些单位由不能转录的间隔区(与内含子不同)把可转录片段分隔组成。rRNA 前体的加工主要是前体的剪接和化学修饰。rRNA 前体的剪接:rRNA 前体在核仁中合成并被加工为成熟 rRNA,这些成熟rRNA 与核糖核蛋白形成核糖体,再运到胞质。rRNA 前体的剪接是经过“自我剪接”(self-
23、splicing)机制进行的:首先,由鸟苷酸的 3-OH 攻击剪接部位的磷酸二酯键,发生转酯反应,下游外显子与内含子相连。随后,上游外显子的 3-OH 向下游外显子与内含子的 3剪接点攻击,发生磷酸转移反应。结果上游外显子与下游外显子相连接,成为成熟的 rRNA。这种剪接不需要任何蛋白质参与,说明 RNA 本身就有酶活性,因此把有酶活性的 RNA 称为核酶(ribozyme ) 。这种方式的剪接反应不仅限于细胞核,也见于线粒体,如酵母线粒体 rRNA 内含子的剪接等。6化学修饰:rRNA 前体加工的另一种主要形式是化学修饰,主要是甲基化反应。甲基化主要发生在核糖的 2, -OH。甲基化的位置在脊椎动物中是高度保守的。此外,rRNA 前体中的一些尿嘧啶核苷酸通过异构作用可转变为假尿嘧啶。5S rRNA 转录产物无需加工就从核质转移到核仁,与 28S rRNA、5.8S rRNA 以及多种蛋白质分子一起组装成为核糖体大亚基后,再转移到胞质。思考题:复制和转录过程有什么相似之处?又各有什么特点?