1、1第 十 一 章 RNA 的 生 物 合 成 转 录转录 以 DNA 为模板,在 RNA 聚合酶(RNA polymerase)的作用下合成 mRNA,将遗传信息从 DNA 分子上转移到 mRNA 分子上,这一过程称为转录( transcription) 。但从广义上讲,转移 RNA(tRNA)和核糖体 RNA(rRNA)等的生物合成过程也是转录。转录是基因表达的第一步,也是关键的一步,因为生物体是否转录某个基因是受到严格调控的。起始位点 转录起始于 DNA 模板上的特定部位,该部位称为转录起始位点(start point) ,而终止于模板上的特殊顺序,称之为终止子(terminator)或终
2、止位点(termination site) 。为了叙述的方便,习惯上以编码链为准,将转录起始位点的 5-端称为上游(upstream) ,3-端称为下游(downstream) 。将转录起始位点标记为+1 ,那么,上游以负数表示,如-10、-35 等,下游则以正数表示,如 +50、+100 等。启动子 能够被 RNA 聚合酶识别并与之结合,从而调控基因的转录与否及转录强度的一段大小为 20200bp 的 DNA 序列,称之为启动子(promoter) 。目前已知的全部原核生物基因及绝大部分真核生物基因的启动子位于转录起始位点的上游序列中,只有真核生物RNA 聚合酶 III 的启动子位于转录起始
3、位点的下游序列中。转录单位 从启动子到终止子之间的 DNA 片段,称为一个转录单位(transcription unit),或者更确切地说,被转录成单个 RNA 分子的一段 DNA 序列,称为一个转录单位。图 11-1 转录单位的结构示意图基因 基因的本义是指负责编码一条多肽链的 DNA 片段。后来发现,有的基因只转录成 RNA(如 tRNA 或 rRNA)而不编码多肽链,所以,基因的确切定义应是:被转录成RNA 的 DNA 片段。将负责编码蛋白质多肽链的 DNA 片段称为结构基因( structural gene) 。2一个转录单位可以是单个基因单顺反子(monocistron) ,也可以是
4、多个基因多顺反子(polycistron ) 。尽管原核生物和真核生物在基因结构、RNA 聚合酶等方面存在很大差异,但二者仍然具有许多共同特点。因此,本章首先介绍转录的共同特点,然后分别介绍原核生物和真核生物的转录过程及各自的特点。第一节 转录的特点 以 DNA 为 模板酶促合成 RNA细胞内参与 RNA 的生物合成过程过程的酶是 RNA 聚合酶(RNA polymerase) 。RNA聚合酶几乎存在于一切细胞中,每个大肠杆菌细胞中大约有 3 000 个分子的 RNA 聚合酶。此酶必须以双链 DNA 中的一条链(或单链 DNA)为模板,按照 A 与 U(或 T 与 A) 、G与 C 配对的原则
5、,将 4 种核糖核苷酸( NTP)以 3,5-磷酸二酯键的方式聚合起来,催化合成与模板互补的 RNA。作为模板的 DNA 既可以是双链,又可以是单链。当 DNA 是双链时,双螺旋 DNA 一小段解链,RNA 聚合酶用单链 DNA 做模板合成 RNA 并迅速脱离 DNA 模板,两个分开的DNA 链又重新结合在一起,不能分离出 DNA-RNA 杂交双链;而单链 DNA 作为模板时,其转录产物则是一条与 DNA 链互补的 RNA 链,这时可以分离获得 DNA-RNA 的杂交双链。DNA 双链中只有一条 链被 转录成 RNA大多数生物的基因是双链 DNA,那么,在转录的过程中是每一条链都作为 RNA
6、的模板,转录生成两条互补的 RNA 产物。模板链 在 DNA 双链中,负责转录合成 RNA 的 DNA 链叫模板链( template strand) ,另一条链叫编码链(coding strand ) 。模板链与编码链互补,模板链转录合成的 RNA 的碱基顺序与编码链的碱基顺序完全一致,只是其中的 T 被 U 取代而已。但应注意,DNA 分子上的编码链和模板链是相对的,如某个基因以这条链为模板链,而另一个基因则可能在该 DNA分子的其他部位以另一条链为模板链。转录 的方向 为 53RNA 链生长的方向为 53,新掺入的核苷酸都在 3-末端发现,而 PPP 基团则在RNA 链的起始核苷酸上发现
7、。用代谢抑制剂 3-脱氧腺苷证明了这一点。3第二节 原核生物基因的转录原核生物基因的转录过程已基本研究清楚,共包括模板的识别,转录起始、延伸、终止等 4 个步骤。一、原核生物 RNA 聚合酶催化 RNA 合成的酶称为 RNA 聚合酶。在大肠杆菌中只发现有一种,其活性型称全酶。全酶 含有 4 种不同的亚基,称为 、和 亚基。这些亚基通过次级键聚合在一起。在全酶中含有 2 个 亚基,其它亚基各 1 个。全酶( 2)分子量大约为 500 000。核心酶 的结合不牢固,它可以随时从全酶上脱落下来,剩余的部分称为核心酶。各亚基功能 亚基的功能主要是结合底物三磷酸核苷 NTP; 的功能是与 DNA 模板结
8、合; 的功能是识别并结合启动子。另外,在核心酶中还存在一个功能尚不清楚的 因子。表 11-1 E.coli RNA 聚合酶的结构与功能亚基 基因 分子量 数目 组分 可能的功能 rpoA 40 000 2 核心酶 酶的连接,装配 rpoB 155 000 1 核心酶 与底物(核苷酸)结合 rpoC 160 000 1 核心酶 与模板结合 10 000 1 核心酶 不详70 rpoD 70 000 1 因子 与启动子结合,识别模板链二、原核生物基因的启动子原核生物不同基因的启动子虽然在结构上存在一定的差异,但具有明显的共同特征:在基因的 5端,直接与 RNA 聚合酶结合,控制转录的起始和方向;都
9、含有 RNA 聚合酶的识别位点、结合位点和起始位点;都含有保守序列,而且这些序列的位置是固定的,如-35 序列,-10 序列等。-35 序列 对于大多数启动子来说,在上游 -35bp 附近存在一段共有序列( consensus sequence):TTGACA;RNA 聚合酶的 亚基识别-35 序列并使核心酶与启动子结合,故又称-35 序列为 RNA 聚合酶的识别位点;-10 序列 又叫 Pribnow 盒( Pribnow box) ,其共有序列为 TATAAT,是 RNA 聚合酶与之牢固结合并将 DNA 双链打开的部位,即结合位点,形成所谓的开放性启动子复合物。4根据启动子的启动效率,即在
10、单位时间内合成 RNA 分子数的多少,将启动子分为强启动子和弱启动子。启动子的强弱与-35 序列和-10 序列密切相关,特别是 -35 序列在很大程度上决定了启动子的强度。另外,这两个序列之间的距离也可能是影响启动子强度的因素之一。实验表明,这两个序列之间的距离为 17bp 时,转录效率最高。天然启动子中,这一段距离大多为 1619bp。原核生物启动子的结构如图 11-2图 11-2 原核生物启动子结构示意图(上)及部分原核基因启动子的-10 序列和-35 序列(下)图 11-2 原核生物启动子结构示意图(上)及部分原核基因启动子的-10 序列和-35 序列(下)、 原核生物的转录过程(一)模
11、板的识别在 亚基的帮助下,RNA 聚合酶识别并结合到启动子上。实验证明,核心酶不能识别启动子,它与 DNA 的结合不一定在特异的启动子部位。 亚基的作用在于它大大降低RNA 聚合酶与 DNA 的非特异性结合,并促进 RNA 聚合酶识别启动子顺序。 亚基还参与促使 DNA 双螺旋打开并以其中的一条链作为模板进行转录。(二)转录的起始 亚基识别-35 序列并与核心酶一起结合在启动子上。关于 RNA 聚合酶分子是如何从-35 序列移动到转录起始位点的问题,早先曾有过“滑动假说”,即 RNA 聚合酶沿着模板链由一个位点滑动到另一个位点。现在虽不能否定这一假说,但也不太象滑动。已有实验证据表明,RNA
12、聚合酶分子很大,其结合在启动子上的范围从-50 到+10 ,可见这一范围包括5-10 序列和转录起始位点。RNA 聚合酶与-10 序列牢固结合并将 DNA 双链打开,形成开放性启动子复合物,RNA 的转录也就开始了。RNA 聚合酶的核心酶是不能在启动子处开始转录的,必须全酶才能启动特异的转录。当形成新 RNA 的第一个磷酸二酯键后, 亚基即由全酶中解离出来,由核心酶继续进行转录。所以,全酶的作用是选择起始部位并启动转录,核心酶的作用是延长 RNA 链。解离出来的 可与另一个核心酶结合起来并启动另一次转录。绝大多数新合成的 RNA 链的 5-末端是 pppA 或 pppG,说明转录的起始核苷酸是
13、三磷酸腺苷或三磷酸鸟苷。并且证明转录不需要引物引导,这一点与复制不同。(三)RNA 链的延伸当第一个磷酸二酯键生成并释出 亚基后,核心酶即沿 DNA 模板移动,并按碱基互补配对的原则,以与第一个磷酸二酯键生成的相同反应方式,依次连接上核苷酸,使 RNA链延伸。由于在转录过程中第一个三磷酸核苷的三磷酸基被保留在产物中,而其余的则否,所以 RNA 链的延长方向是 53。核心酶沿 DNA 模板移动的方向则为 35 ,因为模板链与新生成的 RNA 链是反平行的。RNA 链的延伸是在含有核心酶、DNA 和新生 RNA 的一个区域里进行的,在这个区域里双链 DNA 被打开,呈“ 泡”状,故称之为转录泡(t
14、ranscription bubble) ,在转录泡里,新合成的 RNA 与模板 DNA 形成杂交双链,长约 12bp,相当于 A 型 DNA 一圈的长度。在转录泡里,核心酶始终与 DNA 的编码链结合,使双链 DNA 约有 17bp 被解开。在整个延伸过程中,转录泡的大小始终保持不变,即在核心酶向前移动时,前面的双股螺旋逐渐打开,转录过后的区域则又重新形成双螺旋,二者的速度相同,直至转录完成。每加入一个核苷酸,RNA-DNA 杂交双链就旋转一定的角度,保证 RNA 的 3-OH 始终停留在催化部位。由于 12bp 杂交双链的长度恰好短于双螺旋完整的一圈,在形成完整的一圈前,RNA 因扭力而离
15、开了 DNA 模板,从而防止了 RNA 5-端与 DNA 缠绕在一起。延伸的最大速度约为每秒 50 个核苷酸,相当于转录泡向前移动 17nm。由于 RNA 聚合酶没有核酸外切酶活性,它不能校对新合成的 RNA 链,因而转录的误差比复制的大很多(约 10 万倍) 。由于一个细胞中要合成一个基因的很多转录产物,因而可以耐受这样大的误差。(四)转录的终止终止的主要过程包括:停止 RNA 链延长;新生 RNA 链释放;RNA 聚合酶从 DNA 上释放。当 RNA 聚合酶沿 DNA 模板移动到基因 3-端的终止子序列时,转录停止。原核生物基因转录终止的方式有两种:不依赖于 因子的终止和依赖于 因子的终止
16、。6 因子 又叫终止因子(termination factor) ,是从大肠杆菌中分离出来的一种 275 000大小的六聚体蛋白质,其单体的分子量约为 50 000。它具有两种活性:促进转录终止的活性和 NTPase 活性。后者是前者所必需的。不依赖于 因子 在不依赖于 因子的终止方式中,通过比较许多已知的终止子核苷酸序列发现,它们具有以下共同的特点:有一段富含 GC 的序列,此 GC 区呈双折叠对称,即回文结构(palindrome structure) ;紧接在它后边是一段富含 AT 的序列,因而由此 GC 区转录出来的 RNA 是自身互补的,可通过碱基配对而形成发夹结构。加上终止子的末尾
17、是富含 AT 的,而此区的模板链有连续的碱基 A,所以转录出来的 RNA 链的末尾为连续的碱基 U。由于在终止子中有一个或多个这样的结构,RNA 聚合酶遇到此信号时便停止转录。需要终止因子 终止子 则另一些终止子则需要终止因子 的参与。体外实验证明,用同一 DNA 做模板,在有 因子时合成的 RNA 比没有时要短,说明当 RNA 聚合酶遇到模板中的某些终止子时,在无 因子的条件下,虽然也在此暂停,但不终止,一直转录到不需要 因子的终止子处才真正终止。可见, 因子能检定出那些单靠 RNA 聚合酶检定不出来的终止子。这类终止子的序列富含碱基 C,但缺乏碱基 G。 因子可能是先附着在新生成的 RNA
18、 链上,然后沿着 53方向朝 RNA 聚合酶移动,移动的能量由 ATP 水解供应。当 因子与 RNA 聚合酶接触后,将新生成的 RNA 链释放出来。四、原核生物 RNA 转录后的加工许多转录生成的 RNA 需经加工后才能成为有功能的 RNA 分子。(一)mRNA 的加工原核生物转录生成的 mRNA 基本上不经加工即可进行蛋白质的生物合成即翻译(详见第 15 章) 。事实上许多原核生物的 mRNA 是在转录尚未完成之前就已开始翻译了。也就是说,转录与翻译是偶联在一起的。(二)rRNA 的加工rRNA 的加工过程是以核糖体颗粒的形式进行的,即 rRNA 前体合成后先与蛋白质结合,形成新生核糖体颗粒
19、,而后再经过一系列的加工过程,生成有功能的核糖体。7图 0-3 大肠杆菌 rRNA 的一个转录单位的基因排列和转录后的加工过程在原核生物中,rRNA 包括三种,即 16S,23S 和 5S rRNA。在大肠杆菌中,这三种rRNA 的基因形成一个转录单位,其中还包含一个或多个 tRNA 基因,它们之间由间隔区分开。像这样的转录单位在大肠杆菌的染色体 DNA 中含有 7 个。rRNA 基因首先转录为一个 30S rRNA 前体,再由核糖核酸酶切割,形成中间前体,它们再经过剪接和甲基化转变为成熟的 rRNA 分子。(三) tRNA 的加工 tRNA 的种类比 rRNA 多,在原核生物中有 3040
20、种,在真核生物中有 5060 种。原核生物中的 tRNA 基因是与 rRNA 基因串联在一起排列的,有的在 rRNA基因的间隔区中,有的在该转录单位的末端。原核 tRNA 也是先合成 1 个 tRNA 前体分子,这种前体分子有的只含有 1 个 tRNA,有的则含有 2 个、3 个或多个 tRNA 分子,tRNA 分子之间由间隔区分开。关于 tRNA3-末端 -CCA 的来源问题,在原核生物 tRNA 生物合成中有两种情况:1. 一种是初始转录物自身就有-CCA,它们位于成熟 tRNA 序列与 3端附加序列之间,经转录后加工切除掉附加序列,-CCA 便暴露出来;2. 第二种则是其自身并无-CCA
21、 序列,它是在切除 3端附加序列后,由 tRNA 核苷酰转移酶(nucleotidyltransferase)催化,并由 CTP 与 ATP 供给胞苷酰基与腺苷酰基聚合而成的。tRNA 中含有大量修饰成分,通过各种不同的修饰酶进行修饰,成为成熟的 tRNA 分子。第三节 真核生物 RNA 的转录过程一、真核生物 RNA 聚合酶真核生物 RNA 聚合酶的结构比较复杂,都是多亚基的,通常有 610 个亚基组成,亚基有 46 种。不同来源的 RNA 聚合酶在亚基组成上有相似性。8真核细胞中有 3 种 RNA 聚合酶,RNA 聚合酶 I,和 。这些名称最早是依据它们从DEAE纤维素柱上洗脱下来的先后顺
22、序而定的。后来发现,不同生物的这 3 种 RNA 聚合酶的洗脱顺序不一样,故改为以其对 -鹅膏蕈碱(-amanitine)的敏感性不同来区别。RNA 聚合酶 I 基本不受 -鹅膏蕈碱的抑制,在大于 103mol/L 时才表现出轻微的抑制作用。此酶存在于核仁中,其功能是合成 5.8S rRNA,18S rRNA 和 28S rRNA。RNA 聚合酶对 -鹅膏蕈碱最为敏感,在 109108mol/L 浓度下就会被抑制。此酶存在于核质中,其功能是合成 mRNA 和核小分子 RNA(small nuclear RNA,snRNA) 。RNA 聚合酶对 -鹅膏蕈碱的敏感性介于酶 I 及酶之间,在 105
23、104mol/L 时表现出抑制作用。它也存在于核质中,其功能是合成 tRNA 和 5S rRNA 等。在细胞质中也能发现一些 RNA 聚合酶,是从细胞核中渗漏出来的。现将 3 种真核生物 RNA 聚合酶的特性总结如表。以上 3 种 RNA 聚合酶的分子量都在 500 000 左右,每种聚合酶分子都含有两个大亚基和 48 个小亚基,每个小亚基的分子量为 10 00090 000,各个亚基的功能尚不十分清楚。真核生物也像原核生物一样,不同种类的基因需要不同的蛋白辅助因子协助 RNA 聚合酶进行工作。二、真核生物基因的启动子真核生物的 3 种 RNA 聚合酶各有其自己的启动子,这里主要介绍 RNA
24、聚合酶的启动子。RNA 聚合酶的启动子有 4 个部位,其中前 3 个部位也是大多数启动子都具备的。(1)帽子位点,即转录起始位点。其碱基大多为 A(指编码链) ,两侧各有若干个嘧啶核苷酸。(2)TATA 框(Hogness box) ,其共有序列为:TATAATAAT,一般位于-10 附近,基本上由 AT 碱基对所组成,只有很少启动子中有 GC 碱基对的存在。(30CAAT 框(CAAT box) ,其共有序列为 GGCTCAATCT,一般位于-75 附近。虽然此序列名为 CAAT 框,但其中前两个 G 的重要性并不亚于 CAAT 部分。(4)增强子(enhancer) ,又称远上游序列(fa
25、r upstream sequence) ,一般都在-100 以上。增强子的作用主要包括,对依赖和不依赖于 TATA 框的转录都有增强效应,但对前者增强效应高;距离效应,离 72bp 重复序列近的容易起始转录;极性效应,转录方向背向72bp 重复序列的起始序列优先转录,而朝向 72bp 重复序列的则效率差;不严格的细胞特异性,即不同细胞类型增强作用不一样。三、原核生物 RNA 的转录过 程(一)起始关于真核生物转录的起始机制,现在还不清楚,其原因在于真核的转录机制十分复杂,9以 RNA 聚合酶的转录起始尤甚,涉及众多的蛋白因子,称为通用转录因子(general transcriptional
26、factor,GTF)参与转录的起始。它们在转录起始过程中,相继结合到启动子上,形成开放的起始复合物。目前知道的不少于 6 种。例如,首先是 TFIID,它包含了TATA 结合蛋白(TATA box binding protein,TBP )和多种 TBP 连接因子(TAF) 。含有不同 TAF 的 TFIID 可以识别和结合不同的启动子。而 TFIIA 的结合又有稳定 TFIID 与启动子结合的作用。然后,TFIIF 可以与 RNA 聚合酶结合。TFIIB 既可以结合 TBP,又能引进TFIIF-聚合酶 II 复合物。TFIID 也可以与聚合酶的 C 端结构域作用,使其定位于转录的起始位置,
27、最后在聚合酶 II 帮助下,TFIIE 又将 TFIIH 引进到结合位点,后者具有 ATP 酶,解螺旋酶和激酶的活性,可以催化聚合酶 II 最大亚基的羧基端磷酸化,使转录起始复合物发生变构而促进转录。(二)延伸RNA 合成的速度大约为每秒 3050 个核苷酸,但链的延伸并非以恒定速度进行,有时会降低速度或延迟,这是延伸阶段的重要特点,其原因尚不清楚。人们发现在通过一个富含 GC 对的模板以后约 810 个碱基,则会出现一次延迟。如果在突变体中 GCAT 则减少延迟。如果在连续的 GC 对之间只有一个 AT 对,把这个 AT 变为 GC 则会再现强烈的延迟作用。这种延迟作用可能对 RNA 链的终
28、止和释放有关。(三)终止对于真核生物转录的终止信号和机制了解很少,其主要困难在于很难确定初始转录物的 3-末端,因为在大多数情况下,转录后就很快进行加工,无论是 mRNA、tRNA,还是rRNA 都是如此。研究发现病毒 SV40 的终止点很有点像大肠杆菌不依赖 因子的终止子,有一个发夹结构,末端有一长序列 U。对于 RNA 聚合酶,体外与体内转录物相同,表明体内转录的确是在 RNA 末端处终止的。爪蟾 5S rRNA 的 3-末端为 4 个 U,而这 4 个 U 的前后均为富含 GC 序列中的寡聚T(4 个以上)是所有真核生物 RNA 聚合酶转录的终止信号。这种序列特征高度保守,从酵母到人都很
29、相似。 四、真核生物 RNA 转录后的加工断裂基因 真核细胞的结构基因绝大多数是不连续的,称为断裂基因,编码序列中间隔着插入序列,因此必须对转录产生的初级产物进行加工和修饰才能使之成为有功能的成熟的 mRNA。外显子 真核基因中编码的序列,称为外显子(exon) ;而不表达的序列,称为内含子(intron ) 。初级转录产物中包括了内含子和外显子,称为核不均RNA, hnRNA(heterogeneous nuclear RNA) 。它比加工后成熟的 mRNA 大好几倍。其加工过程是:首先对其首、尾进行修。105-末端加上“帽”(mG(5)pppNmpN-)结构,在其 3-末端加上一个 502
30、00 个 A 的多聚腺苷酸(polyA) 的“ 尾巴”,然后进行剪接,即由相应的酶剪去内含子转录的部分,再将其余的外显子转录的部分连接起来;其次还要经过甲基化等修饰过程,才能变为有功能的mRNA 分子。(一)mRNA“ 首、尾”的修饰真核细胞 mRNA 的 5-末端“ 帽”的结构有三种:N7甲基鸟嘌呤核苷酸部分称为帽 O,符号为 m7GpppX,单细胞真核生物如酵母,只具有帽 O;如果在初始转录物的第一个核苷酸的 2-O 位上产生甲基化,则构成帽 1(1 个甲基化,包括帽 O 部分) ,其符号为 m7GpppXm,这是除了单细胞真核生物外的其余真核生物的主要帽形式;在有些真核生物中,在第二个核
31、苷酸的 2-O 位上还可以再产生甲基化,构成帽 2(包括帽 1 部分) ,其符号为 m7GpppXmpYm。帽 2(2 个甲基化)一般只占有帽mRNA 的 10%15%以下。三种“帽”的结构见图 14-8。所有“帽” 结构皆含 7-甲基鸟苷酸(框示) ,通过焦磷酸连接于 5端。 “帽”的功能还不完全清楚,但已知对 mRNA 的识别、结合和稳定有利。真核 mRNA 3-末端多聚(A)尾通常写。它是在转录后由 RNA 末端腺苷酸转移酶催化一个一个地加上去的。RNA 末端腺苷酸转移酶(作 poly(A)RNA terminal riboadenylate transferase)的催化反应如下: 2
32、MgnTPnPi 多多多poly(A)的功能尚不清楚,但已知 poly(A)与蛋白质结合,可能增加 mRNA 的稳定性。(二)真核 mRNA 的剪接在真核细胞中,绝大部分基因被不同大小的内含子相互间隔开,内含子在 RNA 的转录后加工中要除去,然后把外显子连接起来,才能形成成熟的 RNA 分子。这是所有真核RNA 在转录后加工中必须进行的一个重要步骤。这一过程称为 RNA 的剪接(splicing) 。剪接是在核中进行的,核酸内切酶与连接酶活性可能处于同一剪接复合体(spliceosome)上,剪接时协调进行。一般认为内含子上游与下游各有一个剪接位点,分别称为 5剪接点(或左剪接点)和 3剪接
33、点(或右剪接点) 。按照 A. Klessing 提出的模式,内含子要弯曲成套索状(lariat) ,在 RNA 剪接时,外显子互相靠近,通过二次转酯反应有两个磷酸二酯键被破坏,同时形成一个新的磷酸二酯键而连接。这里以卵清蛋白基因的转录和转录后加工为例可以予以说明,见 Error! Reference source not found.。卵清蛋白基因转录得到的初级产物在经过加“帽”和添“polyA 尾”之后,通过剪接将转录的 7 个内含子“套索”切除,然后把 8 个转录的外显子连接起来。(三)真核 rRNA 转录后的加工11在真核细胞中有 4 种 rRNA,即 28S、18S、5.8S 和 5
34、S rRNA。rRNA 是在核仁中合成的。前三者的基因组成一个转录单位,在转录过程中先形成一个 45S 前体。然后,在核内经过一系列的加工过程,再转移到细胞质中。而 5S rRNA 与 tRNA 一起由 RNA 聚合酶转录,处在另一个转录单位中。(四)真核 tRNA 转录后的加工真核细胞 tRNA 前体的加工过程与原核的类似,真核 tRNA 基因是成簇存在的,基因之间由间隔区分开。但目前分离到的真核 tRNA 前体都是单个 tRNA 分子。另外,在分离到的一些真核 tRNA 前体中似乎都含有插入顺序,而原核 tRNA 前体中则不含有插入顺序,这是二者的一个重要区别。真核 tRNA 前体的加工方
35、式大致如下: 切除 tRNA 前体两端多余的序列:这一过程是在特异性酶的催化下完成的; 末端的添加:即在 3末端添加-CCA 序列,此一步由 tRNA 核苷酰转移酶(tRNA nucleotidyl transferase)催化。这与原核生物 tRNA 3-末端-CCA 序列形成的第二种情况相同; 修饰:tRNA 修饰碱基很多,主要为甲基化修饰,占被修饰碱基的一半以上。还有其他一些方式的修饰,如碱基置换或转换等。第四节 催化活性 RNA核酶及其功能一、核酶的发现核酶是在研究剪接机制的过程中意外发现的。在原生动物四膜虫(tetrahymena)中,26S rRNA 分子是有一个 6.4kb 的前
36、体经切除 1 个 414nt 的内含子后形成的,这一过程是如何进行的呢?Thomas Cech 及其同事对此进行了研究。在寻找剪接过程中所需要的酶蛋白时,他们惊异的发现,一个仅含有纯化的 6.4kb 前体、ATP 及 GTP,而显然没有酶蛋白的对照样品中居然也发生了剪接作用。经过进一步实验证实,此 RNA 发生了自我剪接(self-splicing) ,即在核苷酸存在的条件下,将 414nt 的内含子剪接掉了。这一卓越的实验不仅表明一个 RNA 分子能够具有高度特异的催化活性,并能自我剪接,而且直接导致了核酶(ribozyme)的发现。二、核酶的催化功能 对自我剪接的过程深入研究发现,该过程中
37、不需要 ATP 或 GTP 提供能量,但此反应需要 GTP 作为辅助因子,而且不一定非 GTP 不可,鸟苷、GMP,GDP 或 GTP 中任何一种都可起辅助因子的作用,我们用 G 代表这些化合物中的任何一种。G 的作用不是提供能量,而是作为一个攻击基团并暂时掺合到 RNA 中。G 结合在 RNA 上之后,它攻击 5-剪接点,并与内含子的 5-末端形成磷酸二酯键。此转酯反应使上游外显子产生一个 3-OH,然12后此新生成的上游外显子的 3-OH 攻击 3-剪接点。这第二个转酯反应把两个外显子联结在一起,并将 414nt 的内含子释放出去。随后还发生两次自我剪接。第一次剪接是生成的内含子的 3-O
38、H 攻击其靠近 5-末端的一个磷酸二酯键,结果内含子形成环状,并释出下一个含有 G 的 15nt 片段,G 是在前述的剪接过程中掺合进来的。生成的 399nt 环打开成为线型分子,并进行第二次剪接,其结果是释出一个 4 核苷酸片段并形成环。此环再打开形成一个线型 RNA,此 RNA 叫做 L19 IVS(linear minus 19 intervening sequence,线型的缺失 19 个核苷酸的插入序列) ,我们称之为有 L19 RNA。四膜虫 rRNA 前体的自我剪接过程如 Error! Reference source not found.所示。很明显,RNA 分子和蛋白质一样,
39、是能够作为很有效的催化剂的。并且 RNA 分子也能够形成精确的三维结构并结合特异的底物,形成稳定的过渡态复合物。然而,RNA 与蛋白质的不同之处在于,它不能形成大的非极性囊袋。而且 RNA 仅由 4 种结构元件(building block )构成,而蛋白质则是由 20 种氨基酸构成的,所以 RNA 在空间上的要求远不如蛋白质。这就是为什么自然界中大多数的酶是蛋白质。但必须记住,蛋白质并非唯一的催化剂。现在把 RNA 性质的酶称为核酶(ribozyme) 。除了 L19 RNA 外还发现了一些其他的核酶。看来核酶更适合于识别和催化单链的核酸分子,因为核酶和这类底物使用的是共同的语言碱基配对。三
40、、核酶发现的生物学意义核酶的发现使人们对于生命的起源有了新的认识。以前一般认为,由于 DNA 和蛋白质是生命的基础物质,因而生命的最初形式必定是 DNA 或者蛋白质。然而 DNA 的复制需要蛋白质(酶)的催化,而特定蛋白质分子的合成又必须以 DNA 为模板,因而二者究竟是哪一种首先出现,实在难以推断。核酶的发现使人们普遍认为:生命的最初形式大概是RNA,最初的生命界可能是个 RNA 王国。因为 RNA 既可作为模板而复制繁殖,同时它又是催化剂,即它兼有 DNA 和蛋白质二者的功能。然而在进化过程中,由于作为模板而遗传的功能 RNA 不如双链 DNA 稳定;而作为催化剂的功能它又不如蛋白质那样多
41、样,所以作为遗传信息携带者的功能它让位给 DNA,作为催化剂的功能则大部分由蛋白质所取代,RNA 则仅保留了它作为信使和一部分催化作用等功能,这就是目前生命界的实际情况。这种推断是否正确还有待实验的证明。在应用方面,人们正在设计合成特异切割病毒 RNA或其它 RNA 的核酶,以便用以治疗包括艾滋病、癌症在内的疾病。虽然目前还没有成功应用的报道,但具有良好的发展前景。本章小结在 RNA 聚合酶的催化下,以 DNA 为模板合成 RNA 的过 程称为转录。 转录是基因表达的第一步,也是最关键的一步。转录是不对称的,不需要引物,在双链 DNA 中,作为转录模板的链称为模板链,与之互补 的链称为编码链。
42、13转录是在 RNA 聚合酶的作用下,以 DNA 为模板合成 RNA 的过程。 RNA 聚合酶与启动子识别并结合,起始基因的转录 。原核生物中启动子有两个重要的序列,即 -10 序列和-35 序列。原核 RNA 聚合酶包含有2 5 个亚基。 亚基的作用是 识别并与启动子结合,而其他部分则与模板结合,并依据碱基互补的方式催化 NTP 原料形成 3,5-磷酸二酯键,以 53 方向延伸多核苷酸链。原核生物转录的终止有依赖和不依赖于 因子两种方式。 因子能结合于新生 RNA 链并利用水解NTP 所 释放的能量移动,通过 与 亚基的作用促进转录的终止,而不依赖于 因子的终止机制则与终止子的结构有关。真核
43、生物有 I,II,III 三种 RNA 聚合酶,分别转录 rRNA 基因、mRNA 和 5S rRNA、tRNA 基因。细胞器还有自己的 RNA 聚合酶。真核生物 RNA 聚合酶的启动子最为复杂,有帽子位点和 TATA 框等近启动子成分。真核生物的基因还常会有增强子。真核生物转录的起始机制复杂,涉及多种通用 转录因子,形成 转录起始复合物。转录得到的 RNA 前体一般要经过加工和修饰。几乎全部的真核 mRNA 的 5端都具有含甲基 鸟嘌呤的“帽”结构,大部分的 mRNA 的 3端具有 poly(A)尾。真核基因是不连续基因,其转录产物中编码的外显子被插入的内含子所间隔,要通 过剪接切除内含子、拼接外显子后才能成为成熟的 RNA。催化 RNA 即核酶的发现,对于研究生命的起源和进化具有重要科学意义。