1、分子生物学基础,第四章 遗传信息的转录从DNA到RNA,第一节 RNA转录的概述,一、RNA转录的特点在DNA指导下RNA的合成称为转录。RNA链的转录起始于DNA模板的一个特定起点,并在特定的终点终止,此转录区域称为转录单位。一个转录单位可以是一个基因或多个基因。基因的转录是一种有选择性的过程,随着细胞的不同生长发育阶段和细胞内外条件的改变将转录不同的基因。转录起始主要由DNA分子上的启动子(promoter)控制,而控制终止的部位称为终止子(teminator)。典型的转录单位结构如图4-1。,第一节 RNA转录的概述,图4-1 典型的转录单位结构,第一节 RNA转录的概述,二、转录的基本
2、过程无论是原核还是真核细胞,转录的基本过程都包括:模板识别、转录起始、通过启动子及转录的延伸和终止(图4-2)。,图4-2 大肠杆菌中依赖于DNA的RNA转录过程,第一节 RNA转录的概述,1模板识别模板识别阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。转录起始前,启动子附近的DNA链分开形成转录泡以促使底物核糖核苷酸与模板DNA的碱基配对。转录起始就是RNA链上第一个磷酸二脂键的产生。2转录起始转录的起始从化学过程来看是单个核苷酸与开链启动子酶复合物相结合构成新生RNA的5端,再以磷酸二酯键的形式与第二个核苷酸相结合,起始的终止反应在因子的释放。过去认为磷酸二酯键的形式
3、就是转录起始的终止,实际上,只有当新生RNA链达到69个核苷酸时才能形成稳定的酶DNARNA三元复合物,才释放因子,转录进入延伸期。,第一节 RNA转录的概述,3通过启动子转录起始后直到形成9个核苷酸短链是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。一旦RNA聚合酶成功地合成9个以上核苷酸并离开启动子区,转录就进入正常的延伸阶段。所以,通过启动子的时间代表一个启动子的强弱。4转录延伸RNA聚酶离开启动子,沿DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸。大肠杆菌RNA聚合酶的活性一般为每秒合
4、成50-90个核苷酸。随着RNA聚合酶的移动,DNA双螺旋持续解开,暴露出新的单链DNA模板,新生RNA链的3末端不断延伸,在解链区形成RNADNA杂合物。而在解链区的后面,DNA模板链与其原先配对的非模板链重新结合成为双螺旋。5转录终止当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNADNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来,这就是转录的终止。,第一节 RNA转录的概述,三、RNA聚合酶 1原核生物的RNA聚合酶大多数原核生物RNA聚合酶的组成是相同的(表4-1),大肠杆菌RNA聚合酶由2个亚基、一个亚基、一个亚
5、基和一个亚基组成,称为核心酶。加上一个亚基后则成为聚合全酶(holoenzyme),相对分子质量为4.65105(图4-3)。,第一节 RNA转录的概述,2真核生物的RNA聚合酶真核生物的基因组比原核生物大,RNA聚合酶也更为复杂。其相对分子质量大都在5105左右,有814个亚基,并含有Zn2+。利用-鹅膏蕈碱(-amanitine)的抑制作用可将真核生物RNA聚合酶为分三类(表4-2)。,第二节 启动子与转录的起始,一、启动子的基本结构启动子是一段位于结构基因5端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地相结合并具有转录起始的特异性。因为基因的特异性转录取决于酶与启动子能
6、否有效地形成二元复合物,所以,RNA聚合酶如何有效地找到启动子并与之相结是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布朗运动中的随机碰撞高100倍。,第二节 启动子与转录的起始,1原核生物的启动子结构原核生物启动子序列按功能的不同可分为3个部位(图4-4上)。(1)起始部位:指DNA分子上开始转录的作用位点,该位点有与转录生成RNA链的第一个核苷酸互补的碱基,由前述内容可知,该碱基的序号为+1。(2)结合部位:是DNA分子上与RNA聚合酶的核心酶结合的部位,其长度为7bp,中心部位在10bp处,碱基序列具有高度何守性,富含TATAAT序列,
7、故称之为TATA盒(TATA box),又称普里布诺序列(pribnow box)。因该段序列中富含AT碱基,维持双链结合的氢键相对较弱,导致该处双链DNA易发生解链,有利于RNA聚合酶的结合。(3)识别部位:利用诱变技术可使启动子发生突变,当35序列突变时,将会降低RNA聚合酶与启动子的结合速度,这说明35序列提供了RNA聚合酶识别的信号,该序列的碱基富含TTGACA,其中心则刚好位于35bp处,它是RNA聚合酶亚基的识别部位。,第二节 启动子与转录的起始,图4-4 原核和真核生物的启动子结构,第二节 启动子与转录的起始,2真核生物的启动子结构科学家通过对许多基因启动子区的分析,发现绝大多数
8、功能蛋白基因的启动子都具有共同的结构模式。简单地说,真核基因的启动子(图4-4下)在2535区含有TATA序列,在7080区含有CCAAT序列(CAAT box),在80110含有GCCACACCC或GGGCGGG序列(GC box)。习惯上,将TATA区上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或称上游激活序列(upstream activating sequence,UAS)。,第二节 启动子与转录的起始,3真核生物启动子对转录的影响TATA区和其他两个UPE区的作用有所不同(图4-5)。前者的主要作用是使转录精确地起始,如果除去TATA
9、区或进行碱基突变,转录产物下降的相对值不如CAAT区或GC区突变后明显,但发现所获得的RNA产物起始点不固定。研究SV40晚期基因启动子发现上游激活区的存在与否,对该启动子的生物活性有着根本性的影响。若将该基因5上游2147核苷酸序列切除,基因完全不表达(图4-6)。,第二节 启动子与转录的起始,图4-5 启动子区主要顺式作用元件与基因转录活性,第二节 启动子与转录的起始,图4-6 SV40基因启动子上TATAAA及邻近区域对基因转录活性的影响,第二节 启动子与转录的起始,二、转录的起始1启动子区的识别2原核生物转录的起始原核生物转录起始过程(图4-7):RNA聚合酶在亚基引导下,识别并结合到
10、启动子上,使DNA局部的双链被解开,形成的解链区称转录泡(transcription bubble),解链发生在与RNA聚合酶结合的部位。RNA聚合酶的催化亚基按照模板链对碱基的选择,特异识别底物核苷酸,形成磷酸二酯键并脱下焦磷酸,合成RNA链最初29nt。第一个核苷酸通常为带有3个磷酸基的鸟苷或腺苷(pppG或pppA)。起始合成后,亚基脱离核心酶与启动子,起始阶段至此结束。,第二节 启动子与转录的起始,图4-7 原核生物基因转录的起始,第二节 启动子与转录的起始,3真核生物转录的起始除了RNA聚合酶之外,真核生物转录起始过程中至少还需要7种辅助蛋白质因子参与(表4-3)。因为不少辅助因子本
11、身就包含多个亚基,所以转录起始复合物的分子量特别大。真核生物转录起始过程(图4-8):在7种辅助因子参与下,RNA聚合酶与启动子相互作用,聚合酶首先与启动子区闭合双链DNA相结合,形成二元闭合复合物,然后经过解链得到二元开链复合物。解链区一般在9+13之间,而酶与启动子结合的主要区域在其上游。一旦开链区解链,酶分子能以正确的取向与解链后的有关单链相互作用,形成开链复合物。因此,RNA聚合酶既是双链DNA结合蛋白,又是单链DNA结合蛋白。DNA开链是按照DNA模板序列正确引入核苷酸底物的必要条件。,第二节 启动子与转录的起始,第二节 启动子与转录的起始,图4-8 真核生物RNA聚合酶指导的基因转
12、录起始,第二节 启动子与转录的起始,三、增强子及其功能 除了启动子以外,近年来发现还有另一序列与转录的起始有关。在SV40的转录单元上发现它的转录起始位点上游约200bp处有两段72bp长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始,除去这两段序列会大大降低这些基因的转录水平,若保留其中一段或将之取出插至DNA分子的任何部位,就能保持基因的正常转录。因此,称这种能强化转录起始的序列为增强子或强化子(enhancer)。除SV40外,还在反转录病毒基因、免疫球蛋白基因、胰岛素基因、胰糜蛋白酶基因等许多基因的启动区中陆续发现了增强子的存在。,第三节 转录的终止,一、不依赖于因子的终
13、止现已查明,模板DNA上存在终止转录的特殊信号终止子,每个基因或操纵子都有一个启动子和一个终止子。终止位点上游一般存在一个富含GC碱基的二重对称区,由这段DNA转录产生的RNA容易形成发卡式结构。在终止位点前面有一段由48个A组成的序列,所以转录产物的3端为寡聚U,这种结构特征的存在决定了转录的终止。在新生RNA中出现发卡式结构会导致RNA聚合酶的暂停,破坏RNADNA杂合链5端的正常结构。RNA3端寡聚U的存在使杂合链的3端部分现不稳定的rUdA区域。两者共同作用使RNA从三元复合物中解离出来(图4-9)。终止效率与二重对称序列和寡聚U的长短有关,随着发卡式结构(至少6bp)和寡聚U序列(至
14、少4个U)长度的增加,终止效率逐步提高。,第三节 转录的终止,二、依赖于因子的终止体外转录实验表明,纯化的RNA聚合酶并不能识别特异性的转录终止信号,而加入大肠杆菌因子后该聚合酶就能在DNA模板上准确地终止转录。 因子是一个相对分子质量为2.0105的六聚体蛋白,它能水解各种核苷三磷酸,实际上是一种NTP酶,它通过催化NTP的水解促使新生RNA链从三元转录复合物中解离出来,从而终止转录。依赖于因子的转录终止区DNA序列缺乏共性,说明该因子并不能识别这些终止位点。现在一般认为,RNA合成起始以后因子即附着在新生的RNA链上,靠水解ATP产生的能量,沿着5 3方向朝RNA聚合酶移动,到达RNA的3
15、-OH端后取代了暂停在终止位点上的RNA聚合酶,使之从模板DNA上释放mRNA,完成转录过程(图4-10)。,第三节 转录的终止,图4-11 依赖于蛋白质因子的转录抗终止模式,第四节 转录后加工,一、mRNA的加工15端帽结构目前所知5端帽结构是在核内完成的,且先于对mRNA中段序列的剪接过程,加帽的作用部位是转录后的mRNA 5端的第一个核苷酸上。由前面内容所知,RNA 5端的第一个核苷酸以嘌呤类多见,尤以pppG为主,其作用过程为:先由磷酸酶把5pppG水解生成5pG,然后与另一个三磷酸鸟苷pppG反应生成三磷酸双鸟苷,接着在甲基化酶的作用下,由SAM提供甲基,将甲基连接在后接上去的鸟嘌呤
16、碱基N7位上,生成5m7GpppGp,此结构称帽子结构(图4-12)。,第四节 转录后加工,图4-12 真核生物mRNA5端帽结构,第四节 转录后加工,23端加尾真核生物成熟的mRNA 3端通常都有100200个腺苷酸残基,构成多聚腺苷酸(polyA)的尾巴。通过研究发现,DNA序列中没有多聚T的序列,由此说明了3尾巴polyA是在转录后加上的。研究发现,它还是多聚腺苷酸化的信号,该序列AAUAAA,因为切除该保守序列,3端则不能进行切除,也不能形成polyA尾巴。3端polyA尾的形成见图4-13。,第四节 转录后加工,图4-13 真核生物mRNA3端polyA尾结构的形成,第四节 转录后加
17、工,3mRNA中段序列的剪接真核生物细胞作为转录的模板链中的结构基因中含有表达活性的碱基序列,称外显子(exon),也有无表达活性的碱基序列,称内含子(intron),其后者远多于前者。经转录生成的hnRNA,既有内含子序列,也有外显子序列。剪接在加帽加尾后进行,由核酸内切酶把内含子和外显子的连接处的磷酸二酯键水解,剔除内含子,再连接外显子生成成熟的mRNA(图4-14)。此后,mRNA通过核膜孔转运到细胞质,指导蛋白质的合成。剪接过程比较复杂,其内含子一般左端为GU,右端均为AG,此结构形式不适用于线粒体和叶绿体的内含子,也不适合于tRNA和rRNA的编码基因,该结构可能为核酸内切酶的作用位
18、点。体外实验表明,切开首先在内含子左端GU外进行,进行一系列反应过程再在内含子右端AG处切开(图4-15)。,第四节 转录后加工,图4-14 卵清蛋白mRNA的剪接加工过程 17: 外显子; AG: 内含子。,第四节 转录后加工,图4-15 前体mRNA中内含子的剪切位点,第四节 转录后加工,二、tRNA 加工1原核生物tRNA的加工(1)核酸内切酶与DNA限制性内切酶不同,它不能识别特异的序列,所识别的是加工部位的空间结构。 (2)核酸外切酶从3端逐个切去附加序列。 (3)3端CCAOH结构 所有成熟的tRNA的3端都有CCAOH结构。 (4)修饰碱基的形成 成熟的tRNA含有大量的稀有碱基
19、,如甲基化碱基、二氢尿嘧啶等。这些都是由高度特异性的tRNA修饰酶作用形成的。,第四节 转录后加工,图4-16 tRNA前体的加工,第四节 转录后加工,2真核生物tRNA的加工真核生物tRNA基因数目比原核生物tRNA基因数目大得多,不过其基因也成簇排列,并且被间隔区分开。tRNA前体由RNA聚合酶转录合成,前体加工成成熟的tRNA需要在核酸内工酶和外切酶作用下切除5和3端的附加序列。真核生物tRNA3端不含CCAOH结构。成熟tRNA还需要进行碱基修饰,修饰反应的形式有甲基化反应、还原反应、脱氨基反应和碱基转位反应。tRNA前体中也有内含子成分,在核酸内切酶作用下,切去内含子,再由RNA连接
20、酶催化,使切开的tRNA两部分连接起来。另有报道,成熟tRNA的反密码子环是通过加工插入tRNA前体中的。,第四节 转录后加工,三、rRNA加工 原核生物中rRNA的加工往往与转录同时进行,因此一般得不到完整的前体rRNA。负责其前体加工的核酸内切酶为RNaseIII(图4-17),在该酶的作用下,30S转录产物裂解产生16S和23S rRNA前体,5S rRNA的前体是在RNaseE作用下产生的。真核生物rRNA基因拷贝数很多,呈串联排列,重复达成千上万次。在分类上,把rRNA基因(rDNA)序列称为高度重复的DNA序列。由RNA聚合酶I转录产生45S rRNA 前体,在RNaseIII和其
21、他核酸内切酶作用下,生成18S、5.8S和28S rRNA。经过适当加工后,28S 、5.8S、5S rRNA以及有关蛋白一起组成核糖体大亚基,18S rRNA与有关蛋白组成小亚基(图4-18)。,第四节 转录后加工,图4-17 大肠杆菌rRNA前体的加工,第四节 转录后加工,图4-18 真核生物rRNA前体的加工,第四节 转录后加工,四、核酶的作用特点及方式 1核酶的作用特点(1)核酶的作用底物比较单纯,均为RNA。也就是说,核酶一般多限于催化自身的RNA或其他异体RNA分子进行化学反应。(2)核酶的催化效率较酶蛋白的催化效率一般都低得多。 (3)核酶催化的反应都必须有Mg2+存在时才能进行
22、,这可能是Mg2+在维持核酶催化活性所需的特殊构象方面是必不可少的。(4)核酶的催化作用也表现一定的特异性,例如,RNase P中的核酶只能剪切tRNA前体的5端前导序列,而对于3端或其他部位的核苷酸序列以及对其他种类RNA前体的成熟都不起作用。,第四节 转录后加工,2核酶的作用方式至今发现的所有核酶,其作用方式都比较单调,归纳起来主要不外乎两大类型:一类为剪切型,即此类核酶可催化自身RNA或其他异体RNA分子剪掉一小段或切除一大段寡聚核苷酸序列,其催化功能相当于核酸内切酶的作用。另一类为剪接型,此类核酶的作用主要是催化自身RNA进行化学反应,它们的作用是既剪又接,实际上相当于核酸内切酶和连接
23、酶两种作用。这两类RNA的剪切作用和剪接作用不都需要其他酶(蛋白质)的参与。,第四节 转录后加工,3核酶的作用机制Altman等发现,大肠杆菌RNaseP中的核酶(M1RNA)分子中有一个活性核心。他们用核酸酶处理M1RNA以除去3端的122个核苷酸,结果发现活性只是有所下降,若除去其5端的70个核苷序列,则活性完全丧失。这表明保持M1RNA的完整末端序列特别是其5端序列,对维持其催化活性所需构象是必须的。据此,人们已经根据锤头结构的自我剪切模型和理论,设计合成出一些人们所需要的核酶或其基因。用以剪切破坏人类和动植物有害基因转录出的mRNA或其前体,从而抑制细胞内肿瘤基因、遗传缺陷基因以及病毒基因等不良基因的表达,为基因治疗提供一种可行的途径和美好的前景。,