1、第六章 转录的机制,转录是以DNA为模板酶促合成RNA的过程,是基因表达全过程的第一步,并最终导致由基因编码的蛋白质的合成。转录在化学和酶学上与DNA的复制非常相似,二者都是通过酶的作用合成一条与模板DNA互补的核苷酸链。转录由RNA聚合酶催化,它需要双链DNA模板和4种前体核糖核苷酸(precursor ribonucleotides)ATP, GTP, CTP和UTP。RNA聚合酶在模板链的指导下向正在增长的RNA链的3端共价添加核苷酸。,因此,聚合酶是沿5- 3方向延伸RNA链的。RNA链与DNA模板链是反相平行的。与DNA聚合酶不同,RNA聚合酶能够起始链的合成,因此RNA合成不需要引
2、物。,与DNA复制不同的是转录发生在DNA分子某些特定的区域,而不是以整个DNA分子做为模板。对于一个DNA分子来说并非所有的区域都能被转录,即使是转录活性区也不是每时每刻都在转录。每次转录,双链DNA中也只有一条链被用来指导RNA合成,这条链被称为模板链,又叫反义链(antisense strand)。与RNA序列相同的那条链被称为有意义链(sense strand)或称编码链(coding strand)。,转录分为三个阶段:起始(initiation)、延伸elongation)和终止(termination)。DNA分子上RNA聚合酶结合并起始转录的部位称为启动子(promoter)。
3、转录时,DNA双螺旋必须局部解旋。解旋从RNA聚合酶结合的启动子区开始。然后聚合酶从一个特定的、被称为起始位点的核苷酸处起始RNA链的合成。这一位点被定义为基因序列的1位置。新生RNA链的第一个碱基通常是腺嘌呤(占90%左右)。,转录的终止发生在DNA分子上特定的区域,即终止子(terminator)处。终止子经常含有反向互补序列,被转录后在RNA产物上形成发卡结构,导致RNA聚合酶停顿并随即终止转录。一些终止子可以不需要辅助因子,独立完成转录的终止作用。还有一些终止子需要辅助因子,才能完成终止作用。在终止反应中,RNADNA杂交体解体,RNA聚合酶和RNA从DNA链上被释放出来,同时重新形成
4、DNA双螺旋。,第一节:原核生物的转录机制,大肠杆菌RNA聚合酶是大肠杆菌细胞中最大的酶之一,该酶至少有5种亚基组成,它们分别是、和亚基。RNA聚合酶全酶包括两个亚基,另外4个亚基各一个分子(即2)。全酶(holoenzyme)是转录起始所必需的。因子对转录的延伸不是必需的。在转录起始后它就从转录复合物上释放出来。不含因子的酶称为核心酶(即2)。,一、大肠杆菌RNA聚合酶,a,a,s,bbw,Core (a2, bbpw) Combined molecular weight 390 KDa,Sigma subunitsbind transiently to the corevary in si
5、zedirect RNA polymerase to specific DNA binding sites,a- subunits MW = 35.6 KDa,w- subunits MW = 11 KDa Not required for activity,b - subunits MW = 155 KDa MW = 151 KDa,Eubacterial RNA Pol Subunits,a2bbs Holoenzymea2bb Corebb Catalytic Centers Specific Promoter Recognition,大肠杆菌中最常见的因子是70(因其分子量为70 KD
6、而得命)。因子在全酶对启动子的识别中起关键作用,但并不参与链的延伸过程。大肠杆菌有多种因子。它们识别不同类型的启动子序列。在RNA链延伸89 nt时,因子会从RNA聚合酶中释放出来。然后核心酶沿DNA模板移动合成RNA链。释放出来的因子可以再和其他核心酶结合重新起始转录。,二、70启动子,启动子是DNA分子上RNA聚合酶首先结合的序列。大肠杆菌中,其中最常见的因子是70(因其分子量为70 KD而得命)。70识别的启动子由40至60 bp的序列组成。通过比较不同基因的启动子序列,人们在大肠杆菌基因的启动子中发现了两个6 bp的共有序列,一个在10位置,另一个在35位置。共有序列是指一系列相关但不
7、相同的序列在各个位置上最常出现的核苷酸构成的序列。,大肠杆菌RNA聚合酶全酶所识别的启动子区,启动子的10框和35框的碱基序列都容许在一定范围内发生变化。它们与共有序列越相似,启动子的活性就越高,反之活性就越低。最初转录的50 nt长的序列也影响着启动子的效率。这段序列控制着RNA聚合酶离开启动子并开始全长转录物的合成。在一些较强的启动子中,如rRNA基因的启动子中,位于35序列的上游有一段富含A/T的序列,发现了一种能与RNA聚合酶发生特异性相互作用的DNA元件,称为UP元件。它能增强聚合酶与DNA的结合,提高转录效率。,90的基因的转录起始位点是嘌呤,G比A更常见。起始位点两侧的碱基通常是
8、C和T(如CGT或CAT)。起始位点附近的序列也可影响转录的起始。,三、转录的起始、延伸和终止,RNA聚合酶的核心酶2对DNA有一种非特异的亲和力。当因子与核心酶结合形成全酶之后,全酶对非特异DNA的亲和力显著降低达20 000倍;同时使全酶与启动子的结合能力增强了100倍。总的效果是显著增强了全酶与启动子结合的特异性。在转录的起始阶段全酶识别并与启动子结合是很迅速的。一般认为聚合酶沿着DNA滑动直达启动子序列。聚合酶与处于双螺旋状态的启动子DNA所形成的最初复合物被称为闭合复合物(closed complex)。,当RNA聚合酶与启动子区紧密结合后,围绕转录起始位点解开一小段DNA双螺旋,形
9、成开放复合物(open complex)。被打开的双螺旋的长度为1217 bp。开放复合物一旦形成,聚合酶即开始合成RNA。转录进入流产式起始阶段(abortive initiation)。在这一时期,聚合酶会合成并很快释放一些长度小于10个核苷酸的RNA分子。一旦聚合酶成功地合成一条超过10个nt的RNA,一个稳定的三元复合体就形成了,即一个包括聚合酶、DNA模板和生长中的RNA链的复合体。于是,转录也由起始阶段进入了延伸阶段,因子也与RNA聚合酶分离。,在RNA链的延伸过程中,转录泡与RNA聚合酶一起沿DNA移动。转录泡的大小保持恒定表明,聚合酶在转录泡之前解旋DNA,而在其后复旋DNA。
10、大约有48 nt的新合成的RNA链与DNA模板形成RNADNA杂合体。,在细菌中存在两种不同的转录终止机制。一种终止类型不需要Rho因子的参与,称为Rho非依赖型终止;另一种需要Rho因子的参与,称为Rho依赖型终止。 介导Rho非依赖型终止的DNA序列称为Rho非依赖型终止子,由两个序列元件构成:一段短的反向重复序列(大约20个核苷酸),其后是一段大约由数个T构成的序列。这些元件只有被转录之后才会引发聚合酶的终止反应,也就是说,它们是以RNA而不是DNA的形式起作用。当RNA聚合酶在转录终止序列时,被转录出的,反向重复序列会形成一种发卡结构。发卡的茎部通常有较高的G-C含量,使其有较高的稳定
11、性,从而使RNA聚合酶在停顿。发卡之后通常是4个或更多的U碱基,从而导致RNA和模板链的弱结合。这利于RNA链的解离,从而终止转录。,有些基因的终止序列需要一个辅助的蛋白质因子Rho才能有效地终止转录。Rho因子结合到单链RNA的特定位点上,它利用水解ATP所产生的能量沿RNA链向聚合酶移动。当聚合酶遇到终止信号时,RNA形成的发卡结构有关使聚合酶停顿下来,于是Rho因子追上了RNA聚合酶,它作为一种解旋酶,打开模板和转录产物之间的氢键,造成转录终止 。,Rho in action,Rho is a hexamer helicase.,Can unwind RNA-DNA hybrids.,第
12、二节:真核生物的转录机制,真核细胞内的RNA聚合酶不止一种,在功能上有了分工,不同性质的RNA由不同的RNA聚合酶负责合成。在真核细胞中有三种RNA聚合酶,即RNA聚合酶I、RNA聚合酶II和RNA聚合酶III。,一、真核生物RNA聚合酶, RNA聚合酶I合成5.8S rRNA、18S rRNA和28S rRNA,存在于核仁中,对鹅膏蕈碱不敏感。 RNA聚合酶II合成所有的mRNA以及部分sn RNA,存在于核质中,对鹅膏蕈碱非常敏感。 RNA聚合酶III合成tRNA、5S rRNA和某些sn RNA,也存在于核质中,对鹅膏蕈碱中度敏感。,每种RNA聚合酶都含有两个大亚基和1215个小亚基,其
13、中一些亚基为二种或三种RNA聚合酶所共有。研究得最清楚的真核生物RNA聚合酶是酵母的RNA聚合酶,编码酵母RNA聚合酶各亚基的基因已被克隆,并且被测序。RNA聚合酶各亚基也通过SDS聚丙烯酰胺凝胶电泳得到了分离。,所有RNA pol 的最大的亚基的C-端都含有一段七肽串联重复序列Tyr-Ser-Pro-Thr-Ser-Pro-Ser,延伸形成一个尾巴,被称为羧基末端结构域(carboxyl-terminal domain,CTD)。酵母的Pol II的CTD中有27个这样的重复序列,哺乳动物中有52个重复,每一重复都包含特定的磷酸化位点。,二、RNA Pol I 负责转录的基因,1.核糖体RN
14、A基因,rRNA是细胞内占优势的转录产物,占细胞RNA总量的8090。真核细胞中有4种rRNA,5S、5.8S、18S和28S rRNA。在真核细胞基因组中,18S、5.8S和28S rRNA基因构成一个转录单位,由RNA聚合酶I负责转录。5S rRNA则单独由RNA聚合酶III转录。,rRNA基因属于中度重复序列,集中成簇,形成rDNA。人类细胞在不同的染色体上分布有5个rRNA基因簇,每一rRNA基因簇含有许多转录单位,转录单位之间是非转录间隔区。,真核生物rDNA的编码区在各物种间显示很强的保守性,但是基因间的非转录间隔区和转录间隔区在长度和顺序上变异很大。非转录间隔区是rDNA中变化最
15、大,也是十分重要的一个区域。它含有启动子,控制rRNA基因的转录;存在很多小段重复顺序,具有增强子功能;存在于转录终止有关的信号。,2.RNA Pol I promoter,人类的rRNA基因的启动子由核心启动子和上游控制元件两个部分构成。核心元件(core element)包括转录起始位点,跨越45到20区域,可以单独起始转录。位于180107的上游控制元件(upstream control element, UCE)可以显著提高转录效率。两种元件密切相关,二者有85的序列一致性,并且富含GC。一般来说转录起始位点附近的序列富含AT,使DNA分子在此区段容易解螺旋。,3.upstream b
16、inding factor and selectivity factor I(上游结合因子和选择因子I),RNA聚合酶I需要两种辅助因子。UBF(upstream binding factor )是一种DNA序列特异性结合蛋白,结合在UCE的上半段 。UBF是一种装配因子(assembly factor)。选择因子(selectivity factor 1, SL1)本身并没有启动子结合专一性。但是, 在UBF1与启动子结合后,SL1与UBF1DNA复合物结合,也就是说SL1与启动子的结合需要UBF1的介导。SL1的结合使得RNA聚合酶I 结合到核心启动子上起始转录。,三、RNA Pol II
17、I genes: 5S rRNA and tRNA transcription,RNA聚合酶III是一个至少由16种不同的亚基构成的复合体,与RNA聚合酶II一样也位于核质种。RNA聚合酶III负责5S rRNA、tRNA、无帽子结构的snRNA(small nuclear RNA)和snoRNA(small nucleolar RNA)的转录。,1.tRNA基因的转录,tRNA基因的启动子也位于转录起始位点之后,由两个非常保守的序列构成,分别被称为A框(5-TGGCNNAGTGG-3)和B框(5-GGTTCGANNCC3)。同时这两个序列还编码tRNA的D环和TC环。这意味着tRNA基因内的
18、高度保守序列同时也是高度保守的启动子的序列。,转录因子TFIIIC可与启动子的A框和B框结合。 TFIIIB与A框上游序列结合。TFIIIB没有序列特异性,因此它的结合位点由TFIIIC在DNA上的结合位置决定。TFIIIB促使RNA聚合酶III与转录起始位点结合并起始转录。,2.rRNA基因的转录,与RNA聚合酶I转录的rRNA基因一样,5S rRNA基因也是串联排列形成基因簇。在人类基因组中有一个大约由2000个5S rRNA基因组成的基因簇。5S rRNA基因的启动子位于转录起始位点下游,转录区的内部,被分成两个部分,A框和C框。A可位于5065,C框位于8199。,5S rRNA基因启
19、动子的C框是一个特异DNA结合蛋白TFIIIA的结合位点。TFIIIA作为装配因子使得TFIIIC与5S rRNA基因启动子相互作用。A框也可能稳定TFIIIC与DNA的结合。一旦TFIIIC结合到启动子上,TFIIIB就会结合在转录起始位点附近,促进RNA聚合酶III的结合而起始转录。,3.RNA聚合酶III的上游启动子,还有一类RNA聚合酶III负责转录的基因(例如7SK RNA、7SL RNA和U6 snRNA基因)的启动子位于转录起始位点的上游,属于外部启动子。在这类启动子含有三种元件,靠近转录起始位点的上游序列TATA框,是转录起始所必需的。TATA框上游的是近序列原件(proxim
20、al sequence element, PSE)和远端序列元件(distal sequence element)。,TATA框被含有TBP的转录因子所识别,实际上TBP就是识别TATA框的亚基。TBP亚基与其他亚基结合形成一个复合体,其中一些亚基是pol III聚合酶启动子特异性的,这也可以解释为什么RNA聚合酶III专一性地结合到这类启动子上。TBP及其相关蛋白的作用就是保证RNA聚合酶III的准确定位。,1. RNA聚合酶II体外转录起始的基本机制,RNA聚合酶II识别的启动子由三部分组成:起始框(initiator box),TATA框和上游元件(upstream element)构成
21、。其中起始框和TATA框是体外RNA聚合酶精确起始转录所需的最少一组序列元件,因此又称基本启动子。,四、RNA Pol II基因的转录,Inr and TATA box,所有的真核生物RNA聚合酶自身均不能识别并结合启动子,它们需要转录因子的辅助才能与启动子结合起始体外转录。RNA聚合酶II进行体外基本转录(basal transcription)所必需的转录因子称为通用转录因子。它们的作用包括识别启动子序列、组装转录起始复合体、打开DNA双链和诱发启动子逃离(promoter clearance)。,(2)通用转录因子与转录起始,基本转录的起始,依赖转录因子与启动子的相互作用,以及各种通用转
22、录因子间的相互作用。通过这种相互作用,转录因子按照特定的时空顺序组建转录起始复合物,其中TBP与TATA框的结合则是这一过程的开端。复合物中的转录因子不仅募集RNA聚合酶II并介导它与DNA的结合,而且提供解旋酶、ATPase和蛋白激酶等在内的启动转录起始所必需的各种活性。,TFIID是一个多蛋白复合体,复合体中有一条多肽链即为TATA结合蛋白(TBP),呈马鞍型(saddle shaped)结构。TBP是一种序列特异性DNA结合蛋白,作用于DNA的小沟。马鞍型结构的内部与TATA框结合,这种结合使DNA发生弯曲变形。所形成的TBPDNA复合体为其他通用转录因子和聚合酶与启动子的结合提供了一个
23、平台。,TFIIA与TFIID结合,稳定TFIIDDNA复合体。一旦TFIID与DNA结合,另一个转录因子TFIIB就会与TFIID结合,而TFIIB又可以与RNA聚合酶结合。这似乎是转录起始过程中的重要一步,因为通过与TFIID和RNA聚合酶的相互作用,TFIIB引导RNA聚合酶II和另一转录因子TFIIF一起加入到起始复合体中,并正确定位。TFIIF的作用可能是帮助RNA聚合酶与启动子的结合。,RNA聚合酶结合之后, TFIIE和TFIIH按顺序迅速结合到复合体上。TFIIH是一个大的由多个亚基构成的蛋白质复合体。它具有DNA解旋酶、ATPase和CTD激酶活性,它的作用是打开DNA双链并
24、使RNA聚合酶II的羧基末端结构域磷酸化。TFIIE的作用是引导TFIIH与起始复合体结合,并对TEIIH的解旋酶活性和激酶活性进行调节。,TFIIB,TBP,TFIIE,Total complex has more than 30 polypeptidesRNA pol II (12) TBP (1) TFIIA (3) TFIIB (1) TFIID (12) TFIIE (2) TFIIF (2) TFIIH (12),The assembly of the transcription apparatus: Transcription initiation,5 3,3 5,DNA unw
25、inding to produce an open complex,closed complex,Transition from transcriptional initiation to elongation,5 3,3 5,DNA unwinding to produce an open complex,open complex,5 3,3 5,Start of mRNA synthesis,mRNA,2、上游启动子元件,RNA聚合酶II在体内进行有效转录还需要上游元件。上游元件的长度通常是510 bp,位于转录起始位点50200 bp处,能够极大地提高转录效率。一个启动子可以具有多个上游
26、元件,同一个上游元件也可以存在于不同启动子的不同位置。,常见的上游元件包括GC框、CAAT框、AP1元件以及Oct元件。GC框是真核生物II型启动子中的一个常见元件。它的共有序列是GGGCGG。在转录起始位点上游40100 bp处可以有几个拷贝的GC框。转录因子SP1与GC框结合。一些上游元件可以被几种特异性的转录因子识别。在这种情况下,不同的转录因子存在于不同的组织中。例如,转录因子Oct-1和Oct-2均识别Oct元件。Oct-1存在于所有的组织中,但Oct-2仅存在于免疫细胞中,激活编码免疫球蛋白的基因。,3、增强子(enhancer),除核心启动子和上游调控元件以外,真核生物基因还有一段序列与转录的起始有关。在SV40早期启动子的上游一段200 bp的DNA片段可以明显增强启动子的转录作用。该片段含有两个72 bp长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始,除去这两段序列会大大降低基因的表达水平。这种通过启动子来增强转录的序列被称为增强子(enhancer)。大多数受调控的基因的表达都需要增强子,而持家基因的表达不需要增强子。,