1、第四章 转录(transcription),2,基因表达(gene expression) 是指储存遗传信息的基因经过一系列步骤表现出其生物功能的整个过程。典型的基因表达是基因经过转录、翻译,产生有生物活性的蛋白质的过程。 转录是基因表达的第一步,以dsDNA中的一条单链作为转录的模板,以核糖核苷三磷酸(rNTP)为底物,在依赖DNA的RNA聚合酶(DNA-dependent RNA polynerase ,DDRP)的作用下,按 A U,C G 配对的原则,合成RNA分子的过程。,第一节 基 本 概 念,一、RNA合成的基本特点,1960年Weiss, S, B等发现RNA聚合酶(RNA P
2、ol)。 几乎存在于所有细胞中,其特点是: (1)以核糖核苷三磷酸(rNTP)为底物; (2)以DNA为模板; (3)按53方向合成; (4)无需引物的存在能单独起始链的合成; (5)第一个引入的rNTP是以三磷酸形式存在; (6)在体内DNA双链中仅一条链作为模板; (7)RNA的序列和模板是互补的。,二、RNA合成和DNA复制的区别,(1)转录时只有一条DNA链为模板,而复制时两条链都可作为模板; (2)转录时形成的DNA-RNA杂合双链不稳定,RNA合成后释放;而DNA复制叉形成后一直打开,新链和模板链形成聚合双链; (3)RNA合成不需引物,而DNA复制需引物; (4)转录的底物是rN
3、TP,复制的底物是dNTP; (5)两者使用的聚合酶系不同。,三、有义链和无义链,1963 J.Marmur和Doty Spiegeman区分有义链,采用枯草杆菌的SP8噬菌体为材料; SP8 DNA 双链有“ 轻”、“ 重”,差异明显; 现在将作为转录模板的DNA单链称为模板链(template strand)或反义链(antisense strand); 非模板链称为有义链(sense strand)或编码链(coding strand); 在体外DNA的两条链都可作为RNA合成的模板。,6, 模板单链 DNA的极性方向为3 5, 而非模板单链DNA的极性方向与RNA链相同,均为5 3,D
4、NA,(书写DNA序列时,仅写非模板序列,可不注明极性方向),3-TACTCAT-5,RNA 5-AUGAGUA-3,5-ATGAGTA-3,Non-template(sense strand,编码链,与mRNA序列相同的那条链),template (antisense strand,指根据碱基互补原则指导mRNA生物合成的DNA链 ), 某一基因只以一条单链DNA 为模板进行转录(不对称转录), RNA转录包括promotion, elongation, termination 三个过程, 从启动子(promoter)到终止子(terminator)称为转录单位 (transcription
5、al unit),在DNA双链上,一条链可转录,另一条链不转录 模板链并非永远在一条单链上, 原核生物中的转录单位多为多顺反子,有操纵子结构;, 转录原点记为+1,其上游记为负值,下游记为正值,真核生物中的转录单位多为单顺反子,无操纵子结构;,upstream start point downstream,启动子:指DNA分子上被RNA聚合酶识别并结合形成起始转录复合物的区域。,终止子:在转录过程中,提供转录终止信号的DNA序列,研究转录涉及到两个方面: 其一是RNA合成的酶学反应; 其二是RNA合成的起始、延伸、终止和释放各阶段;,第二节 原核生物的转录,大肠杆菌的RNA聚合酶是目前了解最详
6、细的RNA聚合酶 在一个大肠杆菌细胞中,大约有7000个RNA聚合酶分子,其中有20005000个酶分子在参与RNA的合成 RNA聚合酶合成RNA的速度:37 约40个核苷酸/秒RNA pol 和DNA pol有两点不同: (1)RNA pol 没有任何校对功能; (2)在不需要引物的前提下能起始合成新的RNA链。,一大肠杆菌的RNA聚合酶,大肠杆菌RNA聚合酶,Core Enzyme核心酶,Holo Enzyme全酶480kDa,非专一性与DNA 结合,专一性与 DNA结合,全酶中的亚基与其他亚基结合较松弛,常易从全酶上解离,亚基的功能是识别和结合启动子的保守区,介导RNA聚合酶与启动子的结
7、合。 此外,新发现的一种亚基的功能尚不清楚。,12,因子, 可重复使用(Reusable), 使全酶识别Sextama Box (35区 R位点),并通过与模板链结合, 修饰 RNAPol 构型,降低全酶与DNA的非专一性结合力(107/mol),增强全酶与R, B site(-10区)的专一性结合力 (1014/mol), 启动因子,R位点-Sextama框,松弛结合位点 B位点-Pribnow框(-10区),紧密结合位点, 因子(蛋白)包含一个螺旋-转角-螺旋结构,可以嵌入 DNA 大沟,并通过氢键与 DNA 紧密结合。,14, 转录开始后,亚基脱离聚合酶,以后仅由核心酶催化RNA链的延长
8、,否则 RNA链的延伸缓慢 不同的因子识别不同的启动子E.coli 中有四种因子(70、32、54、28)枯草杆菌中有11种因子(通过因子的更替对转录起始进行调控),枯草杆菌至少有 10 种 因子: A,B,C,D,H,L:识别营养生长期表达的基因的启动子 E,F,G,K:识别孢子形成期表达的基因的启动子,16,因子, 促使RNA Pol与DNA 模板链结合, 位于前端的因子使双链解链为单链, 位于尾端的因子使单链重新聚合为双链,17,因子;, 促进RNA聚合酶 + NTP 使RNA链延长, 完成 NMP之间的磷酸二酯键的连接, Editing(校正), 与终止蛋白Rho()因子竞争RNA 3
9、-end,决定转录是否终止, 构成Holo Enzyme后,因子含有 两个位点,对 NTP 非专一性结合,18, 因子, 强碱性亚基, 与非模板链(sense strand)结合(充当SSB), 受K酶抑制 (K酶与终止有关,K酶结合后RNA Pol从DNA上脱离,转录终止),19,全酶含有五个功能位点, sense strand DNA binding point( ), DNA/RNA 杂合位点hybrid site(), dsDNA 解链位点unwinding point(), dsDNA 再缠绕位点rewinding point(), factor point,RNA pol 执行的功
10、能,识别DNA双链上的启动子(promoter); 使DNA变性,在启动子处解旋成单链; 通过阅读启动子序列,RNA pol确定它自己的转录方向和模板链; 最后当它达到终止子时,通过识别终止序列停止转录。,二、转录的起始与延伸,(一) 启动子的结构和功能启动子(promoter):是指DNA分子上被RNA聚合酶识别并结合形成起始转录复合物的区域,它还包括一些调节蛋白质因子的结合位点。位于基因5 端的调控区域,启动转录的起始。 启动子是控制转录起始的序列,并决定某一基因的表达强度; 与RNA聚合酶亲和力高的启动子,其转录起始频率和效率均高; 启动子的DNA序列有其独特的特点,原核生物和真核生物的
11、启动子序列结构上有一定差异。,23,promoter 由两个重要部分组成 (扩展的启动子),上游部分 CAP-cAMP结合位点 -70 -40,下游部分 RNA Pol的进入(结合)位点 -35 -10 +1,基因表达调控的正控制位点,上游控制因子UCE, upstream control element,核心启动子,core promoter,CAP-cAMP binding site, siteI + CAP-cAMP,cooperative effect,提高siteII 的结合效率,1.上游控制因子的结构特点,Site II + CAP-cAMP 复合体 促使Sextama Box 附
12、近GC岛区的双螺旋结构稳定性降低, Pribnow Box 的解链温度降低,利于转录启动,RNAPol,(1)结构典型,都含识别(R,即-35区),结合(B,即-10 区)和起始(I,+1)位点; (2)序列保守;如-35和-10序列结构; (3)位置和距离都比较恒定; (4)直接和多聚酶相结合; (5)位于基因的上游; (6)决定转录的启动和方向; (7)常和邻近基因共同组成操纵子(operon),这也是原核生物的特性。,2.核心启动子序列的结构特点:,典型启动子的结构,-35区 -10区 转录起点+1TTGACA 16-19bp TATAAT 5-9bp,28,-35区( Sextama
13、框)是RNA Pol的松弛(初始)结合位点因子可以识别该位点,所以称作recognition site (R site) 保守序列为TTGACA,每个碱基的出现频率不同,又可写为 T82T84G78A65C54A45 功能是:(1)为RNA pol的识别位点。亚基识别-35序列,为转录选择模板,很大程度上决定了启动子的强度;(2)-35和-10序列的距离是稳定的,此与RNA pol的结构有关。 位置在启动子中略有变动,-10区(Pribnow 框 ),-10序列是由Pribnow和Schaller(1975)发现,故称为Pribnow框(Pribnow box),它位于转录起点上游约-10 b
14、p处,是RNA pol的牢固结合位点 binding site (B site) 。 保守序列为TATAAT,每个碱基的出现频率不同,又可写为T80A95T45A60A50T96; 位置范围 -4 到-13,AT较丰富,易于解链。 其功能是:(1) RNA pol紧密结合位点;(2)在此形成开放启动子复合体;(3) 使RNA pol定向转录。,-10序列的碱基组成对转录的效率影响很大,发生此区域的某些突变会导致如下结果:,减效突变:TATAAT AATAAT,转录效率会下降,即称减效突变(down mutation)。 增效突变:TATGTT TATATT,则转录效率会上升,即称增效突变(up
15、 mutation)。 前者可能由于T-A的堆集能要小于A-T的堆积能,后者可能是由于堆集能降低和氢键的减少。,转录开始时模板上的第一个碱基为转录起始位点; 在原核生物中90%以上为A或G; 位置固定,常见序列是CAT。,转录起始点(initiation site): +1位点,32,l Sextama Box 与Pribnow Box 间距17bp,有利于RNA Pol启动,l Sextama Box or Pribnow Box mut.,间距趋近于17 bp,up mutation,间距远离于17 bp,down mutation,17bp的间距较17bp的序列对转录更为重要,Sexta
16、ma Box and Pribnow Box mut., 转录率下降100X, 转录率下降1000X,33,因子起着识别启动子的作用;,在菌体细胞中,只有很少的RNA聚合酶分子(核心酶)呈游离状态,大部分与DNA分子结合存在。这种结合为松弛型结合,形成松弛型复合物,并且核心酶对启动子无特殊的亲和力;,全酶形成后,对启动子的亲和力大大提高,转录酶沿 DNA 滑行至启动子,由 因子识别并紧密结合,形成紧密闭合型复合物;,(二)转录的起始,34,35,在开放型启动子起始复合物中,RNA聚合酶移动到转录起点I,酶上的起始位点和延伸位点被相应的核苷酸占据,在亚基的催化下形成第一个磷酸二酯键,从而形成酶-
17、启动子-rNTP三元复合体(ternary complex) 转录开始,当 RNA 合成至长约 9 核苷酸时,因子解离下来,形成延伸复合物,此时核心酶约与55bp(3520)的DNA相互接触。,36,(三)RNA的合成延伸,在酶分子上有两个核苷酸结合位点,一是起始位点,一是延伸位点; 当两个位点都与模板互补的核苷酸结合后,第一磷酸二酯键才能形成; 随着RNA聚合酶沿着模板链的滑动,由亚基催化合成RNA链; 延伸方向为5-3。,转录过程,转录酶沿编码链 5 3 方向移动,开放复合体(保持约 17bp 长)随之前移,RNA 链以 5 3 方向合成延伸,速度约为 43 核苷酸 / 秒。,三、转录的终
18、止,在开放复合体中,RNA 与 DNA 的氢键结合能够防止转录酶脱离 DNA。当 RNA-DNA 杂交区被迫分离时,则转录酶和 RNA 均脱离 DNA,转录结束。 终止子(terminator,t):在转录过程中,提供转录终止信号的序列,按终止方式不同分为强终止子和弱终止子。 强终止子:内部终止子(intrinsic terminators)或称自发终止; 弱终止子:需要因子(rho factor)又称为依赖性终止子(rho-dependent terminator)。,自发终止在 RNA 链中需要两种序列元件:位于 RNA 3 末端的富含 U 的序列,即U串;靠近 RNA 3 末端的自互补序
19、列(即回文序列),可形成茎-环结构。,茎-环结构使转录酶停止合成 RNA。接着由于 U-A 间氢键较弱,故而 RNA 自行脱离 DNA,从而终止转录。,强终止子的结构,NNAAGCGCCGNNNCCGGCGCTTTTTTNNNNNTTCGCGGCNNNGGCCGCGAAAAAANNN DNANNAAGCGCCGNNNCCGGCGCUUUUUUNNN RNA,NN NN NG CC GC GG CC GG CC UNNNNC U UUUU-OH 3 mRNA强终止子结构的模式图,发夹结构,强终止子的结构特点:,(1)有回文结构存在; (2)茎的区域内富含G-C; (3)强终止子3端上有连续6个U
20、。 终止机制: * 终止作用发生在RNA水平上,形成的颈环空间结构阻止了转录的进行,同时3端上连续6个U使RNA易解离,脱离DNA模板,于是整个mRNA释放出来,转录停止。,依赖于 因子的终止大肠杆菌中的 因子为碱性蛋白,分子量为 46 kDa,有解旋酶功能。 因子识别 RNA 上的 rut 位点,与之结合,然后向转录酶移动。当转录酶到达终止序列时,则停止合成 RNA,于是 因子赶上转录酶,使 RNA-DNA 杂交链解开,从而 RNA 和转录酶脱离,转录结束。,含有IR序列,也能形成发夹结构; C的含量多,G的含量少; 缺少U串;*RNA聚合酶在此处暂停,若加入因子,则使转录停止在特定的终止位
21、点。,依赖性终止子结构与终止机制,*因子可识别终止位点上游5090bp的区域,该区域RNA分子中C的 含量高,G的含量少。,RNA Pol转录DNA因子附着到RNA识别位点上因子跟在RNAPol后沿RNA移动RNA Pol在终止位点停下,并被因子追上在转录泡中因子使DNA-RNA杂种双链解开转录终止,释放出RNA Pol,子和 RNA,第三节 真核生物的转录,真核生物的转录和原核转录的不同点: 原核只有一种RNA聚合酶,而真核细胞有三种聚合酶; 启动子的结构特点有所不同,原核生物启动子结构类似,真核有三种不同的启动子和有关的元件,分别对应不同的RNA聚合酶; 真核的转录有很多蛋白质因子的介入。
22、,表12-2 真核生物的三种RNA聚合酶的特点 RNA Pol 位置 产物 相对活性 对-鹅膏蕈的敏 Pol 核仁 28s,18s,5.8s rRNAs 5070% 不敏感 Pol 核质 hnRNA,mRNA,某些SnRNA 2040% 高度敏感 Pol 核质 tRNA,5SrRNA,某些SnRNAs 10% 片段特异,中等敏感表12-3 转录的抑制剂 抑制剂 靶酶 抑制作用 利福霉素 细菌全酶 和亚基结合,抑制起始 链霉溶菌素 细菌核心酶 和亚基结合,抑制起始 放射线素D 真核Pol 和DNA结合,阻止延伸 -鹅膏蕈 真核Pol 和RNA Pol结合,一、真核的RNA 聚合酶,真核生物有三种
23、转录酶:转录酶 I:转录 rRNA(5S rRNA 除外) 转录酶 II:转录所有 mRNA 及某些 snRNA 转录酶 III:转录所有 tRNA 及 5S rRNA 和几种小分子 RNA三种转录酶都含有约 10 个亚基,其中 2 个大亚基与细菌转录酶的 和 亚基相似,起催化 RNA 合成的作用。真核生物转录酶全酶不包括转录因子,但须有转录因子才能起始转录。,二、启动子,真核生物的三种转录酶对应有三种启动子,它们通常包含一个核心启动子和一些调控元件。,转录酶 I 的启动子不同生物的转录酶 I 启动子没有序列同源性,但位置相对一致。45S rRNA 是串联重复的冗余基因(18S + 5.8S
24、+ 28S),在基因内和间隔区都有启动子,因此可以转录出两种产物。,转录酶 II 的启动子起始区中转录起点通常为 A,其上游为 2 个嘧啶及 C,下游为 5 个嘧啶;TATA 盒负责精确定位转录起点。GC 盒(GGGCGG)和 CAAT 盒(GGCCAATCT)为转录因子识别位点,将转录酶吸引到启动子附近,其数量和位置因基因不同可有很大变化。,转录酶 III 的启动子A、B、C 盒皆为长约 10 bp 的序列,协助转录酶 III 与 DNA 结合。,三、转录因子,在真核生物中已发现一些通用的转录因子: 转录酶 I 的转录因子 上游结合因子(UBF) SL1 因子:由 TATA 结合蛋白(TBP
25、)和 TATA 结合蛋白联结因子(TAF)组成,转录酶 II 的转录因子已知作用于 TATA 盒的转录因子 II 主要有 6 种,从酵母到人类均是保守的:TFIIA:使 TFIID 与 TATA 盒结合更紧密,故非必需。TFIIB:将转录酶 II 引进起始复合体。TFIID:识别 TATA 盒,主要成分是 TBP 和 TAF。TFIIE:促进 TFIIH 激酶活性,反控其的解旋酶活性。TFIIF:促进转录酶 II 进入起始复合体,与转录酶 II 结合后有解旋酶活性,为开放复合体形成所必需。TFIIH:对由闭合复合体转向开放复合体起作用,使转录酶 II 脱离起始复合体,进入延伸状态。,转录酶 I
26、II 的转录因子 已知转录因子 III 有 3 种:TFIIIA:识别 Box A 和 Box C,启动 5S rRNA 的转录。TFIIIC:识别 Box A 和 Box B,启动 tRNA 的转录。TFIIIB:含有 TBP,与 TFIIIA-5S rDNA 复合体及 TFIIIC-tDNA 复合体发生作用,然后使转录起点上游的 DNA 弯曲,将转录酶 III 定位于转录起点,激活转录。,TBP 在转录起始中的作用,I 类TAF I 类起始因子 + 转录酶 I I 类转录SL1 复合体 rRNAII 类TAF II 类起始因子 + 转录酶 II II类转录 TBP TFIID 复合体 mR
27、NAIII类TAF III 类起始因子 + 转录酶III III类转录TFIIIB 复合体 tRNA,真核生物细胞中有三种转录方式,分别 由三种RNA聚合酶(、和)催化, 与之相对应有三种启动子: RNA聚合酶启动子- 类基因 RNA聚合酶启动子- 类基因 RNA聚合酶启动子- 类基因 重点介绍RNA聚合酶催化的mRNA的转录,四、真核生物转录的起始,1.RNA聚合酶启动子,启动子最为复杂,它和原核的启动子有很多不同: (1)有多种元件:TATA框,GC框,CAAT框等; (2)结构不恒定; (3)它们的位置、序列、距离和方向都不完全相同; (4)有的存在远距离的调控元件,如增强子; (5)这
28、些元件常常起到控制转录效率和选择起始位点的作用; (6)不直接和RNA pol结合;(7) 需多种转录因子介入。,类基因的启动子和调控区,TATA框:转录起始点上游-30处,又称Hogness框。核心元件起始子(initiator,Inr):一般由Py2CAPy5构成, 位于-3+5 ,可能提供RNA pol 识别。CAAT box:转录起始点上游-75处。 类启动子 上游元件组成 GC box:转录起始点上游-90处。增强子(enhancer)远端调控区 减弱子(dehancer)静息子(sisencer)上游激活序列(upstream activatingseguences UASs),起
29、始子(initiator,Inr),起始点一般没有同源序列; mRNA的第一个碱基倾向A,包括A在内的两侧翼由Py组成称为起始子(initiator,Inr)。在原核CAT起始序列也有这种情况); 一般由Py2CAPy5构成; 位于3+5处; 提供RNA pol 识别; 无论TATA是否存在,Inr起始子的强度和起始位点的选择都很重要; 现已纯化了 Inr结合蛋白。,TATA box,TATA框又称Hogness框,Goldberg-Hogness 框,俚语称为金砖(Goldbrick)。 其一致序列是:T85A97T93A85A63A83A50 ; 常在30区左右,相当于原核的10序列。其作
30、用是:(1) 选择正确的转录起始位点,保证精确起始,故也称为选择子(selector)。(2) 影响转录的速率。,上游启动子元件(UPE),表12-4 哺乳动物 RNA Pol上游转录因子结合的元件元件 保守序列 结合DNA的长度 蛋白质因子 TATAbox TATAAAA 10bp TBP CAAT box GGCCAATCT 22bp CTF/NF1 GC box GGGCGG 20bp SP1 Octamer ATTTGCAT 20bp Oct-1 Octamer ATTTGCAT 23bp Oct-2 KB GGGACTTTCC 10bp NFKB ATF GTGACGT 20bp A
31、TF B. Lewin:GENES.1997,Table 28.2,增强子(enhancer),增强子是在1981年由Benerji,Rusconi小组和Chambom 等发现的,又称远上游序列(far upstream seguence)。 其特点是: 具有远距离效应; 顺式调节; 无物种和基因的特异性; 具有组织的特异性; 有相位性,其作用和DNA的构象有关; 有的增强子可以对外部信号产生反应。,2.型启动子的转录因子,RNA聚合酶自身不能起始转录,必须在其他辅助因子(转录因子)的作用下才能转录,酶与其他辅助因子组成一个基础转录装置,起始类基因的转录; 转录过程需要很多的转录因子参与,他们
32、按一定顺序与DNA结合形成复合物; 转录因子均为分子量大小不等的蛋白因子; 转录起始复合物形成的基本过程为TBP及TAFS先与DNA的TATA框附近区域结合,而后依次为TFIIA、TFIIB、TFIIF、RNA聚合酶及TFIIE。,3.RNA pol的转录起始 TBP 转录复合体 TAFsTFIIATFIIB TFIIFPol IITFIIE,五、转录终止,转录酶 I (rRNA)的转录终止不论是从基因启动子还是从间隔区启动子转录,终止子都是相同的。终止子中有 Sal1 位点(称为 Sal box),能与 TTF1 蛋白结合,使转录酶 I 不能通过,从而造成转录终止。转录酶 II (mRNA)
33、的转录终止没有固定的转录终点,一般都必须通过 poly A 尾巴添加位点之后才能终止。转录酶 III (tRNA 及 5S rRNA)的转录终止转录终止于编码区 3 端的一连串 U 处,一种称为 La 的磷酸蛋白起着与细菌中 因子相似的作用。,六、转录中核小体的命运,两种研究结论结论 1:核小体组蛋白在转录时被完全置换过,即在转录酶通过时完全解体,转录酶通过后又重新形成。结论2:转录时核小体核心没有解体,仍松弛地结合在 DNA 上。 两种模型(针对第一种结论)模型 1:通过转录因子除去组蛋白。模型 2:核小体结构为负超螺旋,转录时开放复合体的前方会产生正超螺旋,促使核小体解体;后方则产生负超螺旋,有利于核小体重新形成。,