1、1. 原核基因组与真核基因组(prokaryotic genomes and eukaryotic genomes ) 大小(size):原核生物的一般都比较小,且变化范围也不大(最大/最小约为 20) 。真核生物的一般要比原核生物的大很多,且变化范围也很大(最大/最小可达 8 万) 基因结构(gene structure: continuous coding sequences, split genes)原核基因组:环状,较小;通常由单拷贝或低拷贝(low-copy)的 DNA 序列组成;基因排列紧密,较少非编码序列 “streamlined”真核基因组:多线状;大小一般要比类核基因组大好几
2、个数量级,且变化范围很大;有大量的非编码序列(重复序列、内含子等) 非编码序列(non-coding sequences: repeated sequences, introns )局部分布的重复序列(localized repeated sequences):串联式( tandem)的高度重复序列(highly repeated sequences):重复单位的长度从几 bp 到几百 bp,可重复几十万次或更多,常见于着丝粒、端粒和异染色质区域散布的重复序列(dispersed repeated sequences):短的散布式重复序列(short interspersed elements
3、, SINEs):500 bp 以下,可重复 105 次或更多,很多 SINEs 都是反转录转座子(retroposon) ;长的散布式重复序列(long interspersed elements, LINEs):5 kb 以上,可重复 104 次或更多,很多 LINEs 也是与反转录转座子相关的序列内含子(intron):I 类(group I intron) 、II 类(group II intron) 、III 类(group III intron) 、核 mRNA 内含子(nuclear mRNA intron) ,即剪接体内含子( spliceosomal intron) 、核tR
4、NA 内含子(nuclear tRNA intron) 、古细菌内含子(archaebacterial intron) 细胞器基因组(organelle genomes: mitochondrial genomes, chloroplast genomes)线粒体基因组:在不同类型的生物中变化很大多细胞动物:细小、致密,没有或很少非编码序列高等植物:复杂、不均一,比动物的大得多原生动物、藻类、真菌:或偏向于动物型,或偏向于植物型,但又有其各自的独特之处叶绿体基因组:比较均一,85 292 kb(大部分都在 120 160 kb 之内)2. 转录(transcription)(1)RNA 聚合酶
5、(RNA polymerase)原核生物:1 种,全酶(holoenzyme)由核心酶与 亚基组成, 亚基的作用真核生物:3 种,由多个亚基组成cis- 顺式、同一分子 trans- 反式、不同分子in vivo 体内、细胞内 in vitro 体外、无细胞体系in situ 原位 in silico 基于生物信息学的研究体系sense strand 有义链)= nontemplate strandantisense strand(反义链)= template strand(2)顺式作用元件与反式作用因子(cis-acting elements and trans -acting factor
6、s)启动子(promoters) 、增强子(enhancers)为顺式作用元件原核启动子:-10 box (Pribnow box), -35 box真核启动子:I 类, II 类,III 类RNA 聚合酶 I 识别的启动子(I 类启动子,class I promoters)RNA 聚合酶 II 识别的启动子(II 类启动子,class II promoters)RNA 聚合酶 III 识别的启动子(III 类启动子,class III promoters)增强子:较多在真核生物中存在;能增强转录的元件,但又不是启动子的一部分(无位置、方向的限制) ,增强子常在启动子的上游,但也可以在基因内部
7、(如内含子中)转录因子(transcription factors)为反式作用因子,真核基因的转录需反式作用因子通用转录因子能使聚合酶结合到启动子上,形成预起始复合物(preinitiation complex) ,包括形成开启的启动子复合物(open promoter complex) ,但只能导致基础水平的转录通用转录因子: I 类, II 类,III 类II 类因子:Polymerase II 转录所需的通用转录因子II 类预起始复合物:包含有 RNA 聚合酶 II 及 6 种通用转录因子:TFIIA、 TFIIB、 TFIID、TFIIE、TFIIF 、TFIIH。TFIID 在 TF
8、IIA 的协助下,首先结合到TATA box,形成 DA 复合物,然后 TFIIB 再结合上去。TFIIF 协助 Polymerase II 结合到 DNA 链上(-34 至+17 区域)TFIIHE、TFIIH 结合到复合物体中,形成 DABPolFEH 预起始复合物TFIID 的结构及功能:TFIID 本身是一个复合物,含 1 个 TATA box 结合蛋白(TATA box-binding protein, TBP)和 8 10 个 TBP 相联因子(TBP-associated factors, TAFs, or TAFIIs)TATA box 结合蛋白(TBP):序列非常保守的一种蛋
9、白质(约 38 kD) ,包含 180 个氨基酸的羧基末端,该末端是 TATA box 结合域(binding domain) 、TBP 是马鞍形的,结合到DNA 双螺旋的小沟上,能使 TATA box 弯曲 80TBP 相联因子(TAFIIs ):至少有 8 种,序列上也相当保守主要功能:促进转录、与启动子的元件相互作用(起始子、下游元件) 、与基因特异转录因子相互作用、TAFIIs 中的 TAFII250 还有酶的功能,如作为组蛋白乙酰转移酶TFIIA:在酵母中有 2 个亚基,在果蝇和人中有 3 个亚基;TFIIA 可以看成是一种TAFII(与 TBP 结合,能稳定 TFIID 与启动子之
10、间的结合) ;在体外体系中,TFIIA 并非必不可少TFIIB: 单亚基的因子(35 kD) ;能把 TFIID 与 TFIIF/Pol II 相连在一起,即是聚合酶 II 结合到预起始复合物所必需的;能与一些基因特异转录因子相互作用,促进转录TFIIF 的结构及功能:由 2 条多肽构成: RAP30 与 RAP70(RAP stands for RNA polymerase II-associated protein) ;RAP30 与 E. coli 的 因子有一定的同源性,能使 TFIIF结合到 Pol II;FIIF 与 Pol II 结合后,能减少聚合酶与 DNA 之间非特异的相互作
11、用,引导聚合酶到已结合有 TFIID、TFIIA 和 TFIIB 的启动子上TFIIE:有 2 个亚基(56 kD, 34 kD) ,每个亚基在 TFIIE 中都有 2 个拷贝(总分子量约为200 kD) ;能结合到 DABPolF 的复合体上,对转录有促进作用TFIIH:最后一个结合到预起始复合物的通用转录因子,结构、功能均复杂功能之一是使 Pol II 最大一个亚基的羧基末端域( CTD)磷酸化,即使 Pol IIA 变为 Pol IIO,从而导致转录起始到转录延伸过渡;具有 DNA 解螺旋酶(helicase )的活性,这是聚合酶离开启动子往前转录(promoter clearance
12、)所需的I 类因子(class I factors): Polymerase I 转录所需的通用转录因子I 类预起始复合物:RNA 聚合酶 I 和 2 种通用转录因子(I 类因子):SL1、UBF(上游结合因子,upstream-binding factor)SL1由 TBP(TATA box 结合蛋白)与 3 种 TAFs(TAFIs,TBP 相联因子)组成的复杂蛋白质SL1 并不直接与启动子结合,但它能加强 UBF 与启动子的结合,促进预起始复合物的形成SL1 还是 rRNA 基因转录的物种特异性的决定因素之一UBF由 2 条多肽构成(97 kD 和 94 kD) ,而 97 kD 的多肽
13、即具 UBF 的活性能与 I 类启动子的核心元件及 UCE(上游控制元件)的位点结合,再与 SL1 一起,促进转录III 类因子(class III factors):Polymerase III 转录所需的通用转录因子,有TFIIIA、TFIIIB、TFIIICTFIIIB 和 TFIIIC 是所有在基因内部有 III 类启动子的基因的转录所需的,5S rRNA 基因的转录还需要 TFIIIATFIIIA一类含“锌指”(zinc finger)的 DNA 结合蛋白的成员;锌指是 4 个氨基酸与 1 个 Zn 离子结合,再加上其他的氨基酸,构成手指状;在 TFIIIA 中, 4 个氨基酸是 c
14、ys-cys-his-his,一连 9 个锌指;锌指能使蛋白质与 DNA 紧密结合TFIIIB 和 TFIIIC:两者是一起共同起作用的TFIIIC 结合到基因内部的启动子中(如果是 5S rRNA 基因,则先有 TFIIIA 结合到启动子区) ,再帮助 TFIIIB 结合到启动子上游区(转录起始位点上游) ,而 TFIIIB 则帮助 Pol III结合在起始位点周围;转录开始后,TFIIIC(或 TFIIIA 和 C)被除去,而 TFIIIB 留在原位,可促进另一轮的转录具外部启动子的基因的转录因子TFIIIB 含有 TBP(TATA box 结合蛋白)及一些 TAFIIIs,可结合到启动子
15、的 TATA box,从而促进转录,可能还需要其他一些通用转录因子TBP 在 3 类转录因子中的作用与 TATA box 结合,组织预起始复合物(特别是对于没有 TATA box 的启动子) ,促进转录基因特异转录因子(激活子)(1)基本结构:一般有 2 个功能域即 DNA 结合域(DNA-binding domain)和转录激活域(transcription-activating domain) ;许多激活子还有二聚体化域(dimerization domain)DNA 结合域的结构锌指(zinc fingers):不少激活子(如 Sp1)都有该结构,锌指结构一般连续出现多次,由 1 个 -
16、螺旋与 1 反向平行的 层片构成, -螺旋上的 2 个 AA 和 层片上的 2 个 AA与 1 个 Zn 离子结合, “指” 上( -螺旋上)的某些 AA 就决定了其与 DNA 结合的特异性GAL4 蛋白质(the GAL4 protein):酵母中的一种激活子,DNA 结合域与锌指相似,但含有 6 个半胱氨酸和 2 个锌离子,有一个与 DNA 进行识别的区域( -螺旋) ,决定其与DNA 结合的特异性核受体(the nuclear receptors):与甾体激素相互作用,组成激素 -受体复合物,起激活子的作用,核受体的 DNA 结合域含有 2 个锌离子,每一个锌离子分别与 4 个半胱氨酸结
17、合,参与形成一指状结构,其中一“指”(氨基末端的“ 指” )上有专门用于识别 DNA 特异序列的 -螺旋同源异形域(homeodomains):在很多激活子中都存在,由基因中的同源异形框(homeobox)编码,而同源异形框一般是基因中的一个外显子,约 180 nt,编码 60AA,十分保守; 同源异形框最初在果蝇的发育调节基因中发现,这些基因的突变称为同源异形突变(homeotic mutation) ,会引起躯体结构的重大改变;含同源异形框的基因又称为同源异形基因(homeotic genes, homeobox-containing genes)每个同源异形域含 3 个 -螺旋,第二、第
18、三个形成一种“螺旋-转折- 螺旋”(helix-turn-helix)结构,而第三个螺旋起到识别 DNA 特异序列的作用 ;另外,同源异形域的氨基末端也插入到 DNA 的小沟中bZIP 和 bHLH 域:又称碱性域( the basic domain) ,能与 DNA 结合及形成二聚体;b 表示碱性区;ZIP 表示亮氨酸拉链(leucine zipper) ;HLH 表示“螺旋-环- 螺旋”(helix-loop-helix)bZIP: 每个单体构成亮氨酸拉链的一半:在一条 -螺旋中,每 7 个 AA 就有 1 个 leucine,因而 leucine 都在螺旋的一面; 2 个单体相互作用,就
19、可构成一条 “拉链” ;与 DNA 结合的部分是“拉链”下的碱性区,它们必须在 bZIP 形成二聚体后,才能与 DNA 特异识别、结合bHLH: 与 DNA 的复合体结构和 bZIP-DNA 复合体相似; helix-loop-helix 为二聚体化域;较长的螺旋有碱性区,能与 DNA 特异结合转录激活域似乎无特定且明显的结构,但可分 3 类:酸性域(acidic domains):富含酸性氨基酸,如酵母 GAL4 的激活域富含谷氨酰胺域(glutamine-rich domains):富含谷氨酰胺,如 Sp1 中的 2 个激活域富含脯氨酸域(proline-rich domains):富含脯
20、氨酸,如 CTF 中的激活域(2)激活子的功能1、促进通用转录因子结合到启动子上(促进 TFIID 结合到启动子(预起始复合物) 、促进TFIIB 结合到预起始复合物、促进 TFIIF/Pol II、TFIIE 结合到预起始复合物)2、促进 RNA 聚合酶 II 的全酶(holoenzyme)结合到启动子,形成完整的预起始复合物3、至少在一些基因中,激活子通过促进整个全酶结合到启动子区域而激活转录4、激活子是使增强子能远距离作用的原因4 种可能性(第三、四种可能性较符合实际情况):Coiling (change in topology)、Sliding、Looping、Facilitated
21、tracking (looping and tracking)(3)多顺反子转录与单顺反子转录多顺反子转录是原核生物的转录方式:操纵子(operons) Operon: A group of contiguous, coordinately controlled genes经典模型:乳糖操纵子(the lac operon)有:lacZ: -半乳糖苷酶( - galactosidase)基因、lacY: 半乳糖苷透过酶(galactoside permease)基因、lacA: 半乳糖苷乙酰基转移酶( galactoside transacetylase)基因、lacI : 调节基因(regu
22、latory gene) 、Operator: 操纵区、Repressor: 阻遏子(阻遏物) 、Inducer: 诱导物(异构乳糖,allolactose)通过阻遏基因(阻遏物)与操纵区,lacZ、lacY、lacA 这 3 个结构基因是一起被调控的,它们组成了一个操纵子(the lac operon)阻遏的机制(两种假说)聚合酶与阻遏物可一起结合在 lac operon 的启动子区,阻遏物的作用只是阻止转录从起始状态进入延伸状态阻遏物的作用是不让 RNA 聚合酶进入 lac operon 的启动子(得到最新实验数据的支持)阻遏物的调控是负调控(代谢物阻遏效应(catabolite repr
23、ession) )乳糖操纵子的调控还需正调控因子cAMP 在细胞中的浓度与葡萄糖的含量成反比,它与一种称为代谢物激活蛋白(catabolite activator protein,又称 CAP)一起,起到正调控作用。 CAP-cAMP 的结合位点在启动子的上游(与启动子紧密相邻) ,该位点称为激活物位点。CAP-cAMP 结合到激活物位点后,就会促进 RNA 聚合酶与 DNA 形成 open promoter complex( CAP-cAMP 能加快 closed promoter complex 的形成,从而提供了更多形成 open promoter complex 的机会) ,结果是促进
24、转录。乳糖操纵子的正调控乳糖操纵子的启动子实际上是一种弱启动子,其 -35 box 与原核启动子相应的共同序列相差甚大,因此才需要 CAP-cAMP 进行正调控;如果是强启动子(与共同序列十分相近) ,则不需要正调控,但这种情况会使得即使葡萄糖存在,乳糖操纵子也一样运作。弱化作用的调控:色氨酸操纵子(the trp operon)合成代谢的操纵子,所编码的酶能把色氨酸前体分枝酸(chorismic acid)转化为色氨酸。色氨酸浓度高,则关闭;色氨酸浓度低,则开启;具弱化子(attenuator) ,无 CAP-cAMP调控色氨酸操纵子有 5 个结构基因(EDCBA)及 1 个调节基因(R)
25、;启动子(trpP )与操纵区(trpO)在结构基因的上游,且操纵区完全在启动子里面;在调控中,色氨酸的作用是帮助阻遏物结合到操纵区,从而使操纵子关闭弱化作用(attenuation)在阻遏作用的基础上(色氨酸操纵子的阻遏作用较弱) ,能再降低转录水平 10 倍前导区与弱化子转录物的第一种较稳定的结构有一终止子(-independent terminator) ,能使弱化作用发生,转录终止转录物的第二种较不稳定的结构没有终止子,转录能继续色氨酸的多寡决定形成哪一种结构(在转录与翻译偶联的情况下)在细菌中,当色氨酸操纵子的前导区转录后,翻译就开始核糖体到达色氨酸密码子时,若色氨酸缺乏,核糖体不能
26、前进,翻译受阻,前导区与弱化子转录物只能形成第二种结构;结构基因能转录;若色氨酸充足,前导肽的翻译能顺利完成,前导区与弱化子转录物能形成第一种较稳定的结构,导致弱化作用发生调控能达成的必要条件转录与翻译偶联,且速率大致相等每个结构基因的转录产物都有其起始密码子,核糖体从各个基因的 mRNA 的起始信号(密码子)开始翻译,即结构基因的翻译与前导序列的翻译无关细菌能符合这样的要求,说明其体系中各组分的协调性单顺反子转录是真核生物的主要转录方式(4)转录起始、延伸及终止起始所需条件原核生物:RNA 聚合酶全酶,启动子RNA 聚合酶(RNA polymerase):(40 kD ) 、(150 kD)
27、 , (160 kD) 、(70 kD ):specificity factor核心酶(core enzyme):, ,2 ,全酶(holoenzyme ): , ,2 ,: specificity factor全酶(holoenzyme )由核心酶与 亚基组成启动子(promoter ):聚合酶的结合位点(binding site ) ,一般位于转录起始位点上游Promoter structure共同序列(consensus sequence):Pribnow box (-10 box, David Pribnow 发现)、-35 box(-10 box 与-35 box 的最佳距离为 17
28、 1 bp)下调突变(down mutation) 上调突变(up mutation)强启动子还有一些额外的元件,如 E. coli 编码 rRNA 的 rrn gene 中的 UP element(上游元件) ,可提高表达数十倍转录起始(transcription initiation)Four steps:Formation of a closed promoter complexConversion of the closed promoter complex to an open promoter complexPolymerizing the first few nucleotide
29、s (up to 10) while the polymerase remain at the promoterPromoter clearance 真核生物:RNA 聚合酶,启动子,转录因子,染色质的合适结构(启动子区无核小体)RNA 聚合酶 I (Polymerase I): large rRNA precursor,位于核仁RNA 聚合酶 II (Polymerase II ): mRNA precursors, snRNAs,位于核质RNA 聚合酶 III(Polymerase III ):tRNA precursors, 5S rRNA precursor, U6, etc 位于核质
30、Polymerase I、II 、III 都由多个亚基组成:均有两个较大的亚基( 100 kD) 、另有多个较小的亚基(大部分 50 kD) ,三种聚合酶都有一些共有亚基(common subunit)RNA 聚合酶 II 的结构:研究得比较清楚的一种,有 12 个亚基( Saccharomyces cerevisiae中)即 Rpb1、 Rpb2、 Rpb3、 Rpb4、 Rpb5、 Rpb6、 Rpb7、 Rpb8、 Rpb9、 Rpb10、 Rpb11、 Rpb12核心亚基(core subunits):Rpb1, Rpb2, Rpb3,对聚合酶的活性必不可少,分别与原核RNA 聚合酶的
31、 , 和 亚基同源,且功能也基本相同(Rpb3 在聚合酶中也是有 2 个拷贝)核心亚基 Rpb1 的特殊之处-不均一性(heterogeneity):在细胞内,有 210 kD 和 240 kD 两种形式(IIa 和 IIo) ;在体外,还有 180 kD 这种形式(IIb)共有亚基(common subunits):与 Rpb5, Rpb6, Rpb8, Rpb10, Rpb12 相应的亚基,在 3 种 RNA 聚合酶中都存在,在 3 种聚合酶中都存在,说明它们是起着十分重要的作用,但具体的功能不很清楚非必需亚基(nonessential subunits):Rpb4, Rpb9,其基因的突
32、变体在正常温度下仍有活力,但在较高或较低温度下则失去活力;Rpb4 和 Rpb7(必需的亚基)与启动子的识别有关(有点像 因子) 、Rpb9 的功能不甚清楚Rpb7 和 Rpb11:另类亚基(不属于上述 3 类) 、RNA 聚合酶的活性所需(Rpb7 与启动子的识别有关)RNA 聚合酶 II 的全酶(the polymerase II holoenzyme):RNA 聚合酶 II 的所有亚基 + 部分通用转录因子 + 其他一些蛋白质因子真核生物的启动子:II 类启动子:与原核基因的启动子最相似,可含有四类元件(TATA 区(TATA box) 、起始子(initiator) 、下游元件(dow
33、nstream element) 、上游元件(upstream element) ) ,前三类是核心启动子(core promoter)的元件TATA 区(the TATA box):位于转录起始位点上游约 25 bp(以中部计,在酵母中可达50 70 bp) ,共同序列为 TATAAAA(in the nontemplate strand, similar to prokaryotic -10 box)功能:确定转录起始位点(一般是 TATA 区的第一个核苷酸后 30 bp) ;有时甚至是决定整个启动子是否有作用有些基因的 TATA 区序列与其共同序列相差较大,而只在某些类型的细胞中才表达的
34、基因则有明显的 TATA 区有些基因甚至没有 TATA 区(看家基因(housekeeping genes) 、控制发育的基因)起始子(initiator ):转录起始位点前后的保守序列,共同序列为:PyPyA NT/APyPy(Py: pyrimidine、N: any nucleotide、A: transcription start point)有些基因仅有起始子序列作为其启动子下游元件(downstream element):某些基因的启动子中存在、位于转录起始位点下游,无共同序列上游元件(upstream element):在 TATA 区的上游: GC boxes:富含 G 和 C
35、,如GGGCGG(-47 -61 region, in the coding strand)和 CCGCCC(-80 -105 region) ,可有 2个或更多的拷贝、CCAAT box:共同序列为 CCAATI 类启动子:变化较 II 类启动子大,无甚保守序列(即随物种而异) ;有一定的结构特征(核心元件(core element) ,转录必不可少、上游控制元件(upstream control element, UCE) ,高效转录所需,核心元件与上游控制元件之间的距离很重要)III 类启动子:位于基因内部(5S rRNA 基因(+50 +83) 、tRNA 基因) ;位于基因外部,类似
36、 RNA 聚合酶 II 识别的启动子(含 TATA box)(U6 snRNA 基因7SL RNA 基因7SK RNA 基因)延伸原核生物: RNA 聚合酶核心酶核心酶起极其重要的作用, 亚基参与转录出的 RNA 的磷酸二酯键的形成转录的拓扑学:两种假说RNA polymerase 及新合成的 RNA 都围绕 DNA 旋转RNA polymerase 前后的 DNA 反向旋转(有较多的依据:拓扑异构酶 topoisomerase 的存在)真核生物:RNA 聚合酶,延伸因子等延伸因子:TFIIS,能促进转录延伸,阻止聚合酶在转录过程中较长时间的暂停;TFIIF,也有阻止聚合酶短暂停止的功能,RN
37、A 聚合酶 II 的全酶:RNA 聚合酶 II 所有亚基+部分通用转录因子+其他一些蛋白质因子终止原核生物:依赖于 因子的终止(-dependent terminator (termination))和不依赖于 因子的终止(intrinsic (-independent) terminator )聚合酶到达终止子(terminator)就会从模板上脱落-independent termination:较为简单,一段反向重复序列(inverted repeat)与一富含 T 的区域(T-rich region in the nontemplate strand)即为终止信号-dependent
38、termination:终止子只有一段反向重复序列(能形成 hairpin 结构) ; 是一种蛋白质(6 聚体) ,可使 RNA 聚合酶的转录能力大大下降(具 RNA-DNA 解螺旋酶的作用,能解开转录复合体中 RNA-DNA 双链)真核生物:比较复杂,且不如原核生物清楚polymerase I 与 polymerase III 的转录终止与原核生物有一定的相似性polymerase II 的转录在聚腺苷酸化位点后至少几百 bp 才终止染色质结构对真核基因转录的影响:若启动子区上有核小体结构,则基因不转录;若没有核小体结构,则可转录核小体结构只由核心组蛋白(H2A, H2B, H3, H4)与
39、 DNA 构成时,即能起到抑制基因转录的作用,且一般的转录激活子不能解除这种抑制;若核小体结构还含有组蛋白 H1,那么其抑制基因转录的能力更强,但 H1 的这种作用可被转录激活子抵消核小体定位(nucleosome positioning):转录激活子能使核小体结构不在启动子区内形成,而只在启动子周围形成;核小体定位使得启动子区成为无核小体区(nucleosome-free zones) ,对 DNase 高度敏感组蛋白有 2 种形式:乙酰化、无乙酰化组蛋白乙酰化(histone deacetylation)乙酰化的形式是在赖氨酸侧链的氨基上加上乙酰基,组蛋白的乙酰化与否是与基因的活性有关的,
40、乙酰化的组蛋白对转录的抑制作用较弱,因为它使染色质结构(核小体结构)发生变化,使组蛋白易从 DNA 上脱落;起乙酰化作用的酶是组蛋白乙酰基转移酶(histon acetyltransferase, HAT) ;酵母中的组蛋白乙酰基转移酶还是一种转录激活子的辅助因子,其他一些转录激活子的辅助因子也是组蛋白乙酰基转移酶细胞核中能促进转录的组蛋白乙酰基转移酶(HAT A)与细胞质中的(HAT B )是不同的HAT A 能结合到染色质上,使核小体中的核心组蛋白乙酰化HAT B 是使细胞质中新合成出来的 H3 和 H4 乙酰化,从而使它们能正确地组装到核小体中(它们的乙酰基在组装后就会被组蛋白去乙酰化酶
41、除去)组蛋白去乙酰化(histone deacetylation)能抑制转录,由组蛋白去乙酰化酶(histone deacetylases)催化,组蛋白去乙酰化酶要与其他转录抑制因子相互作用,才能在合适的区域使组蛋白去乙酰化必须对染色质进行“改造”,才能除去核小体,使基因可转录染色质改造需要 2 类蛋白质:Swi/Snf (pronounced “switch-sniff”) 和 ISwi (initiation switch)Swi/Snf 能改变核小体核心的结构,ISwi 能移走核小体核小体与转录延伸聚合酶前进时,能把遇到的核小体移动位置,因而转录后,所有核小体的位置都发生了改变;且在转录
42、后,核小体一般是被后移了(移到聚合酶后)3. 转录后的加工(1)剪接(splicing)核 mRNA 前体的剪接(剪接体):Step 1:内含子内的一个腺苷酸的 2 羟基进攻连接内含子 5 端与外显子的磷酸二酯键,产生一个游离的外显子(5 外显子)与一个套环(lariat)结构(内含子 + 3 端外显子)的中间产物;Step 2: 5 端外显子的 3 羟基进攻连接内含子 3 端与外显子的磷酸二酯键,使两外显子连接起来,并产生套环状的内含子剪接信号:剪接信号发生变化,则剪接就会受到影响(改变)高等真核生物:5-AG/GUAAGUYNCURA CYnNAG/G- 3 Y:嘧啶(U or C)Yn:
43、约由 9 个嘧啶组成 R:嘌呤(A or G)A :形成套环结构的分枝点酵母:5-AG/GUAUGU UACUAACYAG/G(UU)- 3 剪接体(spliceosomes):核 mRNA 前体、snRNAs (snuRNAs)与蛋白质的复合体,能进行核 mRNA 前体的剪接;snRNAs (snuRNAs): small nuclear RNAs,即核小分子 RNA,有 U1, U2, U4, U5, U6;snRNAs 是用于识别剪接信号的,它们与蛋白质一起,组成核小分子核糖核蛋白(small nuclear ribonuclear proteins, snRNPs) ;与 snRNAs
44、 相应,有 U1 snRNP, U2 snRNP, U4 snRNP, U5 snRNP, U6 snRNPU1 snRNP:能与 5 剪接位点的保守序列配对,这种配对(结合)是剪接所必需的,但光有配对还不足以促成剪接U6 snRNP:能与内含子的 5 端配对,在剪接过程中还与 U2 配对,这些结合都是剪接所必需的U2 snRNP: 能与分枝位点周围的序列配对,且能与 U6 相互作用(通过碱基配对) ,对确定分枝位点及剪接都是必不可少的U5 snRNP:能与 5 端外显子的最后一个核苷酸和 3 端外显子的第一个核苷酸结合,即能通过分子间相互作用把相邻的两个外显子靠在一起,是剪接的第二步所必需的
45、U4 snRNP: 能与 U6 的部分序列配对,从而与 U6 结合在一起,使 U6 处于不活动状态;当 U6 需要发挥作用时,U4 便与 U6 分离,使 U6 能参与剪接过程实际上,剪接除了需要 U1, U2,U4,U5,U6 这几种 snRNPs 外,还需要一些称为剪接因子的蛋白质选择性剪接(alternative splicing):非特异的、默认的、唯一的剪接方式是组成型剪接(constitutive splicing) ;一个基因转录出来的 RNA 前体,通过不同的剪接方式(选择不同的外显子)而形成不同的成熟 mRNA,产生不同的蛋白质选择性剪接往往与发育时期、细胞类型等有关,在 20
46、 个真核 mRNA 前体中,约有 1 个可进行选择性剪接,在人类中,选择性剪接的比例更高,选择性剪接最初在小鼠免疫球蛋白 重链基因中发现,该基因通过选择性剪接,可产生分泌形式( s)与膜结合形式(m )的 2 种蛋白质通过选择性剪接,可对基因的表达起一定的调控作用,因此选择性剪接常用于在不同的组织或发育时期产生组织特异或调控发育的蛋白质 选择性剪接还可有重要的生物学效应,如在果蝇的性决定体系中起重要的作用 自剪接的内含子(self-splicing introns)最初由 Thomas Cech 等人在四膜虫(Tetrahymena) 的 26S rRNA 基因中发现;该基因转录的rRNA 前
47、体有 1 个内含子,而其剪接不需要剪接体,也不需要任何蛋白质的帮助,因此是一种自剪接;自剪接的内含子在核 rRNA 基因、细胞器基因和原核基因中都存在I 类内含子(Group I introns):一般都是核 rRNA 基因的内含子(主要在纤毛虫中) ,还有一些是线粒体基因、叶绿体基因及细菌基因的内含子,在体内也进行自剪接I 类内含子的剪接机制:Step 1:外源鸟苷酸(GTP)的羟基进攻内含子 5端的 A(连结UA 的磷酸二酯键) ,释放出 5外显子(外显子 1) ,并形成一中间产物 Step 2:5外显子 3端的羟基进攻 3外显子(外显子 2)5 端的磷酸二酯键,使 5外显子与 3外显子连
48、结起来,并释放出内含子II 类内含子(Group II introns):主要存于线粒体基因、叶绿体基因及细菌基因中,在体外条件下可自剪接,在体内往往有蛋白质参与剪接;剪接机制与核 mRNA 内含子的有很大的相似性(形成套环中间产物等)总体上,剪接过程与剪接体的很相似:内含子本身的序列代替了 U1、U2 、U4、U5、U6实际上,核 mRNA 内含子(包括参与剪接的 snRNA)与 II 类内含子是有进化关系的 核 tRNA 内含子的剪接核 tRNA 内含子: 内含子较小(10 bp 左右) ,且只有 1 个,一般在相应于反密码子的碱基附近(与反密码子的 3端隔 1 个核苷酸)tRNA 剪接(
49、 tRNA splicing): 分 2 步进行,需要 tRNA 内切酶及 RNA 连接酶的参与Step 1:由剪接内切酶把内含子切除 Step 2:由 RNA 连接酶把两个外显子连接起来(2) 加帽与聚腺苷酸化(capping and polyadenylation):真核生物 mRNA 特有加帽(capping):帽子结构:含 7-甲基鸟苷(m7G ) ,主要有 3 种形式第一种(Cap 0):只在一些病毒 mRNA 中存在,无 2-O-甲基核苷酸第二种(Cap 1):在真核细胞及病毒 mRNA 中存在,有 1 个 2-O-甲基核苷酸第三种(Cap 2):只在真核细胞中存在,有连续 2 个 2-O-甲基核苷酸帽子的合成:需要 3 种酶;核苷酸磷酸水解酶(nucleotide phosphohydrolase;又称 RNA 三磷酸酯酶,