1、第八讲 真核基因表达调控,原核生物的调控系统就是要在一个特定的环境中为细胞创造高速生长的条件,或使细胞在受到损伤时,尽快得到修复,所以,原核生物基因表达的开关经常是通过控制转录的起始来调节的。 真核基因表达调控的最显著特征是能在特定时间和特定的细胞中激活特定的基因,从而实现“预定”的、有序的、不可逆转的分化、发育过程,并使生物的组织和器官在一定的环境条件范围内保持正常功能。,第一节 真核生物的基因组,真核生物基因调控可分为两大类,瞬时调控,发育调控,根据基因调控在同一事件中发生的先后次序,转录水平调控,转录后水平调控,研究基因调控主要应回答3个问题: 什么是诱发基因转录的信号? 基因调控主要是
2、在哪一步(模板DNA的转录、mRNA的成熟或蛋白质合成)实现的? 不同水平基因调控的分子机制是什么?,一、 真核基因组的一般构造特点 在真核细胞中,一条成熟的mRNA链只能翻译出一条多肽链,不存在原核生物中常见的多基因操纵子形式。 真核细胞DNA都与组蛋白和大量非组蛋白相结合,只有一小部分DNA是裸露的。 高等真核细胞DNA中很大部分是不转录的,大部分真核细胞的基因中间还存在不被翻译的内含子。 真核生物能够有序地根据生长发育阶段的需要进行DNA片段重排,还能在需要时增加细胞内某些基因的拷贝数。, 在真核生物中,基因转录的调节区相对较大,它们可能远离启动子达几百个甚至上千个碱基对,这些调节区一般
3、通过改变整个所控制基因5上游区DNA构型来影响它与RNA聚合酶的结合能力。 真核生物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质,原核生物中不存在这样严格的空间间隔。 许多真核生物的基因只有经过复杂的成熟和剪接过程(maturation and splicing),才能顺利地翻译成蛋白质。,二、基本概念,(一)基因家族(gene family),真核生物的基因组中有很多来源相同、结构相似、功能相关的基因,将这些基因称为基因家族。,同一家族中的成员有时紧密地排列在一起,成为一个基因簇(gene cluster) 。,如:编码组蛋白、免疫球蛋白和血红蛋白的基因都属于
4、基因家族,1、简单多基因家族 简单多基因家族中的基因一般以串联方式前后相连。,16S tRNA 23S 5S,17S tRNA 25S 5S,16S tRNA 23S 5S,甲基化,切割,核酸酶降解,1 1 2 1 1 3 3,细菌中rRNA基因家族各成员的分布与成熟过程分析,pre-rRNA,甲基,The eukaryotic ribosomal DNA repeating unit,2、复杂多基因家族,复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。现已发现存在不同形式的复杂多基因家族。,Organization of histone genes
5、 in the animal genome,果蝇,海胆,6000bp,3、发育调控的复杂多基因家族,如:血红蛋白基因,不同发育阶段血红蛋白亚型,血红蛋白的调控序列如R1、R2、R3与编码序列分别被S1、S2、S3隔开,因此不能表达。,在胚胎发育早期,间隔序列S1缺失,使R1与相连,表达。,在胎儿期,间隔序列S2缺失,使R2与相连,表达 。,在成人期,间隔序列S3缺失,使R3与或相连, 或表达。,S1、S2、S3的切除及R系列与编码序列的重组与个体发育阶段有关,因此在发育不同阶段血红蛋白组成不同。,(二)断裂基因,基因的编码序列在DNA分子上是不连续的,为非编码序列所隔开,其中编码的序列称为外显
6、子,非编码序列称内含子。,外显子(Exon) :真核细胞基因DNA中的编码序列,这些序列被转录成RNA并进而翻译为蛋白质。 内含子(Intron) :真核细胞基因DNA中的间插序列,这些序列被转录成RNA,但随即被剪除而不翻译。,1、外显子与内含子的连接区,指外显子和内含子的交界或称边界序列,它有两个重要特征: 内含子的两端序列之间没有广泛的同源性 连接区序列很短,高度保守,是RNA剪接的信号序列5GTAG 3,2、外显子与内含子的可变调控,组成型剪接:一个基因的转录产物通过剪接只能产生一种成熟的mRNA。 如:肌红蛋白重链基因,(41个外显子) 选择性剪接:同一基因的转录产物由于不同的剪接方
7、式形成不同mRNA。 如;小鼠淀粉酶基因,第二节 真核生物基因表达调控的特点和种类,一、真核生物基因表达调控的特点 1、RNA聚合酶 2、多层次 3、个体发育复杂 4、活性染色体结构变化:对核酸酶敏感 、DNA拓扑结构变化 、DNA碱基修饰变化 、组蛋白变化 5、正性调节占主导 6、转录与翻译间隔进行 7、转录后修饰、加工,二、真核生物基因表达调控的种类:,根据其性质可分为两大类:,一是瞬时调控或称为可逆性调控,它相当于原核细胞对环境条件变化所做出的反应。瞬时调控包括某种底物或激素水平升降时,及细胞周期不同阶段中酶活性和浓度的调节。,二是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定
8、了真核细胞生长、分化、发育的全部进程。,根据基因调控在同一事件中发生的先后次序又可分为:,DNA水平调控转录水平调控转录后水平调控翻译水平调控蛋白质加工水平的调控,第三节 真核生物DNA水平上的基因表达调控,基因丢失,基因扩增,基因重排,DNA甲基化状态与调控,染色体结构与调控,一、基因丢失:,在细胞分化过程中,可以通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常常丢失掉整条或部分的染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。 目前,在高等真核生物(包括动物、植物)中尚未发现类似的基因丢失现象。, 马蛔虫受精卵中只有一
9、对染色体(2n=2).,马蛔虫的生殖细胞保存着个体发育必需的全部基因(完整基因组)。在体细胞分化中,染色体破碎成很多片段所谓小染色体。小染色体中具有着丝点的在细胞分裂中得以保存,不具着丝点的片段在细胞分裂中不能分配到子代细胞中,即丢失,造成体细胞基因丢失,从而决定了细胞的分化方向。,昆虫:例如,小麦瘿蚊在个体发育中也有类似的部分染色体丢失的现象。, 许多原生动物有两种类型的核:小核(micronucleus)和大核(macronucleus)。,生殖细胞只有小核。在细胞分化时,小核经历各种变化:,小核,小核,(含有全部无活性DNA为未来的生殖细胞保存遗传信息),大核,(DNA分子具有转录活性)
10、,大核形成过程:,生殖过程中的小核DNA,被切割成5002000bp的线形片段,降解,17000种/1000拷贝,大核,结果:大核DNA 的量是小核的几百倍,而种类丢失了一半。, 蜜蜂工蜂和蜂皇是二倍体,孤雌生殖的单倍体则发育成雄蜂。,高等真核生物是否有基因丢失?,有实验证明未丢失。核代换实验:,二、基因扩增:,基因扩增是指某些基因的拷贝数专一性增大的现象,它使得细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。 如非洲爪蟾体细胞中rDNA的基因扩增是因发育需要而出现的基因扩增现象。,果蝇的不切离的多次复制使基因扩增。,果蝇在卵巢成熟之前,卵巢颗粒细胞中的卵壳蛋白基
11、因被扩增。果蝇的卵母细胞经过4次分裂,形成:,1个卵母细胞,15个营养细胞(为卵母细胞提供营养蛋白质及其它大分子)。,大量蛋白质营养物质合成原因?,营养细胞通过胞浆桥与卵细胞相连,使营养物质顺利进入正在增大的卵细胞。,三、基因重排:,将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,这种方式被称为基因重排。 通过基因重排调节基因活性的典型例子是免疫球蛋白结构基因的表达。,V V V D D D J J J C C,V DJ C,免疫球蛋白重链基因片段重排与组织特异性表达,酵母的交配型转换,HML MATa HMRa,HML MATa HMRa,HML MAT HMRa,基因转换,核酸
12、内切酶HO,四、DNA的甲基化与基因调控:,1、DNA的甲基化,在真核生物中,5-甲基胞嘧啶主要出现在CpG序列、CpXpG、CCA/TGG和GATC中,CpG二核苷酸通常成串出现在DNA上,CpG岛,真核生物细胞内存在两种甲基化酶活性:,日常型甲基转移酶,从头合成型甲基转移酶,2、DNA甲基化抑制基因转录的机理,DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,抑制了转录因子与启动区DNA的结合效率。 5-甲基胞嘧啶在DNA上并不是随机分布的,基因的5和3端往往富含甲基化位点,而启动区DNA分子的甲基化密度与基因受抑制的程度密切相关。(见下图),表8- 1 甲基化修
13、饰对转录的影响,CpG密度 低(28/1.4kb) 高(141/1.5kb) 1/10 低(26/3.3kb),HhaI低水平甲基化,0 0,+(HhaI)(24mCpG/1.5kb),SssI全部甲基化 +(SssI) +(SssI) +(SssI),完全甲基化 基因是否表达,启动区装上增强子序列,表达 表达 (部分) 不表达(完全) 表达, ,甲基化还提高了该位点的突变频率: 5-mC主要出现在5-CpG-3序列中, 5-mC脱氨后生成T,不易被识别和校正。 如:在脑瘤、乳腺癌和直肠癌细胞中,p53基因第273位密码子含CpG序列,常由CGT突变为CAT或TGT(ArgHis或Cys)。
14、3. DNA甲基化与X染色体失活 X染色体的失活中心:Xic,失活的染色体上绝大多数基因都处于关闭状态,DNA序列都高度甲基化。 Xist:只在失活的染色体上表达,而不在活性的X染色体上表达,该基因产物是一功能性RNA分子。,Xist X染色体 其他位点,甲基化,不转录 活性 去甲基化,活性 去甲基化,转录 失活 甲基化,失活,Xist甲基化与X染色体失活,五、染色质结构与基因表达调控:,常染色质(euchromatin)-基因可以转录 异染色质(hetrochromatin)-基因不能转录 ,活性基因置于异染色质内会失活 位置效应(Position effect) :指基因转移到基因组上新位
15、置而引起基因表达的改变活性染色质由于核小体构型发生构象的改变,往往具有疏松的染色质结构从而便于转录调控因子与顺式调控元件结合和RNA聚合酶在转录模板上滑动。,(一)DNase 的敏感性和基因表达 转录活跃区域对核酸酶的敏感度增加 1、DNase超敏感位点(hypersensitive site):具有转录活性的基因周围的DNA区域对DNase降解高度敏感 。 2、特点: (1)一般在转录起始点附近,即5启动子区域 (2) 低甲基化区 (3)不存在核小体结构 (4)裸露易与反式作用因子结合 例:鸡成红细胞中-血红蛋白基因与输卵管中的卵清蛋白基因。,(二)两栖动物卵细胞减数分裂时的灯刷染色体,第四
16、节 真核生物转录水平上的基因表达调控,一、真核基因转录 (一)真核基因结构,“基因”的分子生物学定义:产生一条多肽链或功能RNA所必需的全部核苷酸序列。,(二)真核基因转录的主要成分,1.启动子 2.转录模板 3.RNA聚合酶II 4.RNA聚合酶II基础转录所需的蛋白因子(以“TFII”表示),(二)顺式作用元件,定义:影响自身基因表达活性的非编码DNA序列。 例: 启动子、增强子、沉默子等,(1)启动子:在DNA分子中,RNA聚合酶能够识别、结合并导致转录起始的序列。,核心启动子和上游启动子元件,(2)增强子:指能使与它连锁的基因转录频率明显增加的DNA序列。,增强子特点:, 增强效应十分
17、明显,一般能使基因转录频率增加10-200倍, 增强效应与其位置和取向无关,不论增强子以什么方向排列(53或35),甚至和靶基因相距3 kb,或在靶基因下游,均表现出增强效应;,大多为重复序列,一般长约50bp,适合与某些蛋白因子结合。其内部常含有一个核心序列:(G)TGGA/TA/TA/T(G),该序列是产生增强效应时所必需的;, 增强效应有严密的组织和细胞特异性,说明增强子只有与特定的蛋白质(转录因子)相互作用才能发挥其功能;, 没有基因专一性,可以在不同的基因组合上表现增强效应;, 许多增强子还受外部信号的调控,如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应
18、。,增强子作用机理:,(三)反式作用因子,1、定义:能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率的蛋白质。,TFD(TATA)、CTF(CAAT)、SP1(GGGCGG)、HSF(热激蛋白启动区),2、 反式作用因子对转录的影响真核生物启动子和增强子是由若干可以区分的DNA序列组成的,由于它们和特定的功能基因连锁在一起,因此称为顺式作用元件。真核生物转录调控大多是通过顺式作用元件和反式作用因子复杂的相互作用而实现的,下面介绍的是与顺式作用成分专一性结合的一些转录因子。一般认为,如果某个蛋白是体外转录系统中起始RNA合成所必需的,它就是转录复合体的一部分。根据各个
19、蛋白质成分在转录中的作用,能将整个复合体分为3部分:, 参与所有或某些转录阶段的RNA聚合酶亚基,不具有基因特异性。 与转录的起始或终止有关的辅助因子,也不具有基因特异性。 与特异调控序列结合的转录因子。它们中有些被认为是转录复合体的一部分,因为所有或大部分基因的启动子区含有这一特异序列,如TATA区和TFIID,更多的则是基因或启动子特异性结合调控蛋白,它们是起始某个(类)基因转录所必需的。,3、结构,DNA结合结构域,转录活化结构域,结构域,连接区,(1) DNA结合结构域基序a. Helix-turn-helix(螺旋-转角-螺旋)。是最早发现于原核生物中的一个关键因子,该结构域长约20
20、个aa,主要是两个-螺旋区和将其隔开的转角。其中的一个被称为识别螺旋区,因为它常常带有数个直接与DNA序列相识别的氨基酸。,b. Zinc finger(锌指)重复的锌指结构都是一个螺旋与反向平行的片层的基部以锌原子为中心,通过与一对半胱氨酸和一对组氨酸之间形成配位键相连接,锌指环上突出的赖氨酸和精氨酸参与DNA的结合。 长约30个aa,其中4个氨基酸(4个Cys或2个Cys,2个His)与一个Zinc原子相结合。与Zinc结合后锌指结构较稳定。,具有4Cys的锌指序列: Cys-X2-Cys-X13-Cys-X2-Cys, 这一结构被称为Cys2/Cys2锌指。,具有Cys2/Cys2锌指的
21、转录因子,蛋白 相对分子量 锌指数 靶序列 皮质糖受体 9.4 X104 2 GRE中20bp 雌激素受体 6.6 X104 2 ERE中20bp GAL4 9.9 X104 1 UASC中17bp 腺病毒E1A 3.0 X104 1 ?,c. Leucine zippers(亮氨酸拉链) 是亲脂性(amphipathic)的螺旋,包含有许多集中在螺旋一边的疏水氨基酸,两条多肽链以此形成二聚体。每隔6个残基出现一个亮氨酸。由赖氨酸(Lys)和精氨酸(Arg)组成DNA结合区。,e. 碱性-螺旋-环-螺旋(basic helix-loop-helix),该调控区长约50个aa残基,同时具有DNA
22、结合和形成蛋白质二聚体的功能,其主要特点是可形成两个亲脂性-螺旋,两个螺旋之间由环状结构相连,其DNA结合功能是由一个较短的富碱性氨基酸区所决定的。,8-25,c. Homeodomain(同源域)最早来自控制躯体发育的基因,长约60个氨基酸,其中的DNA结合区与 helix-turn-helix motif相似,人们把该DNA序列称为homeobox。主要与DNA大沟相结合。,(2) DNA结合蛋白主要转录激活结构域,转录激活结构域(transcription activation domains)一般由20-100个氨基酸残基组成。如GAL4分子中有2个这种结构域,分别位于多肽链的第147
23、-196位和第768-881位;GCN4的转录激活结构域位于多肽链的第106-125位。 a. 酸性-螺旋(acidic -helix) 该结构域含有由酸性氨基酸残基组成的保守序列,多呈带负电荷的亲脂性-螺旋,包含这种结构域的转录因子有GAL4、GCN4、糖皮质激素受体和AP-1/Jun等。增加激活区的负电荷数能提高激活转录的水平。可能是通过非特异性的相互作用与转录起始复合物上的TFIID等因子结合生成稳定的转录复合物而促进转录。,b. 谷氨酰胺丰富区(glutamine-rich domain) SP1的N末端含有2个主要的转录激活区,氨基酸组成中有25%的谷氨酰胺,很少有带电荷的氨基酸残基
24、。酵母的HAP1、HAP2和GAL2及哺乳动物的OCT-1、OCT-2、Jun、AP2和SRF也含有这种结构域。 C.脯氨酸丰富区(proline-rich domain) CTF家族(包括CTF-1、CTF-2、CTF-3)的C末端与其转录激活功能有关,含有20%-30%的脯氨酸残基。,第五节 其他水平的调控,一、RNA的加工成熟 1.rRNA和tRNA的加工成熟,4-30,4-31,2.mRNA的加工成熟,(1)5 末端加帽子 (2)3 末端加 poly(A)尾巴 (3)RNA的剪接 (4)核苷酸的甲基化修饰,hnRNA是mRNA的前体。,证据: 在真核生物细胞核中发现存在代谢十分活跃、平
25、均相对分子质量为2 x 107,长度不均一的RNA,而细胞质中平均相对分子质量为1.5 x 106。 hnRNA很不稳定,半衰期只有5-15min。 用放射性同位素做脉冲标记证明,75%被标记的RNA是hnRNA。这些标记的RNA大部分位于细胞核内,只有10%进入细胞质,所以认为它是mRNA的前体。 hnRNA占全部RNA的3%,说明它一经诞生就立即发生了加工变化,不会长久积累下来。 hnRNA3端也带有polyA。 加入dAR(脱氧腺嘌呤核苷)抑制polyA的生物合成,hnRNA和mRNA的合成都受到抑制。,3、真核基因转录后加工的多样性,(1)简单转录单位,(2) 复杂转录单位 含有复杂转
26、录单位的主要是一些编码组织和发育特异性蛋白质的基因,它们除了含有数量不等的内含子以外,其初级转录产物能通过多种不同方式加工成两个或两个以上的mRNA。,利用多个5端转录起始位点或剪接位点产生不同的蛋白质,1 2 3 4 5 6 7,1 2 3 4 5 6 7,1 3 4 5 6 7,利用多个加poly(A)位点和不同的剪接方式产生不同的蛋白质。,降钙素,降钙素相关蛋白,如:大鼠降钙素基因,二、翻译水平的调控,(1)真核生物mRNA的“扫描模式”与蛋白质合成的起始调查第一个AUG前后序列发现,绝大部分都是A/G NNAUGG (2) mRNA5末端帽子结构的识别与蛋白质合成,(3)mRNA稳定性
27、控制 真核生物能否长时间、及时地利用成熟的mRNA分子翻译出蛋白质以供生长、发育的需要,是和mRNA的稳定性以及屏蔽状态的解除相关的。原核生物mRNA的半衰期很短,平均大约3min。高等真核生物迅速生长的细胞中mRNA的半衰期平均3h。在高度分化的终端细胞中许多mRNA极其稳定,有的寿命长达数天。,转运铁蛋白受体(TfR)和铁蛋白负责铁吸收和铁解毒。这两个mRNA上存在相似的顺式作用元件,称为铁应答元件(iron response element,IRE)。 IRE与IRE结合蛋白(IREBP)相互作用控制了这两个mRNA的翻译效率。当细胞缺铁时,IREBP与IRE具有高亲和力,两者的结合有效
28、地阻止了铁蛋白mRNA的翻译,与此同时,TfR mRNA上3非翻译区中的IRE也与IREBP特异结合,有效地阻止了TfR mRNA的降解,促进TfR蛋白的合成。,4. 蛋白质因子的修饰与翻译起始调控 (1) eIF-2磷酸化对翻译起始的影响用兔网织红细胞粗抽提液研究蛋白质合成时发现,如果不向这一体系中添加氯高铁血红素,网织红细胞粗抽提液中的蛋白质合成抑制剂就被活化,蛋白质合成活性在几分钟之内急剧下降,很快就彻底消失。现已查明,网织红细胞蛋白质合成的抑制剂HCI是受氯高铁血红素调节的eIF-2的激酶,可以使该因子的-亚基磷酸化并由活性型转变为非活性型。,(2)CBPII活性与翻译的起始,在脊髓灰
29、质病毒感染的HeLa细胞中,有帽子结构的宿主mRNA的翻译受阻,宿主蛋白质合成停止,但没有帽子结构的脊髓灰质病毒mRNA的翻译却不受影响。若在这种感染细胞抽提液的蛋白质合成体系中加入由突兔网织红细胞中抽提的CBPII,就能恢复有帽子mRNA的翻译活性。,三、翻译后水平的调控,1.多肽的切割 包括:与蛋白质分泌有关的切割与蛋白质活化有关的切割 (1)信号肽的切割 游离核糖体 与内质网结合的核糖体 (2)导肽的切割,(3)多肽的水解加工,如:胰岛素的加工,S,S,S,S,S,S,S,S,S,S,S,S,去掉信号肽,二硫键的形成,去掉多余肽段,胰岛素,2、多肽的剪接和化学修饰,(1)多肽的剪接 蛋白
30、质前体可以通过多肽的剪辑被切成数个片段,然后再以一定的顺序结合起来,最后形成成熟的有活性的蛋白质。 多肽链有时可裂解产生一种以上的多肽或蛋白质,因而震撼生物某些mRNA的翻译产物具有多样性。 例如:垂体激素中的促肾上腺皮质激素(ACTH)、促黑素和内腓肽是 有同一基因产物裂解而来,翻译结束时产物相对分子量为31000,由265个氨基酸残基构成,,蛋白质 相应肽段的位置 蛋白质 相应肽段的位置,ACTH 132-170 内腓肽 192-207 促黑素 132-144 内腓肽 192-222 促黑素 215-232 内腓肽 192-208促黑素 76-87 蛋氨酸脑腓肽 239-253,表7-3 肽段裂解产生的蛋白质,(2)多肽的化学修饰, 蛋白质磷酸化 蛋白质糖基化,