1、第 二 章,基因与基因表达调控,第 一 节基因的结构与功能,1基因的分子基础,现代分子生物学研究已经证实DNA是遗传信息的主要载体,基因的化学本质就是一段DNA分子片段。Watson和Crick提出的DNA分子双螺旋结构模型为遗传信息传递提供了物质结构基础。根据这个模型,DNA分子是由2条互补的多核苷酸链相互缠绕而成,2条链之间通过碱基配对结合在一起。,基因作为一个遗传功能单位,它所对应的一段核苷酸序列被称为顺反子(cistron)。显然,一个顺反子编码一种完整多肽链。因此,顺反子是一个功能单位。基因和顺反子这两个术语常被等同使用,但仔细分析,两者是有区别的:在原核细胞和低等真核细胞中,基因和
2、顺反子是等价的;而在高等真核细胞中,由于基因中内含子的存在,此时顺反子等价于真核基因的外显子。,2基因的结构,结构上,基因由多个不同的区域组成。无论是原核基因还是真核基因,都可划分为编码区和非编码区两个基本组成部分。编码区是可以被转录的区域,由连续的密码子组成,其中包括起始密码(通常是AUG)和终止密码(UAA、UAG和UGA)。编码区中包含5端的非翻译区(5 UTR)和3 端的非翻译区(3 UTR),启动子(promoter):是位于基因5 端上游紧靠转录起点的一段非编码序列,其功能是引导RNA聚合酶与基因相应部位的正确结合,启动基因的转录。一般来说,原核基因的启动子比较简单,只有数十个碱基
3、组成,而真核基因的启动子较大,可能涉及数千个碱基。终止子(terminator):基因3端下游外侧与终止密码子相邻的一段非编码的核苷酸短序列,具有终止转录的功能。即一旦RNA聚合酶完全通过了基因的转录单位后,聚合酶就不能继续向前移动,使转录活动终止。,3原核生物基因结构与调控模式, 操纵子(operon) 机制,由P序列、O序列和CAP结合位点共同构成lac操纵子的调控区,他们相互协调,共同控制着信息区中三个酶的编码基因的表达,3真核生物基因结构与调控模式,不同真核生物的顺式作用元件中也会发现一些共有序列 ,如TATA盒、CAAT盒等,这些共有序列是RNA聚合酶或特异转录因子的结合位点。,2)
4、 真核基因的调节蛋白,还有蛋白质因子可特异识别、结合自身基因的调节序列,调节自身基因的表达,称顺式作用。,由某一基因表达产生的蛋白质因子,通过与另一基因的特异的顺式作用元件相互作用,调节其表达。,反式作用因子(trans-acting factor),这种调节作用称为反式作用。,反式调节,顺式调节,启动子,启动子是RNA聚合酶特异性识别和结合的DNA序列。启动子有方向性,位于结构基因转录起始点的上游,本身并不被转录。 TATA盒(TATA box)是主要的真核生物的启动子元件,它位于转录起始点上游-25bp处,几乎所有已发现的真核生物基因的启动子都有此序列。TATA盒与一种称为TATA因子的转
5、录因子结合后即成为完整的启动子,精确地决定RNA合成的起始位点,上游启动子元件,上游启动子元件(upstream promoter elements)是TATA盒上游的一些特定的DNA序列。反式作用因子可与这些元件结合,通过调节TATA因子与TATA盒的结合、RNA聚合酶与启动子的结合及转录起始复合物的形成(转录起始因子与RNA聚合酶结合)来调控基因的转录效率。 包括CAAT盒、CACA盒及GC盒等。,反应元件(response elements),是一类能介导基因对细胞外的某种信号产生反应的DNA序列。反应元件都具有较短的保守序列。这些元件通常位于启动子附近和增强子内,如热休克反应元件(he
6、at shock response element,HSE)糖皮质激素反应元件(glucocorticoid response element,GRE)。,增强子(enhancer),增强子 是一段DNA序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件。反应作用因子与这些元件结合后能够调控(通常为增强)邻近基因的转录。增强子一般位于转录起始点上游-100-300bp处,但在基因之外或某些内含子也有增强子序列。,转位基因,也称转位因子(transposable elements),是指可以从染色体基因组上的一个位置转移到另一个位置,甚至在不同的染色体之间跃迁的基因成分,因此有些文献形象
7、地称之为跳跃基因(jumping genes)。转位基因最早由美国冷泉港实验室的女科学家B.McClintock,于上世纪40年代晚期在玉米中首次发现。,4特殊结构与功能的基因,原核生物的转位因子分三种不同的类型: 插入序列:分子量小于2000bp 转座子:大于2000bp 可转座的噬菌体:如,噬菌体Mu和D108 。,假基因(pseudogene) :因碱基顺序发生某些突变而失去功能,不能表达或表达异常,生成无生物活性多肽的基因。假基因4个显著特点:没有内含子;具有与mRNA 的poly(A)尾的相应结构;两侧有顺向重复序列;随机出现在非正常的位置。,重叠基因(overlapping gen
8、es),或嵌套基因(nested genes):基因的核苷酸序列是彼此重叠。,基因家族(gene family),就是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因 。(1)核酸序列相同 即多拷贝基因。 如rRNA基因,tRNA基因等 。(2)核酸序列高度同源 如人类生长激素基因家族:人生长激素(hGH)、人胎盘促乳素(hCS)和催乳素(prolactin)。,(3)编码产物具有同源功能区 : 如src癌基因家族,基因产物都含有250个氨基酸顺序的同源蛋白激酶结构域。 (4)编码产物具有小段保守基序 : 如DEAD盒基因家族的产物都具有解旋酶的功能,其结构特征是8个氨基酸序列,内含D
9、EAD序列:Asp-Glu-Ala-Asp。,基因超家族(gene superfamily)是指一组由多基因家族及单基因组成的更大的基因家族。 它们可能起源于相同的祖先基因,但是它们的功能并不一定相同(区别于多基因家族)。,第二节 基因组的结构与功能,一、病毒基因组的结构与功能特点二、原核生物基因组的结构与功能特点三、真核生物基因组结构与功能的特点四、线粒体基因组五、人类基因组,* 基因组(genome)一个细胞或病毒所携带的全部遗传信息或整套基因。,一、病毒基因组的结构与功能特点,1不同病毒基因组大小相差较大,乙肝病毒(HBV)DNA为3.2kb,痘病毒基因组DNA长达300kb,2不同病毒
10、的基因组可以是不同结构的核酸,腺病毒基因组为线性双链DNA,3病毒基因组有连续的也有不连续的流感病毒由8条单链RNA分子构成,4病毒基因组的编码序列大于90% 病毒基因组的大部分是用来编码蛋白质的,只有很小的一部分不编码蛋白质。,5单倍体基因组 除逆转录病毒基因组有两个拷贝外,至今发现的病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。,6基因有连续的和间断的 感染细菌的病毒(噬菌体)基因组与细菌基因组结构特征相似,基因是连续的;而感染真核细胞的病毒基因组与真核生物基因组结构特征相似,有的基因含有内含子,基因是间断的。,7相关基因丛集 如腺病毒晚期基因编码表达的12种外壳蛋白,在晚期基因转
11、录时是在1个启动子作用下生成多顺反子mRNA,然后加工成各种mRNA,编码病毒的各种外壳蛋白,它们在功能上都是相关的。,8基因重叠 有些病毒核酸分子很小,又需要装入尽可能多的基因,因此在进化过程中形成了重叠基因,即同一段核酸序列能够编码2种或2种以上蛋白质。,9病毒基因组含有不规则结构基因 主要类型有: 几个结构基因的编码区无间隔,而是连续 的、不间断的。 mRNA没有5端的帽结构 。 结构基因本身没有翻译起始序列,二、原核生物基因组的结构与功能特点,1具有操纵子结构 这是原核基因组的一个突出的结构特点。所谓操纵子由信息区和调控区组成,前者包括数个编码蛋白质的序列,后者包括启动子、操纵基因,以
12、及下游的转录终止信号。2编码序列在基因组中约占50% 原核生物基因的编码序列在基因组中约占50%,远大于真核基因组,但又小于病毒基因组;编码顺序不重叠,其转录产物多为多顺反子结构。,3多顺反子结构,无内含子 原核基因是多顺反子结构,同时基因内无内含子,是连续的,因此转录后不需要剪切。4基因组中重复序列很少 原核基因很少重复序列,其结构基因多为单拷贝,只有编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。5存在移动基因 原核基因组中存在着可移动的DNA序列,包括插入序列和转座子。,三、真核生物基因组结构与功能的特点,真核基因组结构庞大,1多条染色体,两份同源的基因组 配子(精子和卵子)
13、为单倍体,体细胞一般为双倍体,即含两份同源的基因组,而原核生物的基因组则是单拷贝的。2基因组庞大、复杂 真核基因组远远大于原核生物的基因组,结构复杂,基因数庞大,具有许多复制起点。3单顺反子结构 (monocistron) 即一分子mRNA只能翻译成一种蛋白质。,4非编码顺序占绝大部分,含有大量重复顺序 真核生物基因组内非编码的顺序占90%以上。这是与细菌、病毒的重要区别,且在一定程度上也是生物进化的标尺。6具有内含子结构,普遍存在选择性剪接 大多数真核生物的结构基因具有内含子结构,是断裂基因。7有基因家族 功能相关的基因可串联在一起,构成各种基因家族。,四、线粒体基因组,一个细胞里有许多个线
14、粒体,而且一个线粒体里也有几份基因组拷贝,所以一个细胞里也就有许多个线粒体基因组。 真核细胞内存在两个遗传系统,一个在细胞核内,一个在细胞质内,各自合成一些蛋白质和基因产物,造成了细胞核和细胞质对遗传的相互作用;但是,核基因在生物体的遗传控制中仍起主宰作用 。,五、人类基因组,(一)人类基因组DNA的多态性 DNA序列存在着多态性(polymorphism),这种多态性可以分为两类,即DNA位点多态性和长度多态性。,(二)人类基因组的重复序列 1反向重复序列 是指两个顺序相同的拷贝在DNA链上呈反向排列。 人类基因组约含5%的反向重复序列,散布于整个基因组中,常见于基因组调控区内,可能与复制的
15、调控有关。,2串联重复序列 (tandem repeats) 其特点是具有一个固定的重复单位,该重复单位头尾相连形成重复顺序片段,约占整个人类基因组的10%。,第三节 基因的表达与调控,一、基因表达的概念,基因经过转录、翻译,产生具有特异生物学功能的蛋白质分子的过程。,* 基因表达(gene expression),基因表达是受调控的,二、基因表达的时间性及空间性,(一)时间特异性,(二)空间特异性,基因表达伴随时间顺序所表现出的这种分布差异,实际上是由细胞在器官的分布决定的,所以空间特异性又称细胞或组织特异性(cell or tissue specificity)。,在个体生长全过程,某种基
16、因产物在个体按不同组织空间顺序出现,称之为基因表达的空间特异性(spatial specificity)。,三、基因表达的方式,按对刺激的反应性,基因表达的方式分为:,(一)组成性表达,某些基因在一个个体的几乎所有细胞中持续表达,通常被称为管家基因(housekeeping gene)。,无论表达水平高低,管家基因较少受环境因素影响,而是在个体各个生长阶段的大多数或几乎全部组织中持续表达,或变化很小。区别于其他基因,这类基因表达被视为组成性基因表达(constitutive gene expression)。,(二)诱导和阻遏表达,在特定环境信号刺激下,相应的基因被激活,基因表达产物增加,这种
17、基因称为可诱导基因。,可诱导基因在特定环境中表达增强的过程,称为诱导(induction)。,如果基因对环境信号应答是被抑制,这种基因是可阻遏基因。可阻遏基因表达产物水平降低的过程称为阻遏(repression)。,在一定机制控制下,功能上相关的一组基因,无论其为何种表达方式,均需协调一致、共同表达,即为协调表达(coordinate expression),这种调节称为协调调节(coordinate regulation)。,四、基因表达调控的生物学意义,(一)适应环境、维持生长和增殖,(二)维持个体发育与分化,五、基因表达调控的基本原理,(一)基因表达的多级调控,基因激活,转录起始 转录后
18、加工mRNA降解,转录起始,(二)基因转录激活调节基本要素,基因表达的调节与基因的结构、性质,生物个体或细胞所处的内、外环境,以及细胞内所存在的转录调节蛋白有关。,1. 特异DNA序列和调节蛋白质,原核生物, 操纵子(operon) 机制,共有序列(consensus sequence) 决定启动序列的转录活性大小。,某些特异因子(蛋白质)决定RNA聚合酶对一个或一套启动序列的特异性识别和结合能力。,2 操纵序列 阻遏蛋白(repressor)的结合位点,当操纵序列结合有阻遏蛋白时,会阻碍RNA聚合酶与启动序列的结合,或是RNA聚合酶不能沿DNA向前移动 ,阻碍转录。,3) 其他调节序列、调节
19、蛋白,例如:,激活蛋白(activator)可结合启动序列邻近的DNA序列,促进RNA聚合酶与启动序列的结合,增强RNA聚合酶活性。,有些基因在没有激活蛋白存在时,RNA聚合酶很少或完全不能结合启动序列。,(1) 螺旋-转角-螺旋(helix-turn-helix) 这种结构模式具有两个较短的螺旋片段,每个片段有7至9个氨基酸残基,两个螺旋片段之间有转角结构联系。一个螺旋被认为是识别螺旋,含有较多能与DNA相互作用的氨基酸残基,此螺旋进入DNA双螺旋结构的大沟。,2. DNA与蛋白质之间的相互作用,(2) 锌指(zinc fingers) 锌指结构含有约30个氨基酸残基,其中 4个氨基酸残基(
20、两个是半脱氨酸两个是组氨酸,或4个都是半脱氨酸)以配位键与Zn2+相互作用,如图2-6所示。 锌指能与DNA双螺旋大沟结合。,2. DNA与蛋白质之间的相互作用,(1) 亮氨酸拉链(leucine zippers) 这种结构是指在一段肽链中每隔7个氨基酸残基就有一个亮氨酸残基,这段肽链所形成的-螺旋就会出现一个由亮氨酸残基组成的疏水面,而另一面则是由亲水性氨基酸残基所构成的亲水面。,(2) 螺旋-环-螺旋(helix-loop-helix),六、原核生物的基因表达调控,1. 因子决定RNA聚合酶识别特异性,2. 操纵子模型的普遍性,3. 阻遏蛋白与阻遏机制的普遍性,(二)乳糖操纵子调节机制,1
21、. 乳糖操纵子(lac operon)的结构,没有乳糖存在时,2. 阻遏蛋白的负性调节,有乳糖存在时,无葡萄糖,cAMP浓度高时,有葡萄糖,cAMP浓度低时,3. CAP的正性调节,4. 协调调节, 当阻遏蛋白封闭转录时,CAP对该系统不能发挥作用;, 如无CAP存在,即使没有阻遏蛋白与操纵序列结合,操纵子仍无转录活性。,单纯乳糖存在时,细菌利用乳糖作碳源;若有葡萄糖或葡萄糖/乳糖共同存在时,细菌首先利用葡萄糖。,葡萄糖对 lac 操纵子的阻遏作用称分解代谢阻遏(catabolic repression)。,低半乳糖时,高半乳糖时,葡萄糖低 cAMP浓度高,葡萄糖高cAMP浓度低,Trp 高时
22、,Trp 低时,mRNA,O,P,trpR,调节区,结构基因,RNA聚合酶,RNA聚合酶,?,(三)其他转录调节机制,1. 转录衰减,色氨酸操纵子,前导序列,第10、11密码子为trp密码子,14aa前导肽编码区:,包含序列1,形成发夹结构能力强弱: 序列1/2序列2/3序列3/4,UUUU 3,前导肽,前导mRNA,1.当色氨酸浓度高时,转录衰减机制,衰减子结构就是终止子可使转录,RNA聚合酶,终止,前导肽,前导mRNA,RNA聚合酶,2.当色氨酸浓度低时,Trp合成酶系相关结构基因被转录,序列3、4不能形成衰减子结构,2. 基因重组,沙门菌鞭毛素基因的调节,3. SOS反应,紫外线,与DN
23、A 损伤修复有关的酶和蛋白质,DNA,七、真核生物的基因表达调控,(一)真核基因表达调控特点,1. RNA聚合酶,2. 活性染色体结构变化,(1) 对核酸酶敏感,活化基因常有超敏位点,位于调节蛋白结合位点附近。,(2) DNA拓扑结构变化,天然双链DNA均以负性超螺旋构象存在;,基因活化后,,(3)DNA碱基修饰变化,(4)组蛋白变化, 富含Lys组蛋白水平降低 H2A, H2B二聚体不稳定性增加 组蛋白修饰 H3组蛋白巯基暴露,3. 正性调节占主导,4. 转录与翻译分隔进行,5. 转录后修饰、加工,(三)真核基因转录激活调节,1. 顺式作用元件,启动子,真核基因启动子是RNA聚合酶结合位点周
24、围的一组转录控制组件,至少包括一个转录起始点以及一个以上的功能组件。,2. 反式作用因子,转录调节因子分类(按功能特性),* 基本转录因子(general transcription factors),是RNA聚合酶结合启动子所必需的一组蛋白因子,决定三种RNA(mRNA、tRNA及rRNA)转录的类别。,* 特异转录因子(special transcription factors),为个别基因转录所必需,决定该基因的时间、空间特异性表达。,转录激活因子,转录抑制因子,转录调节因子结构,3. mRNA 转录激活及其调节,真核RNA聚合酶在转录因子帮助下,形成的转录起始复合物,TBP相关因子,真核基因转录调节是复杂的、多样的,* 不同的DNA元件组合可产生多种类型的转录调节方式;,* 多种转录因子又可结合相同或不同的DNA元件。,* 转录因子与DNA元件结合后,对转录激活过程所产生的效果各异,有正性调节或负性调节之分。,