1、第二章 基因,第1节 基因的结构和功能,碱基结构,核苷和核苷酸,磷酸二脂键,DNA分子结构和表示方法,DNA双螺旋结构,右手螺旋 反向平行(antiparallel) 内侧是扁平的盘状碱基 两条链的碱基以氢键(hydrogen bond)与互补碱基相连 AT;C G 上下碱基对相距0.34nm 每个螺旋长3.4nm,10bp,直径2nm 大沟(major groove)和小沟(minor groove),氢 键,DNA结构模型,DNA结构示意图,碱基排列顺序的多样性,DNA分子是由A-T和C-G两种bp连接起来的,每个DNA分子一般有成千上万个bp在每一个位置上只有4种可能: A、 T、C、G
2、 假设DNA分子长1000bp,就可能有41000种不同的排列形式,41000种不同的分子结构反映出来的就可能是41000种不同性质的基因。,二、DNA存在的形式,基因组细胞或生物体的全套遗传物质,由每个染色体组的DNA组成,人体体细胞有两个染色体组,DNA全长3.2109bp 。,高度重复顺序,特点:由很短的碱基序列组成,长度2-200bp,重复次数106-108。一般占DNA碱基对的10%-30%。由一些短的DNA序列呈串联重复排列。,卫星DNA,卫星DNA构成着丝粒,端粒和Y染色体长臂上的异染色质区。称为卫星DNA。,反向重复顺序,是两个顺序相同的互补拷贝在同一条DNA链上反向排列而成的
3、,形成链内碱基配对,形成发夹结构。,中度重复顺序,特点:在长度和拷贝数目上有很大差别。有些中度重复序列DNA具有编码功能,如编码rRNA和tRNA以及组蛋白的基因,大多数无编码功能,主要是一些分散重复DNA序列。,分两类,短分散元件(SINE)长度300-500bp,散在分布在基因组中,拷贝数目可达到105以上。如Alu家族,人基因组中大量分散存在,约有50万-70万份拷贝,相当于平均4kb就有一个Alu序列。 2. 长分散元件(LINE)长度5000-7000bp,重复次数为 102-104 。如KpnI家族。,单一序列,单一序列是单拷贝或很少几次的序列,一般800-1000bp组成。其中有
4、部分是构成编码细胞中的蛋白质的基因(结构基因)。,三、基因及其结构,基因:合成一种有功能的多肽链或者RNA分子所必需的一段完整的DNA序列。 原核生物:DNA分子的一个片段,连续编码。真核生物:(断裂基因 split gene),外显子(exon):编码序列 内含子(intron):两个外显子之间无编码作用的DNA序列。,外显子-内含子接头在每个外显子和内含子之间的接头区高度保守的一致序列;每个内含子的5端为GT;3端为AG。 以上接头也称 GT-AG法则。,侧翼序列每个基因的第一个外显子和最后一个外显子外侧的不编码的DNA序列。,启动子:位于基因转录起始点上游100bp内的与RNA 聚合酶结
5、合,启动转录。 TATA框:位于转录起始点上游-1927bp处;序列为TATAA/TAA/T;与TF结合准确辨认转录起始点。 CAAT框:位于转录起始点上游-7080bp处;序列为GGC/TCAATCA;与CTF结合,促进转录。 GC 框:两个拷贝,分别位于CAAT框的两侧;序列为GGCGGG;与转录因子SP1结合,增强转录。,增强子:位于启动子的上游或下游3kb以上,增强转录,作用方向3-5或5-3。例如:人类珠蛋白基因的增强子由72bp串联重复组成,位于转录起始点上游-1400bp处或下游3300bp处,增强转录200倍。 多聚腺苷酸化附加信号:位于3端非编码区下游的一段 DNA 序列。,
6、断裂基因结构模式图,四、多基因家族和假基因,多基因家族由某一祖先基因经过重复、突变所产生的一组基因。它们在基因组中的拷贝只有微小的差别,并行使相关的功能。所以是一组来源相同、结构相似、功能相关的基因。,有两种存在形式: 一类是一个基因的多次拷贝成簇排列在同一条染色体上,形成一个基因簇。 另一类是一个多基因家族中的不同成员成簇分布于几条不同的染色体上,这些成员的序列虽然有些不同,但是编码一组关系密切的蛋白质。如超基因家族。,假基因,在多基因家族中,某些成员不产生有功能的基因产物,这类基因成为假基因。假基因的核苷酸顺序与相应的活性基因极为相似,但不能表达,不具有正常功能。它们与有功能的基因有同源性,起初可能是有功能的基因,以后由于发生突变,失去了活性,变成了无功能的基因。,思考题,名词解释 : 1.基因、2多基因家族3.假基因 问答题: 1.人体DNA存在的形式有哪几种几种?,