1、第三章 基因组的结构和功能基因(gene)是核酸的中贮存遗传信息的遗传单位,是贮存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列(P27)。从生化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单位或1个突变单位。,表型和基因型 某一机体可以观察到的特征称为表型(phenotype),与表型相应的基因组成称为基因型(genotype)。如细菌能否合成亮氨酸记为Leu+和Leu-,相应的基因型为Leu+和Leu-。等位基因 (1)二倍体细胞有2套基因,一套来
2、自父本,另一套来自母本,每个细胞的全部基因均由2套基因组成,每一对基因称做等位基因。(2)由于突变作用引起DNA结构变异,所以某一基因可具有若干种不同的形式,这种同一基因不同的形式互称等信基因(allele)。,基因的基本结构 5、AGCCGACTATGTCGAAGCTT、GCTTGACTATAAGACA、3 3、TCGGCTGATACAGCTTCTAA、CGAACTGATATTCTGT、5 转录调控区 贮存RNA或蛋白质结构信息区 转录终止区,基因组(gencme) 细胞或生物中,一套完整单倍体遗传特质的总和(包括一种生物所需的全套基因及间隔序列)称为基因组(P27)。 基因组的结构主要指不
3、同的基因功能区域在核酸分列中的分布和排布情况,基因组的功能是贮存和表达遗传信息。 人类基因组包含多染色体和XY两条性染色体上的全部遗传物质(核基因组)以及胞线粒体上的遗传物质(线粒体基因组)。(X免疫基因,男XY,女XX)。 * 1个配对(精子或卵子),1个单倍体细胞或1个病毒所包含的全套基因,称为基因组。,第一节 原核基因组 Prokaryotic genome 以细菌为代表讲述,有称bacteria genome。细菌对医学分子生物学有重要贡献,是基因工程研究的主要材料之一。因为: 1.构造相对简单,基因结构也不复杂,取材便利,易于培养,可选择突变株进行研究,实验结果容易重复。(如选择DD
4、DPI缺乏的Ecoli突变株,Ecoli仍可合成DNA,说明酸I对EcoliDNA合成不起作用。) 2.与人类有共同的要子生物学规律可,如:(1)遗传物质都是DNA;(2)主要的功能分子都是蛋白质;(3)基因密码是通用的,等等。 3.尤其是E.coli,是分子克隆是“明星“,基因工程主要原因的工程菌,因为基因工程的主要工作是克隆克核基因在原核系统中表达。,一、原核生物基因组结构与功能的特点 1.基因组通常仅由一条环状双链DNA分子组成。 其DNA是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称为染色体。细菌染色体DNA在胞内形成一个致密区域,即类核(nucleoid),类核无核膜将之与胞
5、浆分开。 2.基因组中只有1个复制起点。 3.具有操纵子结构。操纵子(operon) 是指数个功能相关的结构基因串联在一起,构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的转录终止信号构成的基因表达单位。(见第六章) 4.结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质。 5.基因序列是连续的,无内含子结构。,6.编码区和非编码区(主要是调控序列)在基因组中约各占50%。(5%,95%) 7.基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。(15AA/秒,2AA/秒) 8.具有编码同功酶的基因(is
6、ogene) 这是一类结构不完全相同,而功能相同的基因。如E.coli含有2个编码乙酸乳酸合成酶的基因和2个编码分支酸变位酶同工酶的基因。 9.细菌基因组中存在可移动的DNA序列,包括插入序列和转座子。 10.原核基因的基本结构特点:启动子(promoter)、操纵基因(operator)、调控序列、结构基因(structure gene)、终止子(terminator)。(见第六章),二、染色体外的遗传物质质粒 (一)概念1.质粒(plasmid) 是独立于许多细菌及某些真核细胞染色体外共价闭合环状的DNA分子(covalant closed circnlar,cccDNA),能独立复制的最
7、小遗传单位。(P35-6)2.质粒是双链的DNA分子,大小在1200kb之间,和病毒不同,它们没有衣壳蛋白(裸DNA)。,从生化学来说,除酵母的杀伤质粒(killer plasmid)是RNA外,其余质粒是染色体外的cccDNA分子。从遗传学来说,质粒是与宿主染色体有别的复制子(真核细胞分裂过程中,DNA纤维分成许多复制单位,该单位称为复制子)。在细胞分裂时能恒定传递给交代细胞的独立遗传因子或能在胞内寄生和复制的复制子。,3.质粒与宿主细胞的关系 (1)质粒对宿主的生存不是必需的,只是“友好”的“借居”宿主细胞中,既不杀伤细胞,对宿主的代谢活动也无影响,宿主离开质粒照样的生存下去。 (2)质粒
8、离开宿主就无法生存,只有依赖宿主细胞的(酶和蛋白质)帮助,才能完成自身的复制(扩增)、转录。 (3)质粒经常为宿主执行一些适当的遗传功能,作为对宿主细胞的补偿(“交房租”)。 (4)质粒赋于宿主各种有利的表型(质粒编码蛋白质或酶),使宿主获得生存优势,与我们基因工程实验紧密相关的,如抗生素抗性基因: Ampr 酶,水解-内酰胺环,解除氨关毒性,使细菌抗氨关。 Tetr 膜蛋白,可阻止四环素进入细胞,使细菌抗四环素。,4.质粒发现和研究意义1)理论意义 质粒能够复制、传递和表达遗传信息,从分子遗传学观点来看是一种有机体,是比病毒更原始的生命形式,是生命起源研究的起一块体重要基石。2)实践意义 是
9、基因工程的重要载体(vector),能把外源基因(目的基因)送到宿主细胞中去克隆扩增或克隆表达(见第八章)。质粒是可以改造的,可以剪切、剪接的,基因工程的重要任务之一就是严格改造质粒的同时,控制质粒不传递,若一个致癌质粒可以传递就会传到外都是。,作为基因工程载体的3个特点:A.都能独立自主的复制;B.都能便利的加以检测(抗生素抗性);C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯化(提质粒)。质粒符合上述3个条件。基因工程中主要使用人工构建的质粒。,(二)质粒的分类1.按质粒的复制机理,分为2类: 1)严谨控制型(stringent contrd type) 2)松弛控制型(relaxe
10、d control type)(1)拷贝数少,一般10个,分子量大; (1)拷贝数多,10-200个,分子量小;(2)复制受限,受细菌宿主DNA复制系 (2)复制不受细菌DNA复制系统限制,统的控制; 仅需DDDPI,当宿主蛋白质合成受抑制(3) 特点是这类质粒可以自传递; 时(如培养中加入氯要素时),其拷贝(4)严谨控制机理(低拷贝原因),认 数可猛增至1000-3000之多,该性质对为是该质粒可以产生阻逼蛋白,反馈 基因工程技术十分有利。抑制自身DNA合成。 3)分子量小,不具备自传递能力;4)基因工程使用松弛型(高拷贝数) 质粒,以获得列多的基因产物。 *拷贝数(copy number)
11、细胞所含的按每基因组计算的某种质粒或基因的数目。,2.按分子量大小,分为2类 1)小型质粒,15kb 小型质粒,无接合和自传递能力,在按 多属接合型或自传递型,大型质粒只 合质粒协助也能转移,也可心通过转化 能通过细菌的接合作用人一个细菌 作用进入受体细胞,这类质粒种类较多, 传到另一个细菌。(如F质粒)。 几乎每种细菌都可以含有2种以上,基因 工程一般用小型质粒。,3.按质粒转移方式,分为3类1)接合型质粒(conjugaative plasmid)带有效接触基因质粒,只能使细菌接合,本身不被传递.2)可移动质粒(mobiliableplasmid)可以被传递,但不能使细菌接合型与可移动性共
12、存时,能传递可移动质粒。3)自传递质粒(selftran missible plasmid)兼具1)2)两种功能因而可以自传递,如F质粒。*转化作用(transformation)这是涉及细菌摄入外源DNA而实现基因转移一种机制。(见第八章),(三)质粒的功能质粒的功能主要通过质粒本身携带的基因偏码蛋白质表现出来。携带质粒的宿主细胞可表现出相应表型。 1.性质粒 即雄性细菌F质粒,它本身转到F-宿主细胞时,使后者变成F+,改变宿主细菌性别。 2.抗生素抗性 抗药性(R)质粒使细菌产生抗生素抗性,这种抗药性抗性基因也可以转移到缺乏这种抗药基因的细菌体内,使之产生抗药性。 3.产生毒素的质粒 如c
13、ol质粒能产生大肠杆菌素因子(colicin),杀死不合该毒素的亲缘细菌。 4.降解复杂的有机化合物作为能源质粒。 5.产生限制和修饰酶。(见第八章),(四)质粒的基本特性1.自主复制 质粒的复制是自主调节的,不受染色体复制调节因素的影响。 复制调控系统由质粒上的复制起点(ori),质粒的rep基因和cop基因组成。Rep蛋白启动质粒的复制,cop基因本身或其表达产物可抑制复制作用,从而控制质的拷贝数。2.质粒的不相容性 利用相同复制系统的质粒不能共存于同一个细胞内。PMB和COLEI是两个密切相关的复制调控系统,带有PMB和COLEI复制调控系统的质粒是不相容的。但它们与带有PSC101或P
14、15A复制调控系统是完全相容的,可以共存于一个细胞内。不相容性使质粒能够很容易被克隆。3.质粒的转移性 在自然条件下,在些质粒可以通过细菌接合作用在细菌细胞向传递。基因工程中常用的质粒载体缺乏转移所需的基因(mob基因),不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌细胞中。,三.转位因子转位因子(transposable element) 即可移动的基因成分(可移动基因,movable gene mob),是指能够在一个DNA分子内部或两上DNA分子之间移动的DNA片段。在细菌中指在质粒和染色体之间或在质粒和质粒之间移动的DNA片段(文献上有时形象地称其为是跳跃基因,jumping
15、 gene)。转位也是DNA重组的一种形式。,移动基因最早由美国冷泉港实验室(cold spring Harbor Laboratory)的女科学家B.MClintock于上个世纪40年代晚期在玉米中首次发现的。60年代,为J.A.Shapirc研究大肠杆菌高效突变实验证实。1983年荣获诺贝尔生物学医学奖。,(一)转位因子的种类及特征细菌的转位因子包插入序列,转座子及可转座的噬菌体。1.插入序列(insertion sequence,IS) IS的形体图,TS target site靶位点 Transposase gene 转位酶基因 IR inverted repeated 反向(倒转重复
16、顺序),(1)IS是一类较小的转位因子,长度约700-2000bp,按发现顺序IS1、IS2命名,只携带转移的必需基因,不含有其它偏码蛋白质结构基因,本身没有表型效应。 (2)IS两侧为反向(倒转)重复顺序(16-41bp),中间为转位酶基因,在插入新的位点侧有3116p顺向重复顺序(directw repeated sequencedk),DR是靶位点序列复制的产物。 (3)IS到处活动,可以插入到E.coli染色体的各个位置上,也可以插入到质粒和某些噬菌体基因组上,甚至同一基因不同位点上。这种插入作用可以双向进行,可以是正向,也可以是反向插入IS这种移动方式称为转位作用(transposi
17、tion)。 (4)在一个世代的107细菌中有1次插入。 *TR(反向倒转重复序列):GGAAGGT、ACCTTC CCTTCCA、TGGAAGG *DR(正同向重复序列):TACGTTACGT,2.转座子(transposon,Tn) (1)Tn是一类较大的可移动成分,除mob gene外,尚含有其它基因,如抗药基因等。Tn是在研究抗药基因中发现的,由此知道抗药基因可在质粒之间,质粒与染色体之间或质粒与可转座的噬菌体之间来回移动,Tn的转位原理和Is基本相同,转位频率为10-310-6/拷贝。 (2)根据结构特征的不同,Tn可以分为2个亚类: 复合型Tn:转座酶由IS编码,IS可以是反向(或
18、正向)重复构型。 TnA:数个结构基因(mob、mdr等)十IR组成。,Structural genes,IR,IR,Structural gene,IS1,IS1,3.可转座的噬菌体(transposable phage) (1)包括Mu和D108两种噬菌体,是一类温和噬菌体*。 (2)感染细菌后,可以整合到细菌染色体中,插入位点是随机的(而入phage插入位点是专一的),可以插到结构基因内部,引起突变,Mu即Mutator(突变子)因此得名。 (3)插入部位的2侧有短的DR,插入时,一个拷贝留在原位,新合成的拷贝插入新的部位。 (4)和IS,Tn相比,Mu末端不含IR,这是可转座成分的一个
19、例外。,*噬菌体(phage)是侵袭细菌的病毒,主要由蛋白质和核酸组成。噬菌的生活周期分为溶菌周期和溶原周期。 溶原性噬菌体(温和噬菌体)宿主菌将自身DNA整合到细菌染色体中和细菌染色体一起复制随细菌增殖传到细菌子代中去,不产生子代Phage.,(二)转位作用的机理 1.复制性转位机理 共联体生成和解离,靶序列的切割与复制。 2.非复制型转位作用 转位将供体DNA转座因子两侧各切断一条单链并与靶序列的两个游离末端连接, 随后并没有复制过程,而是由转座酶将供体DNA转座因子的另一端也切断,因此在供体DNA留下一个致死性缺口。 转座子的两条游离单链在靶位点退火接合,DNA聚合酶项平缺口。,(三)转
20、位的遗传效应 1.基因重排 可能产生1个新的蛋白分子等,基因重排是进化的动力。 2.基因突变 插入到基因内部,可引起插入失活。 3.插入位点引入新的基因 如引进抗药基因。,(四)细菌有限制修饰系统细菌的限制修饰系统是分别由特定的基因编码的限制酶和修饰酶组成的二元系统。1.防御外源性DNA入侵。2.构成细菌种属和菌株之间交叉繁殖屏障,但又允许外源DNA有某些遗漏,利于物种进化。3.基因工程重要的工具酶。(350/400) 甲基化酶 1.保护自身DNA不受限制酶切割(限制)。2.影响DNA分子构象,利于基因表达调控。 限制酶和甲基化酶辩证关系。,第二节 真核生物基因组一.真核生物基因组的结构 (一
21、)真核基因的基本结构 1.结构基因、内含和外显子、断裂基因。 (1)结构基因(structural gene)指能转录成为mRNA、rRNA或tRNA的DNA顺序。 (2)内含子和外显子 真核生物的结构基因是不连续的,编码序列被非编码序列打断,在编码序列之间的序列称为内含子(intron),编码序列称为外显子(extron)。 (3)断裂基因(split gene) 在真核类结构基因组中,编码顺序被许多称为内含子的非编码区分割成几段称之。,2.顺式调控元件顺式调控元件(cisacting elements) 指与结构基因表达调控相关,能够被基因调控蛋白特异性识别和结合的DNA序列。能与顺式作用
22、元件结合调节基因转录活性的蛋白质因子称为反式作用因子(transacting factors)。顺式调控元件有:,(1)启动子(promoter)概念:启动子是促进DNA转录的DNA序列,是DNA分子上可与RNA pol 特异性识别结合并使之转录的部位,但启动子本身不被转录。功能特点:启动子位于结构基因上游启动子有方向性决定转录方向及那一条DNA链作模板转录(以信息链的互补链作模板转录,转录的mRNA与信息链一致)。真核生物的启动子元件是TATA box TATA盒与TATA因子的转录因子结合后即成为完整的启动子。(见第六章),(2)上游启动子元件(upstream promoter elem
23、ents ups)UPS是TATA盒上游的一些特定的DNA序列。反式作用因子可与这些元件结合,通过调节TATA因子与TATA box的结合、RNA pol与启动子结合及转录起始复合物形式来调控基因转录效率。,(3)反应元件(response elements)一些信息分子的受体被细胞外信息分子激活后,能与特异的DNA序列结合,调控基因的表达。这种DNA序列实际上也是顺式元件,由于能介导基因对细胞外的某种信号产生反应,被称为反应元件。反应元件都具有较短的保守序列。这些无件通常位于启动子附近和增强子内,有不少是回文序列。,(4)增强子(enhancer)和沉默子(silencer)增强子是一段DN
24、A序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件。反式作用因子与这些元件结合后,通常为增强邻近基因的转录。增强子一般位于转录起始点上游-100-300bp处,但在基因之外或某些内含子中也有增强子序列(P42)。增强子作用特点:可在5端或3端发挥作用;不受序列方向制约;通过增强启动子发挥作用。沉默子 负调控序列、负增强子;,(5)加尾信号在结构基因的最后一个外显子中有一个保守的AATAAA序列,此位点下游有一段GT丰富区或T丰富区,这两部分序列共同构成poly(A)加尾信号。mRNA转录到此部位后,产生AAUAAA和随后的GU(或U)丰富区。与RNApol结合的延长因子可以识别这种结
25、构并与之结合,然后在AAuAAA下游10-30个碱基的部位切断RNA,并加上poly(A)尾.,(二)基因家族(gene family)基因家族 是指核苷酸序列或编码产物具有一定程度同源性的一组基因.基因家族 中各个基因之间的关系:1.家族中各基因的核苷酸序列相同这些基因族也被称为单纯多基因家庭(如rRNA,tRNA家族)和复合多基因家族(如组蛋白基因家族).tRNA基因:人类基因约有1300个tRNA基因,编码50多种tRNA。每种tRNA可有10-几百个基因拷贝。同种tRNA往往串联在一起形成基因簇,但基因间有非转录间隔区分隔,常常比结构基因长近10倍。,2.家族中各基因核苷酸序列高度同源
26、 (1)人类生长激素基因家族包括人生长激素(hGh)、人胎盘促乳素和催乳素(prolactin)。它们之间的同源性很高,尤其是hGh和hcs之间,蛋白质氨基酸序列有85%的同源性,mRNA上序列上有92%的同源性,说明它们是来自一个共同祖先基因。3种基因并不都排列在一起,hGh和hcs基因位于第17号染色体长臂,催乳素基因位于第6号染色体。 (2)-株蛋白和-株蛋白基因家族这些基因家族的各个成员在DNA分子上的排列顺序按照发育的不同阶段先后次序排列,故也称“发育控制复合多基因家族”。,3.家族中各基因编码的蛋白质有高度的同源性,但基因的核苷酸序列可能不同。 如src癌基因家族 src,abl,
27、fes,fgr,fps,fym,kck,lyn,ros,tkl,yes 此家族中各基因的DNA序列没有明显的同源性。 但每个基因产物都含有250个氨基酸顺序的同源蛋白激酶结构域。 4.家族各基因编码的蛋白质中具有很小的保守基序(conserved motif)。 如DEAD box基因家族。DEAD box:Asp-Glu-Ala-Asp. 此家族中各基因的DNA序列没有明显的同源性,但所有的表达产物都具有解旋酶的功能,都具有同样的保守基序(DEAD盒),DEAD是酶活性的关键结构。,5.基因超家族(gene superfamily)基因超家族 是指一组由多基因家族及单基因家族组成的更大的基因
28、家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。如:(1)免疫球蛋白超基因家族 表达产物都有免疫球蛋白样的结构域结构。有2个微球蛋白、MHCI类抗原的链,类抗原的链和链,Thy1、CD4、CD8等与免疫有关的分子。 在后又陆续发现了许多免疫系统内以及与免疫无关的家族成员。,(2)丝氨酸蛋白酶基因超家族 其基因产物都有一个特殊的功能区,具有酶的功能。功能区中丝氨酸是活性中心瓣关键氨基酸残基。现有很多新成员加进去,如载脂蛋白(apolipoprot
29、ein),它们只是转移胆因醇蛋白颗粒中的成分而不具备任何水解蛋白质的酶功能。 (3)信号传递途径中的小GTP接合蛋白,现在称为ras超家族,包括ras家族、rho家族、rab家族,大约已有30个蛋白质基因被确定为该家族成员。,(三)假基因(pseudogene)1.假基因 在多基因家族中某些与正常功能基因在核苷酸序列上相似,但不能转录或转录后生成无功能基因产物的DNA序列,被称为假基因。 DNA序列,被称为假基因。2.假基因常用符号表示,如1 表示与1 相似的假基因.3.假基因与有功能的基因同源,原来也可以是有功能的基因,由于发生缺失(deletion)、例位(inversion)或点突变(p
30、oint mutaion)等,成为无功能的基因,即形成了假基因,哺乳动物基因组中的1/4基因为假基因,可能为进化的痕迹。,(四)编码序列 真核生物基因组编码序列只占DNA总量的5%,但由于其基因组非常大,故其基因数量就原核生物基因组要大得多(几十倍)。,(五)真核基因组中的转座子在真核基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重复序列往往是可移动的。在些可移动成分的结构与原核基因组的转位因子相似,是通过DNA介导的。而另外一些中度重复序列的转移成分,要先转录成RNA,再逆转录生成cDNA,然后重新整合到基因组中,这种逆转录旁路的转移成分称为逆转录座子(retroposon),是
31、RNA介导的。,(六)重复序列(repeat sequence)重复序列中,除了编码rRNA 、tRNA 、组蛋白及免疫球蛋白的结构基因外,大部分是非编码序列。它们的功能 主要与基因组的结构稳定性,组织形式以及基因表达调控有关。目前已发现一些重复序列的特征与遗传有密切联系,因此可以通过测定重复次数而协助遗传病的诊断。,据出现的频率不同可将DNA序列分为3类:1.高度重复序列 在基因组中的重复次数 1052.中度重复序列 在基因组中的重复次数为 101-1053.单拷贝序列 在整个基因组中出现1次或少数几次(100-101)。,(七)端粒(telommere)以线性染色体形式存在的真核基因组DN
32、A的末端都有一种特殊的结构,称为端粒。(形式上膨大成粒状而得名)。 结构 1.是染色体末端DNA和蛋白质构成复合体。仅在真核细胞染色体末端存在。2.其DNA序列相当保守,一般由多个串联在一起的短寡核苷酸(5-86p)序列构成。3.碱基成分因种属而异,重复次数在不同生物中变化较大,如小鼠的端粒DNA达150kb,人类的端粒DNA约515kb。 功能 1.保护线性DNA的完整复制2.保护染色体末端及决定细胞的寿命等。,二.人类基因组中的重复顺序 (一)反向重复顺序(inverted repeats,IR) ATTAGC GCTAAT ATTAGC GGAT GCTAAT TAATCG CGATTA
33、 TAATCG CCTA CGATTA 1.连续的反向重复顺序,这种结构又称回文结构(palindrome),是指一段DNA顺序,在两条链上,正读与反读意义相同。 2.不连续的反向重复顺序之间含有间隔顺序。 1.2占人类基因组5%,可能与复制、转录调控有关。,(二)串联重复顺序(tandem repeats) 1.编码区串联重复顺序 如组蛋白基因、5srRNA基因等。其意义在于快速大量合成相应基因的mRNA. 2.非编码区串联重复顺序 通常存在于间隔DNA*和内含子内,是组成卫得DNA*的基础。卫星DNA可分为三类,大卫星DNA、小卫星DNA和微卫星DNA。,*间隔DNA(spacer DNA
34、)真核基因组中,在基因之间也有一些非编码顺序将它们隔开,一般称为间隔DNA,是和内含子性质不同的插入顺序。 *卫星DNA(satellite DNA sat -DNA)又称随体DNA。这部分DNA是在用cscl密度梯度离心时发现的。,大肠杆菌DNA剪切成若干片段后离心只得到1个峰,而蟹DNA在主峰旁边还有1个小峰,其中所含DAN称sat-DNA. Sat-DNA的A+T/G+C比值不同于主峰DNA的比值,因而其密度也不同于主峰DNA。比值改变原因是它们含有大量的重复顺序而使某段DNA分子(A+T)或(G+C) 偏低或偏高。(下图因比值远远大于主峰DNA,导致密度较低所致)。,(三)散在重复顺序
35、(intersprersed repeats)散在重复顺序是人类基因组中非串联非反向的重复顺序,包括少数活跃的转位因子,根据重复序列的长度可将该家族分为2个主要类型,短散在核元件和长散在核元件。 1.SINEs(shat interspersed nuclear elements) 2.LINES(long interspersed nuclear elements)代表 Alu家族(逆转录转座子) KpnI家族 (1)序列中含Alu限制酶位点 (1)序列中含Kpn限制酶位点 (2)基因组中重复数3-5105 (2)全长6-7kb (3)Alu顺序之间间隔:3-5kb (3)Knp 消化后可见
36、4条带 (4)相对集中在染色体R带 (4)集中分布在染色体G或Q带 逆转来转座子 RNA介导转座 ,合成cDNA基因组,三.人类基因组DNA多态性某一机体可以观察到的特征,称为表现(phenotype),与表型相应的基因组成称为基因型(genotype).人类个体之间所以表现为千差万别,其物质基础在于基因组DNA的差异.DNA序列的多态性就是这些差异中十分重要的1种,DNA序列多态性可分为位点的多态性和串联重复顺序多态性,前者又可造成限制性长段长度多态性.,(一)DNA位点多态性(DNA site polymorphism)DNA位点多态性 是由于等位基因间在特定位点上DNA序列存在差异造成的
37、.在各种DNA位点多态性系统中,HLA(人类白细胞抗原)是最复杂的一种.就其表型而言,从理论上来说,已远远超过了现有地球人口,人类为远交群体,因此要在无血缘关系人群找到HLA表型完全相同的个体几乎是不可能的.(见分子免疫学).,(二)限制性中段长度多态性(restiction fragment length polymorplism,RFLP) 1.DNA位点的多态性可影响限制酶的切割位点,造成限制片段长度多态性,即用同一种限制酶消化不同个体DNA时,会得到长度各不相同的限片段类型。是DNA多态性的一种特别有用的形式,当DNA分子由于中性突变,使某种限制酶切点数增加,减少或移位,导致限制性片段
38、长度发生改变(也称为RFLP),就会得到不同限制性片段类型,这样的位点称为多态性位点。,(三)重复顺序长度多态性 1.小卫星DNA多态性很复杂,个体之间的差异极高。 2.微卫星DNA多态性,功能不太清楚. (四) DNA位点的多态性可以作为遗传标记,用于基因诊断或个体鉴定,其与疾病的相关研究正在进行之中。,本节概要地介绍了对人类基因组研究和认识,但显然还有大量的未知,比如仅弄清楚了极有限的功能基因,一小部分基因序列,距离彻底了解人类自身遗传背景还很遥远。正是存在这种科学内在的驱动力,人类在20世纪末开始了的探索自身为主要目的的伟大科学计划人类基因组计划,其重要意义完全可以与原子弹计划和阿波罗登
39、月计划相比。,第三节 病毒基因组基因组(genome) 1个配(精子或卵子),1个单倍体细胞或1个病毒所包含的全套基因。病毒核酸或为DNA或为RNA,可以统称为病毒染色体。完整的病毒颗粒具有蛋白质外壳,以保护病毒核酸不受核酸酶的破坏,并能识别和侵袭特定的宿主。类病毒例外,它是一类植物病毒,为很小的单链闭环RNA(250-400碱基)。,病毒核酸与所有的原、真核生物的核酸组比较,最为突出的特点是每种病毒颗粒只含1种核酸,或DNA或RNA,两者不共存于1种病毒颗粒中,据此,病毒可以分成两组,即DNA病毒和RNA病毒。病毒核酸分子量大小:RNA病毒小106-107D,DNA病毒大;107-108D基
40、因数:3-几百个,一切烈性病毒(virulent virus)都具备参下几个时相的生活周期:(1)吸附;(2)核酸进入细胞;(3)转录、翻译和复制;(4)病毒颗粒成熟;(5)释放病毒颗粒。典型的生活周期为6-48小时,噬菌体为20-60分钟。病毒对细胞功能的干予,最典型的是噬菌体(phage),当其入菌后,立即接管了细菌的各种主要功能,细菌自身的DNA复制RNA转录,蛋白质合成,能量代谢等都停顿下来转变成合成病毒的机器。有些动物病毒也有类似的情况,但非普通规律。相对而言,动物病毒和宿主细胞可以共存一段时间至病毒生活周期的后期才造成宿主细胞的严重损害,这些损害有如下3个类型: (1)抑制宿主RN
41、A和DNA的合成。 (2)核糖体合成受损。 (3)蛋白质合成受抑制是普遍现象。与人类疾病有关的病毒属于动物病毒,它包括8个DNA病毒科和12个RNA病毒科,这些病毒基因组结构和功能已基本清楚(见分子病毒学HIV、没办法)。,(二)病毒有(十)链RNA和(一)链RNA之分。(十)RNA病毒 (一)RNA 概念 极性和mRNA极性相同, 与mRNA极性相反或与(十)RNA碱基顺序也相同。 互补的RNA。 作用 1.作为模板(与mRNA一样) 必须依赖翻译出病毒多肽或蛋白质。 RNA的RNA2.作为模板,合成(一)RNA, pol合成(十)可以以(一)RNA为模板 RNA(mRNA)合成子代病毒RN
42、A。 才能翻译出3.作为模板合成cDNA. 病毒(即以mRNA为模板反转录合成DNA)。 蛋白质。,二.病毒基因组结构功能特点(P28) (一)病毒核酸可以是ssDNA、dsDNA或RNA分子,分子结构有发夹、环状、线型、节段型。以SSDNA,dsRNA最为突出。 (二)基因重叠 即同一段基因可以编码2种或以上的基因产物这种现象在其它生物细胞仅见于线粒体和质体DNA.所以是病毒核酸较为独特结构能使小小病毒携带较多的遗传信息,原因是病毒基因阅读框可以错位(SV40)。,(三)连续的和不连续的基因 病毒基因结构特征往往与其宿主细胞基因结构相似。原核病毒(如噬菌体)基因是连续的,没有内含子;真核病毒
43、(如多瘤病毒)基因是不连续的,有内含子。有意思的是,有些真核病毒的内含子或其中的一部分对某一基因来说是内含子,对另一基因却是外显子。如SV40和多瘤病毒的早期区域就是这样的。除了(+)RNA病毒外,真核病毒基因都是先转成mRNA前体,再经过剪接等步骤能成为成熟的mRNA.,(四)节段性基因 大部分病毒核酸都是由一条双链或单链构成,少数病毒核酸由数个片段构成。这类病毒一般度RNA病毒。如flu-v由6-7个片段构成,各段在天然状态下不连接,而且可以转录成6-7个片段相应的 mRNA。单独的片段没有感染性,感染要一起感染才发挥作用。 (五)除了retro-v外,所有的病毒基因都是单倍体基因。即每个
44、基因在某个病毒颗粒中只出现一次,即只有1套基因。 (六)编码区非编码区(95%/5%)。病毒核酸大多数顺序都用来编码蛋白质。,(七)基因常常成簇排列,没有间隔序列或间隔序列很小。功能相关蛋白质基因在基因组的1个或几个特定部位,丛集成簇被转录成多顺反子,然后加工成各种蛋白质的mRNA模板。如腺病毒晚期基因。 (八)不规则的结构基因 1.几个结构基因的编码区不规则,因此有些结构基因无翻译起始序列。 2.有的mRNA(=gene)没有5帽子,但有翻译增强子。 (九)DNA或RNA 1种病毒基因组只是1种核酸。,三、典型病毒基因组 (一)SV40病毒基因组SV40(simian sarcom avir
45、us40 猴肉瘤病毒)属乳多空病毒类,是最小的DNA病毒之一。它可长期潜伏于猴肾细胞,对新生仓鼠有致癌性,体外试验还可使多种属细胞恶性转化。,1、基因组结构特点(1)双链环状DNA分子、MW3103KD,长52436p,与4种组蛋白(H2A、H2B、H3及H4)综合,与真核染色质区别在于不含H1。(2)基因组由早期基因、调控区和晚期基因构成。早期基因含有2个重叠基因,编码T和t(T=tumor)抗原晚期基因含3个重叠基因,编码VP1(主),VP2和VP3(次)3种衣壳蛋白调控区位早、晚期基因之间,长约4006p包括复制起点,启动子和增强子,可调节基因组的复制及早、晚期基因的转录。,2、SV40
46、病毒基因的表达(1)启动子位于调控区复制起点上游,其中含有RNA pdII识别位点位于-21-26bp之间的TATA盒可启动RNA转录起始准确位置,一般不相差10个核苷酸。(2)增强子 在106-250位是2个串联的含有72bp的完全重复顺序,即为增强子,能增强SV40及异源基因的表达。(3)早期基因转录的mRNA前体选择剪接形成不同的mRNA(TmRNA、t-mRNA),3、病毒基因组的复制及基因表达调控T抗原控制病毒的复制,启动晚期基因转录。(1)早期基因T及t的表达受T抗原的反馈阻遇,表现一种自我调节作用。(2)晚期基因表达需要T抗原及SV40DNA本身的复制。一般过程是,感染早期合成T
47、、t抗原T-方面抑制早期mRNA进一步合成;另一方激活多种与DNA复制有关的酶,引发病毒的复制进而推动晚期RNA的合成,产生Vp蛋白(12h)V-DNA+VP123病毒颗粒。,(二)HBV基因组HBV是乙肝的病原体,它可造成持续性感染,引起急、慢性肝炎,部分患者可发生肝硬化,HBV原发性肝癌发生密切相关,我国HBSAg携带者高达10%,因而我国特别重视HBV的研究。,1、HBV基本结构(1)电镜下观察呈园球形,直径约42nm,称Dane颗粒(以发现者命名);中间含1个致密的内核(core),直径约27nm;外为1层约14nm外壳(capsid)。(2)表面有HBsAg(hepatitis B
48、virhs surface antigen);核心有HBcAg和HBeAg;含DNA pol、prorein kinase(蛋白激酶)和reverse transcriptase(逆转录酶),后者与病毒复制特点有关。,2、HBV基因组结构(1) ds()DNA组成的环状结构,开环不封闭。侵入细胞后借助胞内DNA修复机制转变成cccDNA分子(共价闭合环状超螺旋)。(2)基因组双链DNA长短不一,外长内短,长负(链)短正(链),长链2/3是双链,1/3是单链。两链间隙由DNApol填充(上(1)述)。(3)长链(负链)基因重叠是转录mRNA的模板链.,不同毒株均含有4个开放性阅读框(openre
49、ading frame, ORF见第五章)S.C.P.X,其中P区与S.C.X.互相重叠50%以上,故多个ORF可读码2次以上,编码2个以上蛋白质。其中:S区 编码主要蛋白为HBsAgC区 编码HBcAg等。P区 编码DNApol是依赖RNA的DNApol(逆转录酶)。X蛋白功能不详。,4、HBV与肝癌的关系现在普遍认为,HBV感染与原发性肝癌关系密切,流行病学及分子病毒学的证据如下: (1)原发性肝癌(肝细胞性肝癌)HBSAg高达85%,其他肿瘤患者仅为15%; (2)培养肝癌细胞株,不断释放出HBsAg(+); (3)cDNA 探针检查到HBV已整合到肝癌细胞DNA中去; (4)肝癌病人的癌基因,如Ki-ras、Ha-ras、myc被激活。,