1、第三章 基因及基因组结构,一、基因(gene),(一)定义 生物学定义:具有遗传功能的DNA片段。 分子生物学定义:DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功能的多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。,(二)基因的组成,一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控序列、5非翻译序列、内含子以及3非翻译序列等所有的核酸序列(蛋白质基因和RNA基因)。,(三)基因分类,第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因 第二类是只有转录功能而没有翻译功能的
2、基因,包括tRNA基因和rRNA基因 第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因,二、基因组(genome),(一)定义 生物学定义:细胞内所携带的全部遗传信息DNA的总和;对多倍体生物指单倍体DNA的总和。 分子生物学定义: 携带生物体全部遗传信息的核酸量。,编码蛋白的结构基因基因组DNA 复制转录的调控序列功能尚不清楚的区域 不同生物体中具有不同的基因组大小,对人类而言: 22+X+Y+mtDNA。,(二)遗传物质组成,病毒基因组 核基因组 原核生物基因组真核生物基因组线粒体DNA 核外遗传物质 叶粒体DNA质粒DNA 非独立的基因组:转位因子-能在基因组DN
3、A中移动的DNA序列,不能独立存在,需插入核或核外DNA中。,(三)基因组结构与进化的关系:,1.基因组的物质组成从多样 单一;DNA、RNA分工明确单链、双链,线状、环状 双链线状 2. 基因组由小 大; 3. DNA的利用率越来越低;(多拷贝、非编码区、基因不连续) 4. 调控序列增多,调控方式更复杂。,第一节 病毒基因组的结构,(一)病毒的基本结构,外壳蛋白: 识别、侵袭特定的宿主细胞,并保护基因组不被核酸酶破坏; DNA(RNA):编码结构蛋白和少量调控蛋白。 不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。,(二)病毒基因组的结构特点:,1.基因组较小,大小差
4、异较大;CAV DNA 2.3kb,编码3种蛋白质乙肝病毒RNA 3kb,编码4种蛋白质痘病毒DNA 300kb,编码几百种蛋白基因组越小,编码蛋白越少,对寄主依赖性越大。,2.化学组成多样,DNA病毒、RNA病毒单链、双链线状、环状分节段、不分节段,单链环状DNA,基因组共5386个核苷酸,构成3个转录单元,共编码11个蛋白质,总分子量为25万左右,相当于6078个核苷酸所容纳的信息量。 其中非编码序列只有217/5386,不足5%。,3.基因重叠现象普遍存在,重叠基因,定义:核苷酸序列彼此重叠的2个基因为重叠基因overlapping genes,或称嵌套基因nested genes。类型
5、: 一个基因的核苷酸序列完全包含在另一个基因中; 两个基因的核苷酸序列部分重叠; 两个基因只有一个碱基重叠。一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基。,5GCTGGTGGAAAATGAGGAAATTCAAT3 DNA序列Leu Val Glu Asn Glu Glu Ile Gln K蛋白Ala Gly Gly Lys Ter A蛋白 FMetArg Lys Phe Asn C蛋白噬菌体G4一段DNA序列内A、C、K基因三重重叠,基因读框相同,只是起始部位不同,重叠基因,实质:两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白质。意义:使DNA的利用率
6、提高,是基因表达调控的方式之一。 目前,在少数原核生物(大肠杆菌、病毒)中发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。,4.结构简练,大部分可编码蛋白质,只有非常小的一部份不编码蛋白质(通常是基因表达的控制序列)(非编码序列较少);X174 DNA中不翻译的部份只占 217/5375G4 DNA中不翻译的部份占282/5577乳头瘤病毒基因组中不翻译的部份占1.0/8.0 Kb,5. 基因组中功能基因丛集成一个或几个特定区域,形成一个功能单位或转录单元,即形成多顺反子结构(polycistronie)。多顺反子mRNA:可编码两条或两条以上蛋白质分子的mRNA的分子。,6. 除反
7、转录病毒外,病毒基因组只有一个拷贝;,7.有的病毒基因组中具有宿主细胞基因组的结构特点; 比如:某些病毒基因组中的原癌基因与宿主细胞具有类似结构。,第二节 原核生物基因组结构,(一)细菌基因组的结构特点:,1. 拟核(类核)结构; 2. 存在多顺反子结构; 3. 除RNA基因外,基本是单拷贝的; 利于核糖体的快速组装,短时间内合成大量核糖体。 4. 非编码序列相对较少;(相对于真核生物) 5. 基因多是连续的; 6. 存在不同的功能识别区复制起始区、复制终止区等,大肠杆菌的类核结构,核中央由支架蛋白和RNA组成,环状双链DNA绕在支架蛋白的外围,只有一个复制起点,DNA与细胞膜粘在一起DNA上
8、有结合蛋白。,(二)大肠杆菌基因组结构:,1. 基因组DNA在4000kb,估计有3500个基因,已确定的基因有900个,已确定有260个基因具有操纵子结构(75个操纵子中),每个基因平均长度1000bp; 2. 已确定的基因中,多数是与代谢有关的酶、核糖体蛋白; 3. 大多数基因是随机分布的,两条单链作为模板的概率基本相等; 4. 多数基因都是单拷贝。,第三节 真核生物核基因组,(一)真核生物核基因组特点,1.基因组较大; 低等真核生物:107-108 bp,较原核生物大10倍; 高等真核生物:5X108-1010 bp,某些植物和两栖生物可达1011 bp; 哺乳类生物大于2X109它们可
9、编码100万个基因。,Nucleosome structure,Nucleosome core (left)146 bp DNA; 1 3/4 turns of DNADNA is negatively supercoiledtwo each: H2A, H2B, H3, H4 (histone octomer) Nucleosome (right)200 bp DNA; 2 turns of DNA plus spaceralso includes H1 histone,2.真核生物核DNA与蛋白质结合,形成核小体,再缠绕成染色质(染色体);,Nucleofilament structure
10、,3. 基因组一般为双倍体(diploid); 4. 基因为单顺反子。单顺反子:一个基因单独转录,一个基因一条mRNA,翻译成一条多肽链; 5. 存在大量重复序列,重复次数可高达百万倍;,6. 基因组中非编码序列多于编码序列,有大量的冗余DNA; 7. 大部分基因有内含子,因此基因不连续; 8. 具有多个复制起点,而每个复制子的长度较小。 真核生物基因组的突出特点:重复性、基因家族、不连续性。,Properties of the human genomeNuclearthe haploid human genome has 3 X 109 bp of DNAsingle-copy DNA co
11、mprises 75% of the human genomethe human genome contains 30,000 to 40,000 genesmost genes are single-copy in the haploid genomegenes are composed of from 1 to 75 exonsgenes vary in length from 2,300,000 bpAlu sequences are present throughout the genomeMitochondrialcircular genome of 17,000 bpcontain
12、s 40 genes,Type of DNA % of Genome Features Single-copy (unique) 75% Includes most genes 1 RepetitiveInterspersed 15% Interspersed throughout genome betweenand within genes; includes Alu sequences 2and VNTRs or mini (micro) satellitesSatellite (tandem) 10% Highly repeated, low complexity sequencesus
13、ually located in centromeresand telomeres 1 Some genes are repeated a few times to thousands-fold and thus would be inthe repetitive DNA fraction。2 Alu sequences areabout 300 bp in lengthand are repeated about300,000 times in thegenome. They can befound adjacent to orwithin genes in intronsor nontra
14、nslated regions.,50,100,0,I I I I I I I I I,fast 10%,intermediate15%,slow (single-copy)75%,Classes of repetitive DNA,Interspersed (dispersed) repeats (e.g., Alu sequences),TTAGGGTTAGGGTTAGGGTTAGGG,Tandem repeats (e.g., microsatellites),GCTGAGG,GCTGAGG,GCTGAGG,间隔重复序列,串联重复序列,(二)重复性(重复序列),复杂度(X)是指在基因组D
15、NA分子中无重复核苷酸序列的最大长度。例如,(ATAT)n的复杂度为2,(ATGC)n的复杂度为4,噬菌体T4是由2105不重复核苷酸对的DNA分子组成,其复杂度为2105。 C0t1/2值是复性反应进行到一半时,单链DNA初始浓度和所需时间的乘积,C0t1/2值越大表明复性反应越慢,重复序列少,所以C0t与DNA中非重复序列的核苷酸数量成正比。,来自不同生物的DNA,如果反应条件和DNA片段大小相同,则复杂度越大,复性速度就越慢,而C0t12 值就越大。也就是说,基因组的复杂度与其C0t12值成正比,即: x=C0t12 基因的重复次数=实际长度 / DNA复杂度,真核生物DNA复性的各项参
16、数,据基因组重复次数高低:,单拷贝序列轻度重复序列 2 101 重复序列 中度重复序列 10 102高度重复序列 102 106,1. 单拷贝序列:,只有一个拷贝,占基因组的40-70%. 主要是功能基因。 单拷贝序列又称为非重复序列,在一个基因组中只有一个拷贝,在DNA复性曲线中,它是最慢速复性的部分。大多数结构基因都属于这一类型,但单拷贝序列并不都执行遗传功能。,真核生物的单拷贝基因是分散分布于整条染色体或不同染色体之中的。一个蛋白质基因也常分成几段相隔排列。由几个肽段的基因组成一个蛋白质的全部基因,有些肽段的基因仅由内含子隔开,而另一些肽段的基因则分布于几条染色体上。例如,珠蛋白有2条链
17、和2条链,在人类中,链基因位于16号染色体上,链基因则位于11号染色体上。在链基因中,又由几个内含子隔开,串联在11号染色体上。单拷贝基因的另一个特点是普遍存在着内含子。,2. 轻度重复序列,基因组中有2-10个拷贝,是慢速复性的一部分。 主要是组蛋白和rRNA基因、 tRNA基因等。 几个基因都有功能, 编码同一个蛋白质或tRNA; 分两种几个拷贝中有的有功能,有的无功能(假基因) 假基因结构与功能基因相同,但不表达。原因:突变失活,启动子缺陷。,3.中度重复序列,中度重复序列对应于中速复性的部分,在基因组中有数十至数百万个拷贝,分散在整个基因组中。一般无RNA转录产物(非编码序列),一般认
18、为与基因的表达调控有关(包括转录调控序列,复制控制序列,转录后的加工等)。 在基因组中有数千种中度重复序列,其中有一些构成序列家族。各家族成员有的重复串联在一起,有的分散于非重复序列中相间排列。,这类序列的平均长度是300bp左右。长周期分散的重复序列 5000bp 分两种 短周期分散的重复序列 100 300bp,主要存在于人、爪蟾、海胆等生物中,例如,Alu家族等。,4. 高度重复序列,高度重复序列对应于快速复性部分。在基因组中有几百到几百万个拷贝(重复次数 102 106 ),它们的长度差异很大,短的只有几个bp,长的有几十个到几百个bp或更长。这些序列一般不分散,主要集中在异染色质中,
19、特别在端粒和中心粒的附近,由短序列重复多次串联成长长的一大簇, 高度重复序列富含A、T碱基,因序列简单,缺乏转录必要的启动子而不具转录能力,其功能至今尚不清楚。,在多数真核生物的基因组DNA中,都含有20%以上的高度重复序列,其特征之一是两条链的不对称性,它们构成卫星DNA。,反向重复序列,反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。这种重复顺序复性速度极快。序列长度1001000bp,约占人基因组的5。,回文结构,镜子重复,卫星DNA(satellite DNA),卫星DNA(satelliteDNA)是一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成
20、串排列。由于这类序列的碱基组成不同于其他部份(一般富含A/T片断,浮密度较小),可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。,卫星DNA通常是串联重复序列,由各种不同的重复序列家族组成。 重复单位常存在序列变异,反映卫星DNA可能在经过串联重复后发生突变、重复和缺失而得以进化。 在真核生物之间, satellite DNA 总量在2%5%,甚至在亲缘关系密切相关的两个物种之间, satellite DNA也会有悬殊的差别。,分类,卫星DNA按重复单元核苷酸的多少,可分为两类: 小卫星DNA(minisatellite DNA ),由几百个核苷酸对的单元重复组成。
21、微卫星DNA(microsatellite DNA ),由2-20个左右的核苷酸对的单元重复组成。 (占主体),原位杂交技术证明卫星DNA位于染色体的着丝点和端粒处,应用:,1. 生物进化 2. DNA指纹图谱(亲子鉴定) 3. RFLP分析 检测基因缺失、突变、扩增,(三)基因家族 gene family,1.概念 在真核生物基因组中来源相同、结构相似、功能相关的一组成串排列在一起的基因,称为基因家族(gene family)。一些基因彼此靠近,成串地排列在一起,这种基因排列结构叫基因簇(gene cluster)。在基因家族结构中经常会看到基因簇结构。 基因簇多顺反子结构,2、分类:,串联
22、重复多基因家族 组蛋白、tRNA、rRNA 分散重复多基因家族 Alu 家族 不同组织、细胞类型、发育时期表达的多基因家族 同工酶(珠蛋白),3、真核生物中重要的基因家族,(1) Alu基因家族 分散重复序列 在单倍体人基因组中有5X105个拷贝,约占人基因组的3-6%。每个重复单元的长度为300bp,含一个Alu酶切位点,因而得名。酶切后生成130bp和170bp两个片段,每个Alu片段两侧有6-20bp的同向重复序列,存在于间隔区(space)和内含子中。 功能:可能与基因转录、调控、加工有关。,LDL receptor gene,Alu repeats present within in
23、trons,Alu repeats in exons,4,4,4,5,5,5,6,6,6,Alu,Alu,Alu,Alu,X,4,6,Alu,unequal crossing over,one product has adeleted exon 5 (the other product is not shown),(2) rRNA基因家族,串联重复,有转录活性。大多数真核生物rRNA基因家族 集中分布在一条或几条染色体上,以核仁区含量最高。 通常编码区较为保守,内间区具有种间特异性,常被用作物种种类鉴定及进化分析。,rRNA基因家族(gene cluster),真核生物的18S、5.8S和28
24、SrRNA基因构成一个长7.5kb转录单位。 在高等生物中,5SrRNA单独转录的,而且其在基因组中的重复次数高于18S和28S基因。,5S rRNA 基因家族,在所有染色体上都有,分布频率较高。 一般由120bp组成每个重复单元由5sRNA基因和和转录区前的非转录区组成,重复串联形成基因簇。 非洲爪蟾卵母细胞的5sRNA基因:富含A-T的序列,由不同的15bp序列重复而成,(CAAAGTTTGAGTTTT)这段序列的串连数不同,非转录的间隔区的长度会有所改变。,不同生物rRNA和tRNA基因的拷贝数,(3)tRNA基因家族,tRNA基因平均长度约140bp,是一类小分子的基因,在基因组中的拷
25、贝数可达10个至数百个。 基因之间串联重复排列; 多个不同的tRNA基因组成一个串联重复,各重复单元中tRNA基因可以不相同,并单独转录。,(4)组蛋白基因家族,与细胞DNA复制有关 中度重复序列(几十几百个重复),不含内含子,无需转录后加工,mRNA产物无3polyA 基因家族 与DNA复制无关的组蛋白 组织特异性表达的组蛋白,单拷贝,在高等真核生物中, 含有3类组蛋白基因:,H2a、H2b、H3、H4和H1基因,这些基因在细胞分裂的S期中表达,与DNA和染色体的复制有关; 与DNA和染色体的复制无关的组蛋白基因,主要存在于不分裂的、已完成分化的细胞或组织中; 组织专一性的组蛋白基因,例如,
26、红细胞中专一的H5组蛋白基因。后两种组蛋白基因是单拷贝的,mRNA有3-poly A。组蛋白基因家族是指第一类的组蛋白基因。,Nucleosome structure,Nucleosome core (left)146 bp DNA; 1 3/4 turns of DNADNA is negatively supercoiledtwo each: H2A, H2B, H3, H4 (histone octomer) Nucleosome (right)200 bp DNA; 2 turns of DNA plus spaceralso includes H1 histone,特点:,一是组蛋白
27、基因缺乏内含子; 二是组蛋白基因的mRNA没有3poly A尾巴 。 这两个特点使组蛋白基因能很快地转录,并将产物运输到细胞质中。 组蛋白基因家族是重复序列中唯一已知具有蛋白质编码功能的基因。,(5)珠蛋白基因家族,珠蛋白基因家族是最早发现和研究得最多的基因家族之一。动物中的血红蛋白分子是珠蛋白的四聚体,由2个亚基和2个亚基组成。 亚基基因在16号染色体上, 亚基基因在11号染色体上,珠蛋白基因以基因家族的形式排列。,(四)基因的不连续性 真核基因的重要特征,发现: 1977年研究病毒mRNA 时发现,随后在 珠蛋白基因、卵清蛋白基因中证实了断裂基因的存在。证据:1. R环结构2. 限制性内切
28、酶分析,(exon-intron-exon)n structure of various genes,b-globin,HGPRT (HPRT),total = 1,660 bp; exons = 990 bp,histone,factor VIII,total = 400 bp; exon = 400 bp,total = 42,830 bp; exons = 1263 bp,total = 186,000 bp; exons = 9,000 bp,鸡的卵清蛋白基因用EcoR和Hind两种酶切,可得到3或4个片段,把该基因的mRNA逆转录产物cDNA(双链)用以上两种酶切,发现cDNA不能被
29、这两种酶切。,mRNA,cDNA,酶切,(不能被酶切),DNA,DNA中有的序列在mRNA中丢失, 且丢失部分不影响基因功能, 酶切位点在内含子中。,酶切,1、内含子的概念,外显子extron:成熟的mRNA或蛋白质中存在的序列。(在DNA或mRNA中都存在的序列) 内含子intron:在DNA上存在,而在mRNA(或cDNA)中不存在的序列,初级转录产物加工成成熟mRNA时被切除的间隔序列。,5,3,promoterregion,exons (filled and unfilled boxed regions),introns (between exons),transcribed regi
30、on,translated region,mRNA structure,+1,Gene structure (一个完整的具有转录功能的单元),(exon-intron-exon)n structure of various genes,b-globin,HGPRT (HPRT),total = 1,660 bp; exons = 990 bp,histone,factor VIII,total = 400 bp; exon = 400 bp,total = 42,830 bp; exons = 1263 bp,total = 186,000 bp; exons = 9,000 bp,2、基因内
31、含子的特点:,1.内含子是真核生物独有的,但并不是所有真核基因一定有内含子;(组蛋白基因家族) 2.内含子的数量和长度对不同的基因不同,一般基因越长,内含子越多; 3. 在同一基因家族中,编码序列在进化过程中一直比较保守,而内含子变化迅速,差异较大; (内含子变异较外显子大),4.内含子与外显子间的连接处有特殊的序列(序列GTAG)。 高度保守序列 不连续基因剪接成mRNA可能遵照一种通用机制。 5. 一个基因的内含子可以是另一个基因的外显子。 (阅读框和剪切方式不同),3、内含子可能的功能:,1.调控转录速度; 通过与启动子、起始位点的精确碱基配对,阻止或增强RNA聚合酶的活性,从而调控转录
32、。 2. 内含子具有各种剪接信号,使用不同的剪接方式形成不同的成熟mRNA ;,第四节 核外遗传物质的结构及功能,一、质粒DNA Plasmid,1. 存在于原核生物、真菌和少数植物细胞中,是一种核外遗传物质,但不是细胞生存所必需的;2. 有自己的复制起始序列,独立于核DNA进行复制;(有独立的复制系统)3. 质粒DNA含有少量编码蛋白的基因,这些基因对宿主细胞的生存影响不大,但能改变细胞的某些性状,如抗性、降解有机物的酶等;4. 质粒是分子生物学中最常见的克隆载体。,(二)几种常见的质粒,1. 细菌质粒 F质粒 R质粒 Col质粒 Vi质粒 代谢质粒 隐秘质粒,F质粒,F质粒又称致育因子 (
33、Fertility factor , F 因子 )或性质粒(sex plasmid)。其大小约 100kb ,这是最早发现的一种与大肠杆菌的有性生殖现象 ( 接合作用 ) 有关的质粒。 为高频重组质粒,具可转移性和整合性,拷贝数低。,F 质粒基因图谱简图,F+菌株:携带 F 质粒的菌株称为 F+菌株 ( 相当于雄性 ) ; F- 菌株:无 F 质粒的菌株称为 F- 菌株 ( 相当于雌性 ); Hfr菌株: F 质粒整合到宿主细胞染色体上的菌株称之为高频重组菌株 (high frequence recombination , 简称 Hfr) 。 F菌株:当 Hfr 菌株上的 F 因子通过重组回复
34、成自主状态时,有时可将其相邻的染色体基因一起切割下来,而成为携带某一染色体基因的 F 因子,例如 F-lac、F-gal、F-pro 等。因此将这些携带不同基因的 F 因子统称为 F,带有这些 F因子的菌株也常用 F表示。,F质粒的4种存在方式及相互关系,F质粒的4种存在方式及相互关系,R质粒,R质粒又称抗性因子 (Resistance factor , R 因子 ),为抗性质粒,主要包括抗药性和抗重金属二大类,含抗药、分解有毒物质等的基因。,Col质粒(大肠杆菌素因子),因这类质粒首先发现于大肠杆菌中而得名,该质粒含有编码大肠菌素的基因,大肠菌素是一种细菌蛋白,只杀死近缘且不含 Col 质粒
35、的菌株,而宿主不受其产生的细菌素的影响。,Vi质粒,又称为毒性质粒 (virulence plasmid) 。这些质粒具有编码毒素的基因,例如产毒素大肠杆菌是引起人类和动物腹泻的主要病原菌之一,其中许多菌株含有为一种或多种肠毒素编码的质粒。 现在越来越多的证据表明,许多致病菌的致病性是由其所携带的质粒引起的。,代谢质粒,代谢质粒 (Metabolic plasmid),也被称为降解质粒,这类质粒上携带有能降解某些基质的酶的基因,含有这类质粒的细菌,特别是假单胞菌,能将复杂的有机化合物降解成能被其作为碳源和能源利用的简单形式。尤其是对一些有毒化合物,如芳香簇化合物(苯)、农药(2,4-dichl
36、orophenox yacetic acid)、辛烷和樟脑等的降解,在环境保护方面具有重要的意义。,隐秘质粒,隐秘质粒 (cryptic plasmid) 一般质粒类型均具有某种可检测的遗传表型,但隐秘质粒不显示任何表型效应,它们的存在只有通过物理的方法,例如用凝胶电泳检测细胞抽提液等方法才能发现。他们存在的生物学意义,目前几乎不了解。酵母的 2m 质粒不授予宿主任何表型效应,也属于隐秘型质粒。,Ti质粒 一种常用的基因工程载体,土壤中有一种叫根癌农杆菌(Agrobacterium tumerfaciens)的一种土壤微生物,它能感染90个科的双子叶植物的受伤组织。当这种土壤杆菌侵入受伤组织后
37、,受伤组织便不断增生成为冠瘿瘤(craw gall tumor)。这种瘤的产生是由于根癌农杆菌细胞中存在的一种质粒引起的,这种质粒简称为Ti(tumor inducing)质粒。植物受伤组织细胞所发生的一系列变化就是由于Ti质粒中的一段称为T-DNA的片段插入植物细胞染色体后所引起的。,2. 酵母质粒,2u 质粒 双链环状DNA,周长2um,6318bp 3u 质粒 环状DNA,周长3um 线状杀伤质粒 RNA质粒,线状,能分泌一种杀伤因子,对其他酵母有杀伤作用,以保护自身。,3. 真菌质粒有线状,也有环状,有的能整合到线粒体中,有的与菌丝的衰老有关。 4. 植物中的质粒类似于真菌,有线状,也
38、有环状,有的能整合到线粒体中。,二、线粒体DNA mitochondrion DNA(mtDNA),(一)线粒体DNA的结构特点 1.化学结构 cccDNA covalently closed and circular DNA少数线状(存在于植物、原核生物:草履虫、四膜虫等) 2.大小 16 300kb 植物线粒体DNA较大,动物较小;,3. 复制方式:,半保留复制,型、 D-环、滚环复制。 母性遗传,常用于动物进化研究; 母性遗传:由于父本线粒体DNA不进入子代DNA中。Y-染色体 父性遗传常染色体 双性遗传群体家系X-染色体、线粒体DNA 母性遗传,4. 动物线粒体基因组中不存在内含子,甚
39、至还有基因重叠现象。,人mtDNA 基因组长 16569bp,(二)线粒体DNA上的基因分三类,蛋白质合成需要的RNA基因(tRNA rRNA) 编码蛋白质的基因(与呼吸相关的酶基因) 抗性基因,1.蛋白质合成需要的RNA基因,tRNA基因 啤酒酵母中mtDNA上有24个tRNA基因 粗链孢酶中有40个,人和爪蟾中有22个rRNA基因啤酒酵母中有1S和21S rRNA人类细胞中有12S和16S rRNA真核:28S 18S 5.8S 5S原核:23S 16S 5S,2. 编码蛋白质的基因 (与呼吸相关的酶基因),细胞色素氧化酶基因 7个亚基中3个由mtDNA编码NAD FMN CoQ Cytb
40、 CC1ca3 O2 细胞色素还原酶 细胞色素氧化酶 细胞色素还原酶基因:7个亚基中1个由mtDNA编码ATP酶基因 10 个亚基中4个由mtDNA编码33. OSCP,3. 抗性基因,主要在真菌中发现,如抗氯霉素、抗红霉素、抗寡酶素基因等,但不是每个mtDNA上均有抗性基因。,小结:,1.线粒体中可以合成蛋白; 2.线粒体中合成蛋白所需的基因有的可能来自核DNA; 3.mtDNA的结构类似原核生物; 4.质粒、原核DNA、mtDNA有结构的相似性。,(三)线粒体密码子的特殊性:,在mtDNA中,大部分密码子与核DNA相同,但少部分有所不同。密码子 UGA AUA AGG/AGA 线粒体 终止
41、 Ile Arg 核基因 Try Met 终止,线粒体遗传性状的双重控制线粒体的性状由核基因和线粒体基因双重控制;线粒体的组分一方面由线粒编码,另一些组分由核基因编码。,第五节 转位因子 Transposable element,一、定义:,能够进行复制并将一个拷贝插入新位点的DNA序列,或者说能在基因组中移动的DNA序列叫转位因子 。 由于它可以从染色体基因组上的一个位置转移到另一个位置,甚至在不同的染色体之间跃迁所以又称跳跃基因(jump-gene)。,转位因子是基因组中的一个独立单位,在基因组中可移动,是一个更小,更低级的结构单位。DNA的流动性 存在:原核生物、植物中广泛存在,少数存在
42、于动物中。,发现,最早于20世纪40年代由美国冷泉港实验室B.Mc Clintock发现玉米的颜色变化与某些基因的关启有关,而这些基因的关启可能与某些因子的控制有关,而这些因子在基因组中是可以移动的控制因子。当时这一发现并没有引起人们的注意; 直到70年代Shapiro发现大肠杆菌的乳糖操纵子的突变是由于插入了一段序列,后来又发现了其它转位因子后,McClintock的发现才被重视; 1983年Clintock荣获诺贝尔生物学医学奖。,:,二、转位因子的结构特点:,1. 两端存在反向末端重复序列(inverted terminal repeat,ITR),是转位过程中至关重要的结构; 2.绝大
43、多数的转位因子含有开放阅读框,(ORF),编码一个转位酶,促进转位因子的转位;,3.受体DNA在接受插入DNA后,在插入序列的两侧形成同向重复序列; 4. 受体(靶序列)没有确定的特异性,但趋向于一个“热点”区域即所谓“区域性优先”。 取决于DNA双螺旋状态,或DNA-PRO结合状态。,三、转位机制:,转座子的复制; 靶序列的断裂及倍生同向重复序列 转位是一种复制过程。,四、原核生物的转位因子:,IS因子 insert sequence 转座子Tn( Transposon )复合转座子Mu-噬菌体 Mutation-phage,1. IS因子 insert sequence,最简单的转位因子I
44、S ,分子大小范围在 250 1600bp 左右,只含有末端反向重复序列和编码转座所必需的转座酶的基因。它们分布在细菌的染色体、质粒以及某些噬菌体 DNA 上。 15-25bp ,控制转位频率 IS因子插入后,受体两端产生同向重复序列 长度不一,几百-一千个碱基,2. 转位子 Tn Transposon,转座子 (Tn) 比 IS 分子大,与 IS 的主要差别是 Tn 携带有授予宿主某些遗传特性的基因,主要是抗生素和某些毒物 (如汞离子) 抗性基因,也有其它基因。 两端有反向重复序列,有的就是IS因子,也有的不是IS序列。,根据转座子二端结构的组成可将其分为二种类型:,第一种类型是转座子二端为
45、顺向或反向重复的IS ,药物抗性基因位于中间,IS 提供转座功能,连同抗性基因一起转座,称为复合转座子(compound transposon) 或类型转座子。这一类型的转座子实际上是IS 因子的延伸。 第二种类型的转座子的两端为短的反向重复序列(IR) ,其长度一般为 30-50bp,在二个IR 之间是编码转座功能和药物抗性的基因 (或其它基因) ,这类转座子称为类型或称复杂转座子 (complex transposon) , Tn3 是这一类型的典型代表。,Tn3是一个典型的Tn因子,3. Mu-噬菌体 Mutation-phage,一种以大肠杆菌为寄主的温和噬菌体,以裂解生长和溶源生长两
46、种方式之一繁衍自己。 噬菌体存在于大肠杆菌细胞质中,通过整合到寄主染色体上成为溶源噬菌体状态,并与寄主DNA一起复制,这一现象称溶源化。裂解生长,Mu-噬菌体,Mu DNA为线状分子,整合到宿主核基因组中去,会引起染色体上许多位点的突变,故也叫突变因子(Mutator) Mu插入有两种途径: 溶源生长时,Mu插入寄主DNA的任意部位,噬菌体两侧各有5bp靶序列重复; 裂解生长时, Mu随机插入寄主DNA中,一旦插入便很少切除。,C-转位相关基因,A-20KD蛋白基因, B-复制相关基因,四、真核生物的转位因子,1.酵母中的Ty因子:是一种分散重复序列,每个Ty因子全长6.3Kb,两端各有一段3
47、34bp的同向重复序列,称序列,富含AT,可翻译成42个残基的氨基酸,每个酵母细胞基因组中有3035个拷贝。,2.果蝇中的转位因子果蝇中的Copia基因有几种顺序上不相关,但结构和行为相似的因子,统称“类Copia因子”。它们的一般特征如下:,两端有276bp的LTR,具有很高的转录活性,产生poly(A)的mRNA,转录产物大多被限制在细胞核中。,FB因子(fold-back element):果蝇中能通过其两端的反向重复序列回折成发卡状结构的一种可移动遗传因子。转座时靶点序列产生9bp的倍增,有时两个不同的FB因子共同引起一大段DNA的转移。,P因子(P element ),黑腹果蝇的一种
48、转座子。具有不一定的长度,完整的P成份有2900bp,含有四个阅读框,它们是转座所必需的,因此只有完整的P成分才具有转座功能。 共同特点: 两端都有31bp的反向重复序列。,P因子能引起果蝇不育,在果蝇中,P品系雄性与M品系雌性杂交后代产生劣生,而M品系作雄性和P品系作雌性的杂交都不产生劣生后代。P + P M + M 正常M + P P + M 不育原因是雌性P品系细胞质中有P因子的阻遏蛋白抑制P因子中的转位酶的表达;而雄性M品系没有P因子或P因子不完整,因而不能转位引起劣生后代。,逆转位因子 Retroposion,遗传信息的流动:DNA DNA 逆转位因子介导的转位作用:DNA RNA DNA 转位时,RNA cDNA 基因组逆转位因子逆转录病毒无膜蛋白包裹,不能形成病毒颗粒,