1、第二章 基因的概念和结构 一、孟德尔的“遗传因子”-生物性状的遗传符号。 二、基因-位于染色体上的遗传功能单位。1909年,约翰逊首创了“基因”一词,用来代替孟德尔的遗传因子。1926年,摩尔根提出基因的“三位一体”的概念, 即基因是决定性状的最小单位、突变的最小单位、 重组的最小单位。 1、等位基因一对同源染色体同一基因座上的一对基因称为一对等位基因。,等位基因之间存在着显隐性关系。 (1)完全显性 (2)不完全显性 (3)共显性2、复等位基因一个群体中,一对同源染色体的同一基因座上有2个以上的等位基因。例如: (1)果蝇的眼色基因用w代表果蝇的眼色基因,则:,(2)ABO血型系统人类的AB
2、O血型是由三个复等位基因IA 、IB 、i控制。IA 、IB对i 为显性, IA 、 IB之间为共显性。因此,A型血的个体,基因型可能为IA IA 、 IA i ;B型血的个体,基因型可能为IB IB 、 IB i;AB型血的个体,基因型只能为IA IB ;O型血的个体,基因型只能为i i.为显性。,人白细胞抗原(HLA)主要组织相容性抗原系统。主要组织相容性复合体基因(MHC)人类的MHC又称HLA,位于第6号染色体短臂 上,长约4000Kb。按结构功能和组织分布情况的 不同可分为三类:a. HLA-类基因在远离着丝粒2000-4000Kb范围内,有A、B、C、E、F、G、H、J等基因座,每
3、个基因座又有几十个以上的等位基因。(P41 表3-3),HLA-类基因在近着丝粒的1000Kb范围内,主要有DQ 、DR、DP等基因座,每个基因座又有几个、上百个基因。(P41 表3-3) HLA-类基因在近着丝粒处1000Kb-2000Kb范围内,位于HLA-和HLA- 基因之间。该区已发现60多个基因座。HLA是目前已发现的最复杂的复等位基因系统。对于每一个基因座上的复等位基因,它们之间均为共显性。,对于每一个人的某一条6号染色体,HLA各基因座紧密连锁,就构成了单倍型或单元型。HLA是以单倍型方式遗传给下一代的。同卵双生子之间, HLA单倍型完全相同;兄弟姐妹之间,两个单倍型可能相同,也
4、可能不同,通常情况下是一个相同,一个不同。,三、 顺反子 一个基因一条多肽1957年,Benzer以大肠杆菌T4噬菌体为材料,研究了基因内部的精细结构,提出了顺反子、突变子、重组子的概念。 1、 T4噬菌体简介T4噬菌体为T-偶列噬菌体之一,基因组为165Kb的双链DNA分子,包括160个基因,宿主为E.coli。(1)形态特征(2)环状遗传学图,2. 顺反子(cistron)、突变子(muton)、重组子(recon)通过实验和推导,Benzer提出了顺反子、突变子、重组子的概念。顺反子是一个遗传功能单位,一个顺反子决定一条多肽链,顺反子即是基因的同义语。一个顺反子内可以包含一系列突变单位-
5、突变子。各突变子之间可以发生重组,顺反子内也有一系列的重组单位-重组子。,2、重组(recombination )实验和互补(complemetation)实验 (1)重组实验测定两个突变位点之间的距离关系的实验。重组频率(%)= 2 野生型噬菌斑数 100%噬菌斑总数 (2)互补实验确定两个突变之间的功能关系,判断两个突变是位于同一基因内的突变还是两个基因内的突变。,基因的顺反子测试示意图,在反式测验中,如两个突变之间能互补,则表明两个突变是位于两个基因(顺反子)内的突变。如两个突变之间不能互补,则表明两个突变是位于同一个基因内的突变。,四、操纵子(operon)-遗传信息传递和表达调控 的
6、统一体。,1961,法国科 学家F.Jacob 和J.Monod 提出了大肠 杆菌乳糖操 纵子模型。,操纵子模型的提出表明:基因不仅是传递遗传信息的载体,同时又具有调节其它基因表达活性的功能。基因不仅在结构上可分,功能上也可分。操纵子(operon):指几个功能上相近或相关的结构基因排列在一起,由一个共同的启动子、操纵子或其它调控序列来调控这些基因的转录。包括这些结构基因和控制区的整个核苷酸序列就称为操纵子。,1、乳糖操纵子(lac-operon),乳糖操纵子的研究进展: (1)调控区的DNA序列,启动子(promoter)位于调节基因 LacI 末端与结构基因LacZYA mRNA转录起始位
7、点之间,长度约为82bp的一段DNA序列。a) RNA聚合酶识别和结合部位:-10区: 序列特征 5-TATGTT-3-35区: 序列特征 5-TTTACA -3b)CAP结合位点:-70 至 -50 区 CAP(catabolite activator protein,分解代谢物激活蛋白)。正调控蛋白、cAMP-CAP复合物,CAP-cAMP复合物激活Lac启动子的机制,大肠杆菌的葡萄糖效应:,b. 操纵子(operator)-5-+28区。与启动子重叠。2、基因家族(gene family)、基因簇(gene cluster)、假基因(pseuds gene)真核生物基因组中来源相同、结构
8、相似、功能相关的一组基因称为基因家族。例如: (1)5sRNA基因家族由结构相同的数个基因以串联方式重复排列, 基因与基因间由中度重复序列间隔开来。,(2)血红蛋白基因家族血红蛋白基因家族由等基因 组成。类链基因簇:由、成串排列在一起构成, 位于11号染色体上。其表达时间顺序为 。类链基因簇:由成串排列在一起构成,位于16号染色体上。其表达时间顺序为 。假基因:来源于相应的有功能的基因,由于某种突变而失去原有的功能的基因。用表示。,五、外显子和内含子-基因的结构是断裂的(断裂基因 interrupted gene)原核生物的结构基因绝大多数是连续的,而真核生物的编码序列是不连续的。 1、实验证
9、明非编码序列的存在1977,Flavell和Jeffreys 兔珠蛋白基因的mRNA cDNA 同位数标记cDNA 与珠蛋白基因杂交。 结果: 珠蛋白基因片段 cDNA 片段Chambon鸡卵清蛋白mRNA cDNA 卵清蛋白基因杂交 电镜观察 异源双链体,(cDNA),2、断裂基因中外显子保守,内含子可变。,DHRF基因在哺乳类不同物种中外显子和内含子情况,3、RNA剪接 (1)直接切割连接pre-tRNA 内含子 (2)通过转酯作用实现剪接 (3)可变剪接(alternative splicing)一个基因产生不止一种类型的mRNA,称为可变剪接。例如:与果蝇性别有关的基因dsx, 其mR
10、NA在雌蝇和雄蝇中剪接方式不同。 (4)内含子的类型 P53,六、重叠基因(overlapping gene)1977,Sanger , 噬菌体x174各基因的功能:A,DNA单链合成和双链的复制;B、C、D,单链的合成和(或)包装;F、G、H,噬菌体衣壳的结构蛋白;J,参与病毒颗粒构成的一种小的碱性蛋白;K,产物未知;E,细胞裂解,重叠方式: (1)基因套基因如x174基因组中,B基因含在A基因中, E基因含在D基因中。但起始密码子不同,密码的阅读框不同。 (2)部分重叠上游基因的终止密码子和下游基因的起始密码子重叠。 如:基因D终止 x174 DNA序列T-A-A-T-G基因J 起始,基因
11、A终止 x174 DNA序列 A-T-G-A基因C起始 (3)三个基因重叠1978,Shaw ,噬菌体 G4 .G4 DNA序列 -TTCTGATGAAA-,基因B 基因A基因K,七、转座元件-基因并不全是固定在染色体的一个位置上 (1)DNA DNA的转座元件 1、玉米的Ac-Ds系统1950,B.McClintock,Ac:为可自主移动的调节因子,全长4.5Kb,含有 5个外显子,编码转座酶,两端具有11bp的反向重复序列(IR)。 Ds:来源于Ac,由Ac转座酶基因缺失形成。Ds不能自主转座。只有在Ac存在时,Ds才能转座。 Ds全长0.4-4Kb,两端同样具有11bp的反向重复序列(I
12、R)。,Ac-Ds系统产生的遗传学效应,2、插入序列(Insertion sequence,IS) (1)插入序列的结构 (2)IS插入靶位点的示意图 (3)一些IS的类型与结构 (4)IS的遗传学特征(P59),3、转座子(Transposon,Tn) (1)Tn的结构,(2)转座模型 a、剪-粘型转座(cut-and-paste transposition) 又叫简单插入转座,是一种非复制转座。Tn5、Tn10均以此方式转座。,b. 保守型转座(conservation transposition) 非复制转座的一种。,c.复制型转座(replicative transposition)
13、在复制转座的过程中,转座子被复制,一个拷贝留在供体原位,另一个拷贝插入受体新位点。,(3)转座的遗传效应 a,插入突变 b,基因重排,4、果蝇的P因子(P element)(1)果蝇中P品系与M品系杂交中,杂种劣育现象。 (2)P因子的结构与细菌的转座子(Tn)非常相似。,P因子全2907bp两端具有33bp的反向重复序列。(IR) b. P因子有4个编区 (外显子0.1.2.3),3个内含子(1.2.3),(3)P因子与杂种劣育,无转座,可育,转座,不育,无转座,可育,(二) RNA介导的转座元件-反转录转座(retroposon存在于真核生物中,种类复杂。根据其结构和组成,可分为两类: 病
14、毒超家族(viral super family)能编码转座酶或整合酶,能自主地进行转座。 如:酵母Ty转座成分、果蝇copia因子、哺乳动物,LINE1以及所有的还原病毒。 非病毒超家族(nonviral super family)自身没有转座酶或整合酶的编码能力,依靠细胞内的酶系统作用下进行转座。如:SINE等。,1、Ty(transposon in yeast)转座元件 (1)Ty的分子结构,LTR,LTR,(2)Ty因子的转录和翻译 (3)Ty因子的转座的机制 实验证明Ty为RNA介导的反转录转座 (4) Ty转座的遗传效应 a 插入失活 b 增强效应 c DNA重排,(2)果蝇的copia因子(P75),反转录转座子,转座子,转座子,3、LINEs L1 长散在重复序列(Long interspersed nuclear elements)。人类及哺乳动物基因组中散在分布的一类重复序列,长6-8kb,是可自组转座的一类 反转录转座子,有两个ORFs,两端不具有LTR。 4. SINEs 短散在重复序列(short interspersed nuclear elements)非病毒超家族成员,存在于哺乳动物基因组中,长约130-300bp,人类基因组中最普遍的一类 SINEs 为Alu,因其序列中具有限制性内切酶Alu的识别位点AGCT而得名,