1、第二章 核酸的结构与功能,核酸研究史 1869年,年轻的瑞士医生Miescher从收集的绷带上脓细胞的细胞核中得到含有碳、氢、氧、氮和高浓度磷的白色沉淀,称其为“核素”,后来发现它有很强的酸性,又称为核酸。之后不久,Hoppe-Seyler从酵母细胞中分离出一种类似的物质核糖核酸RNA。经过70多年后,人们对核酸及组分化学性质才逐步有所了解。1939年,Knapp等第一次用实验证实核酸是遗传物质基础。1944年,Avery等人通过肺炎双球菌转化实验直接证明DNA是携带遗传信息的分子,Hershy和Chase通过噬菌体的感染实验,也证实DNA是遗传物质。1953年Watson和Crick在总结前
2、人工作的基础上提出了DNA双螺旋结构模型,为核酸的结构与功能研究奠定了基础,也大大推动了分子生物学特别是分子遗传学的发生和发展。,1956年A. Kornberg发现E. coli DNA聚合酶,1958年分离该酶并在体外环境下酶促合成有活性的DNA,1959年诺奖。1958年Meselson用著名的“密度转移”试验证实DNA的“半保留复制”;建立密度梯度离心。1968年冈崎片段发现后提出DNA半保留不连续复制。1959年S. Wess发现转录酶。1960年Jacob Monod经10余年研究后提出乳糖操纵子模型,同时预言mRNA的存在。1961年S. Spiegelman在T2感染的E. c
3、oli中发现mRNA,建立分子杂交技术。1965年R. W. Holley测定酵母丙氨酸tRNA的一级结构,提出tRNA的“三叶草”结构模型。1966年M. W. Nirenberg和H. G. Khorana完成全部遗传密码的破译。1967年Kates和McAuslan发现真核转录酶,1970年发现真核mRNA 含有polyA尾巴(在天花病毒感染细胞中发现),用oligo(dT)柱分离纯化真核mRNA。,1968年M. Gellert等5个实验室发现DNA连接酶,为发展体外DNA重组技术鉴定了基础。1970年H. M. Temin和D. Baltimore同时发现不同反转录病毒的逆转录酶,补
4、充“中心法则”。1970年H. O. Smith发现第一个II型DNA限制性内切核酸酶Hind II,导致一系列DNA限制性内切核酸酶发现及应用,和DNA连接酶一起促进了DNA体外重组的发展。1972年P. Berg等三人建立DNA重组技术,建立了第一个体外DNA重组分子( dvgal DNA片段克隆到SV40)。并建立了含有哺乳动物激素基因的工程菌株,促进了DNA克隆技术的发展和应用。1975年Furuichit和Miura研究质型多角体病毒,发现真核mRNA中的m7Gppp帽子结构。 1977年P. Sharp 和P. Leder分别从腺病毒II型和鸡卵白蛋白基因中发现真核基因内部含有内含
5、子。1977年和分别发明了不同的测序技术,前者发明了化学断裂法,后者发明了加减法和聚合酶链式反应终止技术(即双脱氧终止技术),他因此第二次获诺贝尔奖。,长期以来,人们一直相信所有的酶都是蛋白质,1981-1982年,Cech和Altman各自独立地发现RNA具有生物催化功能,取名为ribozyme(核酶),这打破了蛋白质对生物催化剂的一统天下,极大促进了有关生命起源、生物进化等生物学中带根本性问题的进一步研究。 1985 Mullis等发明了具有划时代意义的聚合酶链反应(Polymerade chain reaction,PCR),这是一种体外扩增DNA的酶促反应技术,又称PCR扩增。 PCR
6、技术的问世,极大地方便了DNA的克隆、鉴定及应用,因此在很短时间内迅速进入生命科学、医学、遗传工程、法医学、考古学等各个领域,并显示巨大的优越性。目前生命科学研究进入后基因时代,更是离不开对核酸的深入广泛研究。,核酸可分成两大类,含有核糖的称核糖核酸(RNA), 含有脱氧核糖的称脱氧核糖核酸(DNA)。DNA主要分布在细胞核,储存并携带遗传信息。决定细胞和个体的基因型;RNA主要分布在细胞质中,负责遗传信息的表达,参与体内蛋白质的生物合成;所有生物细胞都含有这两类核酸。 对于病毒来说,要么只含有DNA,要么只含有RNA,还未发现既含有DNA又含有RNA的病毒。,第一节 核酸的化学组成,核酸是分
7、子量很大的核苷酸高聚物,是由C、H、O、N和P五种元素组成。正象蛋白质是由氨基酸聚合而成一样,核酸的基本结构单位是单核苷酸。 核苷酸水解后产生核苷、磷酸,核苷继续水解,得到碱基和戊糖。其结构单元为核苷酸,一、 碱基、戊糖与核苷,(一)碱基 核酸中的碱基有两类:嘌呤碱和嘧啶碱。常见的嘌呤碱有腺嘌呤(A)和鸟嘌呤(G),它们是嘌呤的衍生物。嘧啶碱基有胞嘧啶(C)、尿嘧啶(U)及胸腺嘧啶(T),都是嘧啶的衍生物。 两类核酸所含的主要碱基都是4种,所含的两种嘌呤碱完全相同,即腺嘌呤和鸟嘌呤。但所含的嘧啶碱有所不同,RNA主要含有胞嘧啶和尿嘧啶,大多数DNA也含胞嘧啶,但不含尿嘧啶。见表。,除上述五种碱
8、基外, 在一些核酸中还存在少量其他修饰碱基,也称为稀有碱基。其中大多数是碱基的甲基化产物或衍生物。tRNA中的修饰碱基种类较多,如次黄嘌呤、二氢尿嘧啶、5-甲基尿嘧啶(胸腺嘧啶)、4-硫尿嘧啶等。,表4-1 两类核酸分子组成的比较,(二)戊糖,RNA和DNA是因所含的戊糖不同而分类的。RNA中的戊糖是D-核糖,DNA中的戊糖是D-2-脱氧核糖,某些RNA中含少量的甲基化核糖。核酸分子中的戊糖都是-D-型。,(三)核苷,核苷是碱基与戊糖生成的糖苷,即戊糖的第1位碳原子(C1)分别与嘌呤碱的第9位氮原子N9或嘧啶碱的第1位氮原子N1相连。所以糖与碱基之间的连接键是N-C糖苷键。在tRNA中存在少量
9、5-核糖尿嘧啶,其C1是与尿嘧啶的第5位碳原子以CC键连接而成的,因为连接方式特殊,也称为假尿苷。 因为所含戊糖不同,核苷分为核糖核苷,用单字符号A、G、C、U表示; 脱氧核苷,在单字符号前加一小写的d,如dA、dG、dC、dT。常见的修饰核苷有:二氢尿苷D,假尿苷,次黄苷或肌苷I,黄嘌呤核苷X。,二、 核苷酸,(一)核苷酸的结构 核苷酸是核苷的戊糖上羟基与磷酸形成的酯。核苷酸的核糖有3个自由的羟基(2,3,5),所以可分别生成2-,3-,和5-核苷酸。脱氧核糖上只有2个自由羟基,相应的脱氧核苷只能生成3-和5-脱氧核苷酸。体内的游离核苷酸多为5-核苷酸,常在其单字符号后添上MP表示单核苷酸,
10、如AMP,GMP,dTMP等。,单核苷酸可以在5位上进一步磷酸化产生5-二磷酸核苷和5-三磷酸核苷。如生物体内的腺苷酸AMP可与一分子磷酸结合成腺苷二磷酸(ADP),ADP再与一分子磷酸结合成腺苷三磷酸(ATP)(图)。其他单核苷酸可以和腺苷酸一样磷酸化,产生相应的二磷酸或三磷酸化合物。 (二)核苷酸的功能 在体内,核苷三磷酸作为核酸生物合成的原料,此还外在生物体内的能量代谢中起着重要的作用。其中ATP在所有代谢途径化学能的贮藏和利用中起着关键的作用,称生物的能量“通用货币”。另外ATP还可作为淀粉生物合成中葡萄糖的载体。其他核苷三磷酸还参与特定的代谢过程,如UTP作为葡萄糖载体参与糖原的合成
11、,CTP参加磷脂的合成,GTP参加蛋白质和嘌呤的合成等。,图4-1 核苷酸及其磷酸化合物图 4-2 cAMP的结构式,腺苷酸还与维生素PP(尼克酰胺)形成辅酶(尼克酰胺腺嘌呤二核苷酸)和辅酶(尼克酰胺腺嘌呤二核苷酸磷酸),它们在生物氧化中起传递氢的作用。腺苷酸还与黄素形成黄素腺嘌呤二核苷酸(FAD),分子的一半是腺嘌呤二核苷酸,另一半是磷酸核黄素,又称黄素单核苷酸(FMN)。FAD和FMN也是在生物氧化系统中起传递氢的作用。辅酶A分子中也包含腺苷酸结构,还有泛酸,即水溶性B族维生素,以及氨基乙硫醇(H2N-CH2-CH2-SH),后者部分的硫基(SH)是辅酶A作为酰基载体参与多种反应的一个重要
12、基团,因此,辅酶A常用HSCoA表示。 ATP在腺苷酸环化酶的作用下可以生成3,5-环状腺苷酸(cAMP),cAMP具有以下的结构式(图)。同样,GTP在鸟苷酸环化酶的催化下可以生成3,5-环鸟苷酸(cGMP)。,cAMP和cGMP是一些激素等信号分子发挥生理作用的媒介物,被称为第二信使。cGMP是cAMP的拮抗物,二者共同在细胞的生长发育中起着重要的调节作用。目前cAMP及其衍生物已用于临床,对心绞痛、心肌梗塞等冠心病发作症状有明显效果。 近些年还发现,一些核苷多磷酸和寡核苷多磷酸类参与基因转录调控过程。如ppGpp或pppGpp以及pppApp,pppAppp等。 许多核苷酸类衍生物可作为
13、抗病毒和抗肿瘤药物,前者如,5-碘尿苷、阿糖胞苷、阿糖腺苷及多聚肌苷酸和多聚胞苷酸,后者如,5-氟嘧啶、,6-巯基嘌呤等。,三、核酸中核苷酸间的连接 实验证明,DNA和RNA都是没有分支的多核苷酸长链,链中前一个核苷酸的3羟基和后一个核苷酸戊糖上的5-磷酸形成酯键,借助这种35磷酸二酯键将核苷酸彼此相连,形成核酸链。每条线形核酸链都有一个5-末端和一个3-末端(图),即如果多核苷酸片段最后一个核苷酸的戊糖的C3-羟基不再参与3,5-磷酸二酯键的构成,这一端就是3端,反之,如果其C5-羟基不再参与磷酸二酯键的构成,就是5端,这样RNA和DNA链都有方向性。 核酸分子戊糖和磷酸所构成的主链上的磷酸
14、基是酸性的,在生理pH下带负电荷;而侧链嘌呤和嘧啶碱基团相对不溶于水而具有疏水性质。,多 核 苷 酸 链 的 化 学 式,第二节 DNA的分子结构,一、 DNA的一级结构 DNA的一级结构就是指DNA分子中通过35磷酸二酯键连接的核苷酸排列顺序。任何DNA分子的糖-磷酸的连接总是一样的,不同核酸之间的千差万别,只在于每个糖环上连接的碱基排列顺序不同,所以核酸的一级结构也称为核苷酸序列或碱基序列。生物之具有多样性就在于它们的DNA中核苷酸序列或碱基序列的变化多端,也即它们的基因组结构不同。无论是DNA,还是RNA,在它们的生物合成的聚合反应中,都是按照53方向进行的,因此没有特别指定时,核苷酸序
15、列都是按照53方向读写。,a 基因组与染色体 所谓基因组是指一个独立生物体所包含的全部遗传信息。在细胞中遗传信息储存在称为染色体的基因结构体上,每条染色体含有一个DNA分子。一般细菌在单条环状染色体上携带它们的全部基因,每条染色体只有一份拷贝,也即其细胞或个体每个基因有一份拷贝,为单倍体。高等生物的染色体为线状的,不同生物有不同数目的染色体,通常每条染色体包含有两份拷贝,因而每个基因有两份拷贝,为双倍体。偶尔也发现有些生物细胞的每条染色体有两份以上的拷贝,如三份拷贝的,称三倍体,四份拷贝的,称四倍体等等。所有基因均为单拷贝的一套完整的基因组称单倍体基因组,因此,通常生物体均含有两个或两个以上拷
16、贝的完整基因组。需要注意的是,单倍体细胞的一些基因可能有多份拷贝,如具单条染色体的大肠杆菌E.coli其延长因子EF-Tu基因有两份拷贝,核糖体RNA基因有7份拷贝,酵母Saccharomyces cerevisiae的单倍体细胞中有多达40%的基因是双重拷贝的。,b 原核生物基因组的特点,原核生物基因组DNA分子较小,其基因分布的主要特点有: 每个基因在基因组中出现仅一次或几次,而且主要为编码蛋白质的结构基因,其次为调控序列。 功能关联的基因常集中在一起,形成一个功能单位在DNA分子的特定部位,相关结构基因常转录成一个mRNA。 有重叠基因存在,同一段DNA可编码多种蛋白质分子,这种现象见于
17、病毒、线粒体和叶绿体及质粒DNA分子。,c 真核生物基因组的特点,真核生物的基因一般分布在若干条染色体上,基因组比原核生物复杂庞大,体细胞基因组是双倍体,配子细胞为单倍体。其基因组组成特点有: 重复序列 真核生物DNA分子中特定碱基序列重复出现的频率相差很大,可分为: 单拷贝序列 在整个基因组中只出现一次或少数几次,为编码蛋白质的结构基因。大多数蛋白质 (包括珠蛋白,卵清蛋白、丝心蛋白和酶蛋白等)的基因在单倍体中都是单拷贝序列。单拷贝序列在人基因组中约占DNA总量的65%,在高等生物中占总DNA的20%。,中度重复序列 在DNA分子中可重复几十到数万次,长度300-7000bp(碱基对),大多
18、与单拷贝基因间隔排列。rRNA基因、tRNA基因和某些蛋白质基因属中度重复序列,还有许多中度重复非编码DNA由长散布元件(LINE)构成,哺乳动物基因组中有2到3万拷贝的LINE (L1)家族,一个完整的L1元件约7000bp,包含两个编码序列,然而绝大多L1元件要短。人的DNA约25%属中度重复序列。,高度重度序列 可重复几十万到上百万次,它们一般位于着丝粒和端粒处,不转录,可能与染色体结构的形成及基因表达的调控有关。人的DNA中有10%是由高度重复序列构成的。许多高度重度序列为短散布元件(SINE),最为人熟知的SINE是300bp的Alu元件,因被限制性内切酶Alu切成170bp而得名,
19、在哺乳动物及人类单倍体基因组中重复30-50万次。卫星DNA,不像LINE与SINE散布在整个基因组中,而是高度重复DNA以长的串联重复簇出现,并总是紧紧卷曲在异染色质中,因此也是惰性的。其量在不同生物中是高度可变的。短的串联重复构成的DNA称小卫星或可变数的串联重复(VNTR),其拷贝数远比卫星DNA少。人与人之间的短随机重复片段在总长度上有很大的不同,这使得我们可以区分每个人,并用于司法鉴定。除了重复序列外,真核生物细胞还有假基因,这是正常基因的缺陷型拷贝,它的缺陷阻止它被表达。在细胞中假基因只以一份或两份拷贝存在,占总DNA的极小部分。, 在结构基因中编码片段被不编码片段隔开,基因中不编
20、码的居间片段称为“内含子”(intron),而编码的片段则称作“外显子”(exons)。内含子将编码基因隔成不连续基因或断裂基因(split gene)。如鸡卵清蛋白基因含有7个内含子,它们把卵清蛋白基因分割成8个外显子(图4-4),基因共有7700bp,而其mRNA只有1859个核苷酸。各类真核生物基因中的内含子数目、位置和占基因总长的比例都不同,但组蛋白基因没有内含子。 基因家族 许多来源相同,结构相似,功能关联的基因或串联排列集中成基因簇,或分散在不同部位。前者如rRNA、组蛋白基因,后者如珠蛋白、生长激素等基因。,图4-4 卵清蛋白基因 白色代表内含子,用A、B、C表示,黑色代表外显子
21、,用1、2、3表示。基因总长7700bp,被7个不编码区分割成8个编码片段,编码部分的总长度为1872bp,数字为该片段的长度,以bp表示。,因为“成熟“的mRNA只能与为其编码的基因中编码区结合形成DNA-RNA杂交分子,不能结合的内含子区便突出成环(图4-5),可在电镜下清楚看到。,图4-5 鸡卵清蛋白基因的结构 左侧的电子显微镜照片显示卵清蛋白基因克隆与卵清蛋白mRNA间形成的复杂“杂交分子”结构;右侧为该照片的示意图,从环形突起部分可看出7个内含子(A到G)的位置。,二、DNA的空间结构,肺炎球菌的转化实验以及噬菌体感染实验使科学家们相信DNA是遗传物质,但遗传信息是如何贮存在DNA中
22、,仍难以推测。 1953年,Chargaff等应用色谱法对多种生物DNA的碱基组成进行了分析,发现DNA中的腺嘌呤数目与胸腺嘧啶的数目相等,胞嘧啶(包括5-甲基胞嘧啶)的数目和鸟嘌呤的数目相等。后来又有人证明腺嘌呤和胸腺嘧啶间可以生成两个氢键;而胞嘧啶和鸟嘌呤之间可以允许生成3个氢键。 在前人工作的基础上, Waston和Crick于1953年的4月25日在Nature发表了题为“核酸的分子结构-脱氧核糖核酸的结构”的文章,阐述了双螺旋结构的要点 。后人的许多工作证明,这个模型基本上是正确的。 (2) DNA的二级结构 X射线衍射 1951年,Rosalind Franklin 和Maurice Wilkins利用X射线衍射图谱分析了DNA的晶体。X射线衍射数据说明DNA中含有两条或两条以上具有螺旋结构的多核苷酸链,而且沿纤维长轴有0.34nm和3.4nm两个重要的周期性变化。 关于碱基成对的证据 电位滴定行为,图 X射线衍射,