1、第 2 章 基因、基因组和基因组学基因 (gene):携带有遗传信息的 DNA 或 RNA 序列,也称为遗传因子。基因是合成有功能的蛋白质或 RNA 所必需的全部 DNA,包括编码蛋白质或 RNA 的核酸序列,也包括为保证转录所必需的调控序列。基因的功能:传递遗传信息,控制个体性状表现。 结构基因 (structural genes):可被转录形成 mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。调节基因 (regulatory genes) :某些可调节控制结构基因表达的基因。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质(或酶) 量的改变。 eg.
2、 miRNA, siRNA, piRNA核糖体 RNA 基因 (ribosomal RNA genes) 与转运 RNA 基因 (transfer RNA genes):只转录产生相应的 RNA 而不翻译成多肽链。 真核生物的 RNA 聚合酶 ( 3 种) :RNA 聚合酶 I, II, III. 开放阅读框架 (open reading frame,ORF):在 DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码序列。断裂基(split gene):真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白
3、质。基因组 (genome):一个细胞内的全部遗传信息,包括染色体基因组和染色体外基因组。 基因组中的 DNA 包括编码序列和非编码序列。 部分病毒基因组-RNA。 C 值 (C-value):一种生物体单倍体基因组 DNA 的总量,用以衡量基因组的大小。通常,进化程度越高的生物其基因组越大,但从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关。存在 C-value paradox (C 值悖理) 。生物复杂性越高,其基因的密度越低。 病毒基因组的大小: 与细菌或真核细胞相比,病毒的基因组很小。不同的病毒之间基因组大小相差很大。乙肝病毒 DNA:3kb,编码 4 种蛋白质;痘病毒的基
4、因组: 300kb,编码几百种蛋白质。病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。 RNA 病毒基因组编码序列具有节段性 :有些病毒的基因组 RNA由不连续的几条核酸链组成(如流感病毒,轮状病毒等) 。 分段基因组的病毒一般感染效率较低 ;分段基因组容易发生重组,故病毒容易变异 。 目前未发现 DNA 病毒有此状况。病毒基因存在基因重叠 :基因重叠:同一段 DNA 片段能够参与编码两种甚至两种以上的蛋白质分子。这种现象在其它的生物细胞中仅见于线粒体和质粒 DNA。此结构意义在于使较小的基因组能够携带较多的遗传信息。 基因重叠的方式 :1)一个基因完全在另一个基因里面。
5、2 )几个基因部分重叠。3)两个基因之间只有一个碱基重叠。 重叠基因的 DNA 序列可能大部分相同,但由于翻译时的读码框架不同、或起始部位不同而产生不同的蛋白质。 有些真核病毒的部分序列,对某一个基因来说是内含子,而对另一个基因而言却是外显子。 病毒基因组的大部分序列具有编码功能:病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码翻译功能。 X174基因组中不编码的序列只占 217/5375。乳头瘤病毒基因组约 8.0Kb,其中不编码的部分约为 1.0kb。 少数真核生物病毒的基因组也存在内含子结构。病毒基因组的转录单元是多顺反子 :多顺反子 mRNA (polycistroni
6、e mRNA) :病毒基因组 DNA 序列中功能上相关的蛋白质的基因或 rRNA 的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个 mRNA 的分子。病毒基因组都是单倍体:除了逆转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。 逆转录病毒带有逆转录酶,能使 RNA 反向转录生成 DNA,因此其基因组可拥有两个拷贝。 噬菌体基因具有连续性:噬菌体的基因是连续的,而真核细胞病毒的基因是不连续的,具有内含子。 原核生物基因组通常比较简单,其基因组大小在 106bp107bp 之间,所包含的基因数目几百个到数千个之间。 种类
7、I II III分布 核仁 核基质 核基质产物 rRNA mRNA, microRNA5S rRNA, tRNA, siRNA 原核生物基因组通常由一条环状的双链 DNA 分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域,称为类核(nucleoid). 大肠杆菌染色体基因组的结构和功能 :大肠杆菌基因组序列中的基因密度非常高,编码区所占的比例较大。大肠杆菌中总共有 4288 个基因,平均编码长度为 950bp,基因之间的间隔区长度为 118bp,而且这些结构基因没有内含子。大肠杆菌 DNA 分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为 转座子 的 50k
8、b 的重复片段。 转座因子:原核生物转座因子主要有二类:插入序列 (insertion sequence,IS) : IS:2000bp 以内,两端都有正向重复序列(direct repeats,DR)和反向重复序列(inverted repeats,IR) ,中间 1kb 左右的编码序列,仅编码和转座有关的转座酶。 只有当 IS 转座到某一基因中使该基因失活或插入位点旁边的染色体发生畸变等效应时才会被发现。 复合型转座子 ( composite transposon, Tn) : Tn :200020000bp 之间,两端由一对 IS 元件组成,带有与转座作用有关的基因以及其他基因。 根据转
9、座的的机制和结果,可将转座分为:复制型转座,保守型转座大肠杆菌染色体外基因组的结构和功能:质粒(plasmid):一类染色体外具有自主复制能力的环状双链 DNA 分子,属染色体外基因组。 大肠杆菌质粒是双链环状结构的 DNA 分子。可以有共价闭合环状 DNA(covalently closed circular DNA,cccDNA) 、缺口的环状 DNA、线性 DNA 三种结构状态。质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些遗传性状。质粒能自主复制,是能独立复制的复制子(autonomous replicon) 。严紧控制(str
10、ingent control)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有 1 个到十几个拷贝。松弛控制( relaxed control)型质粒:其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。 质粒的稳定性与不相容性: 质粒的不相容性(incompatibility):两种不同质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失。携带不同复制和维持机制的质粒属于不同的不相容群,它们可以共存于同一细胞中。 影响质粒稳定性的因素:1.主细胞分裂时质粒能否均衡地分配到子代细胞。2.质粒分子自身结构的稳
11、定性。 真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中-细胞核基因组和细胞器基因组。 真核生物染色体基因组特点 : 人类基因组中仅含有 2500030000 个基因,远低于预期。在人类基因组中只有很少一部份(约 2-3)DNA 序列用以编码蛋白质和结构 RNA。人类基因组中存在大量基因间隔区序列,主要由重复 DNA 构成。 在基因内部含大量内含子。 单拷贝序列:占 40%-80%,结构基因基本上属于单拷贝序列。中度重复序列:重复次数 1010 5,占 10-40%。如 rRNA、tRNA、组蛋白以及免疫球蛋白的基因等,另有部分可能与基因的调控有关。高度重复序列:拷贝
12、数大于106 ,占 10-60%。如反向重复序列 (inverted repeats) 和卫星 DNA (satellite DNA)。 反向重复序列常见于基因的调控区,可能与复制、转录的调控有关。 重复序列的多态性:DNA 多态性:DNA 序列发生变异从而导致的个体间核苷酸序列的差异。主要包括 单核苷酸多态性(single nucleotide polymorphism,SNP)和 串联重复序列多态性(tandem repeats polymorphism) 。 SNP-由基因组 DNA 上的单个碱基的变异引起的 DNA 序列多态性。 据估计,人类基因组中每 1kp 就存在一个SNP 位点,
13、共有约 300 万个之多,是人群中个体差异最具代表性的 DNA 多态性。 相当一部分 SNP 还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。 大多数 SNP 位点十分稳定,人类 85%的 SNP 是共有的。 高度重复序列中的无间隔反向重复序列很容易形成限制性内切酶识别位点,也很容易因为突变产生或是失去一个酶切位点,可以造成 限制性片段长度多态性 (restriction fragment length polymorphism, RFLP).真核基因组存在多基因家族与假基因 :多基因家族 (multi gene family):由某一祖先基因经过重复和变异所产生
14、的一组基因。 假基因 (pseudo gene):与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。 多基因家族大致可分为两类: 一个基因家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。 基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第 7 号染色体长臂 3 区 2 带到 3 区 6 带区域内,这种分布方式与 DNA 复制时需要大量的组蛋白有关。 假基因的产生有两种方式:由突变引起的基因序列变化而失去功能,这样产生的假基因带有内含子,称为常规假基因(conven
15、tional pseudogene) 。mRNA 经过反转录为 cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,称为已加工的假基因(processed pseudogenes) 。真核生物细胞器基因组:真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。 线粒体基因组编码其自身蛋白质合成体系的某些成员,如 rRNA 和 tRNA 等,以及呼吸链中的某些成员,如 ATP 酶、NADH 还原酶、细胞色素氧化酶复合体中的某些组分。其它成员由细胞核基因组编码。 高等动物线粒体
16、基因组具有独特的特点:母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。 线粒体 DNA 损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。遗传密码与通用遗传密码存在差别,如 UGA(终止密码子)编码 Trp,AGA/AGG(Arg)为终止密码子等。 基因组学(Genomics):对生命有机体全基因组进行序列分析和功能研究的学科。 结构基因组学:目的是在生物体的整体水平上测定出全部蛋白质分子、蛋白质蛋白质、蛋白质与其他生物分子复合体的三维结构。 基因定位克隆:利用微卫星和 SNP 全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进
17、一步获得克隆。 功能基因组学:根据已有基因的功能推测基因组中具有相似结构的基因的功能,通过实验手段验证。有效的方法有定点突变、基因敲除(knock-out)和 RNA 干扰及过量表达技术等。 第 3 章 蛋白质组学蛋白质是一种复杂的有机生物大分子,它们是生命活动的实际执行者。几乎所有的生物催化剂-酶,都是蛋白质。构成细胞骨架和动物大部分结构的纤维物质也是蛋白质;胶原蛋白和角蛋白组成了皮肤,毛发和软骨;肌肉大部分也是由蛋白质组成。蛋白质由一个一个的氨基酸首尾相接形成肽链,肽链再折叠形成一定空间结构。蛋白质组(proteome ):指由一个基因组,或一个细胞、组织表达的所有蛋白质。蛋白质组学(pr
18、oteomics ):以蛋白质组为研究对象,分析细胞内动态变化的蛋白质组成成分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,在整体水平上研究蛋白质的组成与调控的活动规律。 功能蛋白质组:细胞在某一阶段或与某一生理现象相关的所有蛋白质。差异蛋白质组:不同种类或状态下各种样本之间蛋白质组的区别与变化。多样-蛋白质数目大大超过基因数目。可变-蛋白质随时间与空间变化。基于凝胶的工作流程是目前使用的较为广泛的、发展最为成熟的工作流程。样品制备:样品来源:细胞、组织、体液等。可采用全蛋白;或进行预分级(线粒体、高尔基体、叶绿体、膜蛋白、核蛋白等)-提高低丰度蛋白质的上样量及检测灵敏度。尽可能扩大蛋
19、白质的溶解度和解聚,以提高分辨率。样品分离:双向凝胶电泳(two-dimensional electrophoresis,2-DE):利用蛋白质的等电点与分子量差异分离之。2-DE 的缺点:难以有效分离极酸、极碱性蛋白质,极大、极小蛋白质,及低丰度蛋白质。胶内酶解过程费时、费力,难以与质谱实现自动化联用。第一向:等电聚焦 IEF;第二向:SDS-PAGE。染色方法:考马斯亮蓝染色;银染(不含戊二醛) ;荧光染色(Cy3,Cy5) ,放射性同位素标记等。新型非凝胶技术:液相色谱法(liquid chromatography, LC)对在双向电泳中难以分离鉴定的高分子量、低分子量、极酸性、极碱性和
20、疏水性强的蛋白进行有效的分离鉴定。LC-MS/MS:液质联用技术。微量测序(microsequencing):N-末端 Edman 降解:经凝胶分离的蛋白质直接印迹在 PVDF 膜或玻璃纤维膜上N 末端氨基酸残基经苯异硫氰酸酯修饰从多肽链上切下修饰的残基再经层析鉴定余下的多肽链被回收再进行下一轮降解循环。 缺点:过程缓慢,消耗大,试剂昂贵。质谱分析(Mass spectrometry):基本原理:样品分子离子化后,根据离子间质荷比( m/z)差异来分离并确定样品分子量。主要质谱类型:MALDI-TOF MS: 基质辅助激光解吸/电离飞行时间质谱 (Matrix-assisted laser d
21、esorption/ionization time of flight mass spectrometry)利用固体基质分子均匀包埋样品分子,在激光照射下,基质分子吸收激光能量而蒸发,携带样品分子进入气相,进一步将能量传递给样品分子,从而实现样品分子离子化。MALDI 最大的特点是离子电荷通常为 1-2 个,而不象 ESI 中为多电荷离子,对分子质量较大的样品而言,不会形成复杂的多电荷图谱,因而对图谱的解析比较清楚。 ;ESI MS: 电喷雾质谱( electrospray ionisation mass spectrometry )待测分子溶解在溶剂中,以液相方式通过毛细管到达喷口。在高电压
22、作用下形成带电荷的雾滴,随着雾滴中溶剂的蒸发,其表面电场随半径减少而增加,电荷密度不断变大,到达某一临界点时,样品以离子方式蒸发进入气相,从而实现离子化。ESI 特点:没有直接的外界能量作用于分子,因此对分子结构破坏较少,是一种典型的“软电离”方式。可形成多电荷离子,因此在较小的 m/z 范围内可以检测到大分子质量的分子。采用电喷雾质谱目前可测定分子质量 100kDa 以下的蛋白质,最高可达 150kDa。由于采用液相方式进样,可与蛋白质化学中常用的液相色谱联用,即液相色谱-电喷雾质谱 (LC-ESI MS)。在常规电喷雾质谱中,喷雾的过程易形成较大液滴,液滴中的样品分子在离子源就不能完全离子
23、化从而降低了样品的利用率和灵敏度。鉴定与注释蛋白质的路线:通过肽指纹图谱(peptide mass fingerprint, PMF)和数据库搜寻匹配通过检测样品中部分肽段的二级质谱信息或氨基酸序列标签和数据库搜寻匹配蛋白质数据库:目前应用最普遍的数据库是 NRDB 和 dbEST 数据库。NRDB 由 SWISS-PROT 和 GENPETP 等几个数据库组成;dbEST 是由美国国家生物技术信息中心(NCBI )和欧洲生物信息学研究所(EBI)共同编辑,包括大量肽序列标签(PST) 。SWISS-PROT(http:/www.expasy.org) 拥有目前世界上最大的蛋白质组学数据库。P
24、MF 或二级质谱匹配检索常用搜索引擎-MASCOT(http:/)抗体芯片:可用于研究在不同生理状态或病理状态下蛋白水平的量变。优点:微型化,集成化,高通量化。如肿瘤标志物抗体芯片等。常用荧光标记:Cy5 和 Cy3 等。酵母双杂交系统(Yeast two-hybrid system):典型的真核转录因子都含有二个结构域: DNA 结合结构域(DNA binding domain,DNA-BD)和转录激活结构域(activation domain,AD) 。二个结构域功能上相互独立又互相依赖,只有结合才具完整活性。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白蛋白的相互作用。 利用酵
25、母双杂交技术筛选新的相互作用蛋白:1)DNA-BD + Bait protein;2)AD + cDNA 文库的基因。将阳性反应的酵母菌株中的 AD-LIBRARY 载体提取分离出来,从而对载体中插入的文库基因进行测序和分析,研究与已知基因在生物学功能上的联系。第 4 章 基因工程基因工程(gene engineering):又称为重组 DNA 技术,是指将外源基因通过体外重组后导入受体细胞,并使其能在受体细胞内复制和表达的技术。分子克隆(molecular cloning):是指在体外将制备的 DNA 片段与载体重组,然后导入受体细胞,并在受体细胞中复制、扩增,以获得该 DNA 分子的大量拷
26、贝的技术。第一节 工具酶一、限制性核酸内切酶(restriction endonuclease, RE)是一类能识别和切割双链 DNA 特定核苷酸序列的核酸水解酶。主要用途:1)在分子克隆过程中切割 DNA 以获取目的基因片段、切割载体形成切口,使目的基因能插入载体。2)分析限制性片段长度多态性(RFLP) ,用于遗传病的诊断,法医 DNA 指纹分析等。3 )用于构建 DNA 的物理图谱、基因定位及 DNA 同源性分析等。类酶识别序列特点回文结构(palindrome) ,切口 :平端切口、粘端切口二、DNA 聚合酶 1、 DNA 聚合酶 和 Klenow 片段 DNA-pol是单一肽链的多功
27、能酶,分子量为 103kd,它具有 3 种酶活性:1)53 聚合酶活性;2)3 5核酸外切酶活性;3)53核酸外切酶活性。 Klenow 片段的主要功能有:1)补齐双链 DNA 的 3末端,同时可使 3末端 DNA 标记同位素; 2)在 cDNA 克隆中,合成 cDNA 第二链;3)DNA 序列分析。 2、 Taq DNA 聚合酶:一种耐热的 DNA 聚合酶,分子量为 65 kd,最佳作用温度是 7080,Taq 酶具有5?3? 聚合酶活性和依赖于聚合作用的 5?3?外切酶活性。Taq DNA 聚合酶可用于 DNA 测序及通过 PCR 对 DNA分子的特定序列进行体外扩增。3、逆转录酶 依赖
28、RNA 的 DNA 聚合酶,它以 RNA 为模板、4 种 dNTP 为底物,催化合成 DNA,其功能主要有:1)逆转录作用;2)核酸酶 H 的水解作用;3) 依赖 DNA 的 DNA 聚合酶作用。4 、末端脱氧核糖核苷酰转移酶 分子量为 60 kd,在二价阳离子存在下,催化脱氧核糖核苷酸转移到单链或双链 DNA 分子的3末端-OH 上。功能主要有:1)在载体或目的基因 3末端加上互补的同质多聚尾,形成人工粘性末端,便于DNA 重组连接。2)用于 DNA3末端的同位素探针标记。 1)底物是单链 DNA 或有 3?突出末端的双链 DNA,需要Mg2+。2)底物是平端或 3?凹端的双链 DNA,需要
29、 Co2+。 三、 DNA 连接酶 大肠杆菌 DNA 连接酶和 T4 DNA 连接酶两种类型,分子量分别为 7500 和 6000,两者的辅基不同,前者需 NAD+,后者需 ATP。它们催化的反应也不尽相同,大肠杆菌 DNA 连接酶只能连接粘性末端,而T4DNA 连接酶既能连接粘性末端,又能连接平末端。 四、 碱性磷酸酶 催化去除 DNA、RNA 或 dNTP 上的 5?-磷酸基团,其主要用途有:1) 除去 DNA 片段上的 5?磷酸,以防自身连接。2)在使用 T4 多核苷酸激酶和 32P 同位素标记前,除去 RNA 或 DNA 上 5?端的磷酸。五、 核酸酶 S1 核酸酶 S1 可水解双链
30、DNA、RNA 或 DNA-RNA 杂交分子中的单链部分。其主要作用有:除去粘性末端以产生平末端;除去 cDNA 合成时形成的发夹结构;分析 RNA 的茎环结构和 DNA-RNA 分子的杂交情况。功能:水解双链 DNA、RNA 或 DNA-RNA 杂交体中的单链部分。载体(vector):指能携带外源 DNA 片段导入宿主细胞进行扩增或表达的工具。载体的本质为 DNA。制备的目的基因或外源性 DNA 片段必须与合适的载体连接形成重组体,才能进入受体细胞并进行复制和表达。载体包括克隆载体和表达载体。常用的载体有:质粒、噬菌体、粘粒、酵母质粒和病毒等。载体大都经过改造,如质粒改造后携带某些选择性标
31、记和克隆位点的遗传信息; 噬菌体改造后只保留同一种限制酶的单个或两个切点。在常用的克隆载体中加入一些与表达调控有关的元件(DNA 序列)即为表达载体,它不仅可携带外源基因片段进入宿主细胞,而且可在宿主细胞中表达外源基因。载体应具备的特征:能自我复制并具较高的拷贝数。分子量一般15kb )的提取。但有一部分质粒 DNA 会与细胞碎片缠绕在一起而丢失,故产率不高。 这些方法主要由质粒 DNA 的扩增、质粒 DNA 的释放、质粒 DNA 的分离纯化三个步骤组成。 质粒 DNA 的纯化:1、CsCl-EB 法,利用 CsCl 形成的连续密度梯度,在过量 EB 存在的条件下,各种不同密度的物质经离心平衡
32、后得以分开。2、聚乙二醇沉淀法(一种分级沉淀法) 。3、柱层析法(树脂)真核细胞 RNA 的分离纯化: RNA 极易被 RNase 水解,除胞内的 RNase 外,它还广泛存在于人的皮肤、唾液、汗液及周围的环境中;RNase 分子结构中二硫键的存在使其生物学活性非常稳定,加热煮沸及一般的变性剂均不能使其完全灭活,而且去除变性剂(denaturant)后,RNase 的活性又可恢复。因此,在 RNA 的制备过程中,排除RNase 的污染及强有力地抑制其活性是 RNA 制备成功与否的关键。为获得完整的 RNA 分子,必须在总 RNA 提取分离的最初阶段,尽可能地灭活胞内 RNase 的活性。选择性
33、地使用 RNase 的变性剂(如酚、氯仿及强烈的胍类变性剂) 。蛋白酶 K 和能与蛋白质结合的阴离子去污剂如 SDS、十二烷基肌氨酸钠或脱氧胆酸钠,并联合使用 RNase 的特异抑制剂(如 RNasin 与 DEPC 等)能极大地防止内源性 RNase 对 RNA 的降解。此外,在变性液中加入 -疏基乙醇、二硫苏糖醇(DTT)等还原剂可以还原 RNase 中的二硫键,有利于 RNase 的变性、水解与灭活。酸性异硫氰酸胍-酚- 氯仿一步法,分离总 RNA:以含 4mmol/L 的( 异)硫氰酸胍与 0.1mmol/L 的 -巯基乙醇的变性溶液裂解细胞,然后在 pH4.0 的酸性条件下,用酚/
34、氯仿抽提裂解溶液,最后通过异丙醇沉淀与 75%的乙醇洗涤来制备 RNA。本法具有简便、快速、经济、高效及提取的 RNA 质量高等优点,能在 3 小时内迅速处理多个标本 。mRNA 的分离纯化:与序列明确的 rRNA、tRNA、snRNA、 scRNA 不同,真核生物的 mRNA 在细胞中含量少,种类多且分子量大小不一。除血红蛋白及组蛋白的 mRNA 外,绝大多数 mRNA 在其 3末端带有长短不同的 poly(A)尾巴。依据 mRNA 的结构特征,利用碱基配对原则,通过 oligo(dT)-纤维素或 poly(U)-琼脂糖凝胶的亲和层析,可以很容易地从总 RNA 制品中分离纯化 mRNA。磁性
35、球珠分离法:该法联合利用了 oligo(dT)与 poly(A)的互补配对、生物素(biotin)与链亲和素(streptavidin)的结合特异性以及磁性分离原理,可对 poly(A )+RNA 进行高效、灵敏及快捷的分离。三、蛋白质的分离与纯化蛋白质的分离纯化是研究蛋白质化学组成、结构及生物学功能、新蛋白质的发现和疾病分子诊断的基础;分子克隆中,下游的处理和分析鉴定,基因工程产品的制备,也需要蛋白质的分离和纯化。蛋白质分离纯化的总目标是增加制品的纯度(purity)或比活(specific activity) ,以增加单位蛋白质重量中靶蛋白的含量或生物学活性(比活常以活力单位数/毫克蛋白质
36、表示) ,即从蛋白混合物中设法去除不要的杂蛋白和变性的靶蛋白,使靶蛋白的产量达到最高值。分离纯化的总体原则:一是保证靶蛋白结构的完整,防止降解和活性蛋白质的变性;二是尽量满足研究与诊断对靶蛋白纯度的要求。纯化蛋白质总是希望纯度和产率均高,例如纯化某种酶,理想的结果是比活力和总回收率均高,但实际工作中二者不能兼得,通常在科研上希望比活力尽可能高,而牺牲一些回收率,在工业生产和分子诊断中则正相反。蛋白质分离纯化条件:1.缓冲液;2.盐、金属离子和螯合剂;3. 还原剂;4.去垢剂;5.增溶剂;6. 蛋白酶抑制剂(pronase inhibitor) ;7.蛋白质的环境因素 表面效应的影响温度的影响储
37、存。 蛋白质的分离纯化是依据其溶解性、分子质量大小及形状、电离性质和生物学功能的差异而进行的。分离纯化的方法可分类如下:以溶解度的差异为依据的方法:盐析、分配层析、有机溶剂沉淀、选择性沉淀和结晶等;以分子大小及形状差异为依据的方法:差速离心、区带离心、超滤、透析和凝胶过滤层析等;以电离性质差异为依据的方法:电泳、离子交换层析等;以生物学功能专一性为依据的方法:亲和层析。盐析法:将硫酸铵、硫酸钠或氯化钠等加入蛋白质溶液,使蛋白质表面电荷被中和以及水化膜被破坏,导致蛋白质沉淀。 等电点沉淀法:净电荷为零,分子之间的静电排斥力最小,因而容易聚集形成沉淀。该法适用于在等电点 pH 稳定的蛋白质。 有机
38、溶剂沉淀法:甲醇、乙醇、丙酮等(保持低温) ,破坏蛋白质的水化层,使蛋白质的溶解度降低而沉淀。 凝胶过滤层析亦称凝胶色谱、排阻色谱或分子筛,是利用凝胶把分子大小不同的物质分离开的一种方法。凝胶色谱的机理是分子筛效应,在洗脱过程中,大分子不能进入凝胶内部,而沿凝胶颗粒间的空隙最先流出柱外;而小分子可以进入凝胶颗粒内部的多孔网状结构,路径长、流速慢,以至最后流出柱外。因此,混合样品如同“过筛”一样,因分子大小的不同得以彼此分开。电泳。蛋白质在高于或低于其 pI 的溶液中为带电的颗粒,在电场中能向正极或负极移动。通过蛋白质在电场中泳动而达到分离各种蛋白质的技术。 每一个蛋白质分子都因为结合了许多的
39、SDS 而带有大量的负电荷,而蛋白质分子原有的电荷则可以忽略。由于所有的蛋白质颗粒都带有大量的负电荷,而且它们的电荷密度也大体相同,因此,Eq 值接近一个常数。所以该法主要利用了蛋白质分子量大小不同而分离蛋白质。 1)SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE):常用于蛋白质分子量的测定。2 )等电聚焦电泳(IEF ) ,通过蛋白质等电点的差异而分离蛋白质的电泳方法。pH 梯度以两性电解质 ampholyte(脂肪族多胺和多羧同系物)在外电场作用下自然形成。3)双向凝胶电泳。蛋白质的纯度(purity)一般指是否含有其它杂蛋白,而不包括盐、缓冲液离子、SDS 等小分子在内,一定条件下的相对均
40、一性。目前常用的鉴定纯度的方法有:有聚丙烯酰胺凝胶电泳(PAGE) 、SDS-PAGE、毛细管电泳(CE) 、等电聚焦电泳(IFE)及高效液相色谱(HPLC) 。此外,还有超速离心法、蛋白质的化学组成和结构分析法。蛋白质的定量,通常是指测定溶液中的蛋白质浓度。测定蛋白质总量的方法很多,最早的经典方法是凯氏定氮法,此法虽有普遍性,但操作繁琐,目前极少使用。应用较为广泛的方法是双缩脲法、福林-酚法和紫外吸收法。测定蛋白质混合物中某一特定靶蛋白的含量通常要用具有高度特异性的生物学方法。活性的测定和总蛋白量的测定配合起来可以用来表示分离纯化过程中某一特定靶蛋白的纯化程度。纯化程度常用这一特定成分的含量
41、(一般用活力单位)与总蛋白量(质量单位)之比来表示。四、生物小分子的提取纯化常用提取方法:1.溶剂提取法;2.水蒸气蒸馏法;3.升华法;4.超临界流体萃取法;5.超声提取法;6. 固相萃取法。 分离精制的原理主要是根据:1)物质溶解度差别; 2)物质在两相溶剂中的分配比不同; 3)物质的吸附性差别;4)物质分子大小差异等进行分离。 常用纯化方法:1.逆流分配法( CCD)2. 液滴逆流色谱法(DCCC )3.高速逆流色谱法(HSCCC )4.气液分配色谱(GC 或 GLC)5.液-液分配色谱 6.凝胶过滤法 7.超滤法 8.硅胶吸附色谱 9.氧化铝吸附色谱10.大孔吸附树脂吸附色谱,等第 8
42、章 核酸分子杂交技术主要用途:核酸定性或定量检测;基因克隆、突变及其表达研究;疾病的临床诊断核酸杂交概述-核酸的结构 一级结构:核苷酸的排列循序 稳定键:磷酸二酯键;二级结构:双螺旋结构 稳定键:氢键、碱基堆积力、疏水键;高级结构:染色体核酸变性(nucleic acid denaturation):在某些理化因素的作用下,维系 DNA 分子二级结构的氢键和碱基堆积力受到破坏,DNA 由双螺旋变成单链过程。化学键变化:维持双螺旋稳定的氢键和疏水键发生断裂,断裂可以是部分的或全部的,可以是可逆的或是非可逆的。化学结构变化:DNA 变性改变了其空间结构,不涉及到其一级结构的改变。DNA 的变性因素
43、:凡能破坏双螺旋稳定性的因素都可以成为变性的条件。加热;极端的 pH;有机试剂(甲醇、乙醇、尿素、甲酰胺等) 。变性能导致 DNA 的一些理化性质及生物学性质发生改变。溶液黏度降低:DNA 双螺旋是紧密的“刚性”结构,变性后代之以“柔软”无规则单股线性结构,DNA 黏度明显下降。溶液旋光性发生改变:变性后 DNA 分子的对称性及局部构型改变。紫外吸收增加:DNA 变性后,DNA 溶液的紫外吸收增强;双链 DNA单链 DNA单核苷酸。变性 DNA 的增色效应( hyperchromic effect): DNA 变性时其溶液 OD260 增高的现象。DNA 分子在250280nm 波长具有吸收紫
44、外光的特性,其吸收峰值在 260nm。增色效应可以作为 DNA 变性的指标。不同来源DNA 的变化不一,如大肠杆菌 DNA 经热变性,其 260nm 的吸光度值可增加 40%以上,其它不同来源的 DNA 溶液的增值范围大多在 2030%之间。解链曲线:通常利用 DNA 变性后在波长 260nm 处吸光度( A260)的增加来监测 DNA 变性的过程。如果以温度对 A260 的关系作图,所得的曲线称为解链曲线。典型 DNA 变性曲线呈 S 型。融解温度( melting temperature,Tm ):在热变性过程中,紫外吸收值达到最大值的 50%时的温度称为 DNA 的解链温度或融解温度。特
45、点:爆发式:热变性是在变性温度范围内突发的跃变过程,很像结晶达到熔点时的融化现象,故名融解温度。狭窄性:变性温度范围很小。Tm 的影响因素:1DNA 分子大小和碱基的组成。2溶液的离子强度。3pH 值。4 变性剂 (一)DNA 分子大小和碱基的组成:不同来源 DNA 间的 Tm 存在差别,在溶剂相同的前提下,这种差别主要是由 DNA 本身下列两方面的性质所造成的。DNA 的均一性;DNA 的(G+C)含量。DNA 的均一性:有二种含义。DNA 分子中碱基组成的均一性:如人工合成的只含有一种碱基对的多核苷酸片段,与天然 DNA 比较,其 Tm 值范围就较窄。因前者变性时氢键断裂几乎可“齐同”进行
46、。待测 DNA 样品组成的均一性:如样品中只含有一种病毒DNA,其 Tm 值范围较窄,若混有其它来源的 DNA,则 Tm 值范围较宽。DNA 的(G+C)含量:在溶剂固定的前提下,Tm 值的高低取决于 DNA 分子中的(G+C)的含量( G+C)含量越高,G-C 碱基对越多,Tm 值越高。因 G-C 碱基对具有 3 对氢键,而 A-T 碱基对只有 2 对氢键,DNA 中(G+C)含量高显然更能增强结构的稳定性,破坏 G-C 间氢键需比 A-T 氢键付出更多的能量。Tm 与(G+C )含量的关系:Tm 与 DNA 中(G+C)含量存在着密切相关性;Tm 与( G+C)含量(X)百分数的这种关系可
47、用以下经验公式表示:核苷酸20bp;Tm=4(G+C)+2(A+T) 。 (二)溶液的离子强度:溶液中离子与 DNA 分子中磷酸基团形成离子键,需要较高温度才能使 DNA 变性。离子强度较低时,Tm 值较低,而且解链的温度范围也较宽。 (三)pH 值:pH 值影响氢键的形成。pH 值在 5-9 范围内,Tm 值变化不明显。当溶液 pH 值小于 4 时或大于 11 时,均不利于氢键的形成,DNA 容易变性。 (四)变性剂:干扰碱基堆积力和氢键的形成,因此可以降低 Tm 值。常用的变性剂有甲酰胺、尿素、甲醛等。核酸复性(nucleic acid renaturation):指变性 DNA 在适当条
48、件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。退火(annealing):热变性 DNA 一般经缓慢冷却后即可复性,此过程称之为“退火” 。影响因素:1)温度和时间:一般认为比 Tm 低 25左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。复性时温度下降必须是一缓慢过程,若在超过 Tm 的温度下迅速冷却至低温(如 4以下) ,复性几乎是不可能的。2)DNA 浓度:DNA 复性的第一步是两个单链分子间的相互作用“成核” 。 “成核”速度与 DNA浓度的平方成正比。溶液中 DNA 分子越多,相互碰撞结合 “成核”的机会越大。3 )DNA 分子大小和复杂度:
49、DNA分子越大,复性速率越慢。DNA 分子越复杂,复性速率也越慢。4 )离子强度:增加盐浓度可加快互补链合成双链的速度,盐中和 DNA 单链中磷酸基团的负电荷,减少互补链静电排斥。核酸分子杂交(molecular hybridization):两条 DNA 链或两条 RNA 链或一条 DNA 链和一条 RNA 链按碱基互补的原则缔合成异质双链的过程称为分子杂交或核酸分子杂交。杂交的本质:就是在一定条件下使互补核酸链实现复性。利用探针(probe)与靶 DNA 杂交,可识别靶 DNA 中的特异核苷酸序列。核酸探针(nucleic acid probe):是指能与特定核苷酸序列发生特异性互补杂交,杂交后可用特殊方法检测的已知被标记的核酸分子。选择探针的最基本的原则:高度特异性;探针的来源是否方便;制备探针的难易程度。核酸探针的类型:基因组 DNA 探针;cDNA 探针;RNA 探针;寡核苷酸探针。基因组 DNA 探针 来源:这类探针来源于某种生物的基因组,多为某一基因的全部或部分序列。制备方法:基因克隆的方法;聚合酶链反应(PCR)。特点:多克隆在载体中的 DNA 片段,可无限繁殖,取之不