收藏 分享(赏)

基因组学第4章.ppt

上传人:精品资料 文档编号:11294755 上传时间:2020-03-13 格式:PPT 页数:40 大小:3.94MB
下载 相关 举报
基因组学第4章.ppt_第1页
第1页 / 共40页
基因组学第4章.ppt_第2页
第2页 / 共40页
基因组学第4章.ppt_第3页
第3页 / 共40页
基因组学第4章.ppt_第4页
第4页 / 共40页
基因组学第4章.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、第4章 基因组测序与组装,基因组测序的终极目标是获取目标生物基因组的完整DNA序列。,4.1 DNA测序 4.1.1 人工DNA测序,DNA测序技术发明于20世纪70年代中期,有两种不同的测序程序: - 链终止法(chain termination method): 通过合成与单链DNA互补的多核苷酸链来读起带测DNA分子的序列,合成的互补单链可在不同位置随机终止反应。 - 化学降解法(chemical degradation method): 双链DNA分子经化学试剂处理,可在特定的核苷酸位点产生切口,用同位素标记带测碱基,确定序列组成。,链终止法的原理,引物与单链模板DNA结合 在链终止反

2、应中加入大量的dNTP和少量的ddNTP。由于DNA聚合酶不能区分dNTP和ddNTP,因此,ddNTP可掺入到新生的DNA单链中,合成的新链在此终止。,引物的序列决定了DNA测序的起点,链终止法测序需要引物起始,因为DNA聚合酶在单链DNA分子上,不能启动DNA合成。 测序时引物的选择 - 通用引物,即克隆位点附近载体上的一段序列。 - 内部引物,如果待测序列长度大于750bp,要进行几次测序,须根据前面已知的序列合成新的引物延伸测序。 - 直接测序时,要选择PCR的正向或反向引物。,4.1.2 自动化测序,荧光染料标记物 (fluorescent dye) 毛细管电泳(capillary

3、electrophoresis) 计算机碱基序列的采集与处理。,荧光染料标记物,荧光染料标记物,毛细管电泳(capillary electrophoresis),毛细管,4.2 基因组测序 4.2.1 基因组测序的策略,1)作图测序 (map-based sequencing): 按照DNA克隆绘制的物理图分别在单个DNA克隆内部进行测序与组装,然后将彼此相连的大分子克隆按次序搭建支架,最后以分子标记为向导将搭建好的支架锚定在基因组整合图上。 2)鸟枪法测序(shotgun sequencing):将整个基因组DNA打断成小片段后将其克隆到载体中,然后随机挑取克隆进行测序,以获得的序列构建重叠

4、群。进一步搭建序列支架,最后以分子标记为向导将序列支架锚定到基因组整合图上。,4.2.2 基因组测序的覆盖面,基因组测序覆盖面(coverage): 随机测序获得的序列总长与单倍体基因组序列总长之比,覆盖面越大,遗漏的序列越少。 覆盖面和丢失率之间测算的公式:P0=e-m m为覆盖面;e为自然对数底数;P为丢失的概率,若m=1 P0=e-1=0.37=37% 若m=5 P0=e-5=0.0067=0.67% 若m=10 P0=e-10=4.510-5=0.000045=0.0045%要使测序的覆盖率达到99.99%,就必须使覆盖面达到8次以上。,4.2.3 序列间隙与物理间隙,间隙:即使将基因

5、组测序的覆盖率确定为99.99%,对大型基因组而言仍有相当数量的DNA序列会在随机测序中丢失。这些被丢失的DNA序列分散在各个染色体区段,形成一个个间隙。,序列间隙:测序时遗漏的序列,这些序列仍然保留在尚未挑选的克隆中。物理间隙:构建基因组文库时被丢失的DNA序列,它们从已有的克隆群体中永久地消失。 物理间隙产生的原因: - 由于特殊的碱基组成,如染色体着丝粒区的高度重复序列缺少合适的酶切位点,难以获得大分子DNA克隆 - 克隆载体中,高度重复序列很不稳定,在扩增中容易丢失。 - 某些基因的表达产物对宿主菌具有毒性,可将宿主菌杀死。,间隙的类型,序列间隙缝合,4.2.4 插入片段的两端测序,每

6、个克隆都是从两端测序,因为同一个载体只有两个引物;每个克隆内部的序列不能进行连续测序,因为缺少对应的引物。 由于所有克隆的插入片段都是随机产生的,因此某一个克隆内部的序列有可能在另一克隆的末端出现。就整体而言,克隆群体所有的两端序列可以连续覆盖整个基因组。,4.3 序列组装,基因组序列组装有关的概念,1) BAC末端顺序(BAC-end sequence) 一个BAC克隆插入片段两端的已测序的顺序,不包括内部序列. 可用于确定BAC的排列方向以及重叠群(contig)在支架(scaffold)中的排列方向. 2) 重叠群(contig) 一群相互重叠的克隆或DNA序列,可以是草图序列或精确序列

7、(finished), 包括连续的(内部无间隙)或不连续的(内部含间隙)DNA序列. 3) 支架(scaffold) 一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙. 4) 草图序列(draft sequence) 人类基因组测序计划定义为经Phred Q20软件认可覆盖测序克隆片段3-4倍的DNA序列. 含间隙或无间隙, 排列方向和位置未定. 5) 完成序列(finished sequence) 顺序差错率(错误碱基数)低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一般测序覆盖率在8-10个单倍体基因组. 引自NCBI, Revised November 6, 2003,

8、草图序列,草图序列可分为3个等级:Phase 0: 测序覆盖面一次的DNA序列;Phase 1: 测序覆盖面3-4次的BAC克隆, BAC及内部片段的位置和排 列方向未定.Phase 2: 测序覆盖面3-4次的BAC克隆, BAC及内部片段的位置和排 列方向已定.,完成序列,1) 完成顺序系指已测序的, 每10000 个碱基中出现一个差错, 且内部不存在间隙的DNA顺序. 2) 完成顺序也称为Phase 3期顺序.,4.3.1 作图法测序与序列组装,4.3.2 鸟枪法测序与序列组装,老鼠基因组是采取全基因组鸟枪法完成的范例。 老鼠基因组测序共构建了6个插入片段大小不同的基因组文库,分别为2kb

9、、4kb、6kb、10kb、40kb和150-200kb。,采用多个基因组文库是因为: - 解决载体遭遇的不兼容问题。 - 采用多种质粒文库也增加了克隆片段的总长,扩大了覆盖面。 - 可以校正序列组装时由重复序列产生的差错。 - BAC文库的构建可以使小片段DNA文库组建的重叠群在大分子克隆中有效而准确地归并与整合。避免了在全基因组范围内直接进行重叠群排序所产生的错误。,利用长度不同插入子克隆两端测序搭建支架,鸟枪法测序的优势与局限,优势: - 速度快,无需提供相关的遗传图和物理图。 - 覆盖面较大,有些在作图法中遗落的基因可在鸟枪法中发现。 局限: - 基因组太大,序列复杂,序列组装的起始阶

10、段工作量非常大。 - 存在大量难以填补的间隙。,4.3.3 几种不同生物基因组的测序,1) 大肠杆菌基因组测序-图位法 2) 流感嗜血杆菌基因组测序-鸟枪法 3) 果蝇基因组测序-鸟枪法 4) 人类基因组测序-图位法和鸟枪法 5) 拟南芥基因组测序图位法 6) 水稻基因组测序-图位法和鸟枪法,人类基因组鸟枪法测序的疑问 -PNAS 99:4143-4144,2002,人类基因组鸟枪法测序是一个神化? 1) 丢失了20%的基因组顺序, 含有116 000个间隙,平均长2.3 kb. 2) 利用了大量公开发表的人类基因组顺序作为组装的支点,这是一些极其关键的顺序. 3) 耗费: 作图法的费用为,

11、10%用于BAC作图与亚克隆, 50-60%用于亚克隆测序,覆盖率为5-6个当量, 30-40%用于完成精确顺序测序. 鸟枪法费用为, 利用了发表的BAC物理图,节省了10%的费用. 由于避免顺序丢失, 随机克隆的覆盖面达到15个基因组当量. 此外利用了公共数据库中BAC的两端顺序,减少了这部分的测序量. 总的费用实际远超过作图法测序. 4) 鸟枪法并未在真正意义上加速人类基因组计划的进程, 人类基因组测序计划组织在过去7-8年中积累的物理图数据被鸟枪法大量利用是其成功的主要因素之一.,人类基因组草图-2000年版本,1) 人类基因组草图在富含基因的常染色体上约有10%的遗漏,整体而言约有30

12、%遗漏(包括基因匮乏的异染色质区),忽略或错序的总数约为数十万。 2) 人类基因组草图有341个遗漏,涉及3800万个碱基对. 3) “鸟枪法”无法测到人类基因组中重复出现的DNA片段,这些片段占到基因组的3至5,对于理解遗传性疾病具有重要意义。,人類基因組測序精图2004年版本,May 27, 2004 人類基因組測序項目完成近半 隨著第9號和第10號人類染色體準確測序和分析結果的發表,人類基因組測序項目已完成近半。迄今已發表的人類染色體有第6、7、9、10、13、14、19、20、21、22號染色體和Y染色體,剩下12個已編號的染色體和X染色體有待完成. “人類基因組項目”所收集的序列數據

13、是按照“百慕大標準”獲取的,將目標準確性定為99.99%,即每10000個DNA鹼基中不到1個錯誤。來自“斯坦福人類基因組中心”的一個研究小組對人類基因組序列數據做了一個質量評估,他們得出結論認為,在整個基因組中,“百慕大標準”被超過了10倍,使得每10000個DNA鹼基中不到1個錯誤。,人类基因组精确顺序已经完成,人类基因组测序的伦理学问题,1)专利问题 提供缺陷型基因的人员在研究成果获得商业利益时是否有权要求给予报酬或拥有部份专利; 2)人类基因组顺序的公开利用问题 如何确定基因的好坏,一旦某人所谓 “次等”的基因被人获知,是否会受到歧视与不公正待遇; 3)保险公司是否有权获知投保人的基因

14、资料,是否有权要求投保人进行某些敏感基因的测试; 4)投保人的基因资料是否具有隐私权,可否拒绝保险公司,招聘单位,所在部门上级主管提出的获知基因资料的要求;,人类基因组测序的伦理学问题,5)某些公司可能提出一些看似正当的理由,如工作环境不利于一些基因组顺序中存在某些“缺陷”的人员而拒绝他们的工作申请,尽管这些人员确有专长。 6)已经确定婚姻关系的配偶双方或即将踏入婚姻之旅的恋人是否有权获知对方基因组中自己感兴趣的基因组成; 7)什么是坏基因:社会如何对待那些被认为具有“暴力”倾向基因型的成员; 8)“敏感”顺序的法律保护:雇员是否可以因为基因组“敏感”顺序而有权拒绝雇主或上级部门的工作调动与安排。 随着基因组计划的深入,诸如此类的问题已经提上议事 日程,如何处理这些问题是对人类智慧的考验。,思 考 题,1) 链终止法测序的原理是什么? 2) 鸟枪法测序与作图法测序的差别? 3) 为何原核生物基因组更适合鸟枪法测序? 4) 图解说明BAC克隆测序与顺序组装的过程. 5) 为何BAC克隆测序和全基因组鸟枪法测序都会留间隙? 6) 什么是物理间隙? 什么是顺序间隙? 如何填补这两类间隙? 7) 大型基因组鸟枪法测序的缺点是什么? 8) 基因组鸟枪法测序要构建大小不同的插入 片段隆文库,原因何在? 9)为何着丝粒区和近端粒区DNA的测序非常困难?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报