收藏 分享(赏)

基因组测序-课程中心-山东大学.ppt

上传人:tangtianxu1 文档编号:2970274 上传时间:2018-10-01 格式:PPT 页数:47 大小:4.19MB
下载 相关 举报
基因组测序-课程中心-山东大学.ppt_第1页
第1页 / 共47页
基因组测序-课程中心-山东大学.ppt_第2页
第2页 / 共47页
基因组测序-课程中心-山东大学.ppt_第3页
第3页 / 共47页
基因组测序-课程中心-山东大学.ppt_第4页
第4页 / 共47页
基因组测序-课程中心-山东大学.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

1、生物信息学 什么是生物信息学,魏天迪2017.2.21,考试情况,2011级上机考试,83 84.5 88 89 89 90 90 93 95 95 99 99 100 100 100 100,考试情况,2012级上机考试,77 80 83 84 84 88 90 92 94 95 97 97 100 100,考试情况,2013级上机考试,66 72 72 80 89 90 91 92 94 96 99 100 100 100 100,课程中心,什么是生物信息学,生物信息学的产生和发展,生物信息学产生的背景:1866年,奥地利人孟德尔根据实验结果提出了基因是以实物存在的假说;,生物信息学的产生

2、和发展,生物信息学产生的背景:1871年,瑞士人Miescher从白细胞细胞核中分离出脱氧核糖核酸(DNA);,生物信息学的产生和发展,生物信息学产生的背景:1944年,美国人阿弗莱、麦克李沃和麦克卡三人通过实验证明DNA是生物的遗传物质;,生物信息学的产生和发展,生物信息学产生的背景:1944年,美国人Chargaff发现DNA中鸟嘌呤(G)与胞嘧啶(C)数量相等,腺嘌呤(A)与胸腺嘧啶(T)数量相等;,生物信息学的产生和发展,生物信息学产生的背景:1953年,英国人Watson和Crick在Nature杂志上发表了DNA的双螺旋结构模型;,Watson Crick Wilkins Fran

3、klin,生物信息学的产生和发展,生物信息学产生的背景:1962年, Watson,Crick和Wilkins因发现了DNA的双螺旋三维结构共同获得了诺贝尔生理学医学奖。,生物信息学的产生和发展,生物信息学产生的背景:1954年,Crick提出了中心法则“DNA - RNA - 蛋白质”;,生物信息学的产生和发展,生物信息学的产生和发展,生物信息学产生的背景:1966年,美国人Nirenberg和Khorana破译了全部遗传密码字典的64个密码子。,生物信息学的产生和发展,生物信息学的萌生:1956年,美国田纳西州的盖特林堡召开了“生物学中信息理论研讨会”;1979年,美国洛斯阿拉莫斯实验室建

4、立了GenBank数据库;1982年,欧洲分子生物学实验室(EMBL)建立了核酸序列数据库;1984年,日本建立了核酸序列数据库DDBJ;90年代初,三大核酸数据库开始资源共享,联合成立了国际核苷酸序列数据库;1987年,美国学者林华安首创了“bioinformatics”一词,“compbio” - “bioinformatique” - “bio-informatics”;,生物信息学的产生和发展,人类基因组计划:1990年,国际人类基因组计划启动,预算30亿美元,被誉为生命科学“阿波罗登月计划”,参与国:美、英、日、德、法;1997年,在耗费了巨额资金和一半预定时间之后,仅完成了3%的工

5、作;1998年,Craig Venter创立Celera公司;1999年, Celera公司在无政府资助下,赶超了多国合作小组;1999年,中国加入多国合作小组,负责测定基因组全部序列的1;2000年,在美国总统克林顿的协调下, Celera公司与多国合作小组合作,宣布完成了人类基因组草图的90;2001年,完成了人类基因组草图的99, Celera公司与多国合作小组合作几乎同时分别在Science和Nature上独立发表自己的草图;2003年,人类基因组序列图绘制成功,彻底完成。,生物信息学的定义,美国国家基因研究中心:生物信息学是一个代表生物学、数学和计算机科学的综合力量的新兴学科。 美国

6、乔治亚理工大学:生物信息学是采用数学、统计学和计算机等方法分析生物学、生物化学和生物物理学数据的一门综合性学科。 美国密苏里大学:生物信息学是获知、管理和处理生物信息的科学与技术。 美国加州大学洛杉矶分校:生物信息学是对生物信息和生物学系统内在结构的研究,它将大量系统的生物学数据与数学和计算机科学的分析理论及使用工具联系起来。 中国军事医学科学院欧阳曙光:生物信息学是研究生物信息的采集、处理、储存、传布、分析和揭示的科学,它通过综合数学、计算机科学与工程学、生物学的工具和技术,揭示大量而复杂的的生物数据所赋有的生物学奥秘。 山东大学生院魏天迪:生物信息学是用计算机解决生物问题。,生物信息学的发

7、展方向,一、算法、软件和数据库的开发背景:数学、物理、计算机科学例如:重复序列蛋白质模板拼接建模算法EnsemLoc蛋白质亚细胞定位软件TollML和LRRML数据库 二、算法、软件和数据库的应用背景:生物、医学、化学例如:Toll样受体及相关蛋白质的结构、功能与进化学的研究,Bioinformatics,Nucleic acid Protein Others,SequencingDatabaseTranscriptional regulation predictionGene predictionMolecular evolutionRNA secondary structure predi

8、ctionGenomics,DatabaseSecondary/3D structure predictionDockingMolecular dynamics simulationsMolecular designDrug designProteomics,Metabolic networkSystem modelingBioimaging,生物信息学的研究对象,基因组测序,基因组测序,测序仪:2000年,荧光自动测序仪(第一代);当前,高通量测序仪(第二代),基因组测序,基因组测序,2012年2月英国牛津纳米孔公司发布公告称,两年内将推出U盘测序仪产品MinION,个人基因组的测序将在15

9、分钟内完成。2014年初兑现承诺,目前产品正在试用期,价格为1000美金左右。2014年6月美国罗氏公司以3.5亿美金收购了纳米孔公司。,基因组测序,2013年11月25日,MinION试用计划启动。参与者须支付1000美元的押金以及运费,而后将收到一台MinION测序仪,包括测序USB装置、流动槽和软件。2014年2月18日,牛津纳米孔公司公布了首批测序数据。文库制备的基本步骤是从高分子量DNA开始的,片段化DNA,无需大小选择,再连接接头。纳米孔中的酶使其变成单链DNA,再通过纳米孔。随着单链DNA 通过纳米孔,测序系统根据电流变化确定DNA序列。,生物数据库,1. 核酸数据库 国际核苷酸

10、序列数据库,2. 蛋白质数据库,=,3. 蛋白质结构数据库,4. 其他专项生物数据库,基因预测,外部预测法 从头预测法 比较基因组法,基因预测,外部预测法 从头预测法 比较基因组法,基于其他大量已知基因情况的核酸序列(基因组),对目标核酸序列进行相似性搜索。,基因预测,外部预测法 从头预测法 比较基因组法,不与其他核酸序列进行比较,根据不同物种基因本身的序列特征进行基因预测。,GENSCAN,基因预测,外部预测法 从头预测法 比较基因组法,不与其他核酸序列进行比较,根据不同物种基因本身的序列特征进行基因预测。,内含子 5GTAG3,基因预测,外部预测法 从头预测法 比较基因组法,根据自然选择的

11、原理,基因区域的变异率应该远低于其他区域。很多物种的基因组已被完全测序,这样,比较相关物种基因组,保守区也就是潜在的基因区。,基因表达调控分析,四个水平上的基因表达调控:转录水平、转录后水平、翻译水平、翻译后水平。,山东大学数学学院李国君教授:,BOBRO A BOTTLENECK BROCKEN TOOL FOR MOTIF FINDING Nucleic Acids Research (IF 7.5),http:/csbl.bmb.uga.edu/maqin/motif_finding/index.html,RNA二级结构预测,长链非编码RNA或tRNA可通过自身碱基互补形成二级结构,如三

12、叶草结构,来行使调解蛋白质功能的功能。,蛋白质三维结构,蛋白质四个水平上的结构:,蛋白质三维结构,all beta alpha+beta all alpha,蛋白质二级结构预测,已知一个蛋白质的氨基酸序列,预测其二级结构。 常用软件:PSIPRED, APSSP2, NNPREDICT, PREDICTPROTEIN,蛋白质三维结构预测,已知一个蛋白质的氨基酸序列,预测其三维结构。 三类方法:1. 同源建模法;2. 穿线法;3. 从头预测法。 前两类方法合称为基于模板法。,MEAKIVKVLDSSRCEDGFGKKRKRAASYAAYVTGVSCAKLQNVPPPNGQCQIPDKRRRLEG

13、ENKLSAYENRSGKALVRYYTYFKKTGIAKRVMMYENGEWNDLPEHVICAIQNELEEKSAAIEFKLCGHSFILDFLHMQRLDMETGAKTPLAWIDNAGKCFFPEIYESDERTNYCHHKCVEDPKQNAPHDIKLRLEIDVNGGETPRLNLEECSDESGDNMMDDVPLAQRSSNEHYDEATEDSCSRKLEAAVSKWDETDAIVVSGAKLTGSEVLDKDAVKKMFAVGTASLGHVPVLDVGRFSSEIAEARLALFQKQVEITKKHRGDANVRYAWLPAKREVLSAVMMQGLGVGGAFIRKSIYG

14、VGIHLTAADCPYFSARYCDVDENGVRYMVLCRVIMGNMELLRGDKAQFFSGGEEYDNGVDDIESPKNYIVWNINMNTHIFPEFVVRFKLSNLPNAEGNLIAKRDNSGVTLEGPKDLPPQLESNQGARGSGSANSVGSSTTRPKSPWMPFPTLFAAISHKVAENDMLLINADYQQLRDKKMTRAEFVRKLRVIVGDDLLRSTITTLQNQPKSKEIPGSIRDHEEGAGGL,蛋白质三维结构预测,同源建模法:相似的氨基酸序列对应着相似的蛋白质结构。,蛋白质三维结构预测,穿线法:不相似的氨基酸序列也可能对应着相似的蛋白

15、质结构。,蛋白质三维结构预测,穿线法:不相似的氨基酸序列也可能对应着相似的蛋白质结构。,已知结构的蛋白质约10万,不同的结构拓扑 1313。,蛋白质三维结构预测,从头预测法:1973年 Anfinsen 科学:蛋白质的三维结构决定于自身的基酸序列,并且处于最低自由能状态。,由于运算量和准确度的问题,只适合几十个氨基酸长的蛋白质。,蛋白质对接,对接要考虑的三个因素: 1. 几何形状互补;2. 分子表面电荷互补;3. 疏水作用。,蛋白质蛋白质对接,蛋白质对接,对接要考虑的三个因素: 1. 几何形状互补;2. 分子表面电荷互补;3. 疏水作用。,小分子化合物蛋白质对接,分子动力学模拟,1 ns 10

16、0 cpu 5 h,Virtual screening,Library of chemical compounds,虚拟分子筛选,计算机辅助药物设计,分子进化,DNA在进化过程中积累突变,导致了不同株系后代DNA,RNA和蛋白质序列的分歧。这个原则可以被用来构建系统发生树。由于内部突变率和选择性限制的差异,不同的大分子序列进化速率不同,使得对密切相关和远距离相关的生物体都可以进行系统发生分析。,代谢网络,代谢网络是决定细胞生理、生化特性的一整套代谢过程和物理过程。通过对代谢网络的研究(构建网络、拓扑分析、代谢流分析)能更好地了解生物体代谢过程, 并利用这一过程促进药物设计、发酵工程和微生物工程等产业的发展。,图表理论,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报