ImageVerifierCode 换一换
格式:PPT , 页数:69 ,大小:10.55MB ,
资源ID:2527      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-2527.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文((第一堂课)生物信息学.ppt)为本站会员(无敌)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

(第一堂课)生物信息学.ppt

1、2018/3/2,生物信息学,袁细国西安电子科技大学E_mail:,2018/3/2,参考书,王翼飞,史定华. 生物信息学智能化算法及其应用,北京:化学工业出版社,2006孙萧,陆祖宏,谢建明. 生物信息学基础,北京:清华大学出版社,2005孙萧,陆祖宏,谢建明. 生物信息学概论(译),北京:清华大学出版社,2004张阳德. 生物信息学,北京:科学出版社,2009,2018/3/2,考核方式,平时成绩 20% 期末考核 80%期末考核基本概念、基本方法的理解智能化算法或统计学中的理论和技术在生物分子数据分析中的应用,2018/3/2,章节及课时安排,2018/3/2,第一部分 基础内容,201

2、8/3/2,第一章 生物信息学简介,2018/3/2,什么是生物信息学,bioinformatics= bio + informatics 生物 信息学相关学科计算生物学(computational biology)系统生物学(systems biology),2018/3/2,生物体系和过程中信息的存贮、传递和表达,细胞、组织、器官的生理、病理、药理过程的中各种生物信息,信息科学,生命科学中的信息科 学,广义:生物信息学是指对生物信息的获取、加工、存储、分配、分析和解读,并综合应用数学、计算机和生物学工具,以更好理解数据中的生物学含义。,2018/3/2,生物分子数据,深层次生物学知识,分子

3、生物信息学Molecular Bioinformatics,狭义:是以基因组DNA序列信息分析作为基础,找到基因组序列中代表蛋白质和RNA基因的编码区,阐明非编码区的信息实质,破译隐藏在DNA序列中的遗传规律;同时,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识生物代谢、发育、分化、进化规律。,2018/3/2,生命的物质基础、能量转换、代谢过程;生命信息的组织、传递、表达过程,物理,化学,分子生物学,遗传学,信息技术,2018/3/2,生物分子信息,DNA序列数据,蛋白质序列数据,生物分子结构数据,生物分子功能数据,最基本,直观,复杂,生物分子数据类型,2018

4、/3/2,生物分子至少携带着三种信息:遗传信息与功能相关的结构信息进化信息,2018/3/2,生物信息学主要研究两种信息载体 DNA分子 蛋白质分子,2018/3/2,2018/3/2,DNA通过自我复制,在生物体的繁衍过程中传递遗传信息。,基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。,DNA序列控制着蛋白质的合成,DNA,RNA,蛋白质,转录,翻译,遗传信息的载体DNA,2018/3/2,基因的DNA序列,蛋白质序列,遗传密码,2018/3/2,生物分子信息,第一部遗传密码,第二部遗传密码,DNA核酸序列,蛋白质氨基酸序列,蛋白质结构,蛋白质功能,

5、最基本的生物信息,生命体系千姿百态的变化,维持生命活动的机器,生物分子数据及其关系,2018/3/2,生物分子信息特征 1)生物分子信息数据量大,如DNA序列以千兆碱基(giga base, Gb)为单位;,2)生物分子信息复杂,既有生命本质信息,又有生命表 象信息; 3)生物分子信息之间存在着密切的联系。,2018/3/2,生物信息学的研究目标与任务,目标 揭示生物分子数据的内涵,加快人类了解自身的进程。,任务 (1)收集和管理生物分子数据; (2)进行数据处理和分析; (3)开发分析工具和使用软件。,2018/3/2,生物信息学的研究意义,理论意义:认识生物本质的必要途径,认识生物科学的本

6、质问题;,从学科角度:改变传统生物学的研究方式;,医学角度:了解基因与疾病的关系,了解疾病产生机理。,2018/3/2,1960s已有建立数据库、序列分析、开发算法,当时叫分子进化如果考虑生物数学,19世纪已经流行首次提出Bioinformatics的说法荷兰理论生物学家1980年代初Ben Hesper和Paulien Hogeweg马来西亚生化物理学家林华安(Hwa A. Lim)于1987年最早提到该词的文献(PubMed)(1990)Genomics,6(2):389,生物信息学的发展历史,2018/3/2,生物信息学发展阶段(1),前基因组时代(pre-genomics era)建立

7、生物数据库(1965, Margaret Dayhoff的Atlas of Protein Sequences; 1982,GenBank Release 3)对位算法(1970,Needleman-Wunsch; 1981,Smith-Waterman)1977,DNA测序和相应的软件分析(RA Staden),2018/3/2,发展阶段(2),基因组时代(genomics era)一批基因组被测序,1982 噬菌体,1995 细菌,1996 酵母,1998 线虫,1999 果蝇,2018/3/2,发展阶段(3),基因组时代(genomics era)数据库搜索算法(1983, Wilbur

8、-Lipman)快速序列相似性查找(1985, FASTN; 1990, BLAST)机构建立1988, NCBI1988, EMBnet1993, Sanger1991,EST技术,2018/3/2,发展阶段(4),后基因组时代(post-genomics era)HGP (1990-2003)1995,蛋白质组学(Proteomics)高通量(high-throughput)实验手段,2018/3/2,发展阶段(5),后基因组时代(post-genomics era)比较基因组学(comparative genomics)结构基因组学(Strutural genomics, 2001)功能

9、基因组学(Functional genomics)系统生物学系统树重建(phylogenic reconstruction),2018/3/2,生物信息学基本方法(1),建立生物数据库如GenBank, EMBL, DDBJ搜索数据库如BLAST序列分析如比对(alignment)、注释(annotation)、寻找外显子统计分析如隐马尔科夫模型(HMM)、贝叶斯分析(Bayesian analysis),2018/3/2,基本方法(2),算法如遗传算法(genetic algorithm, GA)、人工神经网络(artificial neural network, ANN)数学模型如确定性模

10、型(deterministic model)、随机性模型(stochastic model)多学科方法,2018/3/2,应用,基因组层次分析如序列功能、蛋白质、进化研究基因芯片如DNA芯片(DNA chip),蛋白质芯片的动态数据分析药物开发如寻找药靶、药物分子结构、系统药物开发经济价值“bioventure” 生物风险公司药物、生物制品、相关试剂、器材,2018/3/2,发展现状学术,2018/3/2,我国的发展现状(1) 总括,国家高技术研究发展计划(863)生物信息的获取、加工和利用,建立数据库结构基因组和蛋白质组学研究高通量药物筛选、药物设计生物芯片曙光系列生物信息学服务器基因组完成

11、1人类基因组计划(中国卷;3号染色体短臂“端粒至D3S3610”)(1994-2001.8)2001.10独立完成水稻基因组“工作框架图”绘制和数据库建设;完成国际水稻基因组计划的20%其他: 家猪、血吸虫、家鸡、家蚕、大豆,2018/3/2,我国的发展现状(2),生物信息学企业如华大、中科院等建立了一些中国生物信息学大会首届,2001.4.11-13,北京,军事医学科学院第二届, 2002.6.28,北京大学第三届, 2008.10.6-9,武汉华中科技大学国际生物信息学大会首届,2003第四届,2006.6.10,中南大学,2018/3/2,我国的发展现状(3) 主要研究中心,北京华大基因

12、研究中心(中科院基因组研究所) 杨焕明 http:/ 陈竺、赵国屏 http:/ 强伯勤 http:/ 孙之荣 http:/ 罗静初 http:/ 钟扬 http:/ 研究中心,中科院国家基因研究中心 http:/ 中科院理论物理所统计物理和理论生命科学 陈晓松、郝柏林 http:/ 陈润生、蒋太交 http:/ 李亦学 http:/ http:/ 中科院计算所生物信息实验室 http:/ 中科院遗传所分子系统生物学中心 韩敬东 http:/ http:/ 中科院微生物所 http:/,2018/3/2,我国的发展现状(5) 研究中心,天津大学生物信息中心 张春霆 http:/ 徐安龙 htt

13、p:/ 中山医科大学 http:/ 东南大学(江苏省生物信息学专业委员会) 孙啸 http:/ 陈竺哈尔滨医科大学生物信息学系 李霞http:/ 研究中心,天津大学生物信息中心 张春霆 http:/ 徐安龙 http:/ 中山医科大学 http:/ 东南大学(江苏省生物信息学专业委员会) 孙啸 http:/ 陈竺哈尔滨医科大学生物信息学系 李霞http:/ 人类三大计划,曼哈顿原子弹计划(1942-46),阿波罗登月计划(1961-69),人类基因组计划(1990-2003),2018/3/2,人类基因组计划(2),http:/www.ornl.gov/sci/techresources/Hu

14、man_Genome/home.shtml人类基因组计划(Human Genome Project, HGP)由美国能源部(Department of Energy, DOE)和美国国立卫生研究院(National Institutes of Health, NIH)组织完成1990年10月开始,2003年4月完成(1953双螺旋)参与国:美、英、日、法、德、中,2018/3/2,人类基因组计划(3) 任务,遗传图谱物理图谱 序列图谱转录图谱,建立四张图谱,2018/3/2,2018/3/2,遗传图谱(genetic map): 又称连锁图谱(linkage map),是以具有遗传多态性(在一

15、个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。,遗传图谱,2018/3/2,物理图谱,物理图谱(physical map):是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。有两种方法用于确定各遗传标志之间的物理距离,一种是以定位的DNA序列即序列标记位点(Sequencing Tagged Site,STS)作为路标,以DNA实际长度为图距的基因组

16、图谱,另一种是由酵母人工染色体(YAC)和/或细菌人工染色体(BAC)连续克隆重叠群组成的物理图谱。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。,2018/3/2,序列图谱,序列图谱:即分子水平的物理图谱。 DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。,2018/3/2,大规模基因组测序,Megabace 测序仪,3700 测序仪,2018/3/2,运用计算机软件进行序列拼接,2018/3/2,转录图谱,转录图谱(Transcriptional Map),又称表达图谱(Expr

17、ession Map),是以部分5端和3端cDNA顺序即表达序列标志(Expressed Sequence Tags,EST)为位标,根据转录顺序的位置和距离绘制的图谱。是有关基因序列、位置及表达模式等信息的图谱。,2018/3/2,通过定位克隆技术寻找疾病基因的过程,2018/3/2,人类基因组计划在医学方面的研究,对致病基因的克隆。致病相关基因的抑制或调控,即可达到治疗某一疾病的效果。如果掌握了与某种疾病相关的基因及突变,则可以对该疾病进行预测、诊断,甚至治疗。,2018/3/2,基因变异与疾病,2018/3/2,基因组多态性,2018/3/2,人类基因组计划(4) 超额完成目标,2018

18、/3/2,目前生物信息学具体研究内容,1、生物分子数据的收集与管理2、数据库搜索及序列比较 3、基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构预测6、研究药物作用机制和开发新药,2018/3/2,基因组数据库,蛋白质序列数据库,蛋白质结构数据库,DDBJ,EMBL,GenBank,SWISS-PROT,PDB,PIR,1、 生物分子数据的收集与管理,2018/3/2,2、数据库搜索及序列比较,搜索同源序列,通过序列比较寻找相似序列。 序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这

19、是序列相似程度的一种定性描述。多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。,2018/3/2,3、基因组序列分析,遗传语言分析天书 基因组结构分析基因识别基因功能注释基因调控信息分析基因组比较,2018/3/2,4、基因表达数据的分析与处理,基因表达数据分析是目前生物信息学研究的热点和重点。研究方法:基因芯片,蛋白质谱技术和蛋白质组研究。 目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能。,2018/3/2,基因芯片,2018/3/2,2018/3/2,5

20、、蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。蛋白质结构预测分为:二级结构预测:模式识别问题。 空间结构预测:同源模型法。,2018/3/2,生物信息学最新研究热点内容,1.大规模基因组测序中的信息分析2.新基因和新SNP的发现与鉴定3.非编码区信息结构分析4.遗传密码的起源和生物进化5.完整基因组的比较研究6.大规模基因功能表达谱的分析7.生物大分子的结构模拟与药物设计8.生物信息学分析方法的研究9.建立国家生物医学数据库与服务系统10.应用与发展研究,2018/3/2,基因组数据库的介绍(1),HapMap (http:/hapmap.

21、ncbi.nlm.nih.gov/),2018/3/2,基因组数据库的介绍(2),TCGA (https:/tcga-data.nci.nih.gov/tcga/),2018/3/2,基因组数据库的介绍(3),GeneCard (http:/www.genecards.org/),2018/3/2,基因组数据库的介绍(4),UCSC (http:/genome.ucsc.edu/),2018/3/2,2018/3/2,2018/3/2,实例基因图谱,2018/3/2,2018/3/2,生物信息学的挑战,数据规模超大,如单个样本位点数据高达180多万,数据结构复杂,如基因变异形式的多样性、复杂性,群体的异质性,不同人群基因结构有较大差异,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报