收藏 分享(赏)

沙岩的毕业论文new.doc

上传人:dzzj200808 文档编号:2338864 上传时间:2018-09-11 格式:DOC 页数:25 大小:407.50KB
下载 相关 举报
沙岩的毕业论文new.doc_第1页
第1页 / 共25页
沙岩的毕业论文new.doc_第2页
第2页 / 共25页
沙岩的毕业论文new.doc_第3页
第3页 / 共25页
沙岩的毕业论文new.doc_第4页
第4页 / 共25页
沙岩的毕业论文new.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、古细菌 Pyrococcus horikoshii 糖酵解途径酶类的生物信息学统计作 者 姓 名 沙 岩 专 业 生 物 技 术 指导教师姓名 刘 波 专业技术职务 (目录格式) 目 录(三号、黑体、居中、目录两字空四格、与正文空一行)摘 要 1第一章(空两格)(小三号、黑体字)21.1(四号黑体) 21.1.1(四号黑体)41.1.2 71.2 91.2.1151.2.224第二章(空两格) 292.1292.235山东轻工业学院 2009 届本科生毕业论文3摘 要葡萄糖通过“ 中心代谢途径 ”降解为丙酮酸的过程对于生物体物质及能量的代谢具有重要的作用。古细菌的葡萄糖酵解过程具有与真核生物以

2、及细菌葡萄糖代谢显著不同的特征。随着基因组学和蛋白质组学的发展,生物信息学在数据处理中的应用已经越来越广泛。作为数据处理中越来越重要的分析手段,蛋白质组学数据库是蛋白质组学的主要内容之一。生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。序列比对是生物信息学中的一个基本问题, 设计快速而有效的序列比对算法是生物信息学研究的一个重要内容, 通过序列比较可以发现生物序列中的功能、结构和进化的信息, 序列比较的基本操作是比对。本文介绍了序列比对算法的发展现状, 描述了常用的各类序列比对算法, 并分析了它们的优劣。本实验通过生物信息学分析,运用 GenBank、ClustalX、Clus

3、talW、Swiss-Model、 BLAST 等数据库和工具,得到与古细菌糖酵解途径酶类的关键词:生物信息学 ABSTRACTGlucose is degraded to pyruvate via the so called “central metabolic pathways” that play vital roles in the carbohydrate and energy metabolism of organisms. Some variances to the classical glycolytic pathways in bacteria and eukarya are

4、 presented in the glycolysis of archaea.Bioinformatics plays an important role in genomics and proteomics to analyze the vast data from experiments. Recently , many labsestablished a lot of proteomic databases. Bioinformatics is the subject of using computer to store, retrieve and analyze biological

5、 information. Sequence alignment is a basic problem in Bioinformatics, and its main research work is to develop rapid and effective sequence alignment algorithms. We may discover functional, structural and evolutionary information in biological sequences by sequence comparing. This paper introduces

6、山东轻工业学院 2009 届本科生毕业论文4the development actuality of sequence alignment algorithms, describes variety of sequence alignment algorithm and analyses the advantages and disadvantages of them.The experiment through the bioinformatics analysis,use GenBank, ClustalX, ClustalW, Swiss-Model, BLAST and other d

7、atabases and tools, has been with the ancient ways of bacterial enzymes of glycolysis.Key words:Bioinformatics山东轻工业学院 2009 届本科生毕业论文5第一章 前言1.1 古细菌概述古细菌(archaeobacteria)(又可叫做古生菌、古菌、古核细胞或原细菌)是一类很特殊的细菌,多生活在极端的生态环境中。具有原核生物的某些特征,如无核膜及内膜系统;也有真核生物的特征,如以甲硫氨酸起始蛋白质的合成、核糖体对氯霉素不敏感、RNA 聚合酶和真核细胞的相似、DNA 具有内含子并结合组蛋白

8、;此外还具有既不同于原核细胞也不同于真核细胞的特征,如:细胞膜中的脂类是不可皂化的;细胞壁不含肽聚糖,有的以蛋白质为主,有的含杂多糖,有的类似于肽聚糖,但都不含胞壁酸、D 型氨基酸和二氨基庚二酸。自古细菌被分为一个单独域以来,随着其新类群的不断发现,现在古细菌可分为广古细菌(Euryarchaeota) 、泉古细菌(Crenarchaeota)、古古细菌(Korarchaeota)以及纳米古细菌 (Nanoarchaeota)4 个门古细菌介于细菌和真核生物之间,它的结构较真核生物简单,类似于细菌,而很多信息处理过程的组分更接近于真核生物,在 DNA 复制装置中该现象尤其显著。因此,很多古细菌

9、可以作为研究真核生物 DNA 代谢过程的模型,是较好的模式生物。然而,古细菌发现比细菌晚,它的结构又与细菌有所区别,很多在细菌中可以使用的遗传操作技术无法在古细菌中使用。1.1.1 掘越氏热球菌( Pyrococcus horikoshii)掘越氏热球菌(Pyrococcus horikoshii)生存于冲绳岛附近海底约 1395 米的火山口,发现并报道于 1998 年。其最适生长温度为摄氏 95-105,分类上属广古细菌。该菌的完整基因组已测序。1.2 糖酵解途径在机体缺氧条件下,葡萄糖经一系列酶促反应生成丙酮酸进而还原生成乳酸的过程称为糖酵解亦称糖的无氧氧化。糖酵解途径是指细胞在细胞质中分

10、解葡萄糖生成丙酮酸的过程,此过程中伴有少量 ATP 的生成。这一过程是在细胞质中进行,不需要氧气,每一反应步骤基本都由特异的酶催化。在缺氧条件下丙酮酸被还原为乳酸,有氧条件下丙山东轻工业学院 2009 届本科生毕业论文6酮酸可进一步氧化分解生成 乙酰 CoA 进入三羧酸循环 ,生成 CO2 和 H2O。糖酵解总共包括 10 个连续步骤,均由对应的酶催化。总反应式为:葡萄糖+2ATP+2ADP+2Pi+2NAD +2 丙酮酸+4ATP+2NADH+2H+2H 2O1.2.1 古细菌的糖酵解途径迄今,对于真核生物与细菌的糖酵解过程已经进行了深入的研究,其糖酵解途径可分为:经典的 EM 途径与 ED

11、 途径以及氧化的磷酸戊糖途径。古细菌,作为生命的“第三种形式”,其生理习性、代谢途径、遗传机制等均呈现出不同于真核生物与细菌的特点。研究古细菌的代谢过程不但有可能揭示生命起源的机制,而且对于有效的利用这种微生物以及来自其中的极端酶类等也具有重要的现实意义。古细菌糖酵解的研究在 Woese 等提出生命三域学说的 90 年代初开始起步。目前,国际上关于古细菌糖酵解代谢的综述多报道于 2005 年前,而近年来随着许多新的研究成果的出现,古细菌中心代谢途径已成为极端微生物研究的一个热点领域。与真核生物与细菌不同,古细菌中仅存在 EM 途径与 ED 途径,而缺少氧化的磷酸戊糖途径。古细菌 EM 与 ED

12、 途径具有与真核生物及细菌经典的 EM与 ED 途径显著不同的特点。这主要体现在:第一,糖酵解过程中的部分路径即经过的中间代谢物转化过程不同;第二,许多新的酶或酶家族催化糖酵解过程中的同一或不同代谢步骤。1.3 生物信息学生物信息学中途径的发展背景伴随着人类基因组计划的启动,生物信息学这一新兴交叉学科的蓬勃发展,目前已经产生了大量的以核酸和蛋白质等生物大分子数据库及其相关的文献、资料图书。从 1994 年开始,核酸研究杂志每年第一期是生物数据库专辑。国际上 3 大核苷酸、蛋白质数据库分别是:美国国家生物技术信息中心(NCBI)的 GenBank 数据库、欧洲生物信息学研究所(EBI)的核酸序列

13、数据库 EMBL 和日本信息生物学中心(CIB) 的 DNA 数据库 DDBJ。随着生物信息数据库的不断发展,生物信息学的研究方向划分的越来越细致,代谢途径研究则成为其中的一个研究热点。途径作为一条维持生命的分子反应链,不同的生命过程有不同的途径。比如细胞对外界环境变化响应的途径、细胞代谢、凋亡途径和信号途径。一条途径功能的中断可能引起严重的疾病,如癌症。由多山东轻工业学院 2009 届本科生毕业论文7条途径整合起来可形成蛋白质和基因的调控网络。因此,理解途径是理解细胞过程和细胞过程药物的重要步骤。目前对于途径的研究已经成为一个非常活跃的领域。1.3.1 生物信息学的研究领域生物信息学的研究领

14、域包括:(1)大规模基因组测序中的信息分析;(2)大规模基因功能表达谱的分析;(3)序列片段的拼接;(4)新基因和新 SNP 的发现与鉴定;(5)非编码区信息结构分析;(6)密码起源和生物进化的研究,包括序列相似性比较,序列同源性分析和构建系统进化树。1.3.2 主要的生物信息学数据库国际上主要的 DNA 序列数据库有GenBank、EMBL、DDJB、ESTdb、OMIM、GDB 、GSDB 等;蛋白质一级结构数据库有 SWISS-PROT、PIR、OWL 、ISSD 、MIPS 等;蛋白质二级结构数据库有 PROSITE、BLOCKS、PRINTS 等;蛋白质和其他生物大分子的三维结构数据

15、库有 PDB、NDB、 CCSD 等;与蛋白质结构分类有关的数据库有SCOP、 CATH、FSSP 等。1.3.3 生物信息学的基本分析方法随着生物信息的急剧增长,如何从浩瀚的数据库中获取有用信息,怎样处理提取的数据,进而从中获得与生物结构、功能相关的信息是一个使理论生物学家感到棘手的难题。借助于计算机科学、信息科学及其它学科的共同参与,人们发展了生物信息的多种分析方法,其中最基本的方法有序列对比、结构对比及功能对比预测法等。(1)序列比对预测法序列比对是以核酸和蛋白质序列为依据,来比较两个或两个以上核酸或蛋白质在碱基(A、T、C、G)、氨基酸(20 个氨基酸)水平上的相似性和不相似性。山东轻

16、工业学院 2009 届本科生毕业论文8序列比对是生物信息学最基本的分析方法。常用的序列比对方法有两两序列比对和多序列比对。两两序列比对是比较两序列之间的相似性区域和保守位点来寻找两序列可能存在的历史进化关系。两两序列比对又分为总体序列比对和局部序列比对。两个序列的比对有较成熟的动态规划算法:总体序列比对是以Needleman- Wunsch 的算法为理论体系发展的完善的比对方法;当两个序列总体并不很相似,但某些局部片段相似性较高时,Smith-Waterman 算法是解决局部比对的好算法,局部序列比对正是以 Smith-Waterman 动态规则算法为理论依据的比对方法。多序列比对是以两两序列

17、比对为基础,逐步优化两条或多条序列比对结果的方法,其目的是建立两条以上序列可能存在的进化关系。最常见的多序列比对方法有 Pileup 算法和 Clustal 算法。(2)结构比对预测法结构对比的基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性;蛋白质结构预测包括二级和三级结构预测。从方法学上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。以核酸和蛋白质的序列为基础来预测其生物学结构,是生物信息学的核心研究内容。基于核酸序列的预测分析方法就是以核酸序列为基

18、础来分析预测其功能基因的位置。其分析内容常常包括:密码子的偏向、内部重复序列、特殊位点、编码蛋白区和二级结构的预测。(3)功能比对预测法组成蛋白质的氨基酸序列不仅决定着蛋白质的三维结构,而且也决定着它的功能。首先以蛋白质的序列为依据来预测蛋白质的物理性质,如分子量、等电点、亲水性和疏水性、跨膜区域、信号肽和蛋白定位等。蛋白质的功能预测是以目的蛋白为线索力图发现它和功能已知蛋白质的相似性。蛋白质的功能预测主要侧重在序列同源性和功能区序列的保守性。蛋白质二级结构预测有两种策略: 以单一序列为基础和以多重序列对齐为依据的分析方法。常用的三级结构预测方法有同源模建和穿针引线算法。1.3.4 与生物信息

19、学关系密切的数学领域山东轻工业学院 2009 届本科生毕业论文9统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在 DNA 超螺旋研究中是重要工具,在多肽链折叠研究中也有应用;函数论,如傅里叶变换和小波变换等都是生物信息学中的常规工具;信息论,在分子进化、蛋白质结构预测、序列比对中有重要应用,而人工神经网络方法则用途极为广泛;计算数学,如常微分方程数值解法是分子动力学的基

20、本工具;群论,在研究遗传密码和 DNA 序列的对称性方面有重要应用;组合数学,在分子进化和基因组序列研究中十分有用。原则上讲,各种数学理论或多或少或直接或间接都应该在生物学研究中有各种各样的应用,其中包括生物信息学,这种情况正像过去的一、两个世纪,数学应用于物理学一样。而且,生物信息学的发展,又为数学的发展提供了一个新的机遇,可能会产生一些新的分支科学。1.3.5 与生物信息学密切相关的计算机科学技术首先是网络技术和数据库(特别是关系型数据库)管理技术,包括极为重要的实验室数据信息管理系统(LIMS)。其它诸如数据整合和可视化、数据挖掘(Data Mining)、基于 Unix 操作系统的各种

21、软件包以及人工智能,和一些重要算法的复杂性研究。1.3.6 生物信息学工业生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益。它既属于基础研究,以探索生物学自然学自然规律为己任;又属于应用研究,它的许多研究成果可以较快或立即产业化,成为价值很高的产品。生物信息学的这一特点在现有的许多学科中几乎是独一无二的。这里仅举一个例子来说明生物信息学工业的潜力。据报导,只有 50 名员工的德国 Lion 生物信息学公司,将通过扫描公共数据库中的序列来发现 500 个可能的药物作用靶点,以一亿美元的价格预售给德国 Bayer 公司。又据报导,生物信息学产业的市场在 1998 年已经达到 10 亿美元,

22、而到 2002 年估计可增长到2000 亿美元以上。这是一笔巨大的财富,任何政府的科技决策人都不能对此视山东轻工业学院 2009 届本科生毕业论文10而不见。NIH 已向美国国会建议投资 160 亿美元在美国建立 520 个将生物学与计算结合起来的中心。法国议会科技决策评估办公室,最近评估了基因工程、生物信息学和组合化学等学科的应用前景及法国的对策。美国出现了大批的基于生物信息学的公司,实施了许多生物信息学研究计划,主要与药物设计,基因工程药物,生物芯片,代谢工程与化学工程密切相关。生物信息学工业是知识经济的一个典型,潜力巨大。1.3.7 NCBINCBI 是 National Center

23、of Biotechnology Information 的简称,既美国国立生物技术信息中心,NCBI 是在 NIH 的国立医学图书馆(NLM)的一个分支。NLM 是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI 的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。1.3.8 ClustalWClustalW 是一种渐进的多序列比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近

24、的序列并不断重新构建比对,直到所有序列都被加入为止。1.3.9 ClustalX在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。根据相似性分值继续分组比对,直到得到最终比对结果。在比对过程中,相似性程度较高的序列先进行比对而距离较远的序列添加在后面。1.3.10 Swiss-ModelSWISS-MODEL 是一项预测蛋白质三级结构的服务,它利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创建于 1993 年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。同源建模方法预测蛋白结

25、构一般包含以下四步:模板选择;目标序列模板序列比对;构建模型;评价。山东轻工业学院 2009 届本科生毕业论文11不断重复如上步骤直到找到一个令人满意的模型。SWISS-MODEL 开发了几套不同的建模技术。SWISS-MODEL 的预测方法可以被描述为以 螺旋和折叠为基础的“刚性片段组装 “。1.3.11 BLASTBLAST(Basic Local Alignment Search Tool)是一个 NCBI 开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST 是一套在蛋白质数据库或 DNA 数据库中进行相似性比较的分析工具。BLAST 程序能迅速与公开数据库进行相似性序

26、列比较。BLAST 结果中的得分是对一种对相似性的统计说明。现在常见的 BLAST 形式有五种,如下图名称 目的 方法BLASTP 蛋 白 序 列 到 蛋 白 库库 中 存 在 的 每 条 已 知 序 列 将 逐 一 地 同 所 查 序 列 作 一 对 一的 序 列 比 对BLASTX 核 酸 序 列 到 蛋 白 库先 将 核 酸 序 列 翻 译 成 蛋 白 序 列 , 再 对 每 一 条 作 一 对 一 的蛋 白 序 列 比 对BLASTN 核 酸 序 列 到 核 酸 库库 中 存 在 的 每 条 已 知 序 列 都 将 同 所 查 序 列 作 一 对 一 地 核酸 序 列 比 对TBLAS

27、TN 蛋 白 序 列 到 核 酸 库将 库 中 的 核 酸 序 列 翻 译 成 蛋 白 序 列 , 再 同 所 查 序 列 作 蛋白 与 蛋 白 的 比 对TBLASTX 核 酸 序 列 到 核 酸 库将 库 中 的 核 酸 序 列 和 所 查 的 核 酸 序 列 都 翻 译 成 蛋 白 , 这样 每 次 比 对 会 产 生 36 种 比 对 阵 列1.3.12 ORF开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。当一个新基因被识别,其 DNA 序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA 序列可以按六种框架阅读和翻

28、译(每条链三种,对应三种不同的起始密码子)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的山东轻工业学院 2009 届本科生毕业论文12DNA 序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF 的识别是证明一个新的 DNA 序列为特定的蛋白质编码基因的部分或全部的先决条件。1.3.13 FASTA 格式FASTA算法是 1985年由Pearson和Lipman提出并在1988年做了进一步改进的双序列比对启发式算法,采用了改进了的Wobir和Lipman 算法以集中反映具有显著意义的比对结果。其基本思想是:一个能揭示出真实序

29、列关系的比对至少包含一个两个序列都拥有的字(片段),把查询序列中的所有字编成Hash表,然后在数据库搜索时查询这个Hash表,以检索出可能的匹配,这样那些命中的字就能很快地被鉴定出来。算法过程简单描述为:(1)根据点阵图逻辑,从比对的所有结构中计算出最佳的对角线。(2)使用字符方法寻找查询字符和测试序列之间的精确匹配。(3)当所有的对角线发现之后,通过增加空位来连接对角线。(4)在最佳对角线区域中计算出比对结果。1.3.14序列比对算法评价目前生物信息学领域对于序列比对算法的评价有两个标准,一为算法的运算速度,二为获得最佳比对结果的敏感性。双序列比对中的典型算法Smith-Waterman、B

30、LAST 与FASTA,三者比较而言,Smith-Waterman敏感性最强,但算法的复杂度最高,需要在具有极高计算能力的超级计算机上实现。FASTA较mith-Waterman快速而精确性相近。 BLAST运算速度最快,但敏感性最差。多序列比对的典型算法主要是Clustal算法,此算法敏感性比较差,但目前在多序列比对中,尚缺乏比之更快速更有效的算法。由此可见,目前序列比对中面临的问题就是如何研究和设计同时能满足高敏感性和高速度的算法。1.4 多序列对比多序列对比就是把两条以上可能有系统进化关系的序列进行比对的方法。目前对多序列对比的研究还在不断前进中,现有的大多数算法都基于渐近的比对的思想,

31、在序列两两对比的基础上逐步优化多序列对比的结果。进行多序列山东轻工业学院 2009 届本科生毕业论文13比对后可以对比对结果进行进一步处理,例如构建序列模式的 profile,将序列聚类构建分子进化树等等。意义在于通过多个相关蛋白质的相似性,了解其在进化上亲缘关系的远近,推断分子起源的进化规律等。同时研究多个序列中的保守区域,就可以猜测这些区域对蛋白质结构、功能的重要性,从而进行分子设计。1.5 与古细菌糖酵解途径有关的酶类与古细菌糖酵解途径有关的酶主要有(1)ST2037-glycerate kinase 甘油酸激酶(2)ST1212-Enolas 烯醇化酶(3)ST0064- aldehy

32、de dehydrogenase 乙醛脱氢酶(4)ST1302- ribulose-5-phosphate isomerase 5-磷酸核酮糖异构酶(5)ST2268- transketolase 转酮醇酶(6)ST2269- transketolase 转酮醇酶(7)ST2245-Phosphoglucose isomerase 磷酸葡萄糖异构酶(8)ST2484-aldehyde oxidoreductase 乙醛氧化还原酶(9)ST2477- glyceraldehyde-3-phosphate dehydrogenase 甘油醛 3 磷酸脱氢酶1.6 选题的目的与意义山东轻工业学院 2

33、009 届本科生毕业论文14第二章 材料与方法2.1.1 材料各物种与古细菌糖酵解途径有关的酶的基因及蛋白序列从美国国家生物技术中心(NCBI)GenBank 下载。以下以烯醇化酶(ST1212)为例阐述方法步骤。2.1.2 方法(1)在 NCBI 网站(http:/www.ncbi.nlm.nih.gov/)上方搜索栏中输入ST2037(如图 1) 。图 1(2)选择蛋白质序列数据库(Protein:sequence database) 。(3)第一个既是 ST1212 基因在 GenBank 中的信息。其中ACCESSION:NP_377144 为此基因在 GenBank 中的序列号, O

34、RIGIN 表示编码该蛋白的氨基酸序列,为MNDYFRIKKIKGYQILDSRGNKTIRVKIETYGGISETGDAPAGASKGSREAIELRDKDGGVTRAVELVNTLINDSLRDFDVRNQLGIDQTLIRMDGTPNKSRVGGNTTIATSIAVAKTAAKAMGLEIFQYIGGPRVRYLPIPLLNILNGGLHAGNELKIQEFIIIPLSFDSFHEALYAADEVYKQLKGIITEKYGKLYTMLGDEGGVAPPLSKTEDALDLVYTAIKNSGYEDKIVMGIDAASSDFFNGSQYEIDGKKLSPDEMIDYYIQLASRYPLLYI

35、EDPFNENDFERFSILQQKLKKTIVTGDDLFTTNIEYLKKGIEKSSAKGTIVKPNQIGTLSETFEYIEFAKKNSIKIIVSHRSGETEDSFIADLAVGVQSDFIKTGAPARGERTSKYNRLLEIENDYGIEYYGKKIYLLEKVGRVIKTGYTFTNVNNVYVLEVT,ORGANISM 为含有该蛋白的物种。(4)点击下方的 CDS 得到编码该蛋白的 DNA 序列,为 5-ATGAATGACTATTTCAGAATCAAAAAAATAAAGGGTTACCAGATTCTTGATTCTAGAGGAAATAAAACAATCAGAGTTAAAATC

36、GAGACATATGGAGGAATATCAGAAACTGGTGACGCACCAGCTGGAGCATCAAAGGGTAGTAGAGAGGCGATAGAATTAAGGGACAAAGATGGAGGAGTAACTAGGGCAGTCGAGTTAGTAAATACCTTAATTAACGATTCCTTAAGGGATTTTGATGTAAGGAATCAACTAGGAATTGACCAAACATTGATAAGAATGGATGGAACACCTAATAAGTCAAGAGTAGGCGGAAATACAACTATAGCTACATCAATAGCTGTAGCTAAAACAGCTGCAAAAGCTATGGGGTTAGAAATTTTC

37、CAATACATAGGTGGGCCAAGAGTAAGATATCTGCCAATACCATTATTAAATATTTTAAATGGAGGATTACACGCTGGAAATGAACTAAAAATTCAGGAGTTTATTATAATACCTTTAAGTTTTGACAGCTTTCACGAAGCCTTATATGCTGCCGATGAAGTATACAAGCAGTTAAAGG山东轻工业学院 2009 届本科生毕业论文15GAATAATAACAGAAAAATACGGAAAACTTTATACAATGCTAGGAGATGAAGGAGGAGTAGCGCCACCATTATCTAAAACAGAAGACGCATTAGATTTAG

38、TATATACTGCTATAAAGAATTCTGGTTATGAGGATAAGATAGTAATGGGAATAGATGCAGCTTCTTCTGATTTCTTTAACGGAAGTCAATATGAAATAGATGGGAAAAAATTAAGCCCAGATGAGATGATAGATTACTACATCCAATTAGCTTCACGTTATCCGTTATTATATATAGAAGATCCTTTTAACGAGAATGATTTTGAGAGATTTTCTATTTTACAACAGAAGTTAAAGAAAACTATTGTTACTGGAGACGATTTATTTACCACTAACATTGAGTATCTAAAGAAAGGGATAG

39、AGAAAAGTTCTGCTAAAGGTACTATAGTTAAGCCTAATCAAATTGGTACTTTATCAGAGACATTTGAATACATAGAATTTGCGAAGAAAAATTCTATAAAAATAATTGTAAGTCATAGAAGTGGAGAGACAGAAGATTCTTTTATAGCTGATTTAGCTGTTGGAGTACAAAGTGATTTTATAAAGACTGGAGCACCAGCTAGAGGCGAAAGAACTAGTAAATATAATAGATTACTAGAAATAGAAAACGATTATGGAATAGAATATTACGGTAAAAAAATTTATCTTTAA-3。(5)酶类等电

40、点的查询。登陆 expasy(http:/www.expasy.ch/)点击右侧的 Proteomics and sequence analysis tools,选择等电点、分子量查询(Compute pI/Mw) 。然后将(1)步骤中搜索得到的氨基酸序列粘贴到对话框中运行即可得到结果,等电点:5.46;分子量:46304.64。(6)结构域的查询。完成上述步骤(1) ,选择基因数据库(Gene: gene-centered information) ,出现如图 2 所示。图 2点击基因片段选择保守结构域(Conserved Domains) ,如图 3 所示,得到其结构域。山东轻工业学院 2

41、009 届本科生毕业论文16图 3图 4山东轻工业学院 2009 届本科生毕业论文17图 52.2 结果与讨论2.1 同源性 blastp 搜索登陆 NCBI 的 blast 网站(http:/blast.ncbi.nlm.nih.gov/Blast.cgi)选择蛋白质blsat(protein blast) ,将步骤(1)中搜得的氨基酸序列粘贴到对话框中运算,默认所有参数,进行数据库相似性搜索,击中的序列有 100 条。结果如图 2、图 3。山东轻工业学院 2009 届本科生毕业论文18图 6图 72.2 用 ClustalW 做多序列比对选择图 7 中的五个蛋白,得到其氨基酸序列,用 fa

42、sta 格式粘贴至文本文档。格式如下:YP_256003.1 Sulfolobus acidocaldarius DSM 639 MNDRFRIRKLKGYEIIDSRANRTIRVRVETYDGIVGFGDAPAGASKGANEAVE山东轻工业学院 2009 届本科生毕业论文19LKDKNGRVIDAVELVNTVLSDSLKDYDVRRQRVIDTTLIRLDGTQNKSRIGGNTMIATSIAVLKTASRALGQEYFEYIGGPRAKYIPMPLLNILNGGLHAGNNLKIQEFIIIPKNFDKFTEAIQASIEVYKRLKDLITERYGKIYTALGDEGGFSPPLE

43、KTMDALDLVYTSIKSLGYEDKIFMGMDAAASNFFHESHYELDGKRYTAGELIDYYKQLADMYPLMYIEDPFEENDYDSFSQLQSKLKKTIVTGDDLYVTNIEYLKKGIERMSSKGTIVKPNQIGTITETLDYIDFARRNAVKTIVSHRSGETEDSIIADLAVGTQSEFIKTGAPSRGERTSKYNRLIEIELDYGLEFYGKNFYLYP_002832048.1 Sulfolobus islandicus L.S.2.15 MINRFSIEKVKGLEIIDSRGNPTIRVFVRTNDGVESFGDAPAGASKGTRE

44、AIEVRDENGLTVKRAVDIANYIIDPALHGIDVREQGIIDKILIDIDSTENKSKLGGNTIIATSIAALKTASKALGLEVFKYIAGPRLPKIPIPLLNIINGGLHAGNKLKIQEFIILPIKFNTFKEAFFAAIEVYRNLKGLISERYGKIYTAVGDEGGFSPPLEETREALDLIYTSINNAGYQGKIYMGMDAAASDFYDPKKEKYIIDGKELNPTQLLEFYLDLAKEYPIVYLEDPFEENSFDMFGELQNKLNSTIVTGDDLYTTNIKYLKIGIEKRSTKGVIVKPNQVGTISETFEFTNL

45、ARRNSIKLVTSHRSGETEDNFIAEFAVGIESDFIKTGAPARGERTSKYNKLLEIENKFGLEYGGKYFYL|YP_919525.1 cMTMRYNMEDEFSITHVKARWVLDSRGNPTVEAEVRTFAGGYGSAIVPSGASTGTHEALELRDGGKRFHGKGVSKAVENVNKIIAPEILGEDSRKQEEIDSKMISLDGTPNKSRLGANAILSVSLAVAHAAADTYGLPLFQYLGGALASTLPVPLMNIINGGKHAGNELKIQEFLIVPVGASSFSEALAIGSEVYHSLRGYLKEKYGVSAINVGDEGG

46、FAPPMSRTREALDALIHAVKNAGYEPGRDVVLALDAAASEFYDEKRGVYAIDGAELTREKLIEFYESLVEEYPIVSIEDPLYEEDFEGFAEVTRSLKIQVVGDDLFVTNVERLRRGIEAGAANALLLKVNQIGTLTEALSAARMALENNYSVIVSHRSGETEDVTISHIAVALNAGQIKTGAPARSERNAKYNELLRIEEYLGGRARYPGIKAFKAYKRTLYP_001041273.1Staphylothermus marinus F1MTYTTYTTVLDDMFKIKAVRGRYILDSRGNPTVQVKVVT

47、EGLGVGVAAAPSGASTGIHEAVEVRDGGKEFHGKGVRKAVDNVNTIIAPAITGMDSRRQVEIDYKMIEIDGTENKSRLGGNAIIATSLAVAKAAASTMKIPLYYYIGGKQANILPVP山东轻工业学院 2009 届本科生毕业论文20MLNIINGGVHAGNKLDFQEFMIVPAGFNSFHEALRAAVETYHELKRILKEKYGSSAINVGDEGGYAPPLEKIRDALDLLMEAIKSAGYSPGKEIALALDAASSQFYNKEKKVYVVEGRELTRDQMIELYEELVNDYPIVSIEDPLYEEDYDGFAEITKRL

48、GDKVLIVGDDLFTTNPKRLSKGIEVGAANAILVKVNQIGTLTETMEVVRLAHIHNYRTIISHRSGETEDTTIADLAVGLNAGLIKTGAPARGERTAKYNRLLEIEEELEKPMYLGFQLFPRKPYP_001467589.1 Campylobacter concisus 13826MVFIEDVEAHEVLDSRGNPTVRATVRLSDGTEASAIVPSGASTGKREALELRDKDDRYAGKGVLKAVSNVNEKIAEAVIGLDAYNQKAVDAEMLELDGTHNYSNLGANAVLGVSMAVARAAAKSLNIPLYRYLG

49、GANASILPVPMFNIINGGAHANNSVDFQEFMIMPFGFSTFSEALRAATEIYHKLKSILNAAGHSTAVGDEGGFAPNLKDNEEPLKLISQAVKEAGYELGSQIKLALDVASSELYKDGKYELEGKKFSSAELISYYEKLCEKYPIFSIEDGLSEDDWSGWAELTKRLGSKVQLVGDDLFVTNEKILREGIEKNIANAILIKPNQIGSVTQTMQTVRLAQRNGYRCIMSHRSGESEDAFIADFAVALNTGEIKTGATSRSERNAKYNRLLEIELEAGEFLGDNI。登陆网页版 Clustal W(http:/www.ebi.ac.uk

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报