收藏 分享(赏)

利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc

上传人:无敌 文档编号:604649 上传时间:2018-04-14 格式:DOC 页数:45 大小:1.09MB
下载 相关 举报
利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc_第1页
第1页 / 共45页
利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc_第2页
第2页 / 共45页
利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc_第3页
第3页 / 共45页
利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc_第4页
第4页 / 共45页
利用生物信息学方法对基质细胞衍生因子1(sdf-1)进行基因序列和蛋白质序列分析毕业论文.doc_第5页
第5页 / 共45页
点击查看更多>>
资源描述

1、利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 1 页 共 45 页前 言动脉粥样硬化(Atherosclerosis,As)是由多因素所致的血管炎症性疾病,其病变特点之一是动脉粥样硬化斑块部位有炎症细胞的浸润,巨噬细胞源性泡沫细胞是动脉粥样硬化早期的重要事件。实验报道,动脉粥样硬化病变部位的趋化因子较正常高。趋化因子是由不同类型的细胞分泌的低分子量(8-10KD) 的与白细胞趋化和激活有关的蛋白质。到目前为止已发现 50 多种,按照 NH2-半胱氨酸基序的不同,可将趋化因子分为 4 个亚家族,即 C、CC、CXC 和 CX3C。趋化因子受体是 G

2、PCR(G-protein-coupled receptors)超家族成员,是一族与 G 蛋白偶联的、具有 7 个疏水的跨膜结构的受体。它广泛表达于各类淋巴细胞、内皮细胞、神经元等。趋化因子在动脉粥样硬化发生中起着主导作用,针对趋化因子及其受体的干预药物,应用于动脉粥样硬化的治疗将有着诱人的前景。基质细胞衍生因子-1(stromal cell-derived factor-1 alpha, SDF-1)及其特异受体 CXCR4 在胚胎发育、肿瘤细胞迁移及介导免疫缺陷病毒(HIV) 感染中发挥重要作用,最近又在动脉粥样硬化斑块中发现 SDF-1 高表达,SDF-1/CXCR4 与动脉粥样硬化的关

3、系已经引起重视,从生物信息学角度对其进行分析有重要的意义。生物信息学主要是利用生物学数据库,运用计算机、网络及生物学软件,对海量生物原始数据进行基因组序列注释,以作为科研的实验依据。从生物信息学研究的角度出发主要有三大类方法可用于大通量的基因组功能注释工作: 用最大相似的同源基因的功能注释咨询序列; 用模体(MOTIF) 搜索,因为模体往往是功能相关的保守序列; 直系同源簇方法 (cluster of orthologous group, COG),即用不同种族的基因成对相似聚类法把它们划分成各种直系同源簇,从而可以用同一簇中的已知基因注释未知基因。同时结构基因组的研究使得三维结构模建和结构类

4、的识别成为基因组功能注释的一个重要方面 13。我们选择该序列进行研究。从核酸和蛋白质两个方面对 SDF-1 进行详尽的生物信息学分析。核酸分析方面主要分析其核酸序列的基本性质,如限制性酶切位点,基因组在染色体上的定位。蛋白质分析方面,首先分析 SDF-1 序列利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 2 页 共 45 页的基本性质,包括氨基酸组成、分子量、等电点、亲疏水性、蛋白酶切位点、信号肽,分析其二级结构和三级结构,重点分析其保守结构、模体(motif) ,分子立体结构的裂口和穴,A、B 链间的相互作用,配基,多重序列比对,进化分析等。研

5、究目的:通过以上过程,搜寻并整理网上储存的 SDF-1 信息,进一步熟练巩固生物信息学课程的理论与实践知识,熟练操作 Bioedit、DNAMAN 等生物信息学分析软件,为生物信息学课程建设提供和补充新的血液,并以 SDF-1 为入口,学习与研究生物信息学方面的前沿知识和更新后的软件操作,得到 SDF-1 基因和蛋白方面的资料,配合正在开展的对 SDF-1 基因的研究,分别从氨基酸序列和空间构象入手搜寻 SDF-1 的相似分子,为进一步研究该基因的调控及以此为靶点的药物筛选收集信息,并从分子水平分析 SDF-1 分子结构与功能的关系,重点研究其趋化功能相应的分子结构。利用生物信息学方法对基质细

6、胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 3 页 共 45 页一、 生物信息学分析(一)工具与方法采用 Bioedit7.0 和 DNAMAN3.0 分析软件工具和在线有关蛋白质和核酸方面的分析软件,分别进行核酸和蛋白质两个方面的分析。核酸分析首先从 pubmed 核酸数据库中搜索到人的 SDF-1A 链核酸序列,分别进行序列的基本性质分析,限制性酶谱分析及其基因在染色体上的定位分析。具体操作方法将根据上述各个软件上“Help” 文件进行,基因在染色体上的定位分析根据网页上的操作说明进行。从 pubmed 蛋白质数据库中搜索到人的 SDF-1A 链、 B 链和整个前体

7、SDF-1 蛋白质序列,分别进行蛋白序列的基本性质分析(氨基酸组成、分子量、等电点) ,亲疏水性分析,蛋白酶切位点分析,信号肽序列分析,二级结构和三维结构分析,同源序列和进化分析。二级结构分析包括结构功能域、Motif 、保守位点、AB 链间的相互作用及离子配基等,具体操作方法将根据上述各个软件上“Help” 文件和网页上的操作说明进行。(二)结果PDB 入口从下表可见,人的 SDF-1 有“a ”、 “b”两条链,其可形成 2具体,但它的活性形式为单链,通常讲的 SDF-1 就是指其“a”链。另外表中还有 PDBid(1a15)及系统入口编号(P48061) 。PDB Id: 1a15Nam

8、e: ChemokineTitle: Sdf-1alpha Structure:Stromal derived factor-1alpha. Chain: a, b. Synonym: sdf-1. Engineered: yes. Mutation: n33aSource: Synthetic: yes. Homo sapiens. Human. Other_details: chemically synthesizedUniProt: Chains A, B: P48061 (SDF1_HUMAN) Pfam利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析

9、毕业论文第 4 页 共 45 页表 1.SDF-1 蛋白数据库入口1核酸序列分析 SDF-1 的核酸序列的基本性质分析:分析结果显示:我们获得 SDF-1cDNA 序列长度为 279bp,其分子量为:ssDNA:84.55KDa,dsDNA:169.70KDa.四碱基的含量分别为:A: 26.16%,C: 21.86%,G: 29.39%,T: 22.58%.ORIGIN 1 ccatggacgc caaggtcgtc gctgtgctgg ccctggtgct ggccgcgctc tgcatcagtg61 acggtaagcc agtcagcctg agctacagat gcccctgcc

10、g attctttgag agccatgtcg121 ccagagccaa cgtcaaacat ctgaaaatcc tcaacactcc aaactgtgcc cttcagattg181 ttgcaaggct gaaaagcaac aacagacaag tgtgcattga cccgaaatta aagtggatcc241 aagagtacct ggacaaagcc ttaaacaagt aagcacaaca gcccaaagga cttDNA molecule: Length = 279 base pairsMolecular Weight = 84555.00 Daltons, sin

11、gle strandedMolecular Weight = 169700.00 Daltons, double strandedG+C content = 51.25%A+T content = 48.75%Nucleotide Number Mol%A 73 26.16C 61 21.86G 82 29.39利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 5 页 共 45 页T 63 22.58图 2-1 SDF-1cDNA 的碱基组成 限制性酶切分析 限制性酶切分析是分子生物学实验中的日常工作之一。 利用 DNAMAN 软件分析该基因 cDN

12、A 序列的限制性内切酶的酶切位点,分析结果如下:该基因序列含有 24 种限制性内切酶的酶切位点(这 24 种限制性内切酶为TspDTI、MwoI 、Bpu10I、AgeI、HpyF10VI、BseMII、BspCNI 、BsaWI、BsrFI、BceAI、Cac8I 、ApoI、BbvI、HphI 、BssHII、HgaI、AlwI、 PstI、 SfcI、Hpy188III、HaeII、AclI、AfeI、DraI ) 。同时,从图(2.2)中我们获得了这些内切酶在 SDF-1 基因上的具体酶切位点。Restriction Enzyme Map:1 ATGAACGCGAAAGTGGTGGTG

13、GTGCTGGTGCTGGTGCTGACCGCGCTGTGCCTGAGCGATGGCAAACCGGTGAGCCTGAG 801 TACTTGCGCTTTCACCACCACCACGACCACGACCACGACTGGCGCGACACGGACTCGCTACCGTTTGGCCACTCGGACTC 80TspDTI MwoI Bpu10I AgeI Bpu10I HpyF10VI BsaWI BseMII BsrFI BspCNI BseMII BspCNI81 CTATCGTTGCCCGTGCCGTTTTTTTGAAAGCCATGTGGCGCGTGCGAACGTGAAACATCTGAAAATTCTGA

14、ACACCCCGA 16081 GATAGCAACGGGCACGGCAAAAAAACTTTCGGTACACCGCGCACGCTTGCACTTTGTAGACTTTTAAGACTTGTGG利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 6 页 共 45 页GGCT 160BceAI HpyF10VI Cac8I ApoI BbvI HphI MwoI 161 ACTGCGCGCTGCAGATTGTGGCGCGTCTGAAAAACAACAACCGTCAGGTGTGCATTGATCCGAAACTGAAATGGATTCAG 240161 TGACGCGCGA

15、CGTCTAACACCGCGCAGACTTTTTGTTGTTGGCAGTCCACACGTAACTAGGCTTTGACTTTACCTAAGTC 240BssHII HgaI AlwI Hpy188III Cac8I PstI SfcI 241 GAATATCTGGAAAAAGCGCTGAACAAACGTTTTAAAATG 279241 CTTATAGACCTTTTTCGCGACTTGTTTGCAAAATTTTAC 279Hpy188III HaeII AclI AfeI DraI 图2.2 SDF-1的 cDNA限制性酶谱分析 从 NCBI 查询 SDF-1 基因在人类基因组中的定位基因组的定位

16、分析显示,该基因定位在第 10 号染色体长臂的第一区第一亚区,第 2 小区内。红色部分 CXCL12 指示 SDF-1 基因的具体位置。(http:/www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=9606DE SDF-1-alpha(3-67).OS Homo sapiens (Human).利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行基因序列和蛋白质序列分析毕业论文第 9 页 共 45 页The computation has been carried out on the complete sequence. Molecu

17、lar weight: 10665.85 Theoretical pI: 9.92 IEP of FastaSequence from 1 to 67 Isoelectric Point = 10.3329 pH Bound Charge pH Bound Charge1.00 25.99 14.99 8.00 17.87 6.871.50 25.98 14.98 8.50 16.49 5.492.00 25.94 14.94 9.00 14.99 3.992.50 25.81 14.81 9.50 13.74 2.743.00 25.47 14.47 10.00 12.30 1.303.50

18、 24.67 13.67 10.50 10.24 -0.764.00 23.39 12.39 11.00 7.80 -3.204.50 22.15 11.15 11.50 5.79 -5.215.00 21.38 10.38 12.00 4.24 -6.765.50 20.97 9.97 12.50 2.65 -8.356.00 20.55 9.55 13.00 1.25 -9.756.50 19.97 8.97 14.00 0.16 -10.847.00 19.34 8.347.50 18.74 7.74 图 3-1 SDF-1 的等电点分析利用BioEdit软件进行其详细的理化参数分析:从

19、表2和图3-2氨基酸组成来看,该蛋白序列含有较多的碱性氨酸,特别是赖氨酸(Lys,占10.45)和精氨酸(Arg,占7.46) ,其所含酸性氨基酸较少,如天冬氨酸(Asp,占1.49 ) 、谷氨酸(Glu,占4.48) ,另外,其序列中含的非极性氨基酸最多的是亮氨酸(Lue,占11.94) ,其次是异亮氨酸(Ile,占5.97)为其二级结构的螺旋和折叠片的形成打下基础。序列中含有一定数量的带羟基的氨基酸,如丝氨酸(Ser,占4.48) ,苏氨酸( Thr,占1.49 )和酪氨酸(Tyr,占2.99) ,这为该蛋白的磷酸化修饰打下了基础。利用生物信息学方法对基质细胞衍生因子 1(SDF-1)进行

20、基因序列和蛋白质序列分析毕业论文第 10 页 共 45 页Amino Acid Number Mol%Met M 0 0.00Asn N 7 10.45Pro P 4 5.97Gln Q 3 4.48Arg R 5 7.46Ser S 3 4.48Thr T 1 1.49Val V 5 7.46Ala A 5 7.46Cys C 4 5.97Asp D 1 1.49Glu E 3 4.48Phe F 2 2.99Gly G 0 0.00His H 2 2.99Ile I 4 5.97Lys K 7 10.45Leu L 8 11.94Trp W 1 1.49Tyr Y 2 2.99表 2:SDF-1 蛋白的氨基酸组成 protein:Length = 67 amino acidsMolecular Weight = 7834.88 Daltons

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 管理论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报