1、南京邮电大学本科生毕业设计(论文)南京邮电大学毕 业 设 计 ( 论 文 )题 目 miR-430 基因簇的生物信息学分析专 业 生物医学工程学生姓名 王凯班级学号 B09090321指导教师 李小慧评阅教师指导单位 地理与生物信息学院日期: 2013 年 3 月 1 日至 2013 年 6 月 1 日毕业设计(论文)原创性声明本人郑重声明:所提交的毕业设计(论文) ,是本人在导师指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容外,本毕业设计(论文)不包含任何其他个人或集体已经发表或撰写过的作品成果。对本研究做出过重要贡献的个人和集体,均已在文中以明确方式标明并表示了谢意。论文作者
2、签名:日期: 年 月 日摘 要microRNAs (miRNAs) 是由基因组非蛋白质编码序列编码的一类小 RNA(19-24 nt), miRNA 与靶基因的转录产物互补结合,导致 mRNA 降解、翻译抑制, 调节靶基因的表达。miRNA 对动植物的生长、发育等各种生命活动发挥着至关重要的调节作用。通常多个 miRNA 基因在染色体上聚集排列形成 miRNA 基因簇,这些 miRNA 基因簇在不同物种中有较高的保守性,miRNA 基因簇在功能上比单个 miRNA 的作用更高效,对 miRNA 基因簇进行研究,有利于深入了解 miRNA 所参与的复杂调控网络。miR-430 基因簇最早在斑马鱼
3、中被发现,是目前已知的最大的 miRNA 基因簇之一。miR-430 簇分布在斑马鱼 4 号染色体上约 20kb 的一个区域内,三个miRNA(mir-430a,c 和 b)组成了三联体,并以此为基本单元进行复制。miR-430在早起胚胎发育中丰度最高,通过抑制和降解母源基因在母源调控向合资调控的转换过程中起到重要作用。本课题主要开展miR-430基因簇分子进化分析研究。主要的步骤:从miRBase数据库中获得数据,即已知的mir-430基因的成熟序列。根据斑马鱼、青鳉、红鳍东方鲀等物种的mir-430基因的成熟序列通过同源性对比的方法在所有动物物种中进行搜索,利用 BLAST软件进行相似性比
4、较的分析。利用CLUSTALW软件进行渐进的多序列比对。利用MEGA 4.1软件,以mir-430基因簇中的mir-430成员成熟序列构建系统进化树。本课题的目的主要是根据 miRNA 基因在物种间的保守性,利用生物信息学同源性搜寻、对比的方法,探讨 miR-430 基因簇的分子进化规律,揭示 miR-430 基因簇的起源及相关物种的进化关系,为其调控网络的研究提供理论基础。关键词:MIR-430、NCBI、Blast、ClustalW、MEGA 4.1ABSTRACTmicroRNAs (miRNAs) are a class of small non-protein coding sequ
5、ence encoded by the genome RNA (19-24 nt) miRNA target gene transcripts complementary binding, leading to mRNA degradation, translational repression, regulate expression of target genes. miRNA growth, development and other activities of life on plants and animals play a crucial regulatory role. Usua
6、lly multiple miRNA genes are arranged to form miRNA gene cluster on chromosome gathered, these miRNA gene clusters were conserved in different species, miRNA gene clusters are functionally more efficient than a single miRNA miRNA gene cluster study , is conducive to the understanding of miRNA involv
7、ed in complex regulatory networks.miR-430 gene cluster was first found in zebrafish, is the largest known miRNA gene cluster one. miR-430 cluster located within an area of about 20kb zebrafish chromosome 4, three miRNAs (miR-430a, c and b) the triplet, and use it as the basic unit of replication. mi
8、R-430 in early embryonic development in the abundance of the highest in the maternal regulation play an important role in the conversion process of joint control by inhibiting the degradation of the maternal gene.Topics using molecular evolution analysis. Main steps: data obtained from the miRBase d
9、atabase, each species precursor of miR-430 gene sequence. Precursor sequence of miR-430 gene in zebrafish, medaka, red fins puffer species by homology comparison method in all animal species to search using BLAST software for the analysis of the similarity comparison. Use of CLUSTALW Software progre
10、ssive multiple sequence alignment. Use MEGA 4.1 software, the precursor sequence of miR-430 members of the miR-430 gene cluster phylogenetic tree was constructed.The purpose of this project is based on miRNA genes conserved between species, bioinformatics homology search, contrast, investigate the m
11、olecular evolution of miR-430 gene clusters law, to reveal the origin of the miR-430 gene cluster and relatedthe evolutionary relationships of the species, for the study of regulatory networks provide a theoretical basis.KEY WORD :MIR-430; NCBI;Blast;ClustalW;MEGA 4.1目 录第一章 引言 .11.1 miRNA 生物发生及作用机制
12、.21.1.1 miRNA 的生物发生 .21.1.2 miRNA 作用机制 .21.2 miRNA 基因的结构特征 .31.3 miRNA 命名规则 .31.4 miRNA 相关功能 .41.4.1 miRNA 对动物发育的调控作用 .41.4.2 miRNA 对动物疾病发生的影响 .51.4.3 miRNA 对动物细胞增殖和凋亡的影响 .51.5 miRNA 鉴定方法 .61.6 miRNA 对基因表达的影响 .71.6.1 miRNA 对靶基因表达的整体调节作用 .71.6.2 miRNA 与靶基因表达的关联效应 .71.6.3 miRNA 在小鼠不同发育阶段对靶基因表达谱影响 .81.
13、6.4 miRNA 对靶基因表达调控的倾向性 .81.7 miRNA 基因进化模式 .81.7.1 miRNA 基因簇进化 .91.7.2 miRNA 基因家族进化 .9第二章 miRNA-430 基因家族进化及功能分析 .102.1 miRNA-430 的分布与串联复制 .102.2 miRNA-430 的功能和特点 .10第三章 miRNA-430 基因簇分析使用软件介绍 .123.1 miRBase 数据库 .123.2 NCBI .133.3 BLAST 软件 .143.4 CLUSTALW 软件 .153.5 MEGA 4.1 软件 .15第四章 miRNA-430 基因分子进化研究
14、 .174.1 数据与方法 .184.1.1 数据 .184.1.2 序列对比分析方法 .184.2 已知的 mir-430 基因簇的分析 .184.2.1 已知的 mir-430 基因簇序列处理 .184.2.2 利用 CLUSTALW 软件对 mir-430 基因簇进行多序列比对 .194.2.3 利用 MEGA 4.1 软件构建系统进化树 .204.3 其他 mir-430 基因簇的搜索与分析 .234.3.1 通过 NCBI 搜索 mir-430 基因簇的序列 .234.3.2 物种序列命名 .244.3.3 将命名后的基因簇做成 FASTA 文件 .254.3.4 利用 CLUSTA
15、LW 对物种的 mir-430 基因簇进行多序列比对 .264.3.5 利用 MEGA 4.1 软件构建 mir-430 基因簇的系统进化树 .284.4 讨论 .31第五章 全文总结 .32结束语 .33参考文献 .34致谢 .35附录 .36南京邮电大学 2013 届本科生毕业设计(论文)1第一章 引言1958 年,DNA 双螺旋结构的发现者之一,佛朗西斯.克里克 1提出了分子生物学的中心法则,即“遗传信息从 DNA 传递给 RNA,再从 RNA 传递给蛋白质,完成遗传信息的转录和翻译的过程,也可以从 DNA 传递给 DNA,完成DNA 的复制过程” 。这是所有具有细胞结构的生命所遵循的普
16、遍法则。根据这一原理,RNA 分子在生命过程中主要起信息传递,指导细胞蛋白质合成的作用。然而,,随着近年来非编码 RNA 分子,特别是 microRNA(miRNA)的发现,这一原则正遇到越来越多的挑战。miRNA 是一类长度约为 22 个核普酸的内源性非编码 RNA 分子,可通过干扰 mRNA 指导蛋白合成过程,负向调节蛋白编码基因的表达。作为一类进化上保守的、起重要调控作用的分子,miRNA 通过与靶标 mRNA 分子 3一非编码区(3.-untranslated region,3-UTR) 完全或非完全互补结合,miRNA 能有效抑制相关蛋白的合成,或导致靶 mRNA 降解,产生基因沉默
17、效应。研究表明,miRNA 可能为调节基因表达的转录后调控的中心分子。目前已在多个门类的生物中发现 miRNA 的存在,包括植物、动物、某些病毒和藻类等。研究表明 miRNA 可能存在于所有多细胞生物以及少数单细胞生物中,起基因表达调控的作用。早在 1993 年,Lim 等人 2采用定位克隆的方法在线虫(Caonorhabdttis legans)中发现了第一个 miRNA 分子 lin-4。Lin-4 基因不编码蛋白,,而是产生一种小分子RNA,, 这种小分子 RNA 能与靶 mRNA 的 3-UTR 相互作用,从而抑制 Lin-14基因表达。Lin-4 的缺失导致线虫幼虫由 L1 期向 L
18、2 期的转化发生障碍。这一发现当时并未引起人们重视,直到 2000 年第二个 miRNA 一 let-7 的发现,miRNA 在基因表达调控领域的重要作用才逐渐被人们所认识。与 lin-4 类似,let-7 与 lin-41 基因的 3-UTR 互补结合抑制其蛋白表达。Let-7 序列与行为模式在包括人类在内的多个物种中高度保守,暗示了 miRNA 的调控行为可能是一种普遍的模式。目前己有数以千计的 miRNA 在不同物种中被发现。迄今为止,在 miRBase 数据库中己有 15,172 条己注释的 miRNA 序列。其中包括:1048 条人类 miRNA,672 条小鼠 miRNA,176
19、条果蝇 miRNA,175 条线虫 miRNA 以及 213 条拟南芥 miRNA。预计在人类基因组中编码的 miRNA 分子的基因总数可能占到基因总数的 2-3%,它们可能多种物学过程中扮演了重要的角色。己证实 miRNA 参与到包括胚胎发育、细胞凋亡、细胞分裂、分化、死亡、造血作用、癌症发生以及病毒感染等多种基因表达调控途径。对这些小分子 RNA 相关的生物信息学与进化分析的基因序列、加工表达方式、功能等方面的研究表明其系统发育广泛性与进化保守性的特点,暗示了其在生命活动中复杂的调节方式,并可能对构建多细胞组织起精确调控遗传网络的作用。南京邮电大学 2013 届本科生毕业设计(论文)21.
20、1 miRNA 生物发生及作用机制1.1.1 miRNA 的生物发生miRNA 的生物发生是一个多步骤过程。以动物为例,多数 miRNA 过 RNA聚合酶,少数通过 RNA 聚合酶转录为长度在数百至数千核普酸的初级转录本,初级转录本其 5-端多具有 7-甲基鸟嘿吟帽子,3-端具有 poly(A)结构。在细胞核中,初级转录本在辅助因子 DGCR8 帮助下被核酸酶 Drosha 加工成长度约为 60-80nt 的非完全互补茎-环结构,称为前体 miRNA。前体 miRNA 在辅助因子 Ran 的参与下,与细胞膜转运蛋白 Exportin-5 结合,,由细胞核转移至细胞质中,这一过程需要以及 GTP
21、 的水解提供能量。在细胞质中,前体 miRNA在另一种核酸酶 Dicer:及其辅助因子 TRBP 作用下,,被进一步切割为 18-24nt的双链 miRNA 分子。其中的一条或两条链同时作为成熟的 miRNA 分子与蛋白质结合形成核糖核蛋复合体 miRNP,或称为 RNA 诱导沉默复合物,其后miRNA 通过与靶基因 mRNA3-UTR 区互补配对,发挥基因表达调控作用。植物细胞中 miRNA 的发生过程与动物 miRNA 稍有不同,其加工过程主要在细胞核内完成。Pri-miRNA 在细胞核内由 Dieer-like protein 和其他蛋白,如 HYLI 的参与下加工为 pre-miRNA
22、,pre 一 m1RNA 进一步被 DCLI 加工为 miRNA-miRNA*双链复合体,之后被 HENI 蛋白甲基化后在 HASTY 蛋白(与动物ExPortin-5 基因同源)的协助下从细胞核运往细胞质,在解旋酶作用下加工为成熟的 miRNA,降解特定的靶基因。1.1.2 miRNA 作用机制miRNA 与靶标 mRNA 通过碱基互补配对而发生作用,通常 miRNA5-端的第 2-8 个核普酸对于 miRNA 发挥调节功能至关重要,这段区域与 3-UTR 靶位点完全互补配对,被称为 seed 区,其在同源 miRNA 中通常保守。miRNA 靶序列在不同物种中也通常保守。已证实 miRNA
23、 主要存在两种不同的作用机制:降解 mRNA 或抑制 mRNA 翻译。通常情况下,如果 miRNA 与 mRNA 的 3-UTR 非完全互补结合,则 mRNA 不被降解而产生翻译抑制,如果二者具有较高互补程度或完全互补,则导致 mRNA 降解。通常认为在动物细胞中 miRNA与靶基因序列具有较弱的互补性,多导致翻译抑制。通过高通量表达谱分析表明,,动物 miRNA 对多个 mRNA 同时产生降解作用,造成靶基因 mRNA 表达水平的不同程度的下降也可能是一种普遍的现象。相对而言,在植物细胞中 miRNA 通常与靶基因有较高程度的配对,因而多导南京邮电大学 2013 届本科生毕业设计(论文)3致
24、靶 mRNA 的降解,而较少看到翻译抑制的现象存在 ,,如 miR-39 或 miR-171与其靶 mRNA 完全互补,切割降解靶基因 mRNA。1.2 miRNA 基因的结构特征miRNA 基因通常位于蛋白编码的基因间区域,约有三分之一的 miRNA 位于已知蛋白编码基因内含子区的有义或反义链上,miRNA 前体在同一或不同染色体中常呈单拷贝或多拷贝存在,2-3 个甚至更多个 miRNA 基因排列在一起,共同转录为多顺反子 RNA。例如 miR-17-92 基因簇,在人类中共由 6 个成员组成,而在果蝇中则由 8 个成员组成。Ambros 等人 3提出了 miRNA 基因识别与鉴定的一系列标
25、准:(l))通过 Northem 等方法可以从 RNA 样品中检测到 22nt 左右的转录本;(2)) 由分级分离得到的 RNA 分子构建的 cDNA 文库中得到的长度为 22nt左右的序列,这些序列必须精确地与来源生物的基因组序列相匹配;(3)) 具有可以预测的发夹结构前体,在其中一条臂上具有成熟的 miRNA分子。该发夹结构必须具有最低的能量状态,并且在发夹结构的其中一条臂上必须含有 22 核普酸中的至少 16 个,预测的前体 miRNA 二级结构中不应该有大的内部环、泡等结构。在动物中,该发夹结构通常为 60-80nt,而在植物中该前体长度变化较大,甚至可能达到数百 nt;(4)) mi
26、RNA 及其发夹结构前体在进化上高度保守。保守的发夹要符合标准 3 中最少配对碱基数的要求,但不必是能量最低;(5)) 如果 Dieer 功能降低或丧失,应可检测到前体 miRNA 分子在细胞内积累。1.3 miRNA 命名规则由于发现的 miRNA 数量众多,为防止混淆,除最早发现的 lin-4,let-7 及lsy-6 之外,研究者们对于其他 miRNA 统一用 miR-#(#为数字)表示,其基因则记为 mir-#(#为相应数字)。高度同源的 miRNA 在其后加英文字母加以区别,多拷贝 miRNA 基因再其后再加数字。( (1) )除了 lin-4 和 let-7 外,其他 miRNA
27、统一用 miR-#(#为数字)表示,mir-#(#代表数字)表示相应的编码基因。((2))高度同源的 miRNA 在#后加英文小写字母(般从 a 开始)。((3) )多基因拷贝的在后面加-No( 如 miR-2a-I)。之后人们又对命名规则作了补充。不同物种中同源的 miRNA 最好用同一个名字;如果一个前体的两条臂上分别产生一个 miRNA,则根据克隆实验,观南京邮电大学 2013 届本科生毕业设计(论文)4察成熟产物,次要的在后面加“*” 号,如果蝇的 miR-306 与 miR-306*(*表示量少的):如果不能区分表达量的多少,可以如下表达:如拟南芥的 miR-835-5p 和miR-
28、835-3p(5p 表示在 5端的臂上,3p 表示在 3端的臂上 )。1.4 miRNA 相关功能首先,miRNA 的生成过程起始于 pri-miRNA 的产生,,它由细胞核内编码miRNA 的基因转录生成,长度为几百到几千个核苷酸。Lee 等 人证明其中一大类 miRNA 由多聚酶(Pol)转录,,而且一些 miRNA 的转录本(如 let-7)具有 5帽和 3poly(A)的结构。 Rodriguez 等 在基因组水平对 miRNA 的转录也进行了分析,哺乳动物中由内含子编码的 miRNA,其转录酶应该是 Pol。其次, pri-miRNA 在核内被 RNase 核酸酶 Drosha 加工
29、成长约 70nt 的发夹状的pre-miRNA。在这个过程中 , Drosha 和另外的一些成分(如人类中的 DGCR8 蛋白、果蝇中的 Pasha 蛋白)构成一个微小 RNA 处理器(microprocessor)的复合体, pri-miRNA 在这个 microprocessor 中被加工成 pre-miRNA。最后, pre-miRNA 在 Ran-GTP 依赖的核质/ 细胞质转运蛋白 exportin5 的作用下,从核内运输到胞质中。能与 exportin5 结合的 pre-miRNA 必须具有大于 16nt 配对的茎和 3末端有 2 个悬垂碱基的结构特点。胞质中 pre-miRNA
30、在 Dicer 酶的作用下,被切割成双链的 miRNAmiRNA*配对分子,然后成熟的 miRNA 分子被解链, 单链的 miRNA 进入一个核糖蛋白复合体 miRNP(也叫 RISC), 通过与靶基因的3UTR 区互补配对, 指导 miRNP 复合体对靶基因 mRNA 进行切割或者翻译抑制。MiRNA 到底是抑制还是切割取决于 miRNA 与靶序列互补配对的程度,互补配对高的可能进行切割,而配对低的就只是抑制。近年来,关于 miRNA 的研究已经从识别 miRNA、阐明其作用机制,转移到鉴定其功能。并且,随着生物信息学的预测方法、原位杂交、过量表达、基因沉默技术等的发展, 一些 miRNA
31、的功能已经得到确认。这些 miRNA 的作用遍及生命体的发生、生长、发育、分化、信号转导、疾病和死亡的过程。总的来说,miRNA 对动物的负调控作用具体体现在如下三点:1.4.1 miRNA 对动物发育的调控作用通过 DNA 芯片技术,Krichevskv 等 4在 2003 年证明了在哺乳动物脑发育阶段 miRNA 表达的精确调控,约有 20的 miRNA 的表达发生了显著变化,其中 miR19 和 miR131 表达失调时,无早衰素的老鼠表现出严重的大脑缺陷;随后相继发现,miRNA 在调控线虫神经系统发育过程中发挥重要作用;美国哈佛医学院的研究人员研究发现,miRNA 通过转录后抑制 HOX 基因表达,在脊