1、拼起来的课程论文 主干部分忘了是哪个高人写的了- -高等真核生物中重叠基因研究进展摘要 基因重叠是高等真核生物中一种普遍存在的基因组排现象综述了高等真核生物中的重叠基因的分类、数量、互补或自然反义转录本()可能的生物特性和功能及重叠基因与人类疾病的关系关键词 真核生物;重叠基因;反义转录本;双链();基因调控真核生物的细胞内含有成形的细胞核,因此以真核来命名这一类细胞。许多真核细胞中还含有其它细胞器,如线粒体、叶绿体、高尔基体等,是所有单细胞或多细胞的、其细胞具有细胞核的生物的总称,它包括所有动物、植物、真菌和其他具有由膜包裹着的复杂亚细胞结构的生物。重叠基因是指两个或两个以上的基因共有一段序
2、列,或指一段序列为两个或两个以上基因的组成部分年在噬菌体中第一次发现重叠基因2这种单链噬菌体中,相同的序列通过不同的阅读框被识别,产生不同的多肽随后的几年中,在病毒和原核生物基因组中又发现了几对具有不同互补编排的重叠基因在中发现基因重叠年后,真核生物(果蝇和小鼠)中也发现了转录引起的重叠单位,植物中也鉴定出一些重叠基因由于新基因对是在研究特殊位点时偶然发现的,重叠基因对的增长相对稳定而缓慢同时,仅有能够产生自然反义转录本(, )的少数基因对被进一步研究并确定其特性由于数据库和查找标准不同,真核生物重叠基因出现的频率约为:人类基因组中,鼠类基因组中,蝇类基因组中达到,重叠长度从到 ,平均为重叠基
3、因在真核生物中普遍存在并已有很多报道,但直到最近它的重要性才被认识到笔者从高等真核生物重叠基因在分类、数量、可能的生物特性和功能,以及这些基因与人类疾病等几方面进行阐述 重叠基因的种类和数量重叠基因(everlapping gene):指两个或两个以上的结构基因共同一段 DNA 顺序的现象重叠基因原核生物和一些病毒或噬菌体的基因组比较小,核苷酸对是极其有限的,那么怎样有效地利用这些有限碱基来编码更多的遗传信息呢?在生物中存在着一种十分巧妙的机制重叠基因 (overlapping gene)。重叠基因中不仅有编码序列也有调控序列,说明基因的重叠不仅是为了节约碱基,能经济和有效地利用 DNA 遗传
4、信息量,更重要的可能是参与对基因的调控 . 23划分重叠基因可以有不同的标准,包括基因方向(如尾对尾、头对头)、重叠区域(,编码区,内含子)和重叠程度(全部或部分)根据基因相互的组织编排方式,庞大的重叠基因家族可被分成种主要类型(图):第一,反向排列,即反方向的基因转录而来它们可以是会聚的(两条链的端交汇),也可以是分离的(两条链的 端交汇);第二,同向排列,由同一条链上的基因编码而来;第三,嵌套排列,即一基因完全位于同向或是反向的另一基因的内含子之中.从果蝇()常染色质基因组的资料来看,反向重叠基因是最具代表性的类型,大约( )的基因含有反向重叠的,( )是嵌套模式,同向重叠基因较少 反向排
5、列已知的重叠基因大部分都是相反方向两条链的反向重叠基因一般地,重叠位点位于或端非编码基因序列,例如,内含子和启动子元件的末端区域,同时重叠区域也包括编码区基因反向排列可能会形成反义,通过形成双链,反向重叠基因参与各种生物学过程,包括转录、编辑、剪接、稳定性和翻译3 会聚型各种生物信息学分析结果均表明,会聚型反向重叠模式(即头对头)是最普遍的一种4人类基因和在端重叠,这段的保守序列为它们均提供多聚腺苷化信号5在、和汇聚型基因对中6,重叠形成的双链,通过掩蔽富含的元件,可调节转录本的稳定性端重叠还可以干扰基因的剪接,在蟾蜍、小鸡和人类中有一对保守的重叠基因,和,它们是会聚型重叠基因参与转录后调控的
6、一个典型例子具有多聚 位点,产生的转录本在长度上有所不同,它可翻译产生种不同生物特性的蛋白亚基较长的 和的相互作用会干扰的翻译,从而调控不同蛋白亚基的产生7 分离型以上的人类基因属于分离型重叠基因(即尾对尾),它们与其反方向链的端重叠,重叠区域小于其中,较多的基因对共用双向启动子和其他调控元件,少数情况下转录单位也出现重叠分离型反向重叠基因的生物功能目前还不清楚然而,共用端的基因可能会利用这种编排,通过公共的启动子元件来使他们协同表达共用双向启动子的基因具有相同的表达模式,在一些情况下,他们的结构或功能也相互关联和是具有相似生物功能但结构不相关的重叠基因这两个基因编码脊椎动物中嘌呤核苷酸从头合
7、成途径中的两个酶,共用一个含有可使其协同表达的顺式作用元件的双向启动子8端重叠结构相关的基因包括和9钙蛋白酶超家族( )中的成员和,是人类分离型反向重叠基因,共用第一个外显子,分别对应的是的非编码区,的非编码区和编码区 其他一些其他反向重叠基因不能被划分为会聚型或分离型,他们的特征是较短的基因完全位于另一较长的基因中,且共用内含子和外显子序列例如,是颅面骨骼发育中编码 的基因,其重叠基因是反义非编码基因(),长度横跨内含子和外显子 表达与蛋白的合成呈负相关此外,正义和反义转录本合成水平的平衡在体内可以调节蛋白的合成,这是因为互补的互相作用可以保护防止剪接10 同向排列同向排列的重叠基因指位于同
8、一条链上,方向相同而且相互重叠的基因,已被报道数量并不多,仅有上百个尽管通过生物信息学基因组筛选可以查找出更多的同向排列重叠基因,但这种类型可能是最少的一种这也与在果蝇基因组中观察到的比例一致同向排列,往往是在其终止区重叠或者一个基因完全嵌于另一基因(包括外显子和内含子)之中人类基因对是平行排列但不在转录水平表现的重叠基因重叠区域包括的启动子和包括,部分的端1此外,和是包括转录单位的重叠基因一些情况下,两个基因的编码序列均参与重叠,并由不同的阅读框来识别 嵌套排列嵌套排列表示基因序列完全位于另一较长基因的内含子之中由于重叠区域对于其中一个基因仅限于内含子,因此将不会出现重叠的在果蝇中,这种类型
9、占其中有大约的基因可以编码蛋白质此外,大多数的嵌套基因相对于寄主基因是反向排列 反义转录本的生物功能生物基因组中不在同一位点的基因,其有互补重叠的现象称为互补或自然反义转录本和2已报道原核生物中的互补转录本的存在有很多作用虽然真核生物反义相对正义的作用还未明确确定,但研究已表明,它们可能在基因表达的多个水平发挥作用,例如转录、加工、剪接、稳定性、运输和翻译互补转录本一般不会编码蛋白质,而是与被调控基因杂交从而调控其表达目前,种可能的机理可用于解释这些转录本如何调控基因的表达,分别是:转录水平的干扰、 和双链依赖的机理 转录水平的干扰聚合酶催化的转录需要双链的解螺旋和大分子蛋白复合物的参与互相重
10、叠的转录单位,不论是否共用外显子,都不大可能同时开始转录通过对酿酒酵母中和基因重排的研究3,发现当两基因排列方向相向,且不重叠时,二者转录均为正常水平;但若二者发生重叠,则转录减弱此外,编码人类蛋白的基因与一反义相关,且正义和反义的转录过程也是负相关的4这些资料表明顺式自然反义转录本()的表达受到竞争性转录水平干扰的调控然而,在其他一些位点,正义和反义转录也不是总是互相排斥制约的例如,组氨酰合成酶基因与其反义基因,目前虽然还不清楚转录水平的干扰是否存在,但它们却在不同的器官中表达和是果蝇中端重叠两个基因5,它们都具有“持家”()功能,说明转录本虽然互补但并没有表现出干扰 正义和反义形成的双链体
11、可能会掩蔽一些作用于的调控信号,并且阻止反式作用因子的结合甲状腺激素受体基因()以尾对尾的方式与()重叠基因有个亚型,亚型的表达会受到互补的 反义干扰的负调控6这说明由于阻止了顺式调控元件的结合,反义特异性抑制了 的可变剪接. 依赖()的机理和干扰( )研究表明,重叠基因的相互作用可以通过依赖的途径来影响基因表达,包括编辑或依赖干扰的基因沉默正义和反义 可能形成,较长的双链区域可能通过 编辑被修饰和7描述了编码非洲蟾蜍()生长因子基因与其反义链形成尾对尾的互补转录本这个反义基因也编码一个蛋白,但同时直接影响正义,可将部分腺嘌呤残基转换为次黄嘌呤核苷,从而改变正义的信息,导致的快速降解此外,可能
12、会通过干扰机理被消化成的小片段( ,)可以识别长链上的同源区域,并将其特异性降解对于果蝇家族(一种酪蛋白激酶)重复基因的研究可以说明正义反义可以通过依赖机理导致基因沉默脊椎动物内源是否可以引发和基因沉默还需进一步研究 重叠基因和人类疾病之间的关系反义可以通过各种方式影响基因表达,同时一些重叠基因也在病理表现中发挥作用如的最后一个外显子重叠的基因 ,在皮肤成纤维细胞调节胶原沉着中是必需的,并且它也是人类综合症的一个致病基因8基因产物,与重叠,和 错配修复有关,它与形成的二聚体复合物结合到错配碱基处,与一起产生作用突变体与遗传非息肉性结直肠癌有关9此外,此蛋白的突变可导致人类前列腺癌中的微型不稳定
13、性这些仅仅是重叠基因与人类疾病有关的个例,这种类型重叠基因的数量还在不断增加指出,在人类染色体和上分别有和个致病基因与基因重叠有关204 重叠基因技术4. 1 生物重叠基因的启示生物学家发现,一定条件下,组成基因的核苷酸序列有些可重复,即存在重叠基因( overlapp ing gene) 。生物界认为重叠基因能经济和有效地利用DNA的遗传信息量,“节约”碱基,更重要的是能对基因表达起调控作用。受此启发,我们提出了新的算法基于重叠表达的多基因进化算法MEOE (multi2gene evolutionary algorithm based on overlapped exp res2sion)
14、 。它有如下特点:1) 基因的片段在一定条件下可重复表达。2) MEOE的表达空间效率优于其他算法。3) 无需对基因或染色体内容约束。而GP与GEP必须对基因格式作限制,如GEP中尾部不允许出现任何的操作算子。减少限制使得MEOE算法效率高,实验表明,MEOE的速度为GEP的2. 59. 4倍。4) 同GEP相比较,MEOE在函数发现的成功率方面有较大幅度提高。4. 2 定义和编码方法GEP为保证表达式合法性 ,分基因为头部和尾部 ,头部含函数 F和终结符 T,尾部只含 T, 头尾长度必须满足公式 t =h ( n - 1) + 1, 文献21证明了满足 t = h ( n - 1) + 1的
15、基因 (良性基因)集合在遗传操作下封闭。新的MEOE做了改革,取消头尾概念, F和 T中的元素可出现在基因的任何位置 , 因此MEOE的编码具有GA的简单性。另一方面,同GEP算法一样,MEOE可以根据基因编码翻译为唯一对应的表达式树,具体翻译规则如下:1) 依次读取基因中的每个元素。2) 如果读取的元素属于 T,则将此作为表达式树的叶子节点。3) 如果读取的元素属于 F, 则将此元素作为表达式树的非叶节点 ,它的子树数目为函数的参数个数 ,每个子树的根节点依次使用此元素的直接连续后继元素。如果到达基因的末尾 ,则自动填充 T中的元素。新的编码方式使得MEOE具有GA的简单性,无需对基因元素做
16、出任何限制;另一方面,MEOE同样可以形成表达式树,完成从基因型到表现型的映射,从而为解决复杂函数发现问题打下基础。4. 3 重叠基因技术的成果MEOE算法模拟自然界的生物进化,按照“物竞天择,适者生存”的原则对由若干个体构成的种群P实施选择,重组和变异等遗传操作,使种群一代代地进化,从中寻求出最优的个体,从而得到问题的最终解。在文献22中给出了一系列算法和定理。限于篇幅,这里只能介绍其中最重要的结果。这些结果包括:( a) 多基因表达空间定理。指出单基因个体 I的最大表达空间为: 其中 m 为染色体长度 , k为基因个数。( b) MEOE算法的等价基因型定存性定理。即设其中 xi为变量 ,
17、 k为非0正整数 , pi1 , , pin为非0整数。则必定存在一个MEOE算法的基因型 E, 使得 E对应的表达式树与上述公式等价。4. 4 三重叠基因技术的实验结果文献22作了4组实验。限于篇幅,这里介绍其中实验1的结果。考虑二元函数发现问题,根据以下公式: 随机产生20个实数 ,数据范围为 - 3, 3 ,M = 10000 (即规范因子 ) , 分别对MEOE、GEP取基因长度从923,分别运行100次。MEOE算法在不同基因长度的平均进化辈数。最大进化辈数和最小进化辈数如图2所示。二者耗费时间如图3所示。详尽的实验证明,MEOE算法在速度上是GEP算法的2. 59. 4倍。在高次函
18、数发现问题上MEOE算法的成功率比GEP提高至少一个数量级。另外,通过实验证明了基于密度的概率选择函数在高次函数发现问题上具有一定优势,具体细节可参见文献22。5 结语基因重叠是真核生物基因组中的一个普遍特征重叠基因可能通过重排或者接受相邻基因信号形成一般根据两基因的编排方式,基因重叠可能有不同的结果最明显的正效应是反向排列可能会产生在基因表达调控中发挥作用的分子同时,同向排列重叠基因在一些情况下是彼此相关的,它们的表达可能受其特殊排列方式调控参考文献:百度百科词条“真核生物”2 , , , , : 3 , : , , : 4 , , , ( ) : 5 : , ( ) : 6 , , , ,
19、 , : 7 , : , , : 8 , , , , : 9 , , , , , : 10 , , , : ; ; , , : 11 , , , : , , : 12 , : , , : 13 , , , : 14 , , , , : 15 , , , : 16 , , , , , : , : 17 , , , : 18 , , , , : 19 , , , : , , : 20 , , , , , : 21 ZUO J, TANG CJ, L I C, et al. Time Series Prediction based onGene Exp ression ProgrammingM . LNCS (Lecture Notes In Com2puter science). Sp ringerVerlag Berling Heidelberg 2004. 55 - 64. 22 彭京,唐常杰,元昌安,等. 基于重叠表达的多基因进化算法 EB /OL . 中国科技论文在线(教育部). http: / /www. paper. edu. cn. 23 小马哥. 重叠基因 断裂基因.新浪博客