1、结核分枝杆菌基因组学,黄 海 荣,国家结核病参比实验室,提 纲一、结核分枝杆菌基因组总论二、目前一些相关实验室技术的遗传学背景1 基因分型技术2 耐药的分子生物学诊断3 新近的新疫苗、免疫诊断技术,Maps of other spp. nearly identical,MoreThan 4,000 genes,Genome of M. tuberculosis,Cole et al. (1998) Nature 393: 537-544,The Structure of DNA,Figure 1. Schematic diagram of sequencing strategy used by
2、 the publicly funded Human Genome Project. The DNA was cut into 150 Mb fragments and arranged into overlapping contiguous fragments. These contigs were cut into smaller pieces and sequenced completely.,Figure 2. Schematic diagram of sequencing strategy used by Celera. The DNA was cut into small piec
3、es and sequenced completely. These fragments were organized into contigs based on overlapping sequences.,结核分枝杆菌的基本特征,H37Rv的全基因组由4 411 529个碱基组成,大约包括4000个基因,GC含量高达65.6%,表明结核分枝杆菌蛋白质在氨基酸组成上存在偏向性。H37Rv基因组中基因分布密度是平均1.1Kb长度有一个基因,这一数值与大多数原核生物的基因密度接近。与其他快生长的细菌如枯草杆菌不同的是:H37Rv基因方向没有明显的偏向性,59%的基因转录方向与复制叉移动方向相同,
4、而这一数值在枯草杆菌为75%。,在H37Rv基因组中已发现约4000个开放阅读框,约占细菌编码能力的91。通过数据比较,现已确定了约40%的结核杆菌蛋白的功能;另有44%的蛋白与其他蛋白有相似性或可以获得其功能相关信息;剩余的16%的蛋白与其他已知蛋白没有相似性,可能是分枝杆菌特有的功能蛋白。,为什么要研究基因功能?更好的了解疾病的发病机制开发新型的更为有效的治疗措施开发或改良疫苗,How to find function?,Conserved Asp and Glu residues,1. Multiple sequence alignment,2. “Unknowns”,Rv2874 (D
5、sbD) EM domain,Rv1347c acyltransferase,Pa2754 = Rv1720c,Pa2307 = Rv3735,Pa1218 = Rv0820,Rv2238c AhpE,What is an operon?An operon is a set of genes that are: located on the same DNA strandcoded in the same direction adjacent to one another transcribed/expressed togetherWhy predict operons?Knowing the
6、 operons of a genome helps researchers better understand its organization. If researchers know how one of the genes in the operon functions, they can be confident that the other genes in the operon function in a similar manner. A better understanding of the M. tuberculosis genome will lead to better
7、 treatment.,M. tuberculosis genome sequence,常用的基因分型技术的遗传学背景,RFLP Spolgotyping MIRU-VNTR,基因组中的重要的结构序列- 重复序列,结核杆菌基因组中存在重要的重复序列:插入序列(insertion sequence, IS),以及分枝杆菌分散重复序列(mycobacterial interspersed repetitive unit,MIRU),直接重复序列(Direct repeat,DR)。,IS6110 RFLP DNA fingerprinting,IS6110属于IS3家族。IS6110是结核杆菌基因
8、组中最常见的IS序列,也是目前研究比较清楚的 IS序列。在不同株细菌中,IS6110的拷贝数变化很大,从0个到超过25个,这种差别是利用IS6110进行菌型鉴定的基础。,根据结核分枝杆菌基因组中存在插入序列IS6110的数目和位置不同,利用限制性内切酶切割IS6110上相应位点并电泳分离,可以得到类似指纹(Fingerprinting)样的特征性条带,这些条带被称为IS6110 RFLP DNA指纹,该项技术为研究结核分枝杆菌基因分型奠定了基础。,Chromosome of Mycobacterium tuberculosis Hypothetical Strain X and Genotyp
9、ing of M. bovis Bacille CalmetteGurin (BCG), the M. tuberculosis Laboratory Strain H37Rv, and Strain X on the Basis of IS6110 Insertion Sequences and Mycobacterial Interspersed Repetitive Units (MIRUs).,Mycobacterium tuberculosis IS6110 RFLP DNA Fingerprinting,Spoligotyping,Spoligotyping的方法是根据在结核分枝杆
10、菌中存在直接重复区域(Direct Repeat DR区),DR区间的寡核苷酸序列呈多态性而构建的。,具体方法为:采用PCR的方法扩增结核分枝杆菌基因组DNA DR间隔区,引物为DRa: 5-GGTTTTGGGTCTGACGAC-3, DRb: 5-CCGAGAGGGGACGGAAAC-3。且DRa 5末端标记有生物素。PCR产物与已知固定在膜上的43个DR间隔区进行杂交,通过增强化学发光试剂盒进行检测。,Spoligotyping,The DR locus polymorphism: (van Embden et al.),M. canettii,M. microti,M. bovis,M.
11、 tub.,IS1096,40,47,?,Beijing,The DR locus consists in a series of motifs (a repeat and a unique sequence) It changes by deletion of repeats and by insertion of IS elementsParticular patterns constitute signatures for genetic groups,Mycobacterium tuberculosis Spoligotyping Genotype,Variable number ta
12、ndem repeat (VNTR),分散的重复单位(MIRU)是位于基因间的一种特殊的分散重复序列,根据序列、组成和长度在46到101bp这些情况可将MIRU分为3种。结核杆菌H37Rv基因组中有65个拷贝的MIRU,分布于41个位点,主要位于操纵子的基因之间。MIRU可以以连续重复的形式在不同种细菌中存在不同的拷贝数,由此被用来进行菌型鉴定。,每个特定的VNTR位点由两部分组成,即中间的核心区和外围的侧翼区。核心区含有至少一个以上称为重复单元的短序列,一般该重复单元的碱基对数目不变,而串联在一起的重复单元的数目是可变的。,Chromosome of Mycobacterium tuberc
13、ulosis Hypothetical Strain X and Genotyping of M. bovis Bacille CalmetteGurin (BCG), the M. tuberculosis Laboratory Strain H37Rv, and Strain X on the Basis of IS6110 Insertion Sequences and Mycobacterial Interspersed Repetitive Units (MIRUs).,Jinghua2_1(ETRA),1000500200100,ETRA_75bp_397bp_3U,1000500
14、 400200100,3 U,2 U,3 U,3 U,4 U,5 U,新型疫苗、免疫学诊断ESAT-6 CFP-10新型疫苗 ELISPOT T-SPOT,差异区域(Regions of difference,RDs)/缺失区域(deleted regions),与分枝杆菌的抗原变异有密切关系。RD1是惟一的在BCG不同类型的菌株和田鼠分枝杆菌中都发生缺失,而在致病性的结核分枝杆菌和牛分枝杆菌中都存在的缺失区域,它是目前发现的惟一的具有上述特点的 DNA片段。,实线代表基因未发生缺失,虚线代表基因发生了缺失。RD1两侧的虚线代表基因未列出。由上至下列出的细菌分别为结核分枝杆菌H37Rv,牛分枝
15、杆菌BCG,田鼠分枝杆菌OV254,结核分枝杆菌Tb56和牛分枝杆菌AF2122/97。,几种分枝杆菌中RD1的缺失情况,RD1长9.455bp,虽然目前已有较多的关于RD1的报道,但对于这一序列的真实功能还属未知,甚至对于这一段序列包含多少个基因也还未有定论。一般认为,RD1可能共包括11个基因,即从Rv3866到Rv3879c间的基因片段,包括Rv3867、Rv3868、Rv3869、Rv3870、Rv3871、PE35、PPE68、esxB、esxA、Rv3876、Rv3877,其中esxB(Rv3874)和esxA( Rv3875)编码的两个蛋白CFP-10和ESAT6目前正倍受关注。
16、,CFP-10(Culture filtrate protein)又称结核杆菌培养滤液蛋白,而Esat6(Early secreted antigen target)又叫早期分泌抗原,这两种蛋白是细菌早期分泌的强T细胞抗原,近来已被应用作结核病早期诊断的指标。esxB和esxA两个基因存在于同一操纵子内,被共同转录,它们的产物被共同分泌,最终以1:1的比例共同起作用。在RD1区与这两个编码基因相邻的其他基因,业已被证明组成了一个分泌系统。,Growth in C57BL6 mice,TB TBRD1 BCG,Current thoughts on H37RvRD1,Attenuation mu
17、tant re-created Mutant makes less antigens, yet growth impaired The bacteria that makes more antigenic proteins grows better in the host!,耐药的分子生物学检测方法,HAIN Test Gene Chips/Microarray,结核分枝杆菌耐药相关基因1 异烟肼:katG基因、inhA、ahpc基因、oxyR基因 2 利福平:rpoB基因 3链霉素: rpsL基因、 rrs基因 4吡嗪酰胺:pncA 5乙胺丁醇: embCAB操纵子 6喹诺酮类:GyrA和G
18、yrB,其他抗结核药耐药相关基因 卡那霉素和卷曲霉素的作用机制类似于链霉素,都是通过作用于16SrRNA改变核糖体结构,抑制蛋白合成。在rrs基因1400位碱基突变与高水平的卡那霉素耐药有关。 卡那霉素和卷曲霉素或紫霉素之间存在交叉耐药。 环丝氨酸的杀菌机制是通过抑制D丙氨酸消旋酶和D丙氨酸:丙氨酸合成酶的活性抑制肽糖苷的合成。D丙氨酸消旋酶的编码基因是alrA,耻垢分枝杆菌的alrA已被克隆。当在耻垢分枝杆菌和BCG中用多拷贝载体表达alrA时会产生环丝氨酸耐药。研究已发现耻垢分枝杆菌中alrA启动子突变会引起环丝氨酸耐药。 乙硫异烟胺在结构上与INH类似,可能其作用靶位也是分枝菌酸合成。I
19、nhA突变可以导致乙硫异烟胺与INH交叉耐药,但肯定还有其他基因参与乙硫异烟胺耐药的发生,过氧化物过氧化氢酶的突变在乙硫异烟胺耐药中并不起作用。,(1)灵敏度:研究试剂检出阳性的样本占对比试剂检出阳性样本总数的比例。(2)特异度:研究试剂检出阴性的样本占对比试剂检出阴性样本总数的比例。(3)阳性预期值(PPV):研究试剂检出为真阳性结果的样本占总检出阳性样本的比例。(4)阴性预期值(NPV):研究试剂检出为真阴性结果的样本占总检出阴性样本的比例。,判断一种诊断方法优劣的几项常用指标,Genome Proteome TranscriptomeVaccinomeImmunome,后基因组时代,结
20、语结核杆菌全基因组序列的阐明及其详细的生物信息学分析,为人类提供了大量的信息,对于阐明结核分枝杆菌的独特的生物学特点非常有价值。基因组学的研究成果必将深化人类对结核病新型治疗和预防措施的研究。,谢 谢 !,自然突变在不同的药物发生率不同:异烟肼(isoniazid,INH)为3.610-6、利福平 (rifampicin,RFP)为3.5 10-8、链霉素(streptomycin,SM)为3.8 10-6、乙胺丁醇 (Ethambutol,EMB)为0.5 10-4。在治疗过程中如单一用药,病变内绝大多数敏感菌群被杀死 ,而少数自然耐药株得以继续生长繁殖而成为优势菌群,从而产生了耐药结核病,
21、这就是当前普遍接受的选择性突变学说。耐药结核病中继发耐药占大多数,不合理化疗方案、不规则用药对病灶内的菌群进行了药物选择,清除了敏感菌,使耐药菌成为优势菌。随着分子生物学技术的迅猛发展,人们已从分子水平对结核杆菌的耐药机制进行了研究,业已确定,结核杆菌对抗结核药物的耐药性主要是染色体突变所引起。,IS序列在分枝杆菌中普遍存在,3.4%的H37Rv基因组由插入序列和原噬菌体组成。在结核杆菌H37Rv基因组中已发现了56种完整的或有序列缺失的IS序列,分属于至少9个不同家族;另外还发现一定数量的整合酶基因片段,可能与发育不全的IS有关。根据它们的组织方式、序列相似性和末端重复序列,可将这些插入序列分成IS3、IS5、IS21、IS30、IS110、IS256、ISL3家族,以及通过基因组序列分析发现的IS1535家族。在所有的H37Rv的IS成分中,除了IS6110插入序列经常发生转座外,其他IS成分都很稳定,而且在结核分枝杆菌复合群的其他细菌,如牛型分枝杆菌和BCG基因组的相应位置也存在同样的IS成分。,