1、 基因表达及其分析技术生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从 DNA 测序到SNP、拷贝数变异(copy number variation, CNV)等 DNA 多态性分析,到 DNA 甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解析。基因组研究的重要性自然不言而喻。应该说, DNA 测序技术在基因组研究中功不可没,从 Sanger 测序技术到目前盛行的新一代 测序技术(Next Generation Sequencing, NGS)到即将走到前台的单分子测序技术,测序技术是基因组解析最重要的主流技术
2、。而基因 组测序、基因 组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“ 基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后 鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解析就变得至关重要。声称特定基因、特定 SNP、特定 CNV、特定 DNA 修饰等与某种表型有关,最终需要 转基因、基因敲除、突变 、RNAi、中和抗体等技 术验证,并必不可少要结合基因 转录、翻 译和蛋白修饰等数据。基因实现功能的第一步就是转录为 mRNA 或非编码 RNA,转录组学主要研究基因转录为 RNA 的过程。在
3、转录研究中,下面几点是必须考虑的:1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基因表达检测技术,其是否科学,就是要看能否 检测到低丰度表达基因,能否检测到基因丰度的变化尤其是微弱变化,线性范围是否宽广等。这方面的误区在于,很多人过分强调特定技术能否检测到低丰度基因的表达,忽视了特定技术能否检测到基因表达丰度微弱的改变。如果关注全基因组表达信息,那么目前最经典的技术就是全基因组表达谱芯片技术, 这种基因芯片设计 了数据库中所有
4、已知基因、EST 和预测基因、EST 的已知转录本的探针,用来分析全基因组中已知基因、预测基因的已知转录本的表达信息。在利用基因芯片进 行转录研究时, 应该选择 能检测低丰度表达基因的芯片技术, 选择可以反映基因表达微弱变化并且线性范围广的技术,比如Affymetrix 公司的 转录研究方面的芯片。以 GeneChip Human Genome U133 Plus 2.0 Array 为例,该芯片可以分析多达 38500 个基因的 47400 个转录本(而GeneChip Human Genome U133A 2.0 Array 是对 其中 14500 个 well-characterized
5、 human genes 的 18400 个转录本进行分析的)。从精确度、重复性、性价比等角度来讲,芯片技术 仍然是基因表达研究的首选技术。除人全基因组表达谱芯片外,Affymetrix 公司还可以提供以下物种的全基因组表达谱芯片:大鼠,小鼠,拟南芥,大麦,牛,线虫,狗, 鸡,柑橘,棉花,果 蝇,大肠杆菌,玉米,苜蓿,绿脓 杆菌,蚊子/疟原虫、杨树 ,猪,恒河猴,水稻,金黄色葡萄球菌,大豆,甘蔗,西红柿,葡萄,小麦,爪蟾,酵母,斑马鱼等。2,对 mRNA 表达而言,更重要的问题是,每个基因的编码区域由若干外显子组成,而特定基因在不同 细胞类型中或不同发育、生长阶段或不同生理、病理状态下,外 显
6、子存在选择性剪接(alternative splicing),因而会出现不同转录本。不同转录本正是解释同一基因具有不同功能甚至相反功能遗传基础。因此分析基因表达,不仅要知道基因是否表达与表达水平高低,更重要的是需要知道特定基因表达的转录本是什么。如果关注全基因组所有外显子表达并希望预测每个基因选择性剪接,那么基因芯片仍然是该方面研究的经典技术。以 Affymetrix 公司的 GeneChip Human Exon 1.0 ST Array 为例,该芯片可以分析已知的及 预测的转录区域内的超过 1 百万个外显子簇的表达,分析 选择性剪接。 这是迄今为 止最全面的、唯一的同 时可以研究基因表达与
7、选择性剪接的基因芯片。Affymetrix 公司也可以提供小鼠、大鼠的此类芯片,分别分析小鼠的 1 百万个外显子或大鼠的 85 万个外显子。3,基因调节分析。任何基因表达都是受到 严格调控的,包括转录因子调控和表观遗传修饰等。如果关注特定转录因子调节的所有基因,那么 ChIP on chip 技术是必须的。以 Affymetrix 公司的 GeneChip Human Promoter 1.0R Array 为例,该芯片可以分析任何特定蛋白质如转录因子与超过 25500 个启动子的相互作用。每个启动子覆盖 10-12.5kb(转录起始位点下游 2.5kb+上游 7.5kb,对 1300 个癌基
8、因而言,上游延长至 10kb)。如果分析特定 转录因子在特定细胞类型的特定生长、发育阶段或特定生理、病理下调控基因表达的特点,该芯片是很好的工具。 该芯片也覆盖了 UCSC in NCBI human genome assembly (Build 34)中注解的 59% 的CpG 岛 ,该芯片同时可以用于 DNA 甲基化修饰的分析。Affymetrix 公司也可以提供小鼠的此类芯片,分析 转录因子与 28000 个启动子的相互作用。非编码 RNA 也是转录组学研究的热点,Affymetrix 公司的 GeneChip miRNA Array 可以分析 71 个物种的数以千 计的 microRN
9、A 与 Small nucleolar RNAs (snoRNAs)的表达。4,样本问题。最科学的样本应该是同质细胞。不同细胞类型,其基因表达是有差异的,建立细胞类型特异的基因表达数据,才能真正揭示特定细胞类型基因表达的真实面貌。对于组织 ,制作 组织切片,利用(免疫)组织化学技术对特定细胞类型进行鉴定,进而利用激光显微切割技术分离特定细胞类型,这是目前从组织中获得同质细胞的关键技术。问题在于组织切片制备和(免疫)组织化学等环节可能造成 RNA 的降解, 针对这种情况, Affymetrix 公司有专门分析福尔马林固定的、石蜡包埋的组织的全基因组表达的芯片 GeneChip(R) Human
10、X3P Array,该芯片 设计的每个基因的探针,都更靠近 mRNA 3端位置,因为 mRNA越靠近 3端越 稳定。对于医学样品的分组,临床上对疾病、行 为等的诊断、分类的公认标准是转录分析中对样本分组的必不可少的参考,比如肿瘤样本的病理学判读、血液分析中的各种参数、心脑血管分析中的各种参数、精神 类疾病诊断中的行为学参数等。优秀的高级别的科学论文,往往在样本分组分类上非常严格,描述很清晰,篇幅很大。没有合格样本及没有合格样本分组,任何下游分析技术都无法得出有价值数据。5,候选基因表达分析技术。在 实际研究中, 经常会遇到两 类转录分析,全基因组表达分析与候选基因表达分析。应该说,只有通过全基
11、因组表达分析,才能了解特定生命过程相关的所有基因表达,从中鉴定出特定生命过程的关键候选基因(如转录因子)及相关基因的网络、信号通路。关于候选基因表达分析技术,在实时定量 PCR 技术独领风骚很多年后,新的技术不断冲击,包括 Affymetrix 公司的 Branch-DNA 技术。 该技术在分析基因表达时,不是基于将模板进行 PCR 扩增的原理,而是检测杂交于特异基因的一组特异探针的信号,避免了 PCR 过程引发的很多问题;而且可以进行单基因表达分析或 3-36 个基因表达的多重分析。本期基因快讯有专门介绍 Branch-DNA 技术的文献。相信 Branch DNA 技术很快会成为候选基因表
12、达分析的主流技 术。总之,Affymetrix 全基因组表达谱芯片等技术被广泛应用于人类和动物生命科学的基础研究中,如鉴定发育、生长、分裂、分化、细胞凋亡、信号转导等重要生命过程的相关基因,鉴定疾病相关基因。大量的研究在利用基因芯片技术鉴定癌症发生发展和转移的基因,对癌症进行分子分类/分期,寻找癌症分子机制的关 键分子,为癌症诊断筛选重要标志分子,为癌症治疗筛选重要的靶分子,预后分析等.而在作物遗传育种领域,针对转基因生物新品种培育,全基因组表达谱芯片等技术也大有作为:1, 高产、抗逆、优质等农业优良性状相关基因的鉴定:每个物种在自然界中都有不同品种,传统育种也产生了很多栽培种。不同品种、栽培
13、种间性状差异很明显,因此深入分析表型差异的遗传机制, 鉴定高 产、抗逆、优质等农业优良性状相关基因对转基因育种很重要。利用中国丰富的种质资源,通 过各物种全基因组 表达谱芯片技术,可以分析作物各种表型的分子机制,并从数以万计的基因中鉴定农业优良性状相关基因,为转基因作物提供目的基因储备。Affymetrix 可以提供多个物种的全基因组表达芯片,包括:大豆基因组(包括大豆 线虫基因组、大豆疫霉菌基因组)、玉米、小麦、大麦、水稻、苜蓿(含固氮菌)、杨树(包括胡杨)、葡萄、西 红柿、拟南芥、猪、牛、鸡、甘蔗、棉花、柑橘等。2, 转基因生物安全的评估:转基因生物安全的评估需要从多层次综合进行,系统比较
14、基因修饰作物与传统育种作物是必须的。国际上这方面的评估正在形成相关理论技术体系,具体包括:基因组层次( 转进去的目的基因是否对作物基因组稳定性产生影响),转录组层次(从基因转录水平上 评估转进去的目的基因及其表达是否对作物全基因组表达产生影响),蛋白组层 次(转进去的目的基因的蛋白产物是否对作物蛋白组学特征产生影响)。其他包括代 谢组层次,功能特征分析等。转录组学层次的分析是至关重要的,而且技术相当成熟。已 经有科学家做了初步研究,结果显示:传统育种的大豆不同栽培品种间基因表达是有差异的, 这也从遗传机制上解释了大豆不同栽培品种间为什么有性状差异;更重要的是,该研究也显示, 转基因大豆与其相应的对照栽培种间的基因表达差异非常小,也就是说, 转基因大豆与其相 应的对照栽培种间的基因表达本质是一致的!拟南芥的相关分析也证明,转基因拟南芥与非转基因拟南芥间的基因表达本质上是一致的!拟南芥在胁迫环境下基因表达的变化远大于转进去的目的基因对拟南芥基因表达的影响!玉米、水稻、小麦、大麦等物种的相关分析也在进行。当然不同的物种、不同的目的基因对安全的影响可能不一样,安全性评估目前只是开始,大量的 评估还需要做,而基于基因表达谱芯片技术的转录组水平的分析是非常重要的技术。