1、真核细胞中 DNA 与蛋白质结合形成染色质和染色体是生物进化的必然结果1 。 核小体(Nucleosome)是染色质的基本结构单位,其为长度约 160bp 的 DNA 绕由 H2A, H2B, H3 和 H4 各两分子形成的八聚体约两圈的粒状结构, 其中 H3 和 H4 各两分子形成的四聚体位于八聚体的中间, 其两端均与 H2A 和 H2B 各一分子形成的二聚体结合。第五种组蛋白 H1 或称 H5 与连接两核小体之间的 DNA 结合, 并与相邻两核小体首尾相联 , 以稳定核心组蛋白与 DNA双链的结合。Crane 等(1997) 对 H1 与核小体的结合位置提出新的看法2, 认为染色质的高级结
2、构是以核小体为基本结构单位的一级结构经过进一步的盘绕、折叠而形成。由于染色质是真核细胞遗传信息的载体, 真核基因的表达调控一定与染色质密切相关。研究染色质的结构及其在基因表达调控中的作用, 对于揭示真核生物基因表达调控的机理有重要意义。 1 转录区染色质对 DNaseI 的敏感性增加 真核生物的染色质结构在不同物种间无显著差异, 核小体的体积也基本恒定, 但核小体间连接 DNA 的长度是可变的, 它在不同的物种中, 以及不同的组织, 有时不同的发育阶段均有可能不同。例如, 菜豆 (Phaseolus vulgaris)的子叶和叶片组织中, 染色质核小体的重复长度有差异, 叶片中为 191bp,
3、 而子叶中缩短到 177bp, 但没有发现这种差异与基因的特异表达有关 3 。Murray 和 kennard 的进一步研究却发现, 菜豆子叶特异表达的基因-菜豆蛋白基因(phaseolin)的染色质区对 DNase的敏感性比叶片中强, 说明染色质对 DNase敏感与基因的转录有关。在豌豆 (Pisum sativum)中, Steinmuller 等(1986) 4研究了另一储藏蛋白-豆球蛋白(Legumin)基因的染色质在子叶和叶片中变化。在子叶中靠近豆球蛋白基因 3端的染色质对 DNase的敏感度比叶片中高 5 倍。大麦(Hordeum vulgare)中, 大麦醇溶蛋白(Hordein
4、)基因, 捕光叶绿素 a/b 蛋白(light harvesting chlorophyll a/b protein, LHCP) 基因和 1516 kD 多肽基因的染色质对 DNase的敏感度也随着这些基因的表达而显著的增加4 。 在动物组织细胞中的研究同样显示, 基因的转录伴随着其染色质对 DNase的敏感性显著增加。母鸡中, 球蛋白基因在网织红细胞中表达, 而卵清蛋白基因则于输卵管中有转录; 研究发现, 网织红细胞中编码球蛋白 mRNA 的染色质 DNA 更易被DNase降解 , 输卵管细胞中卵清蛋白基因区域的染色质比球蛋白基因区对 DNase更敏感5,6 。 关于染色质对 DNase敏
5、感与该区基因被转录的关系, 研究者认为, 基因的转录造成染色质易被 DNase消化, 而非前者是后者的原因。 2 染色质中 DNase超敏感点与基因的表达调控有关 与由于基因的转录而使转录区染色质对 DNase的敏感性增加不同, 染色质中还存在一些短的区段 , 一般为 50200bp 之间, 对 DNase消化更敏感, 称 DNase超敏感点 (DNaseHypersensivity sites DH sites) , 为无核小体区7 。直接的证据来自 Choder 等的实验结果, 他们用电镜观察 SV40 微小染色体时发现其中存在无核小体区段 , 该区段与限制内切酶分析定位的超敏感点在同一位
6、置。经过对很多基因染色质的研究,发现超敏感点是广泛存在的,一般位于基因的 5端启动子之内或启动子的周围。玉米中有两个基因位点(Adh1 和 Adh2)编码乙醇脱氢酶(alcohol dehydrogenase), 它们均受厌氧协迫而表达。Paul 等(1987)8 发现,Adh1 的 5端区域存在两种类型的 DNase超敏感点, 即组成型和诱导型。前者位于基因更上游位置, 大约为-160170 之间, 经厌氧诱导后, 出现两个新的 DNase超敏感点, 主要者中心位于-40, 次要者中心位于-140, 两者之间为厌氧反应域(anaerobic response regions), 其中至少有两
7、个顺序, -30 位的 TATAA 和-90 位的 CAAT, 被认为对基因的调控非常重要。厌氧环境除了诱导产生两个超敏感点以外, 还使组成型 DNase超敏感点区域的范围扩大。 玉米 Adh2 基因 5端存在三个超敏感点均为组成型的, 它们的中心位置分别为-55, -305, 和-455, 当该基因受诱导而表达时, 超敏感点的敏感度增加 , 并且靠近 TATAA 序列的超敏感点(即-55 位)向 3端方向延伸, 使 TATAA 框暴露。 存在于基因调控区(包括启动子和增强子)的 DNase超敏感点(组成型或经诱导产生)对基因的表达是必要的。在人类 -球蛋白基因的 5端的上游 , 大约 102
8、0kb 位置, 存在着位点控制区(Local control regions, LCRs)或称位点激活区 (Local activating regions, LARS), 它可以使其下游的基因的表达不受其所在染色体位置的影响。LCRs 中存在 4 个超敏感点, 如果LCRs 与人类 -球蛋白基因 (包括启动子和其他一些顺式调控元件)一起转化小鼠, 则球蛋白 mRNA 在转化小鼠的合成量与整合的基因的拷贝数成正相关, 与其整合的位置无关。但如果其中 LCRs 的两个超敏感点 (即 5-SH 和 HS-3)没有被整合, 则球蛋白的表达量很少, LCRs 失去了其原有的功能9 。 3 染色质无核小
9、体区形成的机理 在染色质的 DNase超敏感点内没有完整的核小体结构形成。体外实验表明,虽然基因编码区的核小体对基因的转录影响较小, 但核心启动子区形成核小体后, 转录将无法起始10 。基因的转录要求其核心启动子区和上游调控原件(Core promoter and upstream regulatory elements)为无核小体区或该区核小体被去除(Displacement) 。研究基因自然状态下及基因转录状态下染色质的结构, 发现真核细胞无核小体区的形成至少采取两种策略: 核小体的持久型去除(Persistant displacement) 和诱导去除 (Induced displace
10、ment)11 。 持久型去除主要指在启动子元件(Promoter element)区自然状态下不形成核小体 , 它们主要存在于组成型转录的启动子中, 某些诱导表达的基因在被诱导转录前其启动子中也发现这种类型的无核小体区。 持久型无核小体区的形成可能涉及组成型因子的作用。在 DNA 复制过程中, 核小体未装配之前可以出现短暂的无核小体染色质区, 有些组成型因子优先与该区 DNA 结合, 并阻碍随后该区核小体的形成。在果蝇热休克基因中, 通用转录因子(General factors)和 GAGA 因子(CT 因子)很可能参与了核心启动子区( 即 TATA 盒和转录起始点)持久型无核小体区的形成,
11、 并使上游调控元件维持对热击因子的易接近性12 。SP1 因子也可能参与持久型无核小体区的形成。很多“管家基因(Housekeeping genes)“ 均含有多个 SP1 结合位点。SP1 与这些位点结合后, 阻碍了组蛋白 H1 的结合。在酵母(S. cerevisiae)中,有一类组成型表达的蛋白质, 称为通用调节因子(General regulatory factors, GRFs), 它们在酵母细胞中的含量特别丰富 , 每一种均与特定序列的DNA 结合, 并使该区为无核小体区。当 GRF 结合点突变后,研究发现 GRF 与其结合点的结合为该无核小体区的形成所必需, 并对相邻区域核小体的
12、形成产生重要影响。在 his4 基因的 HSE 区有 RAP1(GRF 中的一种)的结合位点, RAP1 与其结合位点结合后产生无核小体区, 该无核小体区为诱导因子 GCN4 和 BAS1 与 BAS2 等基本因子(basal factors)在该区起作用时所必需13 。诱导去除是指基因在表达前其上游因子结合位点(Upstream factors-binding sites)以及核心启动子区均形成核小体, 经诱导后, 调节因子直接或间接地引起核小体的去除。 pho5 基因在酵母中编码酸性磷酸酶, 当酵母生长的培养基中磷酸缺乏时, 该基因被诱导而表达。pho5 启动子区在抑制状态下形成 6 个核
13、小体, 在倒数第二个核小体上(从转录起始点算起)有 PHO4 和 PHO2 两个反式作用蛋白的结合位点, 第一个结合位点位于 TATA 框在倒数第一个核小体上, PHO4 的另一结合点位于倒数第二和第三个核小体间的连接 DNA 上14 。突变分析发现, PHO4 和 PHO2 两蛋白为产生具有转录活性的染色质和 pho5 基因表达所必需 , 在磷酸缺乏时, PHO4 蛋白先与连接 DNA的靶位点结合, 在 PHO2 的协同作用下, 引起第二位核小体的解体, 暴露 PHO4 的第二个结合点。Svaren(1997)等15的研究还表明, PHO4 与其结合位点结合后, 其他蛋白复合体又与 PHO4
14、 蛋白结合, 使该区的染色质的结构改变。后结合上的蛋白复合体具有 ATP 酶的活性, 说明染色质结构的改变是一个耗能的过程。PHO4 的功能同时还受 pho80 和 pho85 两个基因产物的调控, PHO80 和 PHO85 两蛋白组成激酶复合体 , 对 PHO4 蛋白进行磷酸化使其激活功能被抑制16 。PHO5 的表达需要倒数前四个核小体的解体。现在还不知道其他三个核小体被替代的具体方式, 但能量平衡是一个重要原因 , 第二个核小体上 DNA 序列的变化, 将使启动子的诱导和核小体解体更容易。 与 pho5 基因相似, 鼠乳腺瘤病毒(mouse mammary tumor virus MM
15、TV)长末端重复(long terminal repeat LTR)顺序的启动子受糖皮质激素受体(glucocorticoid receptor GR)的调控。该启动子也形成 6 个位置恒定的核小体,在倒数第二个核小体表面有四个糖皮质激素受体的识别位点, 分别位于-175, -119, -98 和-83, 其中-175 和-83 两结合位点 DNA 的主沟面对溶液, 可以与 GR 结合, 这两个位点相距 92bp。由于核小体的形成,这两个位点正好位于同一核小体的同一侧, 有利于 GR 的结合和后来的激活过程。另两位点其主沟面对组蛋白,因受空间的阻碍与 GR 没有结合能力17 。 在被诱导条件下
16、, GR 以二聚体形式与核小体上的识别位点结合, 但似乎并没有使其结合区核心组蛋白被去除, 而是形成了 GR-核小体复合体。体内研究表明, 具有转录活性的启动子几乎无例外的为 DNaseI 超敏感区, 指示它们缺乏正常的核小体结构。GR 结合后可能促进其他蛋白复合体(其中包括 SWI1、2、3 蛋白在哺乳动物中的类似物)与核心组蛋白作用, 引起核小体的解体18 。SWI1 、2、3 是酵母基因编码的蛋白质,为 GAL1 和 GAL10 等基因的转录以及酵母 GAL4 蛋白起作用时所必需, 它们可能与另两种蛋白 SNF5 和 SNF6 形成多亚基复合体, 辅佐基因专一性蛋白起作用19 。由 GR
17、 诱导的转录是短暂的, 几个小时以后, 基本转录复合体, NF1, GR 和八聚体因子又被核心组蛋白替代, 它们的结合位点又形成核小体, 启动子转录功能被抑制。转录因子被替代的机理还不清楚,组蛋白和转录因子与启动子区的结合很可能是一个动态过程。 Wong 等20对甲状腺激素 -受体的突变研究发现, 该激素受体与甲状腺结合后, 可以引起其靶位点染色质的解体和调控基因转录起始, 但这两个过程分别与激素受体的不同功能区有关,染色质的解体不足以引起基因的转录起始。 4 组蛋白与基因的转录调控有关 核心组蛋白明显分为两个区域羧基末端的疏水区和氨基末端的亲水区, 羧基端形成球形结构参与核小体核心的形成,
18、氨基端带正电荷位于核小体的外部, 与周围环境作用, 为基因的表达调控所必需, 并且不同核心组蛋白的氨基末端所起作用不同。 Kayne 等(1988)21 发现, H4 的 N-末端的缺失可以解除酵母沉默交配位点 (silent mating loci)HML 和 HMRa 的抑制作用,使邻近酵母 2 启动子位置的核小体解体。H4 末端的 4 个带正电荷氨基酸残基(Lys16, Arg17, His18 或 Arg19)的其中之一被甘氨酸替代, 均可以使交配频律降低 5 000 倍22 。H3 和 H4 的氨基末端对酵母端粒区沉默也有重要作用, 它们 N-末端的缺失或一些氨基酸的替代均可以解除端
19、粒沉默(telomeric silencing) 。H3 和 H4 的 N-末端对 GAL1 启动子也有重要的调节功能, 但它们所起的作用并不相同。H4 组蛋白 N-末端第 423 位氨基酸的缺失或该区段乙酰化位点的半胱氨酸残基(即第 5、8、12和 16 位)被其他氨基酸替代, 将大大降低 GAL1 启动子的活性;与此相反, H3 组蛋白 N-末端 415 位氨基酸区段的缺失以及位于该区或邻近区域的半胱氨酸残基(即第 9、14、18 和 23 位) 的替代, 可以使 GAL1 启动子活性增加。Fisher-Adams 等(1995)23在 H3 和 H4 N-末端缺失对 GAL1 启动子转录
20、调控的影响方面进行了很精细的研究,也得到相似的结论。 组蛋白 N-末端乙酰化对染色质结构和基因表达调控有重要影响。 Allfery 等(1964)24 认为, 染色质组蛋白 N-末端半胱氨酸残基的乙酰化,可以作为该染色质具有转录活性的标志。组蛋白乙酰化减弱了染色质对 DNA 的限制, 使核小体的构象发生变化, 转录因子接近核小体的机会增加,因而对基因的转录是有利的。当组蛋白的乙酰化去除后, 伴随着转录的关闭, 同时,组蛋白的乙酰化程度又决定于乙酰化酶和去乙酰化酶的平衡, 因此, Wolffe(1996)认为25, 对某一特定的基因而言, 其染色质的结构和基因转录与否决定于乙酰化酶和去乙酰化酶的
21、比例。目前, 在多种生物中, 乙酰转移酶基因和去乙酰化酶基因均已被克隆。P/CAF 为人类中被克隆的乙酰转移酶基因,研究表明 , P/CAF 基因产物与已知的转录共激活子(coactivator)CBP 和p300 结合, 后者与转录因子(例如 CREB, c-JUN 和 FOS)结合, 因此, Sternglanz(1996)等26认为, 乙酰转移酶通过与转录因子和共激活子结合, 催化启动子区核心组蛋白的乙酰化。 5 核小体与基因调控 核小体是染色质的基本结构单位。体内外实验均证实, 核小体为基因转录的一个通用抑制子(general repressor)。由于缺少H4 组蛋白,核小体不能形成
22、的酵母细胞系中, 很多基因变为组成型表达,而在正常的细胞株系中, 它们均处于抑制状态。 但大量的实验结果证明, 核小体的形成和在染色质的精确定位为真核基因的表达所必需27 。在 MMTVLTR 启动子中, 两个 GR 结合位点( 第-175 和-83)相距 92bp, 由于核小体的形成, 它们正好位于核小体的同一侧面, 在空间上非常接近, 这显然有利于 GR 的结合, 因而对基因的诱导表达有利。 果蝇 hsp26 启动子中,第-51 位和第-34 位为热休克转录因子(heat shock transcription factor, HSTF) 的识别位点, 由于在第-330 至-140 区段形
23、成一个核小体,也使得 HSTF 两个位点在空间上非常接近28 。相似的情况也存在于果蝇 ADH(alcohol dehydrogenase)基因和青蛙的卵黄原基因。卵黄原基因 DNA 的-300 至-140 区段与组蛋白结合形成核小体,转录促进因子(stimulatory transcription factors)、雌激素受体和 NF1 的结合点分别位于该核小体两侧的-300 至-330 和-120 至-110 位, 核小体的形成或该区段的人工缺失, 均可以使该基因的转录量提高 510 倍。因此, Wolffe(1994)29认为, 核小体的形成及其在染色质上的精确定位有以下两方面的作用:(
24、1) 提供一个框架(scaffold), 使转录因子之间的信息传递更有效; (2) 染色质结构的不均一性,即其某些区域不形成核小体, 从而保证了转录因子易于接近染色质模板。 染色质是真核生物遗传物质的载体, 真核基因的表达调控显然与染色质的结构改变有关。染色质的结构在具有转录活性的基因区域确实与基因活性惰性区域有很大的不同,同时, 其结构也存在不均一性,即在启动子或增强子区存在 DNaseI 超敏感点, 它们为基因的表达调控所必需。染色质的重要组成成分-组蛋白,在真核基因的表达调控中也起着非常重要的作用,核小体的形成和正确定位为基因的时空表达提供了重要保证。虽然这里只简单介绍染色质的结构和部分组成成分与基因表达的关系,但仍然可以领悟染色质结构和功能的高度一致。