真核基因表达调控 、真核基因组的复杂性 与原核生物比较,真核生物的基因组更为复杂,可列举如下。 ▲真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组 在109bp数量级,比细菌大千倍:大肠杆菌约有4000个基因,人则约有10万个 基因。 ▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有 遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。 ▲原核生物的基因组基本上是单倍体,而真核基因组是二倍体 ▲如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的 单元,共同开启或关闭,转录出多顺反子( polycistron)的mRNA;真核生物则是 一个结构基因转录生成一条mRNA,即mRNA是单顺反子( monocistron),基本 上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的 亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比 原核生物复杂得多。 ▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因 组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能 至今还不清楚 ▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质 编码的基因绝大多数是不连续的,即有外显子(exon)和内含子( Intron,转录后需 经剪接( splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达 调控的环节。 ▲原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物 基因组中则存在大量重复序列 (repetitive sequences)。用复性动力学等实验表明有
真核基因表达调控 一、真核基因组的复杂性 与原核生物比较,真核生物的基因组更为复杂,可列举如下。 ▲真核基因组比原核基因组大得多,大肠杆菌基因组约 4×106bp,哺乳类基因组 在 109bp 数量级,比细菌大千倍;大肠杆菌约有 4000 个基因,人则约有 10 万个 基因。 ▲真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有 遗传成分(如线粒体 DNA 等),这就增加了基因表达调控的层次和复杂性。 ▲原核生物的基因组基本上是单倍体,而真核基因组是二倍体。 ▲如前所述,细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的 单元,共同开启或关闭,转录出多顺反子(polycistron)的 mRNA;真核生物则是 一个结构基因转录生成一条 mRNA,即 mRNA 是单顺反子(monocistron),基本 上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的 亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比 原核生物复杂得多。 ▲原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因 组中仅约 10%的序列为蛋白质、rRNA、tRNA 等编码,其余约 90%的序列功能 至今还不清楚。 ▲原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质 编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需 经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达 调控的环节。 ▲原核基因组中除 rRNA、tRNA 基因有多个拷贝外,重复序列不多。哺乳动物 基因组中则存在大量重复序列(repetitive sequences)。用复性动力学等实验表明有
三类重复序列:①高度重复序列( highly repetitive sequences),这类序列一般较短, 长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的 10-60%,人的基因组中这类序列约占20%,功能还不明了。②中度重复序列 ( moderately repetitive sequences),这类序列多数长100-500bp,重复101-105 次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约 300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中 约占7%,功能也还不很清楚。在人的基因组中18S28 SIrNA基因重复280次, 5 SIRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成 簇重复30-40次,这些基因都可归入中度重复序列范围。③单拷贝序列 (single copy sequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中 约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复 是单拷贝的基因。 从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还 很有限,使现在国际上制订的人基因组研究计划 human gene project)完成,绘出 人全部基因的染色体定位图,测出人基因组109b全部DNA序列后,要搞清楚 人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需 要经历很长期艰巨的研究过程。 、真核基因表达调控的特点 尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明 显的特点。 (一)真核基因表达调控的环节更多 如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过 程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基 因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过 程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多 的分量。图1扼要地列出真核基因表达的各个可能的环节
三类重复序列:①高度重复序列(highly repetitive sequences),这类序列一般较短, 长 10-300bp,在哺乳类基因组中重复 106 次左右,占基因组 DNA 序列总量的 10-60%,人的基因组中这类序列约占 20%,功能还不明了。②中度重复序列 (moderately repetitive sequences),这类序列多数长 100-500bp,重复 101-105 次,占基因组 10-40%。例如哺乳类中含量最多的一种称为 Alu 的序列,长约 300bp,在哺乳类不同种属间相似,在基因组中重复 3-×105 次,在人的基因组中 约占 7%,功能也还不很清楚。在人的基因组中 18S/28SrRNA 基因重复 280 次, 5SrRNA 基因重复 2000 次,tRNA 基因重复 1300 次,5 种组蛋白的基因串连成 簇重复 30-40 次,这些基因都可归入中度重复序列范围。③单拷贝序列(single copy sequences)。这类序列基本上不重复,占哺乳类基因组的 50-80%,在人基因组中 约占 65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复, 是单拷贝的基因。 从上述可见真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还 很有限,使现在国际上制订的人基因组研究计划(human gene project)完成,绘出 人全部基因的染色体定位图,测出人基因组 109bp 全部 DNA 序列后,要搞清楚 人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需 要经历很长期艰巨的研究过程。 二、真核基因表达调控的特点 尽管我们现在对真核基因表达调控知道还不多,但与原核生物比较它具有一些明 显的特点。 (一)真核基因表达调控的环节更多 如前所述,基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过 程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基 因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过 程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多 的分量。图 1 扼要地列出真核基因表达的各个可能的环节
图1真核生物基因表 真核基因表达的调控 达调控的可能环节 图1总结了以前章节叙 扩增 DNA 重排 转录前调控 述过的基因表达过程,并 细胞核 丢失 转录 作了一些新补充。图中标 转录调控 初始转录物 出了真核细胞在分化过 国工(内切接头,尾》 参饰(甲墨化氧化还转位 程中会发生基因重排 RNA 转录后训控 转运 (gene rearrangement), Ep 降解 胚原性基因组中某些基核苷酿 翻译调控 诉 因会再组合变化形成第 8&多酞前身物 级基因。例如编码完整 加工(内切、一S-S-形成) 输饰(碘酸化乙账化甲酰化译后调担 抗体蛋白的基因是在淋 加入(糖基脂类) 降解超成熟量白质 巴细胞分化发育过程中,短脏 氮基酸 执行功能 由原来分开的几百个不 同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的 完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基 因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基 因表达调控机理。 此外,真核细胞中还会发生基因扩增( gene amplification),即基因组中的特定段 落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的 发育过程中其rRNA基因(可称为TDNA)可扩增2000倍,以后发现其他动物的卵 细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质, 需要有大量核糖体。又如MIX( methotrexate)是叶酸的结构类似物,一些哺乳类 细胞会对含有利用叶酸所必需的二氢叶酸还原酶( dihydrofolate reductase,DHFR) 基因的DNA区段扩增40?00倍,使DHFR的表达量显著增加,从而提高对MIX 的抗性。基因的扩增无疑能够大幅度提髙基因表达产物的量,但这种调控机理至 今还不清楚。 (二)真核基因的转录与染色质的结构变化相关
图 1 真核生物基因表 达调控的可能环节 图 1 总结了以前章节叙 述过的基因表达过程,并 作了一些新补充。图中标 出了真核细胞在分化过 程中会发生基因重排 (gene rearrangement),即 胚原性基因组中某些基 因会再组合变化形成第 二级基因。例如编码完整 抗体蛋白的基因是在淋 巴细胞分化发育过程中, 由原来分开的几百个不 同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的 完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基 因的片段,组合变化而产生能编码达 108 种不同抗体的基因,其中就有复杂的基 因表达调控机理。 此外,真核细胞中还会发生基因扩增(gene amplification),即基因组中的特定段 落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞在受精后的 发育过程中其 rRNA 基因(可称为 rDNA)可扩增 2000 倍,以后发现其他动物的卵 细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质, 需要有大量核糖体。又如 MTX(methotrexate)是叶酸的结构类似物,一些哺乳类 细胞会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase, DHFR) 基因的 DNA 区段扩增 40?00 倍,使 DHFR 的表达量显著增加,从而提高对 MTX 的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至 今还不清楚。 (二)真核基因的转录与染色质的结构变化相关
真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结 构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象: 1染色质结构影响基因转录细胞分裂时染色体的大部分到间期时松开分散在 核内,称为常染色质( euchromatin),松散的染色质中的基因可以转录。染色体中 的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期 核中可以看到其浓集的斑块,称为异染色质( heterochromatin),其中从未见有基 因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺 乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的 基因就全部失活。可见紧密的染色质结构阻止基因表达。 2组蛋白的作用早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转 录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链 上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了 非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能 消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。 发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色 质区段,有富含赖氨酸的组蛋白(H1组蛋白)水平降低,H2AH2B组蛋白二聚体 不稳定性增加、组蛋白乙酰化( acetylation)和泛素化( ubiquitination),以及H3组蛋 白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域 也常缺乏核小体的结构。这些都表明核小体结构影响基因转录 3转录活跃区域对核酸酶作用敏感度增加染色质DNA受 DNaseⅠ作用通常会 被降解成00、400.…bp的片段,反映了完整的核小体规则的重复结构。但活跃 进行转录的染色质区域受 DNase I消化常出现100-200bp的DNA片段,且长 短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对 DNase I高敏感 点( hypersensitive site)。这种高敏感点常出现在转录基因的5侧区(5 flanking region)、3'末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体 的结构发生变化,可能有利于调控蛋白结合而促进转录
真核基因组 DNA 绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结 构、染色质中 NA 和组蛋白的结构状态都影响转录,至少有以下现象: 1.染色质结构影响基因转录 细胞分裂时染色体的大部分到间期时松开分散在 核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中 的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期 核中可以看到其浓集的斑块,称为异染色质(heterochromatin),其中从未见有基 因转录表达;原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺 乳类雌体细胞 2 条 X 染色体,到间期一条变成异染色质者,这条 X 染色体上的 基因就全部失活。可见紧密的染色质结构阻止基因表达。 2.组蛋白的作用 早期体外实验观察到组蛋白与DNA结合阻止DNA上基因的转 录,去除组蛋基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与 DNA 链 上带负电荷的磷酸基相结合,从而遮蔽了 DNA 分子,妨碍了转录,可能扮演了 非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能 消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。 发现核小体后,进一步观察核小体结构与基因转录的关系,发现活跃转录的染色 质区段,有富含赖氨酸的组蛋白(H1 组蛋白)水平降低,H2A·H2B 组蛋白二聚体 不稳定性增加、组蛋白乙酰化(acetylation)和泛素化(ubiquitination),以及 H3 组蛋 白巯基化等现象,这些都是核小体不稳定或解体的因素或指征。转录活跃的区域 也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。 3.转录活跃区域对核酸酶作用敏感度增加 染色质 DNA 受 DNase Ⅰ作用通常会 被降解成 00、400……bp 的片段,反映了完整的核小体规则的重复结构。但活跃 进行转录的染色质区域受 DNase Ⅰ消化常出现 100-200bp 的 DNA 片段,且长 短不均一,说明其 DNA 受组蛋白掩盖的结构有变化,出现了对 DNase Ⅰ高敏感 点(hypersensitive site)。这种高敏感点常出现在转录基因的 5′侧区(5′ flanking region)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体 的结构发生变化,可能有利于调控蛋白 结合而促进转录
4DNA拓扑结构变化天然双链DNA的构象大多是负性超螺旋。当基因活跃转 录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为 负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而 负性超螺旋则有利于核小体的再形成。 5DNA碱基修饰变化真核DNA中的胞嘧啶约有5%被甲基化为5甲基胞嘧啶 (5 methylcytid ine,msC),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低 这种甲基化最常发生在某些基因5侧区的CpG序列中,实验表明这段序列甲基 化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合 从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎 就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的 由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制 还缺乏认识。 (三)真核基因表达以正性调控为主 真核RNA聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要 依赖多种激活蛋白的协冋同作用。真核基因调控中虽然也发现有负性调控元件,但 其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两 种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作 用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基 因表达以正性调控为主导。 三、真核基因转录水平的调控 真核细胞的三种RNA聚合酶(I、Ⅱ和Ⅲ中,只有RNA聚合酶Ⅱ能转录生成 mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控 (一)顺式作用元件( ( cis acting elements
4.DNA 拓扑结构变化 天然双链 DNA 的构象大多是负性超螺旋。当基因活跃转 录时,RNA 聚合酶转录方向前方 DNA 的构象是正性超螺旋,其后面的 DNA 为 负性超螺旋。正性超螺旋会拆散核小体,有利于 RNA 聚合酶向前移动转录;而 负性超螺旋则有利于核小体的再形成。 5.DNA 碱基修饰变化 真核DNA 中的胞嘧啶约有 5%被甲基化为 5 甲基胞嘧啶 (5 methylcytidine,m5C),而活跃转录的 DNA 段落中胞嘧啶甲基化程度常较低。 这种甲基化最常发生在某些基因 5′侧区的 CpG 序列中,实验表明这段序列甲基 化可使其后的基因不能转录,甲基化可能阻碍转录因子与 DNA 特定部位的结合 从而影响转录。如果用基因打靶的方法除去主要的 DNA 甲基化酶,小鼠的胚胎 就不能正常发育而死亡,可见 DNA 的甲基化对基因表达调控是重要的。 由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制 还缺乏认识。 (三)真核基因表达以正性调控为主 真核 RNA 聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要 依赖多种激活蛋白的协同作用。真核基因调控中虽然也发现有负性调控元件,但 其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两 种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作 用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基 因表达以正性调控为主导。 三、真核基因转录水平的调控 真核细胞的三种 RNA 聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有 RNA 聚合酶Ⅱ能转录生成 mRNA,以下主要讨论 RNA 聚合酶Ⅱ的转录调控。 (一)顺式作用元件(cis acting elements)