第十三章基因的转录、转录后 加工及逆转录 转录( transcription)是以DNA单链为模板,NIP为原料,在DNA依赖的RNA聚合酶催 化下合成RNA链的过程。与DNA的复制相比,有很多相同或相似之处,亦有其特点,它们 之间的异同可简要示于表13-1 表13-1转录与复制的异同 相同 转录 复制 或相似 基因的模板链转录 2股链均全复制 DNA dNTP 核苷三磷酸 碱基配对 A T-A: G-C A-T: G-C 遵从碱基配对原则 聚合酶 RNA聚合酶 DNA聚合酶 依赖DNA的聚合酶 产物 mRNA,tRNA,rRNA等DNA 多核苷酸链 转录的模板是单链DNA,与复制的模板有较多的不同特点,引出了下列相关概念。转录过程 只以基因组DNA中编码RNA(mRNA、tRNA、rRNA及小RNA)的区段为模板。把DNA 分子中能转录出RNA的区段,称为结构基因( structure gene)。结构基因的双链中,仅有一股 链作为模板转录成RNA,称为模板链( template strand),也称作 Watson(W)链( (Watson strand) 负(-)链( minus strand)或反意义链( antisense strand)。与模板链相对应的互补链,其编码区的 碱基序列与mRNA的密码序列相同(仅T、U互换),称为编码链( coding strand,也称作 Crick (C)链( Crick strand)、正(+)链( plus strand),或有意义链( sense strand)。不同基因的模板 链与编码链,在DNA分子上并不是固定在某一股链,这种现象称为不对称转录( asymmetrIc transcription)。模板链在相同双链的不同单股时,由于转录方向都从5’→3,表观上转录方向 相反,如图13-1。 与DNA复制类似,转录过程在原核生物和真核生物中所需的酶和相关因子有所不同,转 录过程及转录后的加工修饰亦有差异。下面的讨论中将分别叙述 参与转录的藤 转录酶( transcriptase)是依赖DNA的RNA聚合酶( DNA dependent RNA polymerase
1 第十三章 基 因 的 转 录、转 录 后 加 工 及 逆 转 录 转录 (transcription) 是以 DNA 单链为模板,NTP 为原料,在 DNA 依赖的 RNA 聚合酶催 化下合成 RNA 链的过程。与 DNA 的复制相比,有很多相同或相似之处,亦有其特点,它们 之间的异同可简要示于表 13-1 表 13-1 转录与复制的异同 差 异 相 同 转录 复制 或相似 模板 基因的模板链转录 2 股链均全复制 DNA 原料 NTP dNTP 核苷三磷酸 碱基配对 A-U,T-A;G-C A-T;G-C 遵从碱基配对原则 聚合酶 RNA 聚合酶 DNA 聚合酶 依赖 DNA 的聚合酶 产物 mRNA,tRNA,rRNA 等 DNA 多核苷酸链 转录的模板是单链 DNA,与复制的模板有较多的不同特点,引出了下列相关概念。转录过程 只以基因组 DNA 中编码 RNA(mRNA、tRNA、rRNA 及小 RNA)的区段为模板。把 DNA 分子中能转录出 RNA 的区段,称为结构基因(structure gene)。结构基因的双链中,仅有一股 链作为模板转录成 RNA,称为模板链(template strand),也称作 Watson(W)链(Watson strand)、 负(-)链(minus strand)或反意义链(antisense strand)。与模板链相对应的互补链,其编码区的 碱基序列与 mRNA 的密码序列相同(仅 T、U 互换),称为编码链(coding strand),也称作 Crick (C)链(Crick strand)、正(+)链(plus strand),或有意义链(sense strand)。不同基因的模板 链与编码链,在 DNA 分子上并不是固定在某一股链,这种现象称为不对称转录(asymmetric transcription)。模板链在相同双链的不同单股时,由于转录方向都从 5’→3’,表观上转录方向 相反,如图 13-1。 与 DNA 复制类似,转录过程在原核生物和真核生物中所需的酶和相关因子有所不同,转 录过程及转录后的加工修饰亦有差异。下面的讨论中将分别叙述。 第一节 参 与 转 录 的 酶 转录酶(transcriptase)是依赖 DNA 的 RNA 聚合酶(DNA dependent RNA polymerase
DDRP),亦称为DNA指导的RNA聚合酶( DNA directed RNa polymerase),简称为RNA聚 合酶( RNA pol)。它以DNA为模板催化RNA的合成 原核生物和真核生物的转录酶,均能在模板链的转录起始部位,催化2个游离的NIP形 成磷酸二酯键而引发转录的起始,如图13-2所示。因此,转录的起始不需引物,这也是转录 与复制在起始阶段的一大区别。 原核生物的RNA聚合酶 细菌中只发现一种RNA聚合酶,能催化mRNA,tRNA和rRNA等的合成,研究得比较 清楚的是大肠杆菌(Ecol)的RNA聚合酶。 (一)大肠杆菌RNA聚合酶的组成 大肠杆菌RNA聚合酶的分子量约450kDa,由四种5个亚基(a2BB′0)组成全酶 ( holoenzyme),σ亚基与全酶疏松结合,在胞内、外均容易从全酶中解离,解离后的部分(a ββ′)称为核心酶( core enzyme)。通过利福霉素等抑制转录的实验研究,对转录酶各亚基 的功能已有一定的认识:α亚基可能参与全酶的组装及全酶识别启动子,从而决定哪些基因 可转录;β亚基与底物(NTP)及新生RNA链结合:B′亚基与模板DNA结合:β和β′ 亚基组成酶的活性中心,通过DNA的磷酸基团与核心酶的碱性基团间的非特异性吸附作用, 核心酶能与模板DNA非特异性松驰结合:σ亚基的功能是识别启动子,辩认转录起始点,但 不能单独与DNA模板结合,当它与核心酶结合时,可引起酶构象的改变,从而改变核心酶与 DNA结合的性质,使全酶对转录起始点的亲和力比其他部位高4个数量级,在转录延长阶段 o亚基与核心酶分离,仅由核心酶参与延长过程。因此,o亚基实际上被认为是一种转录辅 助因子,因而称为o因子( o factor) (二)a因子 生物体在生命周期的不同阶段或在内、外环境有所变化时,其基因表达有一定的时、空 顺序,以适应生长、发育及环境变化的需要。RNA聚合酶的活性是决定基因表达的重要一环 而因子是RNA聚合酶识别及结合启动子的亚基,原核生物中所有RNA的转录都由同一种RNA 聚合酶催化,在生命周期的不同阶段或不同环境下,这个酶如何识别所有转录单位的启动子, 是由识别启动子的o因子来完成的。 基因启动子-35和-10区的共有序列(图13-3)是因子识别的位点,如表13-2所示
2 DDRP),亦称为 DNA 指导的 RNA 聚合酶(DNA directed RNA polymerase),简称为 RNA 聚 合酶(RNA pol)。它以 DNA 为模板催化 RNA 的合成。 原核生物和真核生物的转录酶,均能在模板链的转录起始部位,催化 2 个游离的 NTP 形 成磷酸二酯键而引发转录的起始,如图 13-2 所示。因此,转录的起始不需引物,这也是转录 与复制在起始阶段的一大区别。 一、 原核生物的 RNA 聚合酶 细菌中只发现一种 RNA 聚合酶,能催化 mRNA,tRNA 和 rRNA 等的合成,研究得比较 清楚的是大肠杆菌(E coli)的 RNA 聚合酶。 (一) 大肠杆菌 RNA 聚合酶的组成 大肠杆菌 RNA 聚合酶的分子量约 450kDa,由四种 5 个亚基(α2ββ′σ)组成全酶 (holoenzyne),σ亚基与全酶疏松结合,在胞内、外均容易从全酶中解离,解离后的部分(α 2ββ′)称为核心酶(core enzyme)。通过利福霉素等抑制转录的实验研究,对转录酶各亚基 的功能已有一定的认识:α亚基可能参与全酶的组装及全酶识别启动子,从而决定哪些基因 可转录;β亚基与底物(NTP)及新生 RNA 链结合;β′亚基与模板 DNA 结合;β和β′ 亚基组成酶的活性中心,通过 DNA 的磷酸基团与核心酶的碱性基团间的非特异性吸附作用, 核心酶能与模板 DNA 非特异性松驰结合;σ亚基的功能是识别启动子,辩认转录起始点,但 不能单独与 DNA 模板结合,当它与核心酶结合时,可引起酶构象的改变,从而改变核心酶与 DNA 结合的性质,使全酶对转录起始点的亲和力比其他部位高 4 个数量级,在转录延长阶段, σ亚基与核心酶分离,仅由核心酶参与延长过程。因此,σ亚基实际上被认为是一种转录辅 助因子,因而称为σ因子(σfactor)。 (二)σ因子 生物体在生命周期的不同阶段或在内、外环境有所变化时,其基因表达有一定的时、空 顺序,以适应生长、发育及环境变化的需要。RNA 聚合酶的活性是决定基因表达的重要一环。 而σ因子是 RNA 聚合酶识别及结合启动子的亚基,原核生物中所有 RNA 的转录都由同一种 RNA 聚合酶催化,在生命周期的不同阶段或不同环境下,这个酶如何识别所有转录单位的启动子, 是由识别启动子的σ因子来完成的。 基因启动子 -35 和-10 区的共有序列(图 13-3)是σ因子识别的位点,如表 13-2 所示
不同的o因子能识别的共有序列可以完全不同。 二、真核生物的RNA聚合醇 真核生物的RNA聚合酶已发现有三种,称为RNA聚合酶Ⅰ、II和III,分别负责转录不同 的RNA,它们对特异性抑制剂鹅膏蕈碱的敏感性亦有差异,如表13-3所示。 第二节转录过程 转录是生物合成RNA的过程,与复制相似,有起始、核苷酸链延长和链合成终止三个阶 转录的起始 转录的起始,就是形成转录起始复合物的过程。这一阶段反应所需的辅助因子,在原核生 物与真核生物之间有较大的差异。 ()原核生物转录的起始 转录的起始由RNA聚合酶与DNA模板的启动子( promoter)结合 经过对百种以上原核生物不同基因的启动子进行分析,发现启动子具有下列的共同点 在-10bp处有一段共有序列( consensus sequence),富含AT,即- TATAAT-,系 Pribnow等 首先发现,因而称为 Pribnow盒(box),再往上游-35bp的中心处又有一组保守的共有序列, 即- TTGACT。启动子邻近的结构示如图13-3。 结合过程可分为二个步骤,首先由σ因子辨认启动子的-35区,全酶与该区结合,形成 疏松的复合物,此时DNA双链未解开,因而称为封闭型转录起始复合物,继而RNA聚合酶移 向-10区及转录起始点,在-20区处DNA发生局部解链,形成12~17bp的单链区,RNA聚合 酶与DNA结合更紧密,形成开放型转录起始复合物。以单链的模板链为模板,RM聚合酶上的 起始位点和延伸位点被相应的NTP占据,聚合酶的β亚基催化第一个磷酸二酯键的生成,σ 亚基从全酶解离,形成DNA-RNA聚合酶(核心酶)结合在一起的起始延伸复合物。 白真核生物转录的起始 真核生物有三种RNA聚合酶,分别催化不同RNA的合成,每种酶都需要一些蛋白质辅助 因子,称为转录因子( transcription factor,TF)。为方便讨论,转录因子的命名冠以聚合酶 的名称。如RNA聚合酶Ⅱ所需的转录因子称为转录因子Ⅱ( transcription factorⅢ,TFⅡ)。 1.RNA聚合I催化的转录起始RNA聚合酶I催化前rRNA(40SRNA)的合成。前
3 不同的σ因子能识别的共有序列可以完全不同。 二、 真核生物的 RNA 聚合酶 真核生物的 RNA 聚合酶已发现有三种,称为 RNA 聚合酶 I、II和III,分别负责转录不同 的 RNA,它们对特异性抑制剂鹅膏蕈碱的敏感性亦有差异,如表 13-3 所示。 第二节 转录过程 转录是生物合成 RNA 的过程,与复制相似,有起始、核苷酸链延长和链合成终止三个阶 段。 一、 转录的起始 转录的起始,就是形成转录起始复合物的过程。这一阶段反应所需的辅助因子,在原核生 物与真核生物之间有较大的差异。 ㈠ 原核生物转录的起始 转录的起始由 RNA 聚合酶与 DNA 模板的启动子(promoter)结合。 经过对百种以上原核生物不同基因的启动子进行分析,发现启动子具有下列的共同点: 在-10bp 处有一段共有序列(consensus sequence),富含 AT,即 –TATAAT-,系 Pribnow 等 首先发现,因而称为 Pribnow 盒(box),再往上游-35bp 的中心处又有一组保守的共有序列, 即-TTGACT-。启动子邻近的结构示如图 13-3。 结合过程可分为二个步骤,首先由σ因子辨认启动子的–35 区,全酶与该区结合,形成 疏松的复合物,此时 DNA 双链未解开,因而称为封闭型转录起始复合物,继而 RNA 聚合酶移 向–10 区及转录起始点,在–20 区处 DNA 发生局部解链,形成 12~17bp 的单链区,RNA 聚合 酶与 DNA 结合更紧密,形成开放型转录起始复合物。以单链的模板链为模板,RNA 聚合酶上的 起始位点和延伸位点被相应的 NTP 占据,聚合酶的β亚基催化第一个磷酸二酯键的生成,σ 亚基从全酶解离,形成 DNA-RNA 聚合酶(核心酶)结合在一起的起始延伸复合物。 ㈡ 真核生物转录的起始 真核生物有三种 RNA 聚合酶,分别催化不同 RNA 的合成,每种酶都需要一些蛋白质辅助 因子,称为转录因子(transcription factor,TF)。为方便讨论,转录因子的命名冠以聚合酶 的名称。如 RNA 聚合酶Ⅱ所需的转录因子称为转录因子Ⅱ(transcription factorⅡ, TFⅡ)。 1. RNA 聚合酶 I 催化的转录起始 RNA 聚合酶 I 催化前 rRNA(40S RNA)的合成。前
rRNA基因转录起始点上游有两个顺式作用元件( cis acting element),一个是跨越起始点的 核心元件( core element),另一个在-100bp处有上游调控元件( upstream control lement,UCE)。RNA聚合酶I催化的转录需要2种转录因子,分别称为上游结合因子( upstream binding factor,UBF)和选择性因子1( selective factor1,SL1)。SL1含有4个亚基,一个 是TATA盒结合蛋白(TATA- binding protein,TBP),另3个是TBP相关因子(TBP- associated factors,TAF)。UBF与DNA结合令模板DNA发生弯曲,使相距上百bp的UCE和核心元件靠拢, 接着SL1和polI相继结合到UBF-DNA复合物上,完成起始复合物的组建,开始转录,如图13-4 所示 2.RNA聚合酶I催化的转录起始 RNA聚合酶II催化各种前体mRNA的合成。研究表明,RMNA聚合酶I催化的转录起始需要 较多的转录因子参与。为了便于讨论,它们的命名是在转录因子Ⅱ(TFⅡ)后加上大写字母, 分别称为TFⅡA~J。 RNA聚合酶Ⅱ结合的启动子的特点是,转录起始点上游有三处参与转录调控的保守序列 或称为顺式作用元件。在-90bp处有核心序列为 GGGCGG的GC盒,-70bp处有共有 ( consensus)序列为GGC(T) CAATCT的CAAT盒,-30bp处有共有序列为TATA(T)AAT 的TATA盒,又称 Hogness盒( Hogness box)。转录起始点与原核生物相似,大多数为A或G 转录起始复合物的组装:如图13-5 3.RM聚合酶Ⅲ催化的转录起始RN聚合酶Ⅲ催化tRNA,5 S rRNA和7 S rRNA的转录 (1)tRNA基因转录的起始:tRNA基因的转录初产物是tRNA的前体,经加工后产生多 个成熟tRNA。在DNA上的调控序列位于起始转录位点的下游,称为内部启动子。有二个调控 区,分别位于编码 tRNA D环和Tψ环的序列,分别称为A盒和B盒 如图3-6所示。 (2)5SRNA基因转录的起始:5SRNA基因的转录除了需要TFIB和TFⅢC外,还需要 TFIA,首先由TFⅢA结合到起始位点下游81~99b处(C盒),然后 TFIlIC结合到A盒和B 盒,继而是类似tRNA的转录,TFⅢB与TFIC作用,和聚合酶Ⅲ的结合,即可起始转录 、转录的延长 转录延长阶段发生的反应,在原核生物和真核生物比较相近。总的来说,一是聚合酶如
4 rRNA 基因转录起始点上游有两个顺式作用元件(cis acting element),一个是跨越起始点的 核心元件(core element),另一个在–100bp 处有上游调控元件(upstream control element,UCE)。RNA 聚合酶 I 催化的转录需要 2 种转录因子,分别称为上游结合因子(upstream binding factor,UBF)和选择性因子 1(selective factor1,SL1)。SL1 含有 4 个亚基,一个 是 TATA 盒结合蛋白(TATA-binding protein,TBP),另 3 个是 TBP 相关因子(TBP-associated factors,TAF)。UBF 与 DNA 结合令模板 DNA 发生弯曲,使相距上百 bp 的 UCE 和核心元件靠拢, 接着 SL1 和 pol I 相继结合到 UBF-DNA 复合物上,完成起始复合物的组建,开始转录,如图 13-4 所示。 2.RNA 聚合酶II催化的转录起始 RNA 聚合酶II催化各种前体 mRNA 的合成。研究表明,RNA 聚合酶II催化的转录起始需要 较多的转录因子参与。为了便于讨论,它们的命名是在转录因子Ⅱ(TFⅡ)后加上大写字母, 分别称为 TFⅡA~J。 RNA 聚合酶Ⅱ结合的启动子的特点是,转录起始点上游有三处参与转录调控的保守序列 或称为顺式作用元件。在–90bp 处有核心序列为 GGGCGG 的 GC 盒,–70bp 处有共有 (consensus)序列为 GGC(T)CAATCT 的 CAAT 盒,–30bp 处有共有序列为 TATAA(T)AAT 的 TATA 盒,又称 Hogness 盒(Hogness box)。转录起始点与原核生物相似,大多数为 A 或 G。 转录起始复合物的组装:如图 13-5。 3.RNA 聚合酶Ⅲ催化的转录起始 RNA 聚合酶Ⅲ催化 tRNA,5S rRNA 和 7S rRNA 的转录。 (1) tRNA 基因转录的起始: tRNA 基因的转录初产物是 tRNA 的前体,经加工后产生多 个成熟 tRNA。在 DNA 上的调控序列位于起始转录位点的下游,称为内部启动子。有二个调控 区,分别位于编码 tRNA D-环和 Tψ环的序列,分别称为 A 盒和 B 盒。 如图 3-6 所示。 (2)5S RNA 基因转录的起始: 5S RNA 基因的转录除了需要 TFⅢB 和 TFⅢC 外,还需要 TFⅢA,首先由 TFⅢA 结合到起始位点下游 81~99 bp 处(C 盒),然后 TFⅢC 结合到 A 盒和 B 盒,继而是类似 tRNA 的转录,TFⅢB 与 TFⅢC 作用,和聚合酶Ⅲ的结合,即可起始转录。 二、 转录的延长 转录延长阶段发生的反应,在原核生物和真核生物比较相近。总的来说,一是聚合酶如
何向转录起始点下游移动,继续指导核苷酸之间磷酸二酯键的形成,二是转录区的模板如何 形成局部单链区,便于转录 原核生物RNA聚合酶催化转录起始,即核苷酸链中的第一个磷酸二酯键形成后,σ因子 从全酶中解离出来,核心酶就能沿DNA分子移动,真核生物RNA聚合酶不仅需要较多的转录 因子来催化起始,而且转录起始后,酶的移动也靠多种转录因子的共同作用使酶的构象发生 改变来实现,如在TFⅢH等作用下,聚合酶IC端丝氨酸残基的磷酸化是聚合酶向下游移动的 重要因素。 在转录延长过程中,DNA双链需解开10~20bp,形成的局部单链区象一个小泡,故形象 地称为转录泡( transcription bubble)。转录泡是指RNA聚合酶-DNA模板-转录产物RNA结 合在一起形成的转录复合物。为了保持局部的转录泡状态,在RNA聚合酶下游的DNA需不断 解链,可使其下游的DNA(未解开双链部分)越缠越紧,形成正超螺旋,而其上游DNA变得松 驰,产生负超螺旋,需要解旋酶( gyrase)和拓扑异构酶来消除这些现象,如图13-7 转录起始复合物中,核苷酸之间第一个磷酸二酯键的形成是由第一个核苷酸的3’-OH与 第二个核苷酸的5’-磷酸之间脱水而成。第一个核苷酸常为G,来自GTP的5’一三磷酸仍保 留,第二个核苷酸的3’-OH仍然游离形成5’ pppgpP-OH3’。在聚合酶沿模板链的3’→5 移动时,可按模板链碱基序列的指引,相应NTP上的α-磷酸可与延长新链的3’-OH相继形 成磷酸二酯键,其β、γ磷酸基脱落生成焦磷酸后迅速水解,释放的能量进一步推动转录 使新合成的RNA链沿着5’→3’方向逐步延长。在转录局部形成的RNA:DNA杂化双链之间 的引力比DNA双链的弱(因为杂化双链间存在dA:rU配对,dA:rU的稳定性比dA:dT的小), 延长中的RNA链的5’-端会被重新形成的DNA双链挤出,使合成中的RNA的5’-端游离于转 录复合物。 三、转录的终止 ()原核生物转录的终止 原核生物转录的终止有两种主要机制。一种机制是需要蛋白质因子p(Rho)的参与,称 为依赖ρ因子( p factor)的转录终止机制,另一种机制是在离体系统中观察到,纯化的RNA 聚合酶不需要其他蛋白质因子参与,可使转录终止,称为不依赖ρ因子的转录终止机制 1依赖p因子的转录终止:p因子是一种分子量为46kDa的蛋白质,以六聚体为活性形
5 何向转录起始点下游移动,继续指导核苷酸之间磷酸二酯键的形成,二是转录区的模板如何 形成局部单链区,便于转录。 原核生物 RNA 聚合酶催化转录起始,即核苷酸链中的第一个磷酸二酯键形成后,σ因子 从全酶中解离出来,核心酶就能沿 DNA 分子移动,真核生物 RNA 聚合酶不仅需要较多的转录 因子来催化起始,而且转录起始后,酶的移动也靠多种转录因子的共同作用使酶的构象发生 改变来实现,如在 TFⅡH 等作用下,聚合酶ⅡC 端丝氨酸残基的磷酸化是聚合酶向下游移动的 重要因素。 在转录延长过程中,DNA 双链需解开 10~20 bp,形成的局部单链区象一个小泡,故形象 地称为转录泡(transcription bubble)。转录泡是指 RNA 聚合酶-DNA 模板-转录产物 RNA 结 合在一起形成的转录复合物。为了保持局部的转录泡状态,在 RNA 聚合酶下游的 DNA 需不断 解链,可使其下游的 DNA(未解开双链部分)越缠越紧,形成正超螺旋,而其上游 DNA 变得松 驰,产生负超螺旋,需要解旋酶(gyrase) 和拓扑异构酶来消除这些现象,如图 13-7。 转录起始复合物中,核苷酸之间第一个磷酸二酯键的形成是由第一个核苷酸的 3’-OH 与 第二个核苷酸的 5’-磷酸之间脱水而成。第一个核苷酸常为 G,来自 GTP 的 5’-三磷酸仍保 留,第二个核苷酸的 3’-OH 仍然游离形成 5’pppGpN-OH3’。在聚合酶沿模板链的 3’→5’ 移动时,可按模板链碱基序列的指引,相应 NTP 上的α-磷酸可与延长新链的 3’-OH 相继形 成磷酸二酯键,其β、γ磷酸基脱落生成焦磷酸后迅速水解,释放的能量进一步推动转录, 使新合成的 RNA 链沿着 5’→ 3’方向逐步延长。在转录局部形成的 RNA∶DNA 杂化双链之间 的引力比 DNA 双链的弱(因为杂化双链间存在 dA∶rU 配对,dA∶rU 的稳定性比 dA∶dT 的小), 延长中的 RNA 链的 5’-端会被重新形成的 DNA 双链挤出,使合成中的 RNA 的 5’-端游离于转 录复合物。 三、 转录的终止 ㈠ 原核生物转录的终止 原核生物转录的终止有两种主要机制。一种机制是需要蛋白质因子ρ(Rho)的参与,称 为依赖ρ因子(ρfactor)的转录终止机制,另一种机制是在离体系统中观察到,纯化的 RNA 聚合酶不需要其他蛋白质因子参与,可使转录终止,称为不依赖ρ因子的转录终止机制。 1 依赖ρ因子的转录终止: ρ因子是一种分子量为 46kDa 的蛋白质,以六聚体为活性形