第十一章蛋白的生物合成及加工修伟 第十一章蛋白质的生物合成及加工修饰 (The Biosynthesis and transport of protein 在不同的蛋白质分子中,氨基酸有着特定的排列顺序,这种特定的排列 顺序不是随机的,而是严格按照蛋白质的编码基因中的碱基排列顺序决定的。 基因的遗传信息在转录过程中从DNA转移到mRNA,再由mRNA将这种遗 传信息表达为蛋白质中氨基酸顺序的过程叫做翻译。翻译的过程也就是蛋白 质分子生物合成的过程,在此过程中需要200多种生物大分子参加,其中包 括核糖体、mRNA、tRNA及多种蛋白质因子。 第一节参与蛋白质生物合成的物质 、合成原料 自然界由mRNA编码的氨基酸共有20种,只有这些氨基酸能够作为蛋白 质生物合成的直接原料。某些蛋白质分子还含有羟脯氨酸、羟赖氨酸、γ-羧 基谷氨酸等,这些特殊氨基酸是在肽链合成后的加工修饰过程中形成的 下图给出部分特殊氨基酸分子式: COO FN-C-Il HSN-C-H EN-C-H CHa C-o CH CHI y-Carboxyglutamate Methyllysine Dimethyllysine 、mRNA是合成蛋白质的直接模板 蛋白质是在胞质中合成的,而编码蛋白质的信息载体DNA却在细胞核 内,所以必定有一种中间物质用来传递DNA上的信息,实验证明:mRNA是 遗传信息的传递者,是蛋白质生物合成过程中直接指令氨基酸掺入的模板 因此得名信使RNA 原核细胞中每种mRNA分子常带有多个功能相关蛋白质的编码信息,以 种多顺反子的形式排列,在翻译过程中可同时合成几种蛋白质:而真核细 胞中,每种mRNA一般只带有一种蛋白质编码信息,是单顺反子的形式 mRNA以它分子中的核苷酸排列顺序携带从DNA传递来的遗传信息,作为蛋 白质生物合成的直接模板,决定蛋白质分子中的氨基酸排列顺序。不同的蛋 白质有各自不同的mRNA,mRNA除含有编码区外,两端还有非编码区。非 编码区对于mRNA的模板活性是必需的,特别是5端非编码区在蛋白质合成 中被认为是与核糖体结合的部位
第十一章 蛋白质的生物合成及加工修饰 ·1· 第十一章 蛋白质的生物合成及加工修饰 (The Biosynthesis and transport of protein) 在不同的蛋白质分子中,氨基酸有着特定的排列顺序,这种特定的排列 顺序不是随机的,而是严格按照蛋白质的编码基因中的碱基排列顺序决定的。 基因的遗传信息在转录过程中从 DNA 转移到 mRNA,再由 mRNA 将这种遗 传信息表达为蛋白质中氨基酸顺序的过程叫做翻译。翻译的过程也就是蛋白 质分子生物合成的过程,在此过程中需要 200 多种生物大分子参加,其中包 括核糖体、mRNA、tRNA 及多种蛋白质因子。 第一节 参与蛋白质生物合成的物质 一、合成原料 自然界由 mRNA 编码的氨基酸共有 20 种,只有这些氨基酸能够作为蛋白 质生物合成的直接原料。某些蛋白质分子还含有羟脯氨酸、羟赖氨酸、γ-羧 基谷氨酸等,这些特殊氨基酸是在肽链合成后的加工修饰过程中形成的。 下图给出部分特殊氨基酸分子式: 二、mRNA 是合成蛋白质的直接模板 蛋白质是在胞质中合成的,而编码蛋白质的信息载体 DNA 却在细胞核 内,所以必定有一种中间物质用来传递 DNA 上的信息,实验证明:mRNA 是 遗传信息的传递者,是蛋白质生物合成过程中直接指令氨基酸掺入的模板, 因此得名信使 RNA。 原核细胞中每种 mRNA 分子常带有多个功能相关蛋白质的编码信息,以 一种多顺反子的形式排列,在翻译过程中可同时合成几种蛋白质;而真核细 胞中,每种 mRNA 一般只带有一种蛋白质编码信息,是单顺反子的形式。 mRNA 以它分子中的核苷酸排列顺序携带从 DNA 传递来的遗传信息,作为蛋 白质生物合成的直接模板,决定蛋白质分子中的氨基酸排列顺序。不同的蛋 白质有各自不同的 mRNA,mRNA 除含有编码区外,两端还有非编码区。非 编码区对于 mRNA 的模板活性是必需的,特别是 5'端非编码区在蛋白质合成 中被认为是与核糖体结合的部位
第十一章蛋白的生物合成及加工修伟 mRNA特点:短命原核:半衰期几秒-几分钟真核:半衰期数小时。 功能是蛋白质合成的模板,多肽链氨基酸排列顺序就取决于mRNA的核 苷酸的排列顺序。 蛋白质由20种氨基酸构成的,mRNA却只有4种碱基,如果由一种碱 基编码氨基酸,那么4种碱基只能决定4种氨基酸:如果2个碱基编码一种 氨基酸也只能编码42种氨基酸:若由3个碱基作为一组,可以有43=64种 排列,那么就满足了编码20种氨基酸的需要,实验证明:确实是3个碱基 编码一种氨基酸。 联体密码:3个连续的碱基编码一种氨基酸,即每3个核苷酸组成的1 个密码子,称为三联体密码子,简称密码子 、遗传密码的破译 破译遗传密码的突破性工作主要包括三个方面:一是体外翻译系统的建 立;二是核酸的人工合成;三是核糖体结合技术。 1966完全确定了编码20种氨基酸的遗传密码,编排出了遗传密码字典: (1)阐明蛋白质生物合成的基础。 (2)为分子遗传学的中心法则的确立提供了有力证据。是生命科学史上的 又一重大突破 mRNA分子上以5→3方向,从AUG开始每三个连续的核苷酸组成一个 密码子,mRNA中的四种碱基可以组成64种密码子。这些密码不仅代表了20 种氨基酸,还决定了翻译过程的起始与终止位置。每种氨基酸至少有一种密 码子,最多的有6种密码子。 在1966年编排出了遗传密码字典。见下表: Second letter of codon A G uut Phe uct Ser Uac tr UGU C U UUA Leu UCA Ser UAA Stop UGA Stop Leu UCG Ser UAG Stop UGG Trp CUU Leu CCU Pro CAU His CGUArg CUC Leu CCC Pro CAC His Arg First CUA Leu CCA Pro CAA GIn CGA Arg G Pro CAG GIn CO letter of codon U Ile ACU Thr AAU Asn AGU Ser (5′end)A GUU Val GCu Ala GAU Asp 姗器絀器
第十一章 蛋白质的生物合成及加工修饰 ·2· mRNA 特点:短命 原核:半衰期几秒-几分钟 真核:半衰期数小时。 功能是蛋白质合成的模板,多肽链氨基酸排列顺序就取决于 mRNA 的核 苷酸的排列顺序。 蛋白质由 20 种氨基酸构成的,mRNA 却只有 4 种碱基,如果由一种碱 基编码氨基酸,那么 4 种碱基只能决定 4 种氨基酸;如果 2 个碱基编码一种 氨基酸 也只能编码 4 2 种氨基酸;若由 3 个碱基作为一组,可以有 4 3=64 种 排列,那么就满足了编码 20 种氨基酸的需要,实验证明:确实是 3 个碱基 编码一种氨基酸。 三联体密码:3 个连续的碱基编码一种氨基酸,即每 3 个核苷酸组成的 1 个密码子,称为三联体密码子,简称密码子。 1、遗传密码的破译 破译遗传密码的突破性工作主要包括三个方面:一是体外翻译系统的建 立;二是核酸的人工合成;三是核糖体结合技术。 1966 完全确定了编码 20 种氨基酸的遗传密码,编排出了遗传密码字典: ⑴阐明蛋白质生物合成的基础。 ⑵为分子遗传学的中心法则的确立提供了有力证据。是生命科学史上的 又一重大突破。 mRNA 分子上以 5'→3'方向,从 AUG 开始每三个连续的核苷酸组成一个 密码子,mRNA 中的四种碱基可以组成 64 种密码子。这些密码不仅代表了 20 种氨基酸,还决定了翻译过程的起始与终止位置。每种氨基酸至少有一种密 码子,最多的有 6 种密码子。 在 1966 年编排出了遗传密码字典。见下表:
第十一章蛋白的生物合成及加工修伟 遗传密码字典 第二位 第三位 苯丙氨酸(Phe)|丝氮酸(ser) 酪氨酸(Tyr) 半胱氨酸(Cy)U 苯丙氨酸(Phe)丝氨酸(ser)|氨酸(Ty) 半胱氨酸(Cys)C 亮氨酸(Leu) 丝氨酸(ser) 终止密码子 终止密码子 亮氨酸(Leu 丝氨酸(Ser) 终止密码子 色氨酸(Trp) 亮氨酸(Leu) 脯氨酸(Pro) 氦酸(His) 精氨酸(Arg) 亮氨酸(Leu) 脯氨酸(Pro) 组氨酸(Hs) 精氨酸(Arg) 亮氨酸(Leu) 脑氨酸(Pro) 谷氨酰胺(Gn)精氨酸(Arq) 亮氨酸(Leu) 脯氨酸(Pro) 谷氨酰胺(Gn)精氨酸(Ar) 异死氯酸(I)苏氯酸(T)天冬酰胺(A如)丝氨酸(se)U 异亮氨酸(l)|苏氨酸(Thr) 天冬酰胺(Asn)丝氨酸(se 异亮氨酸(Ile) 氨酸(Thr) 赖氨酸(Lys) 精氨酸(Arg) 甲硫氨酸(met)|苏氨酸(Thr) 赖氨酸(Lys) 精氨酸(Arg) 缬氨酸(va) 丙氨酸(Ala) 天冬氨酸(Asp)甘氮酸(Gy) 缬氨酸(Va1) 丙氨酸(Ala) 天冬氨酸(Asp)甘氨酸(Gy) CAGUCA G|缬氨酸(vai 丙氨酸(A|a) 谷氨酸(Gu) 甘氨酸(Gy) 氨酸(Val 内氨酸(A|a 谷氨酸(Gu) 甘氨酸(Gy) 位于mRNA起动部位AUG为氨基酸合成肽链的起动信号。以哺乳动物 为代表的真核生物,此密码子代表蛋氨酸:以微生物为代表的原核生物则代 表甲酰蛋氨酸 密码子UAA、UAG、UGA是肽链成的终止密码,不代表任何氨基酸 它们单独或共同存在于mRNA3末端。人们赋予这三个密码子特殊的名字 UAA(赭石密码子)、UAG(蛋白石密码子)、UGA(琥珀密码子)。 2遗传密码具有以下特点 (1)按5→3方向编码(方向性:阅读方向5→3,与mRNA合成方向一致) 不重叠、无标点、连续的 从起始码AUG开始,三个碱基代有一个氨基酸,这就构成了一个连续不 断的读框,直至终止码。如果在读框中间插入或缺失一个碱基就会造成移码 突变,引起突变位点下游氨基排列的错误 (2)密码子的简并性(摆动性、变偶性) 种氨基酸可有两个或更多个密码子的现象为简并性。密码子的前两个 碱基决定其专一性,第三位碱基可有变异,如A、G、C、U。(即密码子 和反密码子的第一、第二两个碱基的配对是标准配对,而第三个碱基则可以 随意配对。) 这种简并性主要是由于密码子的第三个碱基发生摆动现象形成的,也就 是说密码子的专一性主要由前两个碱基决定,即使第三个碱基发生突变也能 翻译出正确的氨基酸, 同一种氨基酸共用不同密码子称为同义密码子。只有色氨酸(Irp)和甲硫
第十一章 蛋白质的生物合成及加工修饰 ·3· 遗传密码字典 U A C G U C A G U C A G 第二位 第一位 (5ˊ) 第三位 (3ˊ) U C A G U C A G U C A G 位于 mRNA 起动部位 AUG 为氨基酸合成肽链的起动信号。以哺乳动物 为代表的真核生物,此密码子代表蛋氨酸;以微生物为代表的原核生物则代 表甲酰蛋氨酸。 密码子 UAA、UAG、UGA 是肽链成的终止密码,不代表任何氨基酸, 它们单独或共同存在于 mRNA3'末端。人们赋予这三个密码子特殊的名字: UAA(赭石密码子)、UAG(蛋白石密码子)、UGA(琥珀密码子)。 2.遗传密码具有以下特点: ⑴按 5'→3'方向编码(方向性:阅读方向 5'→3',与 mRNA 合成方向一致)、 不重叠、无标点、连续的 从起始码 AUG 开始,三个碱基代有一个氨基酸,这就构成了一个连续不 断的读框,直至终止码。如果在读框中间插入或缺失一个碱基就会造成移码 突变,引起突变位点下游氨基排列的错误。 ⑵密码子的简并性(摆动性、变偶性) 一种氨基酸可有两个或更多个密码子的现象为简并性。密码子的前两个 碱基决定其专一性,第三位碱基可有变异,如 A 、G 、C 、U。(即密码子 和反密码子的第一、第二两个碱基的配对是标准配对,而第三个碱基则可以 随意配对。) 这种简并性主要是由于密码子的第三个碱基发生摆动现象形成的,也就 是说密码子的专一性主要由前两个碱基决定,即使第三个碱基发生突变也能 翻译出正确的氨基酸。 同一种氨基酸共用不同密码子称为同义密码子。只有色氨酸(Trp)和甲硫
第十一章蛋白的生物合成及加工修伟 氨酸(Met)仅有一个密码子 生物意义:可以减少有害的突变,简并增加了密码子中碱基改变仍然编 码原来氨基酸的可能性 (3)起始码与终止码( Initiation codon and termination codon) 密码子AUG是起始密码,代表合成肽链的第一个氨基酸的位置,它们位 于mRNA5′末端,同时也是蛋氨酸的密码子,因此原核生物和真核生物多肽 链合成的第一个氨基酸都是蛋氨酸(原核:甲酰蛋氨酸)。 当然少数细菌中也用GUG做为起始码。在真核生物CUG偶尔也用作起 始蛋氨酸的密码 密码子UAA,UAG,UGA是肽链成的终止密码子或无意义密码子,不 代表任何氨基酸,它们单独或共同存在于mRNA3末端。因此翻译是沿着 mRNA分子5′→3′方向进行的。 (4)密码的通用性 大量的事实证明生命世界从低等到高等,都使用一套密码,也就是说遗 传密码在很长的进化时期中保持不变。因此这张密码表是生物界通用的 然而,真核生物线粒体的密码子有许多不同于通用密码,例如(P514) 人线粒体中,UGA不是终止码,而是色氨酸的密码子;AGA,AGG不 是精氨酸的密码子,而是终止密码子,加上通用密码中的UAA和UAG,线 粒体中共有4个终止码子;内部甲硫氨酸密码子有两个,即AUG和AUA 而起始甲硫氨酸密码子有四组,即AUN。 例外:线粒体AUA、AUU→起始信号,而非lle:UGA→Trp,而非终 密码子结构与氨基酸侧链极性之间也有一定关系: ①氨基酸侧链极性性质在多数情况下由密码子的第二个碱基决定。第二个碱基为嘧啶(Y)时,氨 基酸侧链为非极性,第二个碱基为嘌呤时,氨基酸侧链则有极性 ②当第一个碱基为U或A,第二个碱基为C,第三个碱基无特异性时,所决定的氨基酸侧链为极 性,不带电 ③当第一个碱基不是U,第二个碱基是P时,氨基酸侧链则带电。在此前提下,若是一个是C或 A时,表示带正电的氨基酸,第一、二个碱基分别是G、A时,此种氨基酸带负电,但上述关系 也有个别例外 许多实验证实,在原核生物和高等真核生物中同一组密码子的使用频率 是不相同的。高频密码子多出现在那些表达量高的蛋白质基因中,例如,核 糖体蛋白质基因、RecA蛋白质基因等。这种使用频率与细胞内一组tRNA含 量不同有关
第十一章 蛋白质的生物合成及加工修饰 ·4· 密码子结构与氨基酸侧链极性之间也有一定关系: ①氨基酸侧链极性性质在多数情况下由密码子的第二个碱基决定。第二个碱基为嘧啶(Y)时,氨 基酸侧链为非极性,第二个碱基为嘌呤时,氨基酸侧链则有极性。 ②当第一个碱基为 U 或 A,第二个碱基为 C,第三个碱基无特异性时,所决定的氨基酸侧链为极 性,不带电。 ③当第一个碱基不是 U,第二个碱基是 P 时,氨基酸侧链则带电。在此前提下,若是一个是 C 或 A 时,表示带正电的氨基酸,第一、二个碱基分别是 G、A 时,此种氨基酸带负电,但上述关系 也有个别例外。 氨酸(Met)仅有一个密码子。 生物意义:可以减少有害的突变,简并增加了密码子中碱基改变仍然编 码原来氨基酸的可能性。 ⑶.起始码与终止码(Initiation codon and termination codon) 密码子 AUG 是起始密码,代表合成肽链的第一个氨基酸的位置,它们位 于 mRNA5′末端,同时也是蛋氨酸的密码子,因此原核生物和真核生物多肽 链合成的第一个氨基酸都是蛋氨酸(原核:甲酰蛋氨酸)。 当然少数细菌中也用 GUG 做为起始码。在真核生物 CUG 偶尔也用作起 始蛋氨酸的密码。 密码子 UAA,UAG,UGA 是肽链成的终止密码子或无意义密码子,不 代表任何氨基酸,它们单独或共同存在于 mRNA3'末端。因此翻译是沿着 mRNA 分子 5′→3′方向进行的。 ⑷密码的通用性 大量的事实证明生命世界从低等到高等,都使用一套密码,也就是说遗 传密码在很长的进化时期中保持不变。因此这张密码表是生物界通用的。 然而,真核生物线粒体的密码子有许多不同于通用密码,例如(P514): 人线粒体中,UGA 不是终止码,而是色氨酸的密码子;AGA,AGG 不 是精氨酸的密码子,而是终止密码子,加上通用密码中的 UAA 和 UAG,线 粒体中共有 4 个终止码子;内部甲硫氨酸密码子有两个,即 AUG 和 AUA; 而起始甲硫氨酸密码子有四组,即 AUN。 例外:线粒体 AUA、AUU→起始信号,而非 Ile ;UGA→Trp ,而非终 止子。 许多实验证实,在原核生物和高等真核生物中同一组密码子的使用频率 是不相同的。高频密码子多出现在那些表达量高的蛋白质基因中,例如,核 糖体蛋白质基因、RecA 蛋白质基因等。这种使用频率与细胞内一组 tRNA 含 量不同有关
第十一章蛋白的生物合成及加工修伟 、tRNA是活化氨基酸的运载工具 tRNA在蛋白质生物合成过程中起关键作用。mRNA推带的遗传信息被翻 译成蛋白质一级结构,但是mRNA分子与氨基酸分子之间并无直接的对应关 系。这就需要经过第三者“介绍”,而tRNA分子就充当这个角色。 tRNA分子的二级结构呈三叶草型,三级结构呈倒L型。 tRNA是类小分子RNA,长度为73-94个核苷酸,tRNA分子中富含稀有 碱基和修饰碱基,tRNA分子3端均为CCA序列,氨基酸分子通过共价键与 氨基酸结合,此处的结构也叫氨基酸臂。每种氨基酸都有2-6种各自特异的 tRNA,它们之间的特异性是靠氨酰tRNA合成酶来识别的。这样,携带相同 氨基酸而反密码子不同的一组tRNA称为同功tRNA,它们在细胞内合成量上 有多和少的差别,分别称为主要tRNA和次要 tRNA。 主要tRNA中反密码子识别tRNA中的高 频密码子,而次要tRNA中反密码子识别 mRNA中的低频密码子。每种氨基酸都只有 种氨酰tRNA合成酶。因此细胞内有20种 氨酰tRNA合成酶 tRNA分子中还有一个反密码环,此环上 的三个反密码子的作用是与mRNA分子中的 密码子靠碱基配对而形成氢键,达到相互识别 的目的。但在密码子与反密码子结合时具有 定摆动性,即密码子的第3位碱基与反密码子mRNA5 A U C 的第1位碱基配对时并不严格,见右图 23 Codon 配对摆动性完全是由tRNA反密码子的 空间结构所决定的。反密码的第1位碱基常出 现次黄嘌呤I(见下图),与A、C、U之间皆可形成氢键而结合,这是最常见 的摆动现象。这种摆动现象使得一个tRNA所携带的氨基酸可排列在2-3个不 同的密码子上,因此当密码子的第3位碱基发生一定程度的突变时,并不影 响tRNA带入正确的氨基酸。1 321 321 Anticodon(3’)G-C-I G-C-I G-C-I(5) Codon (5)C-G-A C-G-U C-G-C(3’) 123 123 123 在蛋白质生物合成过程中,特异识别mRNA上起始密码子的tRNA被称 为起始tRNA,它们参加多肽链合成的起始,其它在多肽链延伸中运载氨基酸 的tRNA,统称为延伸tRNA
第十一章 蛋白质的生物合成及加工修饰 ·5· 三、tRNA 是活化氨基酸的运载工具 tRNA 在蛋白质生物合成过程中起关键作用。mRNA 推带的遗传信息被翻 译成蛋白质一级结构,但是 mRNA 分子与氨基酸分子之间并无直接的对应关 系。这就需要经过第三者“介绍”,而 tRNA 分子就充当这个角色。 tRNA 分子的二级结构呈三叶草型,三级结构呈倒L 型。 tRNA 是类小分子 RNA,长度为 73-94 个核苷酸,tRNA 分子中富含稀有 碱基和修饰碱基,tRNA 分子 3'端均为 CCA 序列,氨基酸分子通过共价键与 氨基酸结合,此处的结构也叫氨基酸臂。每种氨基酸都有 2-6 种各自特异的 tRNA,它们之间的特异性是靠氨酰 tRNA 合成酶来识别的。这样,携带相同 氨基酸而反密码子不同的一组 tRNA 称为同功 tRNA,它们在细胞内合成量上 有多和少的差别,分别称为主要 tRNA 和次要 tRNA。 主要 tRNA 中反密码子识别 tRNA 中的高 频密码子,而次要 tRNA 中反密码子识别 mRNA 中的低频密码子。每种氨基酸都只有 一种氨酰 tRNA 合成酶。因此细胞内有 20 种 氨酰 tRNA 合成酶。 tRNA 分子中还有一个反密码环,此环上 的三个反密码子的作用是与 mRNA 分子中的 密码子靠碱基配对而形成氢键,达到相互识别 的目的。但在密码子与反密码子结合时具有一 定摆动性,即密码子的第 3 位碱基与反密码子 的第 1 位碱基配对时并不严格,见右图。 配对摆动性完全是由 tRNA 反密码子的 空间结构所决定的。反密码的第 1 位碱基常出 现次黄嘌呤 I(见下图),与 A、C、U 之间皆可形成氢键而结合,这是最常见 的摆动现象。这种摆动现象使得一个 tRNA 所携带的氨基酸可排列在 2-3 个不 同的密码子上,因此当密码子的第 3 位碱基发生一定程度的突变时,并不影 响 tRNA 带入正确的氨基酸。 在蛋白质生物合成过程中,特异识别 mRNA 上起始密码子的 tRNA 被称 为起始 tRNA,它们参加多肽链合成的起始,其它在多肽链延伸中运载氨基酸 的 tRNA,统称为延伸 tRNA