第四章DNA、RNA、和遗传信息流 Chapter 4 Opener part 1 Blochemistry,Sixth Edition 2007 W.H.Freeman and Company 这个母亲和她的两个女儿基因相同,所以她们长得很相像。基因必须表达后才能执行其功能。 蛋白质调节基因的表达。锌指纹蛋白是一个调节基因表达的蛋白质。该蛋白质(用绿色球表 示锌;用红色表示蛋白质)能够与相应的DNA区域(黑色)结合。这段DNA区域就是基因 表达的调控区域[left)Barnaby Hall/Photonica.(right)Drawn from 1AAY.pdb]。 DNA和RNA是核酸。核酸携带的遗传信息能够一代代传递。这些生物大分子是很多核 苷酸的线性聚合物。每个核苷酸有糖基、磷酸、和碱基。磷酸连接的糖形成核酸骨架,起结 构作用。核酸链排布的碱基序列携带遗传信息。DNA分子是双螺旋,有两条序列互补的核 酸链。一条核酸链可以充当另一条核酸链的模板。DNA是所有细胞和很多病毒的基因。但 是有些病毒的遗传物质是RNA分子。 基因决定了细胞蛋白质的种类,但是DNA不是蛋白质合成的直接模板。DNA链的序列 信息先拷贝到RNA分子(即信使RNA,mRNA)。mRNA所携带的遗传信息指导蛋白质合成。 DNA信息拷贝到RNA分子的过程叫转录(transcription),而mRNA分子作为模板指导蛋白 质合成的过程叫潮译translation)。在正常细胞内遗传信息的流动(也称基因表达)是DNA 转录产生RNA,RNA作为模板翻译成蛋白质。 transcription translation DNA RNA Protein
第四章 DNA、RNA、和遗传信息流 这个母亲和她的两个女儿基因相同,所以她们长得很相像。基因必须表达后才能执行其功能。 蛋白质调节基因的表达。锌指纹蛋白是一个调节基因表达的蛋白质。该蛋白质(用绿色球表 示锌;用红色表示蛋白质)能够与相应的 DNA 区域(黑色)结合。这段 DNA 区域就是基因 表达的调控区域 [(left)Barnaby Hall/Photonica. (right) Drawn from 1AAY.pdb]。 DNA 和 RNA 是核酸。核酸携带的遗传信息能够一代代传递。这些生物大分子是很多核 苷酸的线性聚合物。每个核苷酸有糖基、磷酸、和碱基。磷酸连接的糖形成核酸骨架,起结 构作用。核酸链排布的碱基序列携带遗传信息。DNA 分子是双螺旋,有两条序列互补的核 酸链。一条核酸链可以充当另一条核酸链的模板。DNA 是所有细胞和很多病毒的基因。但 是有些病毒的遗传物质是 RNA 分子。 基因决定了细胞蛋白质的种类,但是 DNA 不是蛋白质合成的直接模板。DNA 链的序列 信息先拷贝到 RNA 分子(即信使 RNA, mRNA)。mRNA 所携带的遗传信息指导蛋白质合成。 DNA 信息拷贝到 RNA 分子的过程叫转录(transcription),而 mRNA 分子作为模板指导蛋白 质合成的过程叫翻译(translation)。在正常细胞内遗传信息的流动(也称基因表达)是 DNA 转录产生 RNA,RNA 作为模板翻译成蛋白质
DNA的核苷酸序列或RNA的核苷酸序列与蛋白质氨基酸序列之间的关系就是遗传密 码。几乎所有生物所用的遗传密码都是相同的。密码子(codo)用三联碱基序列构成,编码 一种氨基酸。真核生物转录和翻译之间还有一个核酸剪接加工(splicing)步骤。真核基因 有外显子(exon)和内含子(intron)。基因转录将内含子和外显子作为一个转录单位,转录生成 的RNA分子称为前体RNA(pre-RNA)。在mRNA被翻译成蛋白质之前,必须先除去RNA 分子内的内含子序列。真核生物内含子和外显子序列的存在对蛋白质进化有重要意义。 4.1核酸含有连接于核糖磷酸骨架的四种碱基 核酸DNA和RNA适宜于充当遗传信息的载体,原因在于核酸分子的共价结构。这些生 物大分子的结构单位类似,各结构单位之间以末端对末端连接的方式形成的线性聚合物(图 41)。这种聚合物的每个单体是核苷酸。一个核苷酸单体含有三个组分,分别是一个糖、一 个磷酸、和一个碱基。各种核酸的碱基共有4种。核酸的碱基序列是核酸的独有特性,含有 线形信息。 Base; Basej+1 Basej+2 Sugar Sugar Sugar Sugar Sugar Phosphate Phosphate Phosphate Phosphate Phosphate 2007 W.H.Freeman and Company 图4.1核酸的聚合物结构。 H H 5 H HO OH HO OH H 3 HO OH HO Ribose Deoxyribose fgre品Sith diion 2007 W.HL Freeman and Company 图4.2核糖和脱氧核糖。糖单位的院子用阿拉伯数字加“,”表示,以区别于碱基原子的 序号(图4.4)
DNA 的核苷酸序列或 mRNA 的核苷酸序列与蛋白质氨基酸序列之间的关系就是遗传密 码。几乎所有生物所用的遗传密码都是相同的。密码子(codon)用三联碱基序列构成,编码 一种氨基酸。真核生物转录和翻译之间还有一个核酸剪接加工(splicing)步骤。真核基因 有外显子(exon)和内含子(intron)。基因转录将内含子和外显子作为一个转录单位,转录生成 的 RNA 分子称为前体 RNA(pre-RNA)。在 mRNA 被翻译成蛋白质之前,必须先除去 RNA 分子内的内含子序列。真核生物内含子和外显子序列的存在对蛋白质进化有重要意义。 4.1 核酸含有连接于核糖磷酸骨架的四种碱基 核酸 DNA 和 RNA 适宜于充当遗传信息的载体,原因在于核酸分子的共价结构。这些生 物大分子的结构单位类似,各结构单位之间以末端对末端连接的方式形成的线性聚合物(图 4.1)。这种聚合物的每个单体是核苷酸。一个核苷酸单体含有三个组分,分别是一个糖、一 个磷酸、和一个碱基。各种核酸的碱基共有 4 种。核酸的碱基序列是核酸的独有特性,含有 线形信息。 图 4.1 核酸的聚合物结构。 图 4.2 核糖和脱氧核糖。糖单位的院子用阿拉伯数字加“ ’ ”表示,以区别于碱基原子的 序号(图 4.4)
RNA和DNA的差异在于糖基组分和一种碱基 DNA的糖基是脱氧核糖。前缀脱氧(deoxy-)表示核糖2'-位碳原子所连接的氧原子已经 脱去(图4.2)。注意,糖的C-原子编号加上“,”,而碱基环的原子编号没有添加“’”, 使两者之间能够区分。核酸分子的一个糖基与另一个糖基之间用磷酸二酯键连接。一个核糖 的3’-羟基与磷酸脱水缩合成磷酸酯,后者又与下一个核糖的5’羟基脱水缩合。用磷酸二酯 键连接的糖链就是核酸骨架(图43)。对同类核酸而言,核酸骨架都是一样的。但核酸的碱 基排序则不同。DNA分子含有两种嚎吟碱基和两种嘧啶碱基(图44)。 base base base DNA ase ase RNA 品o 图4.3DNA和RNA的骨架。核酸骨架用3’-到5’-的磷酸二酯键连接。其中一个糖单位用红 色强调,一个磷酸基用蓝色强调。 PURINES Purine Adenine Guanine PYRIMIDIN Pyrimidine Cytosine Jraci 58eeohEdnon 2007 W.H.Freeman and Compary 图4.4嘌哈和嘧啶。碱基原子的编号不加“’”。RNA分子用尿嘧啶替代DNA的胸腺嘧啶
RNA 和 DNA 的差异在于糖基组分和一种碱基 DNA 的糖基是脱氧核糖。前缀脱氧(deoxy-)表示核糖 2'-位碳原子所连接的氧原子已经 脱去(图 4.2)。注意,糖的 C-原子编号加上“ ’ ”,而碱基环的原子编号没有添加“ ’ ”, 使两者之间能够区分。核酸分子的一个糖基与另一个糖基之间用磷酸二酯键连接。一个核糖 的 3’-羟基与磷酸脱水缩合成磷酸酯,后者又与下一个核糖的 5’-羟基脱水缩合。用磷酸二酯 键连接的糖链就是核酸骨架(图 4.3)。对同类核酸而言,核酸骨架都是一样的。但核酸的碱 基排序则不同。DNA 分子含有两种嘌呤碱基和两种嘧啶碱基(图 4.4)。 图 4.3 DNA 和 RNA 的骨架。核酸骨架用 3’-到 5’-的磷酸二酯键连接。其中一个糖单位用红 色强调,一个磷酸基用蓝色强调。 图 4.4 嘌呤和嘧啶。碱基原子的编号不加“ ’ ”。RNA 分子用尿嘧啶替代 DNA 的胸腺嘧啶
与DNA相似,RNA分子也是核苷之间用3'-到5'的磷酸二酯键连接的没有分支的线性 聚合物(图4.3)。RNA的共价结构与DNA的共价结构相比,有两,点差异。(1)RNA的糖 基是核糖,不是脱氧核糖。(2)RNA的一个碱基是尿嘧啶(U),而不是胸腺嘧啶(T)。 注意磷酸二酯键带负电荷。负电荷对亲核基团如氢氧根离子有排斥作用。因此磷酸二酯 比羧酸酯耐受碱攻击的能力强。耐受性加强有助于储存遗传信息分子的完整性。DNA分子 的2'位没有氧原子,使核酸耐受碱水解的能力更强,稳定性更高。这一特性可能正是现代 生物选用DNA(而不是RNA)作为遗传物质的原因。 核苷酸是核酸的基本单位 碱基与核糖共价连接的产物叫核苷。RNA分子的四种核苷分别是腺膘吟核苷 (adenosine),鸟嘌呤核苷(guanosine),胞嘧啶核苷(cytidine),和尿嘧啶核苷(uridine)。DNA 分子的四种核苷分别是脱氧腺嘌呤核苷(deoxyadenosine),脱氧鸟嘌呤核苷 (deoxyguanosine)),脱氧胞嘧啶核苷(deoxycytidine),和脱氧胸腺嘧啶核苷(thymidine)。在这 些核苷中,嘌吟的N-9位或嘧啶的N-1位与糖基的C-1'位共价连接(图4.5)。如果按照标准 方向书写核酸结构,碱基环处于糖基平面的上方,因此N-糖苷健是β-型。核苷酸是核苷与 1个或几个磷酸连接形成的磷酸酯。最常见的核苷酸是核苷5'-OH与磷酸交联形成的核苷5” 磷酸或5-核苷酸。例如ATP是腺苷5-三磷酸。该核苷酸是通用的能源分子,很重要。ATP 的三磷酸基团水解所释放的能量能驱动很多细胞过程(15章)。脱氧鸟嘌吟核苷3”磷酸 (dGMP)与ATP的差别有(I)碱基是鸟嘌吟而不是腺嘌呤;(2)糖基是脱氧核糖而不是核 糖;(3)只有一个磷酸而不是三个磷酸;和(4)磷酸化位置是3'而不是5。单体核苷酸连接 形成RNA和DNA。DNA分子的四个核苷酸单体是脱氧腺嘌呤核苷酸、脱氧鸟嘌吟核苷酸、 脱氧胞嘧啶核苷酸、和胸腺嘧啶核苷酸。注意:尽管胸腺嘧啶核苷酸也是脱氧核糖核苷酸, 但是通常不加前缀脱氧(deoxy-),因为RNA几乎没有胸腺嘧啶。 NH2 β-Glycosidic linkage 22 ho HO OH Figure 4-5 07H.Freemanand Company 图4.5核苷的糖苷使是β-型
与 DNA 相似,RNA 分子也是核苷之间用 3'-到 5'-的磷酸二酯键连接的没有分支的线性 聚合物(图 4.3)。RNA 的共价结构与 DNA 的共价结构相比,有两点差异。(1)RNA 的糖 基是核糖,不是脱氧核糖。(2)RNA 的一个碱基是尿嘧啶(U),而不是胸腺嘧啶(T)。 注意磷酸二酯键带负电荷。负电荷对亲核基团如氢氧根离子有排斥作用。因此磷酸二酯 比羧酸酯耐受碱攻击的能力强。耐受性加强有助于储存遗传信息分子的完整性。DNA 分子 的 2’位没有氧原子,使核酸耐受碱水解的能力更强,稳定性更高。这一特性可能正是现代 生物选用 DNA(而不是 RNA)作为遗传物质的原因。 核苷酸是核酸的基本单位 碱基与核糖共价连接的产物叫核苷。RNA 分子的四种核苷分别是腺嘌呤核苷 (adenosine),鸟嘌呤核苷(guanosine),胞嘧啶核苷(cytidine),和尿嘧啶核苷(uridine)。DNA 分 子 的 四 种 核 苷 分 别 是 脱 氧 腺 嘌 呤 核 苷 ( deoxyadenosine ), 脱 氧 鸟 嘌 呤 核 苷 (deoxyguanosine),脱氧胞嘧啶核苷(deoxycytidine),和脱氧胸腺嘧啶核苷(thymidine)。在这 些核苷中,嘌呤的 N-9 位或嘧啶的 N-1 位与糖基的 C-1'位共价连接(图 4.5)。如果按照标准 方向书写核酸结构,碱基环处于糖基平面的上方,因此 N-糖苷键是型。核苷酸是核苷与 1 个或几个磷酸连接形成的磷酸酯。最常见的核苷酸是核苷 5'-OH 与磷酸交联形成的核苷 5'- 磷酸或 5'-核苷酸。例如 ATP 是腺苷 5'-三磷酸。该核苷酸是通用的能源分子,很重要。ATP 的三磷酸基团水解所释放的能量能驱动很多细胞过程(15 章)。脱氧鸟嘌呤核苷 3'-磷酸 (dGMP)与 ATP 的差别有(1)碱基是鸟嘌呤而不是腺嘌呤;(2)糖基是脱氧核糖而不是核 糖;(3)只有一个磷酸而不是三个磷酸;和(4)磷酸化位置是 3'而不是 5'。单体核苷酸连接 形成 RNA 和 DNA。DNA 分子的四个核苷酸单体是脱氧腺嘌呤核苷酸、脱氧鸟嘌呤核苷酸、 脱氧胞嘧啶核苷酸、和胸腺嘧啶核苷酸。注意:尽管胸腺嘧啶核苷酸也是脱氧核糖核苷酸, 但是通常不加前缀脱氧(deoxy-),因为 RNA 几乎没有胸腺嘧啶。 图 4.5 核苷的糖苷键是型
NH 02 5'-ATP 3'-dGMP 9 图4.6腺嘌呤核苷5’-三磷酸(ATP)和脱氧鸟嘌呤核苷3'-磷酸(3'-dGMP)。 缩写pApCpG或ACG表示DNA的一段三核苷酸,是用磷酸二酯键连接的脱氧腺苷单 磷酸、脱氧胞苷单磷酸、和脱氧鸟苷单磷酸。P表示一个磷酸基团(图47)。5'-端有一个磷 酸基团与核糖S'-OH连接。注意,核酸与多肽链一样有极性。DNA链的一端是5-OH(或 者与5-OH结合的磷酸),另一端是游离的3'-OH。书写核酸链时按照5-向3”-的方向书写。 因此,ACG表示5-端是A,3'-端是G。由于这种极性,ACG和GCA是两种不同的化合物。 G OH 图4.7DNA链的结构。核酸链有一个5’-端(通常与磷酸结合)和一个3°-端(通常是羟基)。 天然DNA分子的一个显著特征是DNA的长度。DNA分子必须含有很多核苷酸才能携 带一种生物(即使是最简单生物)全部的遗传信息。例如多瘤病毒的DNA长度是51O0个 核苷酸。大肠杆菌基因组只有一个DNA双链,每条链的长度是460万核苷酸(图4.8)。高 等生物的DNA长度更长。人基因组DNA长度有30亿碱基,分成24种染色体(其中22种 常染色体和X,Y性染色体)。已知DNA最长的生物是印度muntjak(亚洲鹿),其基因组 长度与人基因组长度相当,但只有3种染色体,其中最长的染色体长度达到10亿多个核苷 酸。如果将这种DNA分子完全伸展,长度将超过1英尺。有些植物染色体含有更长的DNA 分子
图 4.6 腺嘌呤核苷 5’-三磷酸(ATP)和脱氧鸟嘌呤核苷 3’-磷酸(3’-dGMP)。 缩写 pApCpG 或 ACG 表示 DNA 的一段三核苷酸,是用磷酸二酯键连接的脱氧腺苷单 磷酸、脱氧胞苷单磷酸、和脱氧鸟苷单磷酸。p 表示一个磷酸基团(图 4.7)。5'-端有一个磷 酸基团与核糖 5'-OH 连接。注意,核酸与多肽链一样有极性。DNA 链的一端是 5'-OH(或 者与 5'-OH 结合的磷酸),另一端是游离的 3'-OH。书写核酸链时按照 5'-向 3'-的方向书写。 因此,ACG 表示 5'-端是 A,3'-端是 G。由于这种极性,ACG 和 GCA 是两种不同的化合物。 图 4.7 DNA 链的结构。核酸链有一个 5’-端(通常与磷酸结合)和一个 3’-端(通常是羟基)。 天然 DNA 分子的一个显著特征是 DNA 的长度。DNA 分子必须含有很多核苷酸才能携 带一种生物(即使是最简单生物)全部的遗传信息。例如多瘤病毒的 DNA 长度是 5100 个 核苷酸。大肠杆菌基因组只有一个 DNA 双链,每条链的长度是 460 万核苷酸(图 4.8)。高 等生物的 DNA 长度更长。人基因组 DNA 长度有 30 亿碱基,分成 24 种染色体(其中 22 种 常染色体和 X,Y 性染色体)。已知 DNA 最长的生物是印度 muntjak(亚洲鹿),其基因组 长度与人基因组长度相当,但只有 3 种染色体,其中最长的染色体长度达到 10 亿多个核苷 酸。如果将这种 DNA 分子完全伸展,长度将超过 1 英尺。有些植物染色体含有更长的 DNA 分子