第二章遗传物质的基础 ·9. 第二节核酸 脱氧核糖核酸(DNA)是细胞中最重要的分子,它含有生物的全部遗传信息:核糖核酸 (RNA)可以作为某些病毒的遗传物质。 一、核酸 DNA和RNA中的碱基是杂环芳香环。腺嘌吟、鸟嘌呤为双环结构,胞嘧啶、胸腺嘧啶、 尿嘧啶为单环结构。在RNA结构中尿嘧啶代替了胸腺嘧啶,胸腺嘧啶与尿嘧啶不同之处在 于其5-位上有一个甲基. 戊糖环第一位碳原子(C)与嘧啶碱第一位N原子(N)或嘌呤碱第九位N原子(N)以N糖 苷键相结合形成核苷。RNA中,戊糖为核糖(bose):DNA中,戊糖为2'-脱氧核糖,2'羟基被氧 替代。 核苷中的戊糖羟基被磷酸酯化,形成核苷酸(nucleotide)。核糖核苷能形成三种不同的核苷 一2核糖核苷酸,3'-核糖核苷酸及5'-核糖核苷酸。脱氧核糖核苷只形成两种核苷酸 3'-脱氧核糖核苷酸和5'核糖核苷酸。 在DNA或RNA分子中,一个核糖5'-羟基与另一个核糖3'-羟基之间形成磷酸盐基团共 价连接,把核糖核苷酸或脱氧核糖核苷酸连接起来形成多聚体。这种键称为磷酸二酯键 (phosphodiester bond)。每一核酸链中,有自由的5'端和3'端,5'端上可带有或不带有磷酸盐 基团,3端常常为羟基。在中性条件下,每个磷酸盐基团带有一个负电荷。因此核酸是高度带 电荷的多聚体。 按规定,DNA或RNA序列的5'端写在左边。因此,一段DNA序列片段可以写作5' ATGGTCTC-3'或ATGGTCTC;而RNA序列可以写作5'-AUGGUCUC-3'.由于DNA或 RNA链有特定的方向,故ATAAG与GAATA是不同的两个片段, 二、RNA 所有生物的细胞内都含有三种RNA,即mRNA,tRNA和rRNA。原核生物有三种rRNA 即5 SrRNA,16 S+RNA和23 S rRNA,真核生物有四种rRNA,即5SRNA,5.8SRNA,18S rRNA和2 8S rRNA,这些rRNA是核糖体(ibosome)的重要成分, 生物体内存在着与20种氨基酸对应的tRNA分子,它们在蛋白质合成过程中起着接受、 转运和掺人氨基酸的作用。mRNA的功能是从DNA上把遗传信息接受过来,决定蛋白质的 氨基酸顺序。 绝大多数RNA分子在细胞核内合成。核内存在各种RNA的前体,如tRNA前体 rRNA前体和mRNA前体,前体RNA需要经过剪切、装配和修饰才能成为成熟的RNA。 绝大多数植物病毒和RNA肿瘤病毒以RNA作为遗传物质。病毒RNA(除负链RNA病 毒外)包括噬菌体RNA,既是遗传信息载体(类似DNA功能),也具有mRNA功能。类病毒 没有蛋白质外壳,只有游离的RNA分子
10 工业微生物育种学 RNA一级结构为直线形多聚核苷酸。分子质量的差别极大。tRNA的二级结构都是呈 三叶草形的结构,三叶草形结构(clover-leaf structure)由氨基酸臂、二氢尿嘧啶环、反密码环、 额外环和TC环五部分组成。 依靠9个氢键,tRNA分子在二级结构基础上形成L形三级结构(图2.5),mRNA、rRNA 在一定条件下也可形成二级结构(图2.6)。 du 功能城2 功能域3 能域 20 1542 a 之一反亲码了环 图2.5tRNA三级结构 图2.6大肠杆菌16 S rRNA的二级结构 三、DNA 细胞型的生物及部分病毒是以DNA作为遗传物质的。不同生物DNA分子大小、结构都 有一定的差异。细菌DNA比噬菌体大10倍以上,哺乳动物DNA又比细菌DNA大1000倍 以上。高等真核生物DNA为双链线状结构,而细菌、线粒体、叶绿体、质粒及某些病毒DNA 为双链环状结构。X174病毒的DNA为单链环状结构,而细小病毒其DNA为单链线状结 构。λ噬菌体,其含的双链DNA可以是线状,也可以是环状。DNA的一级结构是DNA分子 内碱基的排列顺序,它以密码子的方式蕴藏了遗传信息。任何一段DNA序列都具有高度的 个体性或种族特异性。DNA一级结构具有两种遗传功能,一种是编码蛋白质氨基酸顺序,另 一种是参与基因的转录、翻译,DNA复制和细胞分化等。DNA分子中总的A十T与G十C含 量相等,但在有些区段A一T含量很高,这些区段都与DNA调节功能有关。 通常两条互补的DNA单链可以形成DNA二级结构一右手双螺旋结构(图2.7)。在 双螺旋结构中,每个碱基对中的碱基在同一平面上,并且与双螺旋的轴垂直。相邻的碱基对以 36旋转,每个螺圈10个碱基对。双螺旋有两个槽沟,一个大沟和一个小沟,两条链是反向平
第二章遗传物质的基础 11 行的。一般天然(在细胞中)的DNA都是B型,但是湿度不 同对DNA的结构有影响。在相对湿度为75%时,DNA为 -AT A型,相对湿度为66%时为C型,除了A,B、C三种类型外, 还有D型和E型。 在DNA中,如果有嘌吟嘧啶相间排列的序列,当在高 盐溶液中就可以采取左旋形式,即Z型DNA。在B型DNA 中,只要有一段是嘌呤嘧啶交替出现,则这一段可以采用乙 DNA形式,而其他区段仍为B型DNA。Z型DNA多集中 在调控区,所以认为Z型DNA多参与基因表达调控。 大多数原核生物及病毒的完整DNA分子是双链环状的 一个环状双链DNA分子可以是共价闭合环,也可以是切口环 状。共价闭合环状DNA分子常常形成超螺旋结构,超螺旋结 构有两种一负超螺旋和正超螺旋。负超螺旋形成超螺旋 时,旋转方向与DNA双螺旋方向相反,旋转结果使DNA分子 内部张力减少。在自然条件下的共价闭合环状DNA呈负超 螺旋结构。正超螺旋DNA与负超螺旋相反,形成超螺旋时的 - 旋转方向与DNA双螺旋方向相同,加大DNA分子内部张力。 超螺旋结构中存在单链区,这些单链区是含90%以上的A:T图2.7DNA双螺旋结构 区域,它的功能与起始遗传重组、起始DNA复制和起始mRNA的合成有关。 第三节基因的组织与结构 一、基因组 基因组(genome)对于原核生物来说,就是它的整个染色体;对于二倍体的真核生物来说, 是能够维持配子或配子体正常功能的最低数目的一套染色体。 原核生物基因组很小,DNA含量低,如E.coli DNA分子质量为2.4×10Da,相当于 4.2×10bp,含有3000~4000个基因。SV40病毒分子质量为3×10Da,5243bp,含5个 基因。 真核生物基因组分子大,低等真核生物为10'~10bp,高等真核生物达5X103~100bp, 哺乳动物为2×10bp。 重复序列是基因组结构的一个特点,原核生物基因组中重复序列少,真核生物基因组中重 复序列多。在真核生物中,根据DNA重复序列多少,通常把DNA序列分为以下四种类型。 1.单一序列 单一序列在一个基因组中,只有一个拷贝,真核生物的大多数基因在单倍体中是单拷贝的。 2.轻度重复序列 轻度重复序列在一个基因组中有2一~10个拷贝,如组蛋白基因。在某些情况下,这些序列 并非一点不差地重复
。12 工业微生物育种学 3.中度重复序列 中度重复序列十至几百个拷贝,每个拷贝平均长度300p。中度重复序列一般是不编码 的,据认为在基因调控中起重要的作用,包括开启或关闭基因,促进或终止转录、DNA复制起 始等,如Alu序列家族 4.高度重复序列 高度重复序列儿百个到几百万个拷贝。在高度重复序列中,有一些是重复数百次的基因,如 RNA基因和某些RNA基因,大多数为不编码的序列。例如,在果蝇染色体着丝粒附近就存在 着几种高度重夏序列一 -ACAAACT为1.1X10'个拷贝,占基因组DNA的25%;ATAAACT 为3.6×10个拷贝,占基因组DNA的80%。在高度重复序列中常有些A:T含量很高的简单 高度重复序列,由于A:T片段浮力密度较小,因而在将DNA切断成数百个碱基对的片段进行 超离心时,常会在主要的DNA带的上面有一个次要的DNA带相伴随,这就是所谓的卫星DNA。 后来的结果发现由于有些高度重复序列碱基组成与整个基因组碱基组成差异不大,因而并非所 有的高度重复序列在超离心时都可以形成次要的DNA带,这种DNA也称为隐蔽卫星DNA。实 验表明,卫星DNA位于着丝粒附近异染色质区。卫星DNA长度通常为100~5000kb。长度为 1Oobp一2Okb的卫星DNA常称为小卫星DNA或微卫星DNA,微卫星DNA其每一个串联重复 单位小于4bp。以CA为串联重复单位形成的微卫星DNA很普遍,可占到人类基因组的O.5%。 单核苷酸重复序列可占到人类基因组的0.3%。 二、基 因 基因是一个遗传信息单位,其对应着一段编码多肽氨基酸顺序的不连续的DNA片段。 在DNA链上,大多数基因呈散布状态,各个基因之间常被非编码的基因间DNA分隔。但有 些基因却聚集成群形成基因家族。基因家族分为两种,一种是操纵子,另一种是多基因家族。 操纵子存在于原核生物中,如乳糖操纵子,操纵子上的基因之间相互协同调控。多基因家族存 在于高等真核生物中,多基因家族又可分为简单多基因家族和复杂多基因家族。简单基因家 族中每个重复单元含有单一的转录区和非转录区(图2.8),如5 S rRNA、DNA。 A 5 S rRNA基因重复单元 组蛋白基因重复单元 一A 图2.8多基因家族 A。简单多基因家族,如5 SrRNA基因B复杂多基因家族,如果蝇组蛋白基氏
第二章遗传物质的基础 。13. 在复杂的多基因家族中,每个重复单元含有多个不同的转录区和非转录区。同样,在不同 生物中,重复单元重复数也不同。从整个基因组结构来看,简单多基因家族包含的基因是一致 的,而复杂的多基因家族包含的基因是相似的。 DNA分子中的遗传信息贮存在碱基序列中。在基因表达过程中,DNA转录RNA,RNA 翻译多肽链,遗传信息是以“中心法则”进行传递的。“中心法则”指出遗传信息只能以DNA一 RNA→蛋白质这种单一方向进行传递。但反转录病毒可以发生反转录,即由RNA合成 DNA,这是“中心法则”的一个补充。一个细胞的功能取决于许多不同蛋白质的协同作用,细 胞何时何地合成何种蛋白质取决于基因中含有的遗传信息。 现已知道大多数真核生物基因都是不连续基因。基因的编码序列在DNA分子上是不连 续的,被一系列DNA片段所隔开,编码序列称为外显子(exon),把外显子割裂的DNA片段称 为内含子(intron)。内含子的数量变化很大,不同的基因变化幅度为0~50个以上。内含子 并非不编码氨基酸,某些内含子可以绵码蛋白质,而文些蛋白质与内含子的刑除或传播打扩散密 切相关。外显子也并非都编码氨基酸,如tRNA基因和rRNA基因。在基因中,外显子的总 长不如内含子的总长。真核生物基因首先转录成前体RNA,前体RNA经过剪接过程去掉内 含子,留下外显子,形成成熟的RNA,进而参与蛋白质合成。在细菌基因中,很少发现内含子。 某些基因因DNA序列发生变化,虽然在序列上与活性基因相似,但不具备功能、不能编 码蛋白质,这种基因称为拟基因(pseudogene)。拟基因是进化过程中DNA序列发生改变而 产生的,是进化的残遗体,如珠蛋白基因家族中的拟基因。 基因组内存在着可转移的DNA片段,称为转座因子(transfer factor)。转座因子是一些 DNA序列,它能在同一细胞的不同染色体之间或者同一染色体的不同位点之间转移。这种转 移不依赖于序列的同源性,在原位点上这种序列不丢失,只是它的一个新拷贝插人到新的位点 上。转座因子的转座会引起多种遗传效应,如极性效应、插入突变、缺失和倒位等。转座因了 两端存在末端重复序列,绝大多数转座因子可以编码一种转座酶,其功能是促进其转座。转座 因子包括插人序列(IS)、转座子(transposon)和转座噬菌体。在病毒如G4和ΦX174中,还发 现若干基因共用某一段核苷酸序列的现象,即基因重叠现象。在细菌和果蝇中也发现类似 现象 三、遗传密码 遗传密码是指DNA上核苷酸与蛋白质链上氨基酸的对应关系。密码子是指mRNA上 三个连续的核苷酸决定一个特定的氨基酸,这三个核苷酸称为密码子(codo)(表2.1)。在 64个密码子中,除3个是终止密码外,有61个为氨基酸密码子。但是氨基酸只有20种,所 以许多氨基酸对应的密码子不止一种。几种密码子编码同一种氢基酸,这种现象称为简并 (degeneracy)。对应于同一氢基酸的不同密码子,称为同义密码子(synonymous codon)。凡 属同一氨基酸的密码子,其密码子前两个碱基相同,特异性就很强,而第三个碱基变化大, 特异性就弱。在密码子中,研究认为,第二个(中间)碱基与氨基酸的极性有关。第二个碱 基如果是嘌呤,该密码子编码的氨基酸具有极性侧链:第二个碱基如果是嘧啶,侧链为非 极性