第三篇遗传信息传递及其调控 4.病毒基因组存在着基因重叠1977年研究中X174噬菌体时发现了重叠基因。bX174感染大肠 杆菌后可合成11个蛋白质分子,总分子量为250kDa左右,相当于6078个核苷酸所容纳的信息量。而 该病毒DNA本身只有5375个核苷酸,最多能编码总分子量为200kD的蛋白质分子,由此发现了基因 重叠现象。病量基因组大小十分有限,因此在讲化时程中形成了基因重叠编码现象,即同一DNA片段 可以是2种甚至3种蛋白质分子的部分编码区,换句话说,两种不同蛋白质的编码区有一部分是共用 的。这样的重叠编码机制提高了病毒基因组的编码能力。 病毒基因组不仅存在着结构基因的重叠,也存在着编码区和调控区的重叠。乳头瘤病毒是一类感 染人和动物的病毒,基因组约为8.0kb,其中不翻译的部分约为L.0k,该区域同时作为其他基因表达的 调控区。 5.病毒基因组的大部分区域是编码蛋白质的,只有极小部分不被翻译。中X174噬菌体中不翻译的 DNA部分只有217个核苷酸(总长5375),占不到5%。不翻译的DNA序列通常是基因表达的调控区 如RNA聚合酶结合位点、转录的终止信号及核糖体结合位点等 6.有的病毒基因可以转录生成多顺反子RNA病毒基因组中有的功能相关的基因或DNA基因 (转录生成核糖体RNA的基因)可以形成一个转录单元。它们可被一起转录成为多顺反子mRNA,然后 再加工成为编码各种蛋白质的mRNA模板。如腺病毒晚期基因编码病毒的12种外壳蛋白,转录时是在 一个启动子的作用下生成多顶反子mRNA,然后再加工成各种mRNA,编码病毒的各种外壳蛋白 7.除反转录病毒外,病毒基因组都是单倍体,每个基因只有一个拷贝,即在病毒颗粒中只出现 次。反转录病毒基因组有两个拷贝。 噬菌体基因是连续的,而真核细胞病毒的基因是不连续的。除了正链RNA病毒外,感染真核细胞 的病毒基因都是先转录成mRNA前体,再经加工切除内含子成为成熟的mRNA。由于基因重叠现象,某 一基因的内含子或其中的一部分可以是另一个基因的外显子。 (二)原核生物基因组的结构特点 原核生物的基因组较小,对其结构和功能的认识远较直核生物深入。原核生物基因组DNA虽然与 蛋白质结合,但并不形成真正的染色体结构,只是习惯上称之为染色体DNA。原核生物的基因组主要 是染色体DNA,有的含有质粒等其他携带遗传物质的DNA。 原核生物基因细的结构具有以下特点:①基因组较小,基因组中很少有重复序列:②编码蛋白的基 因多为单拷贝基因,但编码RNA的基因是多拷贝基因:③编码蛋白的基因在基因组中所占的比例约为 50%:④许多编码蛋白的结构基因在基因组中以慢纵子(operon)为单位排列 1.原核生物基因以操纵子方式组构操纵子是原核生物基因表达的协调控制单位,包括启动序 列、操纵序列和结构基因等。启动序列是基因转录调控中NA聚合酶识别位点及其周围的序列。操纵 序列并非结构基因,而是一段能被阻渴蛋白识别和结合的特异DNA序列。操纵子结构中,数个功能上 有关联的结构基因串联排列,共同构成信息编码区。这些结构基因共用一个启动序列和一个转录终止 信号序列,因此转录合成时仅产生一条mRNA长链,编码几种不同的蛋白。这种mRNA分子携带了几 个多肽链的编码信息,被称为多顺反子mRNA(polycistron) 原核生物所完成的生命活动不仅仅是简单的基因组复制,还有复杂的代谢活动,即获得外界环境的 营养成分,产生能量并合成自身生长所需的材料(核苷酸、氨基酸等)。原核生物需要根据外界环境的 变化,调控自身的酶系统的组成及功能,调整细胞内某些蛋白质的数量,适应环境的变化(如高温、渗透 压改变等)。 2.原核生物中的质粒DNA质粒(plasmid)是细菌细胞内一种自我复制的环状双链DNA分子,能 够稳定的独立存在于宿主染色体外,并传递到子代,不整合到宿主染色体DNA上。质粒的分子量一般 为10°~10kb,小型质粒的长度一般为1.5~15kb。质粒常含有抗生素抗性基因,经过人工改造后的质 粒DNA是重组DNA技术中常用的载体。 质粒只有在宿主细胞内才能完成自己的复制,一旦离开宿主就无法复制和扩增。质粒对宿主细胞 330
第十四章基因表达调控 的生存不是必需的,宿主细胞离开了质粒依日能够存活。尽管质粒不是细菌生长、繁殖所必需的物质 但它所携带的遗传信息能赋予细菌特定的遗传性状,如耐药性质粒带有耐药基因,可以使宿主细菌获得 耐受相应抗生素的能力:一些人类致病菌的毒力基因亦存在于质粒中,如炭疽杆菌中编码炭疽毒素的 基因 (三)真核生物基因组的结构特点 直核生物的基因组比较庞大,并日不同生物种间养异很大。直核生物基因组具有以下特点:①直核 生物基因结构庞大,如人的单倍体基因组含有3×10p,大约含有2万~2.5万个基因,而大肠杆菌基因 组含有约4×10°bp,约4000个基因;②真核基因转录产物为单顺反子,即一个编码基因转录生成一个 RNA分子,经翻译生成一条多肽麟:③直核基因组含有大量的重复序列.重复序列成集中成藤,或散召 分布于基因间:④真核基因中不被转录的区域远远超过被转录的区域。基因两侧的不被转录的序列往 往是基因表达的调控区。在基因内部有内含子、外显子之分,因此真核基因是不连续的。 L,人类基因组DNA的组成人类基因组DNA包含了细胞核染色体DNA和线粒体DNA所携带的 所有遗传物质,见图14-5。 人类基因组 细胞核基因组 约25%约75% 基因外序列 24224格鷂 约1%约 外显子 内子中 图145人类基因组DNA的组成 2.人类基因组中存在大量重复序列真核生物基因组存在着大量重复序列。重复序列的长度不 等,短的仅含两个碱基,长的多达数百、乃至上千个碱基。重复序列的重复频率也不尽相同,可以分为高 度重复序列(highly repetitive sequences)、中度重复序列(moderately repetitive sequences)和单拷贝或低度 重复序列(single copy sequences)等3种 (1)高度重复序列:高度重复序列重复频率可达10次。在基因组中所占比例随种属而异,从 10%~60%不等。在人基因组中,高度重复序列约占基因组长度的20%。高度重复序列又按其结构特 点分为以下2种:①反向重复序列(inverted repeated sequence)是存在于双链核酸分子中排列方向相反 的一段DN4序列,其总长度约占人基因组的5%。反向重复序列多数是散在,而非群集于基因组中 ②卫是DNA(satellite dna)是另一类高度重复序列.这类重复序列的重复单位一般由2≈1Obm组成,成 串排列。由于这类序列的碱基组成不同于基因组的其他部分,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA或随体DNA。在人基因组中,卫星DNA约占5%~6% 目前认为,高度重复序列的功能是:①参与复制水平的调节。反向重复序列常存在于DNA复制起 点区的附近,是一些蛋白质(包括酶)的结合位点:②参与基因表达的调控。高度重复序列可以转录至 核内不均一RNA分子中,而有些反向重复序列可以形成发夹结构,有助于稳定RNA分子:③参与染色 体配对。如卫星DNA成能样分布在色体着丝粒附近,可能与染色体减数分婴时染色体配对有关 即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DA序列 (2)中度重复序列:中度重复序列指在真核基因组中重复数十至数万(<10)次的重复序列。少数 在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。依据重复序列的长度分为两种类型: ①短分散重复片段(shor interspersed repeated segments,SNES)的平均长度为300 -500bp,与平均长度 为10OObp的单拷贝序列间隔排列。拷贝数可达10万左右。如Au家族、Hinf家族等属于这种类型的 3别
第三篇遗传信息传递及其调控 中度重复序列。②长分散重复序列(long interspersed repeated segments.LNES)的平均长度为3500 5000bp,与平均长度为13000bp的单拷贝序列(个别长几万bp)间隔排列 中度重复序列在基因组中所占比例在不同种属之间差异很大,一般占10%一40%,在人类基因组 中约占12%,这些序列大多不编码蛋白质。这些非编码的中度重复序列的功能可能类似于高度重复序 列。在结构基因之间以及内含子内都可以见到中度重复序列。 真核生物基因组中的RNA基因也属于中度重复序列。与其他中度重复序列不同,各重复单位中 的RNA基因都是相同的。RNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为 rDNA区,如染色体的核仁组织区即为DNA区。 (3)单拷贝序列:单拷贝序列,又称为低度重复序列,在单倍体基因组中以单拷贝形式存在的DNA 序列,大多数编码为蛋白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为散在分布的重复 序列 3.线粒体DNA的结构线粒体是细胞内的一种重要细胞器,是生物氧化的场所。 ,个细胞可拥 有数百至上千个线粒体。线粒体DNA(mitochondrial DNA,mtDNA)可以独立编码线粒体中的一些蛋白 质,因此mtDNA是核外遗传物质。mtDNA的结构与原核生物的DNA类似,是环状分子。线粒体基因的 结构特点也与原核生物相似。 人的线数体基因组全长16569bD,共编码37个基因,句括13个编码构成呼吸链多酶体系的一些多 肽的基因22个编码mt-RNA的基因,2个编码mt-rRNA(16S和12S)的基因。 第二节基因表达调控的基本知识 一、基因表达的概念 基因表达就是指基因负载的遗传信息转变生成具有生物学功能产物的过程,包括基因的激活、转 录、翻译以及相关的加工修饰等多个步骤或过程。在一定的调节机制控制下,大多数基因经历基因激 活、转录及翻泽等时程,产生具有特定生物学功能的蛋白质成者RNA分子,赋予细胞或者个体一定的功 能或形态表型。并非所有基因的表达都产生蛋白质,RNA,RNA编码基因转录产生RNA的过程也 干基因表达 不同生物的基因组含有不同数量的基因。细菌的基因组约含有4000个基因;多细胞生物的基因数 达万个:人类基因组约含有2万~2.5万个基因。在某一特定时间或生长阶段,基因组中只有一小部分 基因处于表达状态。例如,大肠杆菌通常只有约5%的基因处于高水平转录活性状态,其余大多数基因 不表达,或者表达水平很低。基因表达水平的高低不是固定不变的。例如,大肠杆菌中与细菌蛋白质生 物合成有关的延长因子编码基因大多数情况下表达十分活跃,而参与DNA损伤修复有关的基因却很少 表达:但在紫外线照射引起DNA损伤时,DNA损伤修复相关的蛋白表达变得异常活跃。因此,生物体 中某种功能的基因产物在细胞中的数量会随时间和环境而改变。 二、基因表达的特点 基因表达具有时间特异性及空间特异性的特点 (一)时间特异性 基因的表达按一定的时间顺序发生,即根据功能需要,某一特定基因的表达严格按特定的时间顺序 发生,称为基因表达的时间特异性(temporal specif6ciy)。如噬菌体、病毒或细菌侵入宿主后,呈现一定 的感染阶段。随感染阶段发展、生长环境变化,这些病原体以及宿主的基因表达都有可能发生改变,有 的基因开启,有的基因关闭。 332