关高度重复的DNA序列在植物基因组中是如何形成的,存在着几种可能性(图43.4a)。单个重复DNA序列的几个拷贝可能按相同的方向排列在一起,这种模式被称为“简单串联排列”(Simpletandemarray)。另一种情况是,重复的DNA序列以同一方向(重复/单拷贝散布repeat/single-copyinterspersion)或相反的方向(反向重复invertedrepeats)分散在单拷贝DNA中。除此之外,几组重复的DNA序列还可能以多种可能的方式排列,同时出现在植物基因组中,像“复合串联排列”(Compoundtandemarry)或“重复性的散布”(repeat/repeatinterspersion)。重复DNA序列的存在极大地增加了植物的基因组的大小,也为寻找和鉴别单独的单拷贝基因增加了难度。因而,鉴别单拷贝基因就如同“大海捞针”。许多机制能够说明植物基因组中出现高重复率DNA序列的原因。通过将特定染色体区域的DNA多次复制,将此DNA序列放大,就可能生成重复的序列。减数分裂中染色体的不等交换或者转座因子的活动(见下一部分),也可能产生重复序列。转座因子正如18章所述,转座因子(TransposableElements)是特殊的DNA序列,可以从基因组上的一个位置转移到另一个位置。它们可以从某处突然切下来,而插入到另一位点。因此,转座因子一直被称为“跳跃基因”(jumpinggenes)。转座因子插入到基因的编码区或调节区。这种插入将影响基因的表达,导致可检测或不可检测的突变(图43.4b)。BarbaraMcClintock首先报道了玉米的转座因子,并因此荣获1983年的诺贝尔奖(图18.23)。由于它们具有独立复制并在基因组中移动的能力,转座因子也可能产生重复的DNA序列。人们相信,玉米中大量的类似反转录病毒的插入(retroviral-likeinsertions)可能就造成这种情况。基因组中特定位点的重复DNA序列的滞留可能引发转座因子本身的突变,使它丧失转座的能力(capacitytotranspose)。叶绿体的基因组及其进化叶绿体是一种进行光合作用的细胞器,它能在植物体内独立的复制。植物叶
关高度重复的 DNA 序列在植物基因组中是如何形成的,存在着几种可能性(图 43.4a)。单个重复 DNA 序列的几个拷贝可能按相同的方向排列在一起,这种模 式被称为“简单串联排列”(Simple tandem array)。另一种情况是,重复的 DNA 序列以同一方向(重复/单拷贝散布 repeat/single-copy interspersion)或相反的方 向(反向重复 inverted repeats)分散在单拷贝 DNA 中。除此之外,几组重复的 DNA 序列还可能以多种可能的方式排列,同时出现在植物基因组中,像“复合 串 联 排 列 ”( Compound tandem arry ) 或 “ 重 复 性 的 散 布 ” (repeat/repeat interspersion)。重复 DNA 序列的存在极大地增加了植物的基因组的大小,也为 寻找和鉴别单独的单拷贝基因增加了难度。因而,鉴别单拷贝基因就如同“大海 捞针”。 许多机制能够说明植物基因组中出现高重复率 DNA 序列的原因。通过将特 定染色体区域的 DNA 多次复制,将此 DNA 序列放大,就可能生成重复的序列。 减数分裂中染色体的不等交换或者转座因子的活动(见下一部分),也可能产生 重复序列。 转座因子 正如 18 章所述,转座因子(Transposable Elements)是特殊的 DNA 序列,可 以从基因组上的一个位置转移到另一个位置。它们可以从某处突然切下来,而插 入到另一位点。因此,转座因子一直被称为“跳跃基因”(jumping genes)。转座 因子插入到基因的编码区或调节区。这种插入将影响基因的表达,导致可检测或 不可检测的突变(图 43.4b)。Barbara McClintock 首先报道了玉米的转座因子, 并因此荣获 1983 年的诺贝尔奖(图 18.23)。 由于它们具有独立复制并在基因组中移动的能力,转座因子也可能产生重复 的 DNA 序列。人们相信,玉米中大量的类似反转录病毒的插入(retroviral-like insertions) 可能就造成这种情况。基因组中特定位点的重复 DNA 序列的滞留可 能引发转座因子本身的突变,使它丧失转座的能力(capacity to transpose)。 叶绿体的基因组及其进化 叶绿体是一种进行光合作用的细胞器,它能在植物体内独立的复制。植物叶
绿体拥有自身独特的DNA,且与细胞核中的染色体是分开的。这种DNA是由母体遗传得到的,编码独特的叶绿体蛋白。有人认为叶绿体源自一个能进行光合作用的原核生物,这种原核生物由于内吞作用而成为了植物细胞的一部分(见35章)。研究已经表明,叶绿体DNA拥有许多像原核生物一样的特征。它与原核生物的染色体DNA类似,也是双链环状DNA。此外,叶绿体DNA中含有编码核糖体的基因(genes forribosomes),与出现在原核生物中的核糖体基因非常相似。所有陆生植物叶绿体中的DNA都具有几乎同样的基因数(大约是100),而且排列的次序也相同。与植物细胞核中DNA的进化相比,叶绿体DNA的进化更加保守。因而当人们研究DNA序列的相似性时,它提供了一个更容易解释的进化模型。叶绿体DNA也不容易被重组产生的转座因子和突变所改变。虽然光合作用所需要的蛋白质大部分还是由核基因所编码,但叶绿体DNA编码的很多蛋白质都与光合作用有关。随着时间的推移,细胞核和叶绿体基因组之间似乎已经发生了一些基因交换。比如,光合作用的卡尔文(Calvin)循环中最关键的酶包括大小两Large single-copyregion(~87kb)个亚基。大亚基由叶绿体基因编码:小亚基则由核基因组编码。编码小亚基的基因组有一段Typical plantchloroplastgenome靶序列,它使小亚基能够进入叶绿体与大亚基结合。这些基因定位的InvertedrepeatSmall single-(~25 kb)进化史仍然是个谜。copyregion(~18kb)图43.5叶绿体基因组一个典型的植物叶绿体基因组示叶绿体基因组的一意图,包括2个单拷贝基因区域,其中一个包含大约87000个典型特征就是在DNA个核苷酸(87kb),另一个大约是18kb:另外还有2个对称的反向重复序列,每个25kb。叶绿体DNA不会发生核序列中出现了两段相同基因组中常见的染色体重组事件,因而可以作为DNA系统发生分析的良好材料。的反向重复(invertedLargesingle-copyregion大的单拷贝区repeats)(图43.5)。其它Typicalplantchloroplastgenome典型的植物叶绿体基因组Invertedrepeat反向重复的DNA序列极少发生现Smallsingle-copyregion小的单拷贝区
绿体拥有自身独特的 DNA,且与细胞核中的染色体是分开的。这种 DNA 是由母 体遗传得到的,编码独特的叶绿体蛋白。有人认为叶绿体源自一个能进行光合作 用的原核生物,这种原核生物由于内吞作用而成为了植物细胞的一部分( 见 35 章)。研究已经表明,叶绿体 DNA 拥有许多像原核生物一样的特征。它与原核 生物的染色体 DNA 类似,也是双链环状 DNA。此外,叶绿体 DNA 中含有编码 核糖体的基因(genes for ribosomes),与出现在原核生物中的核糖体基因非常相 似。 所有陆生植物叶绿体中的 DNA 都具有几乎同样的基因数(大约是 100),而 且排列的次序也相同。与植物细胞核中 DNA 的进化相比,叶绿体 DNA 的进化 更加保守。因而当人们研究 DNA 序列的相似性时,它提供了一个更容易解释的 进化模型。叶绿体 DNA 也不容易被重组产生的转座因子和突变所改变。 虽然光合作用所需要的蛋白质大部分还是由核基因所编码,但叶绿体 DNA 编码的很多蛋白质都与光合作用有关。随着时间的推移,细胞核和叶绿体基因组 之间似乎已经发生了一些基因交换。比如,光合作用的卡尔文(Calvin)循环中 最关键的酶包括大小两 个亚基。大亚基由叶绿 体基因编码;小亚基则 由核基因组编码。编码 小亚基的基因组有一段 靶序列,它使小亚基能 够进入叶绿体与大亚基 结合。这些基因定位的 进化史仍然是个谜。 叶绿体基因组的一 个典型特征就是在 DNA 序列中出现了两段相同 的 反 向 重 复 ( inverted repeats)(图 43.5)。其它 的DNA序列极少发生现 图 43.5 叶绿体基因组 一个典型的植物叶绿体基因组示 意图,包括 2 个单拷贝基因区域,其中一个包含大约 87000 个核苷酸(87kb),另一个大约是 18kb;另外还有 2 个对 称的反向重复序列,每个 25kb。叶绿体 DNA 不会发生核 基因组中常见的染色体重组事件,因而可以作为 DNA 系 统发生分析的良好材料。 Large single-copy region 大的单拷贝区 Typical plant chloroplast genome 典型的植物叶绿体基因组 Inverted repeat 反向重复 Small single-copy region 小的单拷贝区
反向(inversion)或者删除作用,但是一旦发生了,它们就可能作为分析植物间进化关系的特征或工具。比如,在菊科向日葵属植物中,其叶绿体DNA有一个大的反向序列,而在别的植物科中却没有出现。先前有关植物间进化关系的研究工作多侧重于植物解剖学和形态学上的对比分析,如今,像植物叶绿体DNA序列这样的分子数据正越来越广泛地被采用。与其它真核生物相比,植物细胞核可能含有大量的DNA,但其中只有很少的一部分是功能基因。染色体拷贝数目增加(多倍性)以及DNA序列的重复导致植物基因组中DNA过量。叶绿体基因组的进化比核基因组更慢,它可以提供重要的有关进化的信息。比较基因组作图和模式系统随着研究DNA序列的新技术的出现,我们对植物基因组的认识逐步加深。而这方面的深入了解能使我们更好地操纵基因特性。比如农作物产量,抗病性生长能力,营养价值,抗旱性。这些特性中每一个都由多基因编码。通过基因组作图(genomemapping)使植物模式化,植物生物学家为将来植物的培育以及从基因水平上认识植物进化奠定了基础。水稻作为一种模式系统被选中是因为它的基因组较小,与其它谷类有很高的染色体保守性。从基因组的意义上看,“水稻就是小麦”。植物另外一个模式系统就是拟南芥(Arabidopsis)。这种芥菜类的野草具有特别小的基因组。它只有20%的重复DNA(见表43.1),这使得测定它的全序列比较容易。如下面将讨论的,进一步达到单个碱基对的检测水平是一个渐进的阶梯过程。RELP和AFLP可作为绘制基因组图谱和检测多态性的工具在染色体上线性地确定每个基因,经典的办法是将它与已经通过突变确定了的基因杂交。重组的概率就可以用来计算两个遗传标记物(geneticmarkers)之间亲缘关系的远近(见13章)。结果就是一张遗传图或连锁图(geneticorlinkagemap)。这种方法仅限于那些具有等位基因的基因,而且能通过表现型得以鉴定的。更多的基因组可以使用限制性片断长度多态性(restrictionfragmentlengthpolymorphismsRFLPs)来作图,这样就不需要有宏观表型。注意,RFLPs是包
反向(inversion)或者删除作用,但是一旦发生了,它们就可能作为分析植物间进 化关系的特征或工具。比如,在菊科向日葵属植物中,其叶绿体 DNA 有一个大 的反向序列,而在别的植物科中却没有出现。先前有关植物间进化关系的研究工 作多侧重于植物解剖学和形态学上的对比分析,如今,像植物叶绿体 DNA 序列 这样的分子数据正越来越广泛地被采用。 与其它真核生物相比,植物细胞核可能含有大量的 ,植物细胞核可能含有大量的 DNA,但其中只有很少 ,但其中只有很少 的一部分是功能基因。染色体拷贝数目增加 。染色体拷贝数目增加(多倍性)以及 DNA 序列的重复导 致植物基因组中 DNA 过量。叶绿体基因组的进化比核基因组更慢 。叶绿体基因组的进化比核基因组更慢,它可以提供 重要的有关进化的信息。 比较基因组作图和模式系统 随着研究 DNA 序列的新技术的出现,我们对植物基因组的认识逐步加深。 而这方面的深入了解能使我们更好地操纵基因特性。比如农作物产量,抗病性, 生长能力,营养价值,抗旱性。这些特性中每一个都由多基因编码。通过基因组 作图(genome mapping)使植物模式化,植物生物学家为将来植物的培育以及从 基因水平上认识植物进化奠定了基础。水稻作为一种模式系统被选中是因为它的 基因组较小,与其它谷类有很高的染色体保守性。从基因组的意义上看,“水稻 就是小麦”。植物另外一个模式系统就是拟南芥(Arabidopsis)。这种芥菜类的野 草具有特别小的基因组。它只有 20%的重复 DNA( 见表 43.1),这使得测定它 的全序列比较容易。如下面将讨论的,进一步达到单个碱基对的检测水平是一个 渐进的阶梯过程。 RELP 和 AFLP 可作为绘制基因组图谱和检测多态性的工具 谱和检测多态性的工具 在染色体上线性地确定每个基因,经典的办法是将它与已经通过突变确定了 的基因杂交。重组的概率就可以用来计算两个遗传标记物(genetic markers)之 间亲缘关系的远近(见 13 章)。结果就是一张遗传图或连锁图(genetic or linkage map)。这种方法仅限于那些具有等位基因的基因,而且能通过表现型得以鉴定的。 更多的基因组可以使用限制性片断长度多态性 性片断长度多态性(restriction fragment length polymorphisms RFLPs)来作图,这样就不需要有宏观表型。注意,RFLPs 是包
含一个或多个基因的部分DNA片断。这种方法在19章详细讨论过(见图19.2,19.4,19.9和19.10),包括RFLP图谱的分析,或者用限制性内切酶在特定位点剪切所获得的DNA片断的模式的分析。将克隆得到的探针与凝胶电泳分离出来的DNA片断进行杂交,可以确定该限制性片断长度的多态性(RFLPs)。RFLP作图能很快确定基因组中重要的区域。而有关的序列的数据则需要复杂的以计算机为基础的检索和匹配(matching)系统。目前最密集的RFLP图谱存在于水稻中,12条染色体上绘制了2000个DNA序列。另外一种应用序列可变性的工具图43.6普通大豆和“多瘤”大豆的AFLP是AFLPs,或称为扩增片断长度多态指纹图谱模式现在仍然不清楚究竞是什么因素决定了普通大豆(a)和“多瘤”突变性(amplifiedfragmentlength体(b)的根瘤数目。这些植物间细微的基因差异能用AFLP(c)检测出。条带模式的polymorphisms)。基因组中的DNA片变化反映了与“多瘤”突变相关的基因标断先用限制性内切酶(通常是EcoRI记。第1列:普通大豆DNA;第2列:“多根瘤”大豆DNA。和Msel)切断,然后利用聚合酶链式反应(PCR)扩增,得到的PCR产物代表了被限制性酶切断的每一段DNA,这些片断根据其大小通过凝胶电泳可分开。与RFLPs一样,AFLPs通过与克隆探针杂交进行鉴定。因为整个基因组在凝胶上都能看得见(图43.6),AFLPS凝胶上条带的大小比RFLP图谱上的表现出更大的多态性。RFLPS和AFPLS(在许多其它基因组分析的工具中)都可以为通过杂交从亲本传递给子代的遗传特性提供标记。DNA微阵列如何使得DNA序列对研究者有用,而不仅仅是一大堆电子信息的数据?
含一个或多个基因的部分 DNA 片断。 这种方法在 19 章详细讨论过(见图 19.2,19.4,19.9 和 19.10),包括 RFLP 图谱的分析,或者用限制性内切酶在 特定位点剪切所获得的 DNA 片断的 模式的分析。将克隆得到的探针与凝 胶电泳分离出来的 DNA 片断进行杂 交,可以确定该限制性片断长度的多 态性(RFLPs)。RFLP 作图能很快确定 基因组中重要的区域。而有关的序列 的数据则需要复杂的以计算机为基础 的检索和匹配(matching)系统。目前 最密集的 RFLP 图谱存在于水稻中,12 条染色体上绘制了 2000 个 DNA 序列。 另外一种应用序列可变性的工具 是 AFLPs,或称为扩增片断长度多态 性 ( amplified fragment length polymorphisms)。基因组中的 DNA 片 断先用限制性内切酶(通常是 EcoRI 和 MseI)切断,然后利用聚合酶链式 反应(PCR)扩增,得到的 PCR 产物代表了被限制性酶切断的每一段 DNA,这 些片断根据其大小通过凝胶电泳可分开。与 RFLPs 一样,AFLPs 通过与克隆探 针杂交进行鉴定。因为整个基因组在凝胶上都能看得见(图 43.6),AFLPS 凝胶上 条带的大小比 RFLP 图谱上的表现出更大的多态性。RFLPS 和 AFPLS(在许多 其它基因组分析的工具中)都可以为通过杂交从亲本传递给子代的遗传特性提供 标记。 DNA 微阵列 如何使得 DNA 序列对研究者有用,而不仅仅是一大堆电子信息的数据? 图 43.6 普通大豆和“多瘤”大豆的 AFLP 指纹图谱模式 现在仍然不清楚究竟是什 么因素决定了普通大豆(a)和“多瘤”突变 体(b)的根瘤数目。这些植物间细微的基因 差异能用 AFLP(c)检测出。条带模式的 变化反映了与“多瘤”突变相关的基因标 记。第 1 列:普通大豆 DNA;第 2 列:“多 根瘤”大豆 DNA