第五章DNA序列测定 述 DNA的测序是分子生物学研究中非常重要和关键的内容。对D一级结构的研究,有助 于探索基因结构与功能、基因与疾病关系,进而推动生命科学研究获得质的飞跃。测定基因 组的全部核苷酸序列、阅读和分析全部遗传信总,正是人类基因组计划(human genome project,.HGP)的最主要目标之 DA测序的主要方法有两种,即双脱氧链终止法(Sanger法、酶促法)和化学裂解注 (Maxam-Gelbert法)。二者均依赖于高分辨率的变性聚丙烯酰胺凝胶电泳(PAGE)。不管是 酶促法还是化学法,都是分为4个反应体系进行测序反应,寡核苷酸链分别终止于不同位置 的A、T、G或C碱基。4种反应体系的寡核苷酸链产物,进行变性聚丙烯酰胺凝胶电泳,放 射自显影后,读出待测DNA的连续序列。 第一节Sanger双脱氧链终止法 一、原理(单链) DNA链中的核苷酸是以3,5-磷酸二酯键相连接,合成DNA所用的底物是2-脱氧核 苷三磷酸(dNP),在Sanger双脱氧链终止法中被掺入了2 一双脱氧核苷三磷酸 (ddNTP),当ddNTP位于链延伸末端时,由于它没有3-OH,不能再与其它的脱氧核苷酸 形成3,5-磷酸二酯键,DNA合成便在此处终止,如果此处掺入的是一个ddATP,则新 生链的末端就是A,依次类推可以通过惨入ddTTP、ddCP、ddGP,则新生练的末端为T、 C或G,根据这个原理,Sang©r与197年建立了双脱氧链终止测序法。他本人也因此而获得 了诺贝尔 在测序反应中通常设置4个反应,各反应管中同时加入一种DNA模板和引物、DNA聚合 酶I(失去5'→'外切核酸酶活性入其中一管中分别加入一种ddNTP(如ddTTP、dTTP) 以及其它三种dNTP(dATP、dCTP、dGTP),引物末端用放射性核素标记,ddTTP的比例 很小(1:10),因此掺入的位点是随机的,经过适当的条件下温有,将会有不同长度的D阳 片段合成(P163及图) 二、DNA序列测定的策略 (一)测序载体和引物 (二)大片段DNA序列测定的策略 1.鸟枪法将长链DNA片段随机断裂成适于序列测定的片段(300-60Obp),断裂方法 有超声波处理、核酸 酶I法和限制酶切制法。2.嵌套缺失法(e,Erase-a-base (1)首先将大片段克隆到测序载体: (2)选用两种限制酶从待测DNA片段与载体序列之间将DNA切断,使切割后近载体端 为3突出的粘性末端,近待测DNA的末端为5突出的粘性末端或平端: (3)用外切核酸酶Ⅲ消化上述线性DA(3C,250核苷酸/min),在不同时间终止 反应,可以获得在同 并依次 0-250bp的DNM片段 (4)用核酸酶S1消化末端的单链,使之成平端,经T4DNA连接酶连接环化,得到 一套缺失长度不同的DNA片段克隆: (5)将各个克隆从其缺失端开始用通用引物测序。由于引物相同,测序结果可以从子
第五章 DNA 序列测定 概 述 DNA 的测序是分子生物学研究中非常重要和关键的内容。对 DNA 一级结构的研究,有助 于探索基因结构与功能、基因与疾病关系,进而推动生命科学研究获得质的飞跃。测定基因 组的全部核苷酸序列、阅读和分析全部遗传信息,正是人类基因组计划(human genome project, HGP)的最主要目标之一。 DNA 测序的主要方法有两种,即双脱氧链终止法(Sanger 法、酶促法)和化学裂解法 (Maxam-Gelbert 法)。二者均依赖于高分辨率的变性聚丙烯酰胺凝胶电泳(PAGE)。不管是 酶促法还是化学法,都是分为 4 个反应体系进行测序反应,寡核苷酸链分别终止于不同位置 的 A、T、G 或 C 碱基。4 种反应体系的寡核苷酸链产物,进行变性聚丙烯酰胺凝胶电泳,放 射自显影后,读出待测 DNA 的连续序列。 第一节 Sanger 双脱氧链终止法 一、原理(单链) DNA 链中的核苷酸是以 3`,5`-磷酸二酯键相连接,合成 DNA 所用的底物是 2`-脱氧核 苷三磷酸(dNTP),在 Sanger 双脱氧链终止法中被掺入了 2`,3`-双脱氧核苷三磷酸 (ddNTP),当 ddNTP 位于链延伸末端时,由于它没有 3`-OH,不能再与其它的脱氧核苷酸 形成 3`,5`-磷酸二酯键,DNA 合成便在此处终止,如果此处掺入的是一个 ddATP,则新 生链的末端就是 A,依次类推可以通过掺入 ddTTP、ddCTP、ddGTP,则新生链的末端为 T、 C 或 G,根据这个原理,Sanger 与 1977 年建立了双脱氧链终止测序法。他本人也因此而获得 了诺贝尔奖。 在测序反应中通常设置 4 个反应,各反应管中同时加入一种 DNA 模板和引物、DNA 聚合 酶 I(失去 5′→′外切核酸酶活性)、其中一管中分别加入一种 ddNTP(如 ddTTP、dTTP) 以及其它三种 dNTP(dATP、dCTP、dGTP),引物末端用放射性核素标记, ddTTP 的比例 很小(1:10),因此掺入的位点是随机的,经过适当的条件下温育,将会有不同长度的 DNA 片段合成 (P163 及图) 二、DNA 序列测定的策略 (一)测序载体和引物 (二)大片段 DNA 序列测定的策略 1.鸟枪法 将长链 DNA 片段随机断裂成适于序列测定的片段(300-600bp),断裂方法 有超声波处理、核酸酶 I 法和限制酶切割法。2.嵌套缺失法(nested deletion,Erase-a-base) (1)首先将大片段克隆到测序载体; (2)选用两种限制酶从待测 DNA 片段与载体序列之间将 DNA 切断,使切割后近载体端 为 3`突出的粘性末端,近待测 DNA 的末端为 5`突出的粘性末端或平端; (3)用外切核酸酶 III 消化上述线性 DNA(37°C,250 核苷酸/min),在不同时间终止 反应,可以获得在同一端缺失并依次相差 200-250bp 的 DNA 片段。 (4)用核酸酶 S1 消化末端的单链,使之成平端,经 T4 DNA 连接酶连接环化,得到 一套缺失长度不同的 DNA 片段克隆; (5)将各个克隆从其缺失端开始用通用引物测序。由于引物相同,测序结果可以从子
片段序列的相互重叠部分准确无误地将相邻片段的序列拼接起来。 原理解析 A.该法巧妙地利用cxo的酶学特征,它有35外切酶活性,它只能切dsDNA或平头 的3末端或龟缩的3末端,而不能切sDNA的3末端(即突出末端)。 B.水解速度较均匀,在37℃,每分钟可降解250个核苷酸,因此,在一定的时间间隔内 取样终止反应,可以得到依次相差200-250个碱基对的D4片段。 C.cxo能从DNA的切口处进行3一5外切,因此,样品不能有切口存在,操作时用含有 50mmol/LpH4. NaOAC (醋酸钠 )的酚代替普通的pH7.0的酚去 有切口的DNA 分于 D.exolII能被微量的NaCI强烈抑制,因此,样品DNA必须用酚/氯仿抽提和酒精沉淀。 3、引物延伸法 从DNA的3'端依赖特定引物延伸测定一段DNA序列,再根据测得序列设计新的引物, 如此逐步推进。 第二节Maxam-Gilbert化学修饰法 氧链 法建立的同时,Maxam和Gilbert于I977年建立了一种以化学修 饰为基础的DNA序列分析法,称为Maxam-Gilbert化学修饰法。 基本原理:用化学试剂处理具末端放射性标记的DNA片段,造成碱基的特异性切割, 由此产生一组具有各种不同长度的DNA链的反应混和物,经凝胶电泳按大小分离和放射自 显影,便可根据X线片底板上显示相应带谱,直接读出待测DNA片段的核苷酸顺序。 化学修饰法的特测DNA片段有的是双链,有的是单鞋DN。在进行碱基特异性化学切 割反应前,首先对待测DNA片段作末端标记,使其末端(⑤'端或者是3'端)带上放射标记 如果待测DNA是双链,必须使其形成末端标记的单链。 对末端标记的DNA链进行化学断裂反应分两步进行: 第一步是在4个反应管中分别以肼、硫酸二甲酯(DMS)和甲酸对特定的碱基进行化学 悠饰 第二步是以六氢吡啶取代被修饰的碱基并将DNA链断裂。 DNA化学裂解反应体系(P166】 反应体系 碱基修饰试剂 基修饰反应 主链断裂试剂断裂点 G 硫酸二甲酯 鸟嘌岭甲基化 六氢吡啶 G C+A 甲酸 脱嘌吟作用 六氢吡晾 G和A C+T 密啶开 六氢叫 店 C和T 肼(加盐 胞嘧啶开环 六氢吡啶 DMS(硫酸二甲酯)在中性pH环境中,主要作用于G,被六氢毗啶作用而造成该位点 上DNA链的断裂 甲酸具有脱吟作用。DNA链在脱嘌吟位点(G和)发生断裂 肼,在碱性条件下,作用于胸腺嘧啶和胞嘧啶,在具有六氢吡啶的条件下,导致在这个 核苷酸位置上发生DNA链的断裂。如果在反应体系中加入高浓度的盐,同胸腺嘧啶的反应 速率便会下降,主要作用于胞嘧啶。 在化学修饰反应过程中,通过控制反应温度和反应时间,只有一小部分碱基被修饰(而
片段序列的相互重叠部分准确无误地将相邻片段的序列拼接起来。 原理解析: A.该法巧妙地利用 exoIII 的酶学特征,它有 3`®5`外切酶活性,它只能切 dsDNA 或平头 的 3`末端或龟缩的 3`末端,而不能切 ssDNA 的 3`末端(即突出末端)。 B.水解速度较均匀,在 37 °C,每分钟可降解 250 个核苷酸,因此,在一定的时间间隔内 取样终止反应,可以得到依次相差 200-250 个碱基对的 DNA 片段。 C.exoIII 能从 DNA 的切口处进行 3`→5`外切,因此,样品不能有切口存在,操作时用含有 50mmol/LpH4.0 NaOAC(醋酸钠 )的酚代替普通的 pH7.0 的酚去除有切口的 DNA 分子。 D.exoIII 能被微量的 NaCl 强烈抑制,因此,样品 DNA 必须用酚/氯仿抽提和酒精沉淀。 3、引物延伸法 从 DNA 的 3′端依赖特定引物延伸测定一段 DNA 序列,再根据测得序列设计新的引物, 如此逐步推进。 第二节 Maxam-Gilbert 化学修饰法 一、Maxam-Gilbert 化学修饰法原理 几乎与双脱氧链终止法建立的同时,Maxam 和 Gilbert 于 1977 年建立了一种以化学修 饰为基础的 DNA 序列分析法,称为 Maxam-Gilbert 化学修饰法。 基本原理:用化学试剂处理具末端放射性标记的 DNA 片段,造成碱基的特异性切割, 由此产生一组具有各种不同长度的 DNA 链的反应混和物,经凝胶电泳按大小分离和放射自 显影,便可根据 X 线片底板上显示相应带谱,直接读出待测 DNA 片段的核苷酸顺序。 化学修饰法的待测 DNA 片段有的是双链,有的是单链 DNA。在进行碱基特异性化学切 割反应前,首先对待测 DNA 片段作末端标记,使其末端(5′端或者是 3′端)带上放射标记。 如果待测 DNA 是双链,必须使其形成末端标记的单链。 对末端标记的 DNA 链进行化学断裂反应分两步进行: 第一步是在 4 个反应管中分别以肼、硫酸二甲酯(DMS)和甲酸对特定的碱基进行化学 修饰; 第二步是以六氢吡啶取代被修饰的碱基并将 DNA 链断裂。 DNA 化学裂解反应体系(P166) 反应体系 碱基修饰试剂 碱基修饰反应 主链断裂试剂 断裂点 G 硫酸二甲酯 鸟嘌呤甲基化 六氢吡啶 G G+A 甲酸 脱嘌呤作用 六氢吡啶 G 和 A C+T 肼 嘧啶开环 六氢吡啶 C 和 T C 肼(加盐) 胞嘧啶开环 六氢吡啶 C DMS(硫酸二甲酯)在中性 pH 环境中,主要作用于 G,被六氢吡啶作用而造成该位点 上 DNA 链的断裂。 甲酸具有脱嘌呤作用。DNA 链在脱嘌呤位点(G 和 A)发生断裂。 肼,在碱性条件下,作用于胸腺嘧啶和胞嘧啶,在具有六氢吡啶的条件下,导致在这个 核苷酸位置上发生 DNA 链的断裂。如果在反应体系中加入高浓度的盐,同胸腺嘧啶的反应 速率便会下降,主要作用于胞嘧啶。 在化学修饰反应过程中,通过控制反应温度和反应时间,只有一小部分碱基被修饰(而
不是全部被修饰),随后进行的断裂反应也是定量反应。因此,DNA链并不是在所有可被修 饰的碱基位点断裂,而是随机断裂。在4个反应中,产生4套带相同标记末端、长短不一的 寡聚核苷酸片段 只有带标记末端的片段可被识别,没有标记 末端的片段可以忽略不计 以上4种反应体系DNA片段混合物经高分辨凝胶电泳与放射自显影,使可直接读得测 定DNA片段的碱基排列顺序。各DNA子片段测序工作完成后,按酶切图谱,可顺序相连 完成完整的长链DNA序列。 学修饰法的特点 与双脱氧链终止法相比,Maxam-Gilbert化学修饰法具有一些独到的特点 1.本法不需要体外进行酶催化的延伸反应,未经克隆的待测DNA片段也可以直接进行 序列测定: 2.对于含有稀有碱基如5-甲基腺嘌呤或G、C含量较高的DNM片段、短链的宾聚核苷酸 3,采用化学修饰 端,也可以标记3'末端,因此可以从两 个相反方向测定同一条DNA链的核苷酸顺序,测定结果可以互作参照,彼此核对。 主要缺点 1.操作比较繁琐和费时,未端核素标记效率低造成放射自显影需曝光较长时间: 2.对过长DNA链的序列测定仍比较闲难。 第三节DNA测序自动化技术 一、激光测序法(终止标记系统) 用4种不同的荧光基团分别标记4种dNT,这样测序反应就可以在一个试管中进行 终止反应的产物按终止位置碱基的不同,其3末端带有不同的荧光基团 ,被激发后发出 同的荧光,因此可以上样在一个加样孔上,电泳结束后,用DNA测序仪识别,经软件处理, 便得到待测的核苷酸序列。工作量和效率均大大提高。 二、焦磷酸测序技术的原理 焦磷酸测序技术()是1987年发展起来的一种新型的酵联级联测序技术, 其原理是:引物与模板DNA退火后,在DNA聚合酶(polymerase)入ATP硫酸化酶(sulfurylase) 荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)4种酶的协同作用下,每一个dNTP 的聚合与一次荧光信号的释放级联起来,以荧光信号的形式实时记录模板DNA的核苷酸序 列。它具有快速、准确、经济、实时检测的特点,不需要凝胶电泳,也不需要对DNA样品 进行任何特殊形式的标记和染色,有很高的可重复性、高度的并行性和高度的自动化。 具体过程: 第一步,测序引物杂交到PCR扩增的模板上,与DNA聚合酶(polymerase入、ATP硫酸 化酶(sulfurylase、入荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)加入反应体系。 第二步,加入4种dNP到反应体系中进行聚合酶链式反应,当DNA聚合酶将某一种 NTP与模板上相应的核苷酸互补聚合时,会产生相同摩尔数的焦磷酸。需要说明的是在焦 磷酸测序中 ATP不 能被光素酶识别,故用arS-dATP代替常用的dP。 第三步,在5'-腺苷磷酸硫酸化醇协调作用下ATP硫酸化酶将焦磷酸(PP)转移到 ATP上,该硫酸化的ATP驱动荧光素酶将荧光素转化成氧化荧光素,后者在荧光素酶催化下 释放出与ATP量成比例的荧光,发出的荧光信号被CCD摄像机拍摄下来,并以很尖的波峰
不是全部被修饰),随后进行的断裂反应也是定量反应。因此,DNA 链并不是在所有可被修 饰的碱基位点断裂,而是随机断裂。在 4 个反应中,产生 4 套带相同标记末端、长短不一的 寡聚核苷酸片段。只有带标记末端的片段可被识别,没有标记末端的片段可以忽略不计。 以上 4 种反应体系 DNA 片段混合物经高分辨凝胶电泳与放射自显影,便可直接读得测 定 DNA 片段的碱基排列顺序。各 DNA 子片段测序工作完成后,按酶切图谱,可顺序相连 完成完整的长链 DNA 序列。 二、Maxam-Gilbert 化学修饰法的特点 与双脱氧链终止法相比,Maxam-Gilbert 化学修饰法具有一些独到的特点。 1.本法不需要体外进行酶催化的延伸反应,未经克隆的待测 DNA 片段也可以直接进行 序列测定; 2.对于含有稀有碱基如 5-甲基腺嘌呤或 G、C 含量较高的 DNA 片段、短链的寡聚核苷酸 的序列测定,化学修饰法较双脱氧链终止法更具优越性; 3.采用化学修饰法测序时,既可以标记 5′末端,也可以标记 3′末端,因此可以从两 个相反方向测定同一条 DNA 链的核苷酸顺序,测定结果可以互作参照,彼此核对。 主要缺点 1.操作比较繁琐和费时,未端核素标记效率低造成放射自显影需曝光较长时间; 2.对过长 DNA 链的序列测定仍比较困难。 第三节 DNA 测序自动化技术 一、激光测序法(终止标记系统) 用 4 种不同的荧光基团分别标记 4 种 ddNTP,这样测序反应就可以在一个试管中进行, 终止反应的产物按终止位置碱基的不同,其 3`末端带有不同的荧光基团,被激发后发出不 同的荧光,因此可以上样在一个加样孔上,电泳结束后,用 DNA 测序仪识别,经软件处理, 便得到待测的核苷酸序列。工作量和效率均大大提高。 二、焦磷酸测序技术的原理 焦磷酸测序技术(pyrosequencing)是 1987 年发展起来的一种新型的酶联级联测序技术, 其原理是:引物与模板 DNA 退火后,在 DNA 聚合酶(polymerase)、ATP 硫酸化酶(sulfurylase)、 荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)4 种酶的协同作用下,每一个 dNTP 的聚合与一次荧光信号的释放级联起来,以荧光信号的形式实时记录模板 DNA 的核苷酸序 列。它具有快速、准确、经济、实时检测的特点,不需要凝胶电泳,也不需要对 DNA 样品 进行任何特殊形式的标记和染色,有很高的可重复性、高度的并行性和高度的自动化。 具体过程: 第一步,测序引物杂交到 PCR 扩增的模板上,与 DNA 聚合酶(polymerase)、ATP 硫酸 化酶(sulfurylase)、荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)加入反应体系。 第二步,加入 4 种 dNTP 到反应体系中进行聚合酶链式反应,当 DNA 聚合酶将某一种 dNTP 与模板上相应的核苷酸互补聚合时,会产生相同摩尔数的焦磷酸。需要说明的是在焦 磷酸测序中,dATP 不能被荧光素酶识别,故用 a-S-dATP 代替常用的 dATP。 第三步,在 5’-腺苷磷酸硫酸化酶协调作用下 ATP 硫酸化酶将焦磷酸(PPi)转移到 ATP 上,该硫酸化的 ATP 驱动荧光素酶将荧光素转化成氧化荧光素,后者在荧光素酶催化下 释放出与 ATP 量成比例的荧光,发出的荧光信号被 CCD 摄像机拍摄下来,并以很尖的波峰
形式在pyrogram软件记录下来。每一峰高(即荧光信号强度)都与参与DNA合成的核苷 酸数成比例。 第四步,没有聚合的过剩的TP迅速被三磷酸腺苷双磷酸酶降解,反应体系得以再生 随后加入另一种NTP,重复以上反应。模板序列就可以随聚合酶链式反应的进行而被同步 测定。整个测序过程没有特殊的标记、染色、电泳等烦琐的操作。 特点: 焦磷酸测序法适于对已知的短序列的测序分析,目前的技术通常能满足25-30个核苷酸 的短序列测定,其重复性和精确性能与sanger DNA测序法相媲美,而速度却大大的提高 最近开发的PQ96MA和PQ96HS系统能在1小时内同时对96个样品进行SNPs分析和基因 分析,工作效率大大提高,测序成本大大降低
形式在 pyrogram 软件记录下来。每一峰高(即荧光信号强度)都与参与 DNA 合成的核苷 酸数成比例。 第四步,没有聚合的过剩的 dNTP 迅速被三磷酸腺苷双磷酸酶降解,反应体系得以再生, 随后加入另一种 dNTP,重复以上反应。模板序列就可以随聚合酶链式反应的进行而被同步 测定。整个测序过程没有特殊的标记、染色、电泳等烦琐的操作。 特点: 焦磷酸测序法适于对已知的短序列的测序分析,目前的技术通常能满足 25-30 个核苷酸 的短序列测定,其重复性和精确性能与 sanger DNA 测序法相媲美,而速度却大大的提高, 最近开发的 PQ96MA 和 PQ96HS 系统能在 1 小时内同时对 96 个样品进行 SNPs 分析和基因 分析,工作效率大大提高,测序成本大大降低