I868年,瑞士的内科医生Friedrich Miescher,从外科医院包扎伤口的绷带上的脓细胞核中提取到一种富含磷元素的酸性化合物,将其称为核 质(nuclein):后来他又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物质组成的,此酸性物质即是现在所知的核 酸(ucleic acid)。I944年Oswald Avery,.Colin Macleod和Maclyn McCarty发现,一种有夹膜、具致病性的肺炎球菌中提取的核酸桪 NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜,不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎 球菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认 识,确立了核酸是遗传物质的重要地位;DNA遗传作用的进一步肯定来自Alfred Hershey和Martha Chase对一个感染大肠杆菌的病毒的研究。 即用放谢性同位素32P标记噬菌体DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果发现进入细菌体内,使细菌 生长、繁殖发生变化的是32P标记的DNA,而不是35S标记的蛋白质,并且新繁殖生成的噬菌体不含?35S,只含32P。1953年Watsoni和Crick创 立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制 (replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平奠定了基础,成为现代分子生物学发展史上最为辉煌的里程 碑。后来的研究又发现了另一类核酸李NA(ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起着重要的作用。从此,核酸研究的进展日 新月异,如今,由核酸研究而产生的分子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人类对生命本质的认识进 入了一个薪新的天地。 第一节核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 一、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点:一是核酸一般不含元素S,二是核酸中P元素的含量较多并 且恒定,约占9~10%。因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核 苷和磷酸,核苷还可再进一步水解,产生戊糖和含氨碱基(图15·1)。 「辟酸 核酸一→核苷酸一 ,龙精(pentose】 核苷一+ 藏基(bae) (nucleotide>(nucleoside) 图15·1核酸的组成 核苷酸中的碱基均为含氨杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺 嘌呤(adenine,A),密啶碱(pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。DNA和RNA都含有鸟嘌呤(G、腺 嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在于DNA中。它们的化 学结构请参见图示。 啶 鸟暴吟 6一氯蓝原吟) 2-氢落6-氧第的) 胞啶 尿嘴啶 (亿一氧4一其基密呢) (24-二氧) (5-甲基尿嚯爽】 核酸中五种碱基中的酮基和氨基,均位于碱基环中氨原子的邻位,可以发生酮式一烯醇式或氨基?亚氨基之间的结构互变。这种互变异构 在基因的突变和生物的进化中具有重要作用
1868年,瑞士的内科医生Friedrich Miescher从外科医院包扎伤口的绷带上的脓细胞核中提取到一种富含磷元素的酸性化合物,将其称为核 质(nuclein);后来他又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物质组成的,此酸性物质即是现在所知的核 酸 (nucleic acid) 。 1944 年 Oswald Avery,Colin Macleod 和 Maclyn McCarty 发 现 , 一 种 有 夹 膜 、 具 致 病 性 的 肺 炎 球 菌 中 提 取 的 核 酸 桪 NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜,不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎 球菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认 识,确立了核酸是遗传物质的重要地位;DNA遗传作用的进一步肯定来自Alfred Hershey和Martha Chase对一个感染大肠杆菌的病毒的研究。 即用放谢性同位素32P标记噬菌体DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果发现进入细菌体内,使细菌 生长、繁殖发生变化的是32P标记的DNA,而不是35S标记的蛋白质,并且新繁殖生成的噬菌体不含?35S,只含32P。1953年Watson和Crick创 立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制 (replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平奠定了基础,成为现代分子生物学发展史上最为辉煌的里程 碑。后来的研究又发现了另一类核酸桼NA(ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起着重要的作用。从此,核酸研究的进展日 新月异,如今,由核酸研究而产生的分子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人类对生命本质的认识进 入了一个崭新的天地。 第一节 核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 一、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点:一是核酸一般不含元素S,二是核酸中P元素的含量较多并 且恒定,约占9~10%。因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核 苷和磷酸,核苷还可再进一步水解,产生戊糖和含氮碱基(图15-1)。 图15-1 核酸的组成 核苷酸中的碱基均为含氮杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺 嘌呤(adenine,A),嘧啶碱(pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。DNA和RNA都含有鸟嘌呤(G)、腺 嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在于DNA中。它们的化 学结构请参见图示。 核酸中五种碱基中的酮基和氨基,均位于碱基环中氮原子的邻位,可以发生酮式一烯醇式或氨基?亚氨基之间的结构互变。这种互变异构 在基因的突变和生物的进化中具有重要作用
NH 重氨式 有些核酸中还含有修饰碱基(modifiedcomponent)),(或稀有碱基,unusual component),这些碱基大多是在上述嘌岭或嘧啶碱的不同部位 甲基化(methylation)或进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各种类型核酸中的分布也不均一。DNA中 的修饰碱基主要见于噬菌体DNA,如5-甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多,如1-甲基腺嘌呤(mlA), 2,2一二甲基鸟嘌呤(m22G)和5,6-二氢尿嘧啶(DHU)等. CH,OH 5-甲基胞毫晚m 5-羟甲丛胞密晚mC H,0 H.C 出 1-甲基腺哪岭m') 2,2-二甲嘉马第吟mG) 5.6-二氧尿密呢DHU) 嘌呤和嘧啶环中含有共轭双键,对260左右波长的紫外光有较强的吸收。碱基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定 性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(eoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将 戊糖的C原子编号都加上“”,如C1'表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的C1'与嘧啶碱的N1或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多数是核糖或脱氧核糖的C5'上羟基被磷酸酯化,形成5'核苷 酸。核苷酸在5'进一步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AMP外,还有二磷酸腺苷(ADP,adenosine5'· diphosphate)和三磷酸腺苷(ATP,adenosine5'-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的中间产物或者酶活 性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核苷酸还有环化的形式。它们主要是3',5',环化腺苷酸(cAMP,adenosine3,5'-cyclicmonophosphate)和3',5'·环化鸟苷酸 (cGMP,guanosine3',5',cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信号中起若十分重要的作用。 OH HO 0- OHOH核 OH 脱氧校能 尿H越(UMP) 算音酸dAMP QH OH HO P-0-P-0-CH 0= H0-P-0 OHOH 二磷融藤青ADP] 3,-环化像苷酸(AMP) NH. OHOHOH HN -0-CH 0-dL0 HO一P=D OH OH O OH 兰纳酸黎背(ATP y,-乐化鸟破(GMP到 表15·1核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺骠呤(A) adenosine monophosphate adenosine adenine 脱氧腺苷酸(dAMP) 脱氧腺苷
有些核酸中还含有修饰碱基(modifiedcomponent),(或稀有碱基,unusual component),这些碱基大多是在上述嘌呤或嘧啶碱的不同部位 甲基化(methylation)或进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各种类型核酸中的分布也不均一。DNA中 的修饰碱基主要见于噬菌体DNA,如5-甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多,如1-甲基腺嘌呤(m1A), 2,2一二甲基鸟嘌呤(m22G)和5,6-二氢尿嘧啶(DHU)等。 嘌呤和嘧啶环中含有共轭双键,对260nm左右波长的紫外光有较强的吸收。碱基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定 性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(deoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将 戊糖的C原子编号都加上“′”,如C1′表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的C1′与嘧啶碱的N1或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多数是核糖或脱氧核糖的C5′上羟基被磷酸酯化,形成5′核苷 酸。核苷酸在5′进一步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AMP外,还有二磷酸腺苷(ADP,adenosine 5′- diphosphate)和三磷酸腺苷(ATP,adenosine 5′-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的中间产物或者酶活 性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核 苷 酸 还 有 环 化 的 形 式 。 它 们 主 要 是 3′ , 5′- 环 化 腺 苷 酸 (cAMP,adenosine 3′,5′-cyclicmonophosphate) 和 3′ , 5′- 环 化 鸟 苷 酸 (cGMP,guanosine 3′,5′-cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信号中起着十分重要的作用。 表15-1 核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺嘌呤(A) adenosine monophosphate adenosine adenine 脱氧腺苷酸(dAMP) 脱氧腺苷
deoxydenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌岭(G) guanosine monophosphate guanosine guanine 脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 跑苷酸(CMP) 胞苷 胞嘧啶(C) cytidine monophosphate cytidine cytosine 胞氧跑苷酸(dCMP) 脱氧跑苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymidine monophate thymidine thymine 尿苷酸(UMP) 尿苷 尿密啶(U) uridine monophosphate uridine uracil 第二节 DNA的一级结构与功能 (一)DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一级结构即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照 一定的排列顺序,通过磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故又可称为碱基顺序。核苷酸之间的连接 方式是:一个核苷酸的5'位磷酸与下一位核苷酸的3'OH形成3',5'磷酸二酯键,构成不分支的线性大分子,其中磷酸基和戊糖基构成DNA链的 骨架,可变部分是碱基排列顺序。核酸是有方向性的分子,即核苷酸的戊糖基的5'位不再与其它核苷酸相连的5'未端,以及核苷酸的戊糖基3 位不再连有其它核苷酸的3末端,两个末端并不相同,生物学特性也有差异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。目前多由仪器自动合成而用 作DNA合成的引物(Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途。 表示一个核酸分子结构的方法由繁至简有许多种(图15-2)。由于核酸分子结构除了两端和碱基排列顺序不同外,其它的均相同。因此,在 核酸分子结构的简式表示方法中,仅须注明一个核酸分子的哪一端是5末端,哪一端是3'末端,未端有无磷酸基,以及核酸分子中的碱基顺序 即可。如未特别注明5和3'末端,一般约定,碱基序列的书写是由左向右书写,左侧是5'未端,右侧为3'未端。 PipApAPTpTpC OH PGPAATTC-OH3 -GAATTC-3 GAATTC 图15·2核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨大的生物高分子,一般将细胞内遗传信息的携带者枣染色 体所包含的DNA总体称为基因组(genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度则差异极大,一般 讲,进化程度越高的生物体其基因组构成越大、越复杂,见(表15-2)。 表15-2某些有代表性的生物体内DNA大小 分子量 碱基对(bp) 干碱基对kb)】 最简单的微生物 SV40病毒 3×106 5×103 噬菌体 3.4×107 5×104 50 细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物 小鼠 1.5×1012 2.3×109 230万 1.8×1012 2.8×109 280万 DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。 基因的功能取决于DNA的一级结构。一个DNA分子能携带多 少基因呢?如果以1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对(base pair,,bp),可编码5种基因,人类基因组含 3×109 bp DNA,理论上可编码200万以上的基因,然而,由于哺乳动物的基因含有内含子(intorn),因而每个基因可长达5000~8000bp,少数 可达20,000p。按这样大小的基因进行推算,人类基因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核酸杂交 已测得哺乳类细胞含50,000~100,000种mRNA,由此推论整个基因组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为
deoxydenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌呤(G) guanosine monophosphate guanosine guanine 脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 胞苷酸(CMP) 胞苷 胞嘧啶(C) cytidine monophosphate cytidine cytosine 胞氧胞苷酸(dCMP) 脱氧胞苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymidine monophate thymidine thymine 尿苷酸(UMP) 尿苷 尿嘧啶(U) uridine monophosphate uridine uracil 第二节 DNA的一级结构与功能 (一)DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一级结构即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照 一定的排列顺序,通过磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故又可称为碱基顺序。核苷酸之间的连接 方式是:一个核苷酸的5′位磷酸与下一位核苷酸的3′-OH形成3′,5′磷酸二酯键,构成不分支的线性大分子,其中磷酸基和戊糖基构成DNA链的 骨架,可变部分是碱基排列顺序。核酸是有方向性的分子,即核苷酸的戊糖基的5′位不再与其它核苷酸相连的5′末端,以及核苷酸的戊糖基3′ 位不再连有其它核苷酸的3′末端,两个末端并不相同,生物学特性也有差异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。目前多由仪器自动合成而用 作DNA合成的引物(Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途。 表示一个核酸分子结构的方法由繁至简有许多种(图15-2)。由于核酸分子结构除了两端和碱基排列顺序不同外,其它的均相同。因此,在 核酸分子结构的简式表示方法中,仅须注明一个核酸分子的哪一端是5′末端,哪一端是3′末端,末端有无磷酸基,以及核酸分子中的碱基顺序 即可。如未特别注明5′和3′末端,一般约定,碱基序列的书写是由左向右书写,左侧是5′末端,右侧为3′末端。 图15-2 核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨大的生物高分子,一般将细胞内遗传信息的携带者枣染色 体所包含的DNA总体称为基因组(genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度则差异极大,一般 讲,进化程度越高的生物体其基因组构成越大、越复杂,见(表15-2)。 表15-2 某些有代表性的生物体内DNA大小 分子量 碱基对(bp) 千碱基对(kb) 最简单的微生物 SV40病毒 3×106 5×103 5 λ噬菌体 3.4×107 5×104 50 细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物 小鼠 1.5×1012 2.3×109 230万 人 1.8×1012 2.8×109 280万 DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。基因的功能取决于DNA的一级结构。一个DNA分子能携带多 少基因呢?如果以1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对(base pair,bp),可编码5种基因,人类基因组含 3×109bp DNA,理论上可编码200万以上的基因,然而,由于哺乳动物的基因含有内含子(intorn),因而每个基因可长达5000~8000bp,少数 可达20,000bp。按这样大小的基因进行推算,人类基因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核酸杂交 已测得哺乳类细胞含50,000~100,000种mRNA,由此推论整个基因组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为
rRNA等重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复 序列,这些重复序列或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。可见原核细 胞由于DNA分子较小,必须充分利用有限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 @真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即 有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译成一个mRNA分子,一条多肽链。 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃 至上干。重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度 重复序列可达I03~I04次,如为数众多的Alu家族序列,Kpnl家族,Hi家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基 因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60 ~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(interveningsequences),称为内含子(intron),编码区则 称为外显子(exon)。内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA, 作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可能是RNA,可能是单链的,也可能是双链的,可能是闭环分 子,也可能是线性分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支架蛋白构成一致密的区域,称为类核 (nucleoid). ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为多顺反子mRNA(polycistronic mRNA),然后再加工成各种 蛋白质的模板mRNA. ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体Wx174中只有5%是非编码 区。 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列。 (三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅存在着细微的差异,但在 DNA水平却存在着差异,尤其在不编码蛋白质的区域以及没设有重要调节功能的区域表现更为突出。这种不影响生物体表型的DNA突变被称为 中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生 突变,使突变所在部位的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生较大的顺序突变如缺失、重复、插入,或 DNA高变区内某串联重复顺序的拷贝数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核酸内切酶消化此DNA, 便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中就会出现不同长度的限制性片段类型。 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法 医学上对罪犯的确认等。 (四)DNA序列分析(DNa sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知道其DNA顺序。因此DNA序列分析是分子遗传学中一项既 重要又基本的课题。 1986年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组3×10bp全序列的序列分 析和人类基因的染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八门、种类繁多。但是究其所依据的基本原理,不外乎Sag®r 的核酸链合成终止法及Maxam和Gilbert的化学降解法两大类。虽然原理不同,但这两种方法都同样生成互相独立的若干组带放射性标记的寡核 苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或多种残基上。由于DNA链上每一个碱基出现在可变终止端的机会均等,因 而上述每一组产物都是一些寡核苷酸的混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA片段上的位置所决定。然后在可以区分长度仅 相差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即 可从凝胶的放射自显影片上直接读出DNA上的核苷酸顺序。以下分别介绍。 1.Sanger双脱氧链终止法 DNA的合成总是从5端向3'端进行的。DNA的合成需要模板以及相应的引导核酸链。DNA的合成过程中,在合成的DNA链的3'末端,依据 碱基配对的原则,通过生成新的3',5'·磷酸二酯键,使DNA链合成终止,产生短的DNA链。具体测序工作中,平行进行四组反应,每组反应
rRNA等重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复 序列,这些重复序列或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。可见原核细 胞由于DNA分子较小,必须充分利用有限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 ①真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即 有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译成一个mRNA分子,一条多肽链。 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃 至上千。重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度 重复序列可达103~104次,如为数众多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基 因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60 ~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(interveningsequences),称为内含子(intron),编码区则 称为外显子(exon)。内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA, 作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可能是RNA,可能是单链的,也可能是双链的,可能是闭环分 子,也可能是线性分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支架蛋白构成一致密的区域,称为类核 (nucleoid)。 ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为多顺反子mRNA(polycistronic mRNA),然后再加工成各种 蛋白质的模板mRNA。 ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体ψx 174中只有5%是非编码 区。 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列。 (三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅存在着细微的差异,但在 DNA水平却存在着差异,尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出。这种不影响生物体表型的DNA突变被称为 中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生 突变,使突变所在部位的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生较大的顺序突变如缺失、重复、插入,或 DNA高变区内某串联重复顺序的拷贝数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核酸内切酶消化此DNA, 便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中就会出现不同长度的限制性片段类型。 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法 医学上对罪犯的确认等。 (四)DNA序列分析(DNa sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知道其DNA顺序。因此DNA序列分析是分子遗传学中一项既 重要又基本的课题。 1986年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组3×109bp全序列的序列分 析和人类基因的染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八门、种类繁多。但是究其所依据的基本原理,不外乎Sanger 的核酸链合成终止法及Maxam和Gilbert的化学降解法两大类。虽然原理不同,但这两种方法都同样生成互相独立的若干组带放射性标记的寡核 苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或多种残基上。由于DNA链上每一个碱基出现在可变终止端的机会均等,因 而上述每一组产物都是一些寡核苷酸的混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA片段上的位置所决定。然后在可以区分长度仅 相差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即 可从凝胶的放射自显影片上直接读出DNA上的核苷酸顺序。以下分别介绍。 1.Sanger双脱氧链终止法 DNA的合成总是从5′端向3′端进行的。DNA的合成需要模板以及相应的引导核酸链。DNA的合成过程中,在合成的DNA链的3′末端,依据 碱基配对的原则,通过生成新的3′,5′-磷酸二酯键,使DNA链合成终止,产生短的DNA链。具体测序工作中,平行进行四组反应,每组反应
均使用相同的模板,相同的引物以及四种脱氧核苷酸:并在四组反应中各加入适量的四种之一的双脱氧核苷酸,使其随机地接入DNA链中,使 链合成终止,产生相应的四组具有特定长度的、不同长短的DNA链。这四组DNA链再经过聚丙烯酸胺凝胶电泳按链的长短分离开,经过放射 自显影显示区带,就可以直接读出被测DNA的核苷酸序列(图15·3)。 999 0= 0= 00 3一松游冥核替能 2一脱名候查酸 JAdAUTdTdGdCdTaAdGdcdGdCdTaAdGdc? AdAdCiGrAdTdCHG入Tacan9 dATP dGTr 汽时 OGI 10T dCTP CTP dTIP 打TP eTTP m ddATp ddGTP ddTTP 3 -dAdAdTdTUGdCHTMGdCdGdCdTdAddG AdAdTaT&GdcTdAdGdCdGdrdT s-dAlATUTUGdCTd. s-dAdAdTd'rdGdCITdAdGdCddG -dadAdTdTGdCrdAdGddc s-oAdAd s-dAdAdTU IdGdCaTudA s-dAlAd'TuTuGdec s'-dAdAdTdTddG s-cAdAd rddT s-dAddA 5-ddA 所湖疗列 图15·3双脱氧链终止法测定DNA序列原理示意 2.Maxam?Gilbert DNA化学降解法 这一方法的基本步骤为(1)先将DNA的未端之一进行标记(通常为放射性同位素32P:(2)在多组互相独立的化学反应中分别进行特定碱基的 化学修饰;(3)在修饰碱基位置化学法断开DNA链;(4)聚丙烯酰胺凝胶电泳将DNA链按长短分开:(⑤)根据放射自显影显示区带,直接读出 DNA的核苷酸序列(图15-4). S'HO-GATCGGACCT 3 单端成射同位聚杯记 (此例为了一表殊标记) S HPGATOGGACCT 3 不完伞修饰 修饰G修饰G和A修悔T和C修修C 化学裂解 」电冰分离 GG+A T+CC 余长核酸 PGATOGGACC PGATOGGAC C] NPGATCGGAC 方 POATOGG☒四 PGATCG囹 PGATC G PGAT C] PGA O因 Ψ 口表示触锋饰碱基及断裂位置 图15·4化学裂解法测定DNA的核苷酸序列 第三节DNA的二级结构与功能 (一)DNA的二级结构?双螺旋结构模型(double helixmodel))
均使用相同的模板,相同的引物以及四种脱氧核苷酸;并在四组反应中各加入适量的四种之一的双脱氧核苷酸,使其随机地接入DNA链中,使 链合成终止,产生相应的四组具有特定长度的、不同长短的DNA链。这四组DNA链再经过聚丙烯酸胺凝胶电泳按链的长短分离开,经过放射 自显影显示区带,就可以直接读出被测DNA的核苷酸序列(图15-3)。 图15-3 双脱氧链终止法测定DNA序列原理示意 2.Maxam?Gilbert DNA化学降解法 这一方法的基本步骤为(1)先将DNA的末端之一进行标记(通常为放射性同位素32P;(2)在多组互相独立的化学反应中分别进行特定碱基的 化学修饰;(3)在修饰碱基位置化学法断开DNA链;(4)聚丙烯酰胺凝胶电泳将DNA链按长短分开;(5)根据放射自显影显示区带,直接读出 DNA的核苷酸序列(图15-4)。 图15-4 化学裂解法测定DNA的核苷酸序列 第三节 DNA的二级结构与功能 (一)DNA的二级结构?双螺旋结构模型(double helixmodel)