第2章延伸阅读 延伸阅读2-1基因概念的发展 基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。1909年丹麦遗传学家约翰逊(W, Johansen1859~1927)在《精密遗传学原理》一书中正式提出基因°概念,用以替代孟德尔(G.J.Mendel)早年所提出 的遗传因子(genetic factor)一词。经过l00多年的发展,基因的概念也在不断更新,经历了经典基因概念到现代新的 基因概念的形成过程。早期的基因概念简单,就是能够编码蛋白质的DNA片段,现在己很难用几句话把基因概念表 述清楚。下面是目前常见的几类基因及其概念。 跳跃基因(leap gene),是指能够改变自身位置的一段DNA序列,也叫“转座元”,可在染色体内或不同染色体 间移动,其本身可编码转座酶(transposase),也含有非蛋白编码序列。1956年,麦克林托克(B.McClintock)在研 究玉米籽粒的色素斑点时,首先提出了一个可在染色体上移动的“控制因子”,一个控制因子整合到一个基因位点上, 可产生一种新的突变型。这种可从染色体的一个位置转移到另一个位置,或从一条染色体转移到另一条染色体的 DNA片段叫做跳跃基因。跳跃基因的发现使人们进一步认识到基因不是稳定、静止不动的实体,它在结构上有明确 的界限,在功能上是一个单独的遗传单位,它可以通过自身的运动调节基因的活性。 重复基因(repeat gene),指在真核基因组中具有一份以上拷贝的基因,这些拷贝或在一条染色体上串联排列, 或分散到多条染色体上。I968年,布里顿(R.J.Britten)和科恩(S.S.Kohne)通过DNA分子复性动力学研究发现, 在真核细胞DNA中,存在着高度重复序列(重复频率大于105)、中度重复序列(重复频率在102~10之间)和非重 复序列(单一序列)。重复基因的发现,使人们从“量”上对基因的概念又有了新的认识。 TTAGCCGTAACTCCAATTCCGTCATAATGCCTCTATTGGC 3 图S2-1重复基因 重叠基因(overlapping gene),指公用一段DNA序列的两个或两个以上结构基因的互称,这与“互不沾染、单个 分离”的传统基因概念相悖。该基因1977年由桑格(F.Sanger)在研究DX174噬菌体DNA的核苷酸序列时发现的,它 的同一部分DNA序列能够编码两种不同的蛋白质,即不同基因的核苷酸序列有时是可以共同的,它们的核苷酸序列 彼此重叠,这样的基因称为重叠基因。这在低等生物尤其在病毒中重叠基因是普遍存在的。因为病毒基因组都很小, 为了利用有限的DNA序列编码更多的蛋白质,不得不使几个基因的编码序列重叠在一起,这是病毒等增加自身基因 遗传信息量的一种进化策略
1 第2章 延伸阅读 延伸阅读 2-1 基因概念的发展 基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。1909年丹麦遗传学家约翰逊(W. Johansen 1859~1927)在《精密遗传学原理》一书中正式提出“基因”概念,用以替代孟德尔(G.J. Mendel)早年所提出 的遗传因子(genetic factor)一词。经过100多年的发展,基因的概念也在不断更新,经历了经典基因概念到现代新的 基因概念的形成过程。早期的基因概念简单,就是能够编码蛋白质的DNA片段,现在已很难用几句话把基因概念表 述清楚。下面是目前常见的几类基因及其概念。 跳跃基因(leap gene),是指能够改变自身位置的一段DNA序列,也叫“转座元”,可在染色体内或不同染色体 间移动,其本身可编码转座酶(transposase),也含有非蛋白编码序列。1956年,麦克林托克(B. McClintock)在研 究玉米籽粒的色素斑点时,首先提出了一个可在染色体上移动的“控制因子”,一个控制因子整合到一个基因位点上, 可产生一种新的突变型。这种可从染色体的一个位置转移到另一个位置,或从一条染色体转移到另一条染色体的 DNA片段叫做跳跃基因。跳跃基因的发现使人们进一步认识到基因不是稳定、静止不动的实体,它在结构上有明确 的界限,在功能上是一个单独的遗传单位,它可以通过自身的运动调节基因的活性。 重复基因(repeat gene),指在真核基因组中具有一份以上拷贝的基因,这些拷贝或在一条染色体上串联排列, 或分散到多条染色体上。1968年,布里顿(R.J. Britten)和科恩(S.S. Kohne)通过DNA分子复性动力学研究发现, 在真核细胞DNA中,存在着高度重复序列(重复频率大于10 5)、中度重复序列(重复频率在10 2~10 5之间)和非重 复序列(单一序列)。重复基因的发现,使人们从“量”上对基因的概念又有了新的认识。 图S2-1 重复基因 重叠基因(overlapping gene),指公用一段DNA序列的两个或两个以上结构基因的互称,这与“互不沾染、单个 分离”的传统基因概念相悖。该基因1977年由桑格(F. Sanger)在研究ΦX174噬菌体DNA的核苷酸序列时发现的,它 的同一部分DNA序列能够编码两种不同的蛋白质,即不同基因的核苷酸序列有时是可以共同的,它们的核苷酸序列 彼此重叠,这样的基因称为重叠基因。这在低等生物尤其在病毒中重叠基因是普遍存在的。因为病毒基因组都很小, 为了利用有限的DNA序列编码更多的蛋白质,不得不使几个基因的编码序列重叠在一起,这是病毒等增加自身基因 遗传信息量的一种进化策略
G 噬菌体中X174的重叠基因B 图S2-2重叠基因 假基因(seudogene)看似正常基因,却不能表达任何RNA或蛋白质。1977年,杰奎(G.Jacq)等人根据对非 洲爪蟾5 S rRNA基因簇(gene cluster)的研究,首次提出了假基因的概念。现在已在大多数真核生物中发现了假基 因。其核苷酸序列与相应的正常功能基因基本相同,但不具有功能,不能转录或翻译生成成熟mRNA或蛋白质,或 产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质,是一种功能失活的基因。因此,把不产 生有功能的基因产物的这种基因称为假基因。 断裂基因(split genes),又称不连续基因,由编码序列和非编码序列相间排列构成,编码序列叫外显子(cxon)、 非编码序列为内含子(intron),因为编码序列存在于成熟的RNA中,翻译成蛋白质后,可呈现出一定性状,而非编 码序列在剪接过程中被切除。1977年至1978年,几个实验室都发现了基因的“内部间隔区”,哈佛大学的吉尔伯特(W Gilbert)认为基因是一个嵌合体,它包含内含子与外显子两个区段,其中内含子能转录但不能翻译,因表达的外显 子被不能表达的内含子隔开,故称之为断裂基因。 外显子 DNA 内含子 前体mRNA RNA的接合 成熟mRNA 图S2-3断裂基因
2 图S2-2 重叠基因 假基因(seudogene)看似正常基因,却不能表达任何RNA或蛋白质。1977年,杰奎(G. Jacq)等人根据对非 洲爪蟾5S rRNA 基因簇(gene cluster)的研究,首次提出了假基因的概念。现在已在大多数真核生物中发现了假基 因。其核苷酸序列与相应的正常功能基因基本相同,但不具有功能,不能转录或翻译生成成熟mRNA或蛋白质,或 产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质,是一种功能失活的基因。因此,把不产 生有功能的基因产物的这种基因称为假基因。 断裂基因(split genes),又称不连续基因,由编码序列和非编码序列相间排列构成,编码序列叫外显子(exon)、 非编码序列为内含子(intron),因为编码序列存在于成熟的RNA中,翻译成蛋白质后,可呈现出一定性状,而非编 码序列在剪接过程中被切除。1977年至1978年,几个实验室都发现了基因的“内部间隔区”,哈佛大学的吉尔伯特(W. Gilbert)认为基因是一个嵌合体,它包含内含子与外显子两个区段,其中内含子能转录但不能翻译,因表达的外显 子被不能表达的内含子隔开,故称之为断裂基因。 图S2-3 断裂基因
隐蔽基因(cryptogene)的编码序列与mRNA的相应序列有差异,转录产物上需插入、删除或取代一些核苷酸 才能生成有翻译功能的mRNA分子。一般来说,用做翻译模板的mRNA分子应该与其编码基因有对应关系,也就是 说它的核苷酸碱基与基因的核苷酸碱基互补,而且数量相等,对真核基因来说应与外显子序列相对应。但是自1985 年以来,在某些病毒、植物和动物中发现mRNA前体在成熟过程中发生了碱基的增加、缺失或替换,mRNA与基因 之间失去了一一对应关系。这一现象首先在原生动物中发现,并称之为NA编辑。这种需要编辑才能正常表达的基 因称为隐蔽基因。 反转录基因(retron)是一群古老的以反转录作用合成RNA/mDNA复合msDNA分子的遗传单元。retron是1987 年由病毒学家塔戴尔(A.Dhundale)等在一种古老的细菌Myxococcus xanthus中通过一种叫msDNA(multicopy single-stranded DNA)的新型卫星DNA而发现的。以后的研究证明msDNA广泛存在于细菌类如Myxobacter的许 多属和种中,它由细菌基因组上一段叫retron的DNA序列经转录和反转录产生,称之为反转录基因
3 隐蔽基因(cryptogene)的编码序列与mRNA的相应序列有差异,转录产物上需插入、删除或取代一些核苷酸 才能生成有翻译功能的mRNA分子。一般来说,用做翻译模板的mRNA分子应该与其编码基因有对应关系,也就是 说它的核苷酸碱基与基因的核苷酸碱基互补,而且数量相等,对真核基因来说应与外显子序列相对应。但是自1985 年以来,在某些病毒、植物和动物中发现mRNA前体在成熟过程中发生了碱基的增加、缺失或替换,mRNA与基因 之间失去了一一对应关系。这一现象首先在原生动物中发现,并称之为RNA编辑。这种需要编辑才能正常表达的基 因称为隐蔽基因。 反转录基因(retron)是一群古老的以反转录作用合成 RNA/mDNA 复合 msDNA 分子的遗传单元。retron 是 1987 年由病毒学家塔戴尔(A. Dhundale)等在一种古老的细菌 Myxococcus xanthus 中通过一种叫 msDNA(multicopy single-stranded DNA)的新型卫星 DNA 而发现的。以后的研究证明 msDNA 广泛存在于细菌类如 Myxobacter 的许 多属和种中,它由细菌基因组上一段叫 retron 的 DNA 序列经转录和反转录产生,称之为反转录基因
延伸阅读2-2DNA体外重组技术的建立 DNA体外重组技术是指在体外将两个或多个来源相同或不相同的DNA片段连接成新的重组DNA分子,再转 到特定宿主细胞中进行自主复制并表达。这项技术大约建立于20世纪70年代初期。 l972年,美国斯坦福大学的伯格(P.Brg)等人将一种猿猴病毒的DNA与噬菌体DNA用同一种限制性内切 酶切割后,再用DNA连接酶把这两种DNA分子连接起来,构建了世界上第一个重组DNA分子,并因此获得了1980 年度诺贝尔化学奖。 1973年,美国斯坦福大学的科恩(S.Cohen)等人首次通过将大肠杆菌的抗四环素(Tetr)质粒PSCI01和抗新 霉素(N)及抗磺胺(S)的质粒R6-3,在体外用限制性内切酶EcoR I切割,用连接酶连接成新的重组质粒,然 后转化到大肠杆菌中,在含四环素和新霉素的平板上选出了抗四环素和抗新霉素的重组菌落,完成了体外DNA重 组和扩增的全过程。该实验的成功是基因工程发展史上的一个里程碑,它不仅说明质粒分子可以作为基因克隆的载 体,将外源DNA导入寄主细胞,还说明真核生物的基因可以转移到原核细胞中,并实现其功能表达,同时还建立 了质粒一大肠杆菌这样一个基因克隆模式,使人们对基因工程前景充满了希望。因此,1973年定为基因工程元年
4 延伸阅读 2-2 DNA 体外重组技术的建立 DNA 体外重组技术是指在体外将两个或多个来源相同或不相同的 DNA 片段连接成新的重组 DNA 分子,再转 到特定宿主细胞中进行自主复制并表达。这项技术大约建立于 20 世纪 70 年代初期。 1972 年,美国斯坦福大学的伯格(P. Berg)等人将一种猿猴病毒的 DNA 与噬菌体 DNA 用同一种限制性内切 酶切割后,再用 DNA 连接酶把这两种 DNA 分子连接起来,构建了世界上第一个重组 DNA 分子,并因此获得了 1980 年度诺贝尔化学奖。 1973 年,美国斯坦福大学的科恩(S. Cohen)等人首次通过将大肠杆菌的抗四环素(Tet r)质粒 PSCI01 和抗新 霉素(Ne r)及抗磺胺(S r)的质粒 R6-3,在体外用限制性内切酶 EcoR I 切割,用连接酶连接成新的重组质粒,然 后转化到大肠杆菌中,在含四环素和新霉素的平板上选出了抗四环素和抗新霉素的重组菌落,完成了体外 DNA 重 组和扩增的全过程。该实验的成功是基因工程发展史上的一个里程碑,它不仅说明质粒分子可以作为基因克隆的载 体,将外源 DNA 导入寄主细胞,还说明真核生物的基因可以转移到原核细胞中,并实现其功能表达,同时还建立 了质粒—大肠杆菌这样一个基因克隆模式,使人们对基因工程前景充满了希望。因此,1973 年定为基因工程元年
延伸阅读2-3人类基因组计划 人类基因组计划(human genome project,HGP)是由美国科学家于1985年率先提出,于1990年正式启动,由 美国、英国、法国、德国、日本和我国科学家共同参与测定组成人类染色体(指单倍体中所包含的30亿个碱基对 组成的核苷酸序列,绘制人类基因组图谱的一项科学探索工程。其目的是希望能辨识人类染色体上载有的基因及其 序列,并破译其中的遗传信息。这是人类为了探索自身的奥秘所迈出的重要一步,是人类科学史上的一个伟大工程。 ①主要内容。人类基因组计划的研究内容主要表现在四张图上:遗传图、物理图、序列图和转录图,主要是绘 制人类基因组序列框架图。I993年马里兰州Hunt,Valley会议上,经美国国立人类基因组研究中心(National Human Genome Research Institute,.NHGRI)修订后的HGP内容包括:人类基因组作图及序列分析:基因的鉴定:基因组研 究技术的建立、创新与改进:模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组 的作图及测序:信息系统的建立,信息的储存、处理及相应的软件开发:与人类基因组相关的伦理学、法学和社会 影响与结果的研究:研究人员的培训:技术转让及产业开发:研究计划的外延等几方面,这些内容构成了20世纪 到21世纪最大的系统工程。 ②基本策略。测定整个基因组的经典方法是先作图再测序。研究的基本策略包括1)cDNA策略:人类基因组 中发生转录表达的序列(即基因)仅占总序列的约5%,对这一部分序列进行测定将直接导致基因的发现。其方法 是从cDNA文库中选取基因并克隆,进行序列测定,然后将结果通过计算机与己知的数据库进行比较,最终在染色 体上进行定位。2)基因鉴定的策略:通常采用定位克隆或候选定位克隆的策略,即利用与疾病连锁的标记在基因 组文库中找到表达序列,再利用这一表达序列去识别全部cDNA,找到该基因。 ③科学意义。HGP研究已经最终破译了人类DNA分子的全部核苷酸序列,建立了人类遗传物质的一整套信息 数据库;可以在DNA全序列阐明的基础上建立染色体的三维结构,进一步来解释扩增、插入、缺失、易位、重组 等过程的分子机制:可以使医学上的5千多种遗传疾病以及恶性肿瘤、心血管疾病等由此得到预测、预防、早期诊 断和治疗:HGP作为整个生命科学发展的“突破口”,可以带动生命科学其他领域及应用生物技术的发展,并对所涉 及的伦理、法律等社会科学领域也将产生巨大的影响。因此,HGP的研究不仅具有深刻的科学意义,也具有深远的 社会意义。HG对生命科学研究与生物产业发展的导向性意义,可以用规模化、序列化、信息化、产业化、医学化、 人文化来归纳
5 延伸阅读 2-3 人类基因组计划 人类基因组计划(human genome project, HGP)是由美国科学家于 1985 年率先提出,于 1990 年正式启动,由 美国、英国、法国、德国、日本和我国科学家共同参与测定组成人类染色体(指单倍体中所包含的 30 亿个碱基对 组成的核苷酸序列,绘制人类基因组图谱的一项科学探索工程。其目的是希望能辨识人类染色体上载有的基因及其 序列,并破译其中的遗传信息。这是人类为了探索自身的奥秘所迈出的重要一步,是人类科学史上的一个伟大工程。 ①主要内容。人类基因组计划的研究内容主要表现在四张图上:遗传图、物理图、序列图和转录图,主要是绘 制人类基因组序列框架图。1993 年马里兰州 Hunt, Valley 会议上,经美国国立人类基因组研究中心(National Human Genome Research Institute, NHGRI)修订后的 HGP 内容包括:人类基因组作图及序列分析;基因的鉴定;基因组研 究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组 的作图及测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理学、法学和社会 影响与结果的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面,这些内容构成了 20 世纪 到 21 世纪最大的系统工程。 ②基本策略。测定整个基因组的经典方法是先作图再测序。研究的基本策略包括 1)cDNA 策略:人类基因组 中发生转录表达的序列(即基因)仅占总序列的约 5%,对这一部分序列进行测定将直接导致基因的发现。其方法 是从 cDNA 文库中选取基因并克隆,进行序列测定,然后将结果通过计算机与已知的数据库进行比较,最终在染色 体上进行定位。2)基因鉴定的策略:通常采用定位克隆或候选定位克隆的策略,即利用与疾病连锁的标记在基因 组文库中找到表达序列,再利用这一表达序列去识别全部 cDNA,找到该基因。 ③科学意义。HGP 研究已经最终破译了人类 DNA 分子的全部核苷酸序列,建立了人类遗传物质的一整套信息 数据库;可以在 DNA 全序列阐明的基础上建立染色体的三维结构,进一步来解释扩增、插入、缺失、易位、重组 等过程的分子机制;可以使医学上的 5 千多种遗传疾病以及恶性肿瘤、心血管疾病等由此得到预测、预防、早期诊 断和治疗;HGP 作为整个生命科学发展的“突破口”,可以带动生命科学其他领域及应用生物技术的发展,并对所涉 及的伦理、法律等社会科学领域也将产生巨大的影响。因此,HGP 的研究不仅具有深刻的科学意义,也具有深远的 社会意义。HGP 对生命科学研究与生物产业发展的导向性意义,可以用规模化、序列化、信息化、产业化、医学化、 人文化来归纳