第14卷第3期 人类学学报 Vol 14. No.3 1995年8月 ACTA ANTHROPOLOGICA SINICA Aug,1995 综述 平形等 DNA与人类起源和演化 现代分子生物学技术在人类学研究中的应 刘武 叶健 中园料学古廾椎动物与古人类研究所 (公安部第二研究所分子遗传室) 1987年I月,美国加州大学伯克利分校的分子生物学家Cann、 Stoneking和 Wilson 3人联合在英国《自然》杂志发表了题为“线粒体DNA与人类进化”的文章(Cann,et al,1987)。他们根据对祖先来自非洲、欧洲、亚洲及新几内亚和澳大利亚土著共147名妇 女胎盘细胞线粒体( Mitochondrion)脱氧核糖核酸DNA)的分析宣称:人类共同的祖先是 20万年前生活在非洲的一个女人。这一被称之为“夏娃"(Eve)理论的学说在国内外报刊广 为报道并在学术界引起了激烈的争论。“替代学说”的支持者认为这一研究结果为现代人 的单一起源理论提供了遗传学上的证据( Stringer and andrews,1988).而坚持“多地区起 源理论”的学者则指出世界各地人群在线粒体脱氧核糖核酸 mtDNA)上的相似性并不意味 着所有的现代人类拥有共同的近期祖先。相反,这些相似性反映了自从大约一百万年前我 们的祖先出现在旧大陆以来基因交流( Gene flow)所导致的遗传上的联系,这种联系是我 们的祖先自出现以来迁栖移动相互交往的结果( Wolof,MH.eta,1988: Thone and wolpoff,1991).伴随着这一争论的进行,现代分子生物学技术,尤其是DNA研究在阐 明人类起源、演化、群体间相互关系及考古鉴定上的应用价值引起了遗传学家和人类学家 的广泛关注,国外许多大学和研究机构纷纷开展包括化石DNA在内的DNA的研究并试 图以此来解决众多人类学上悬而未决的难题.但同时也不乏学者对这一技术的可靠性和准 确性表示怀疑。本文将从遗传学和分子生物学技术的角度对DNA在人类学应用的理论基 础、实际应用及存在的问题作一简要的介绍,同时对这一新兴的领域在未来人类学研究上 的应用前景进行讨论。 1现代分子生物学理论与技术在人类学上的应用 人类的体质特征,包括肉眼观察测量性状和细胞甚至分子水平的特征,都是受遗传基 控制的。人类血型、血清蛋白型等特征虽然在细胞水平上刻画了人类群体和个体的特 征,但这些特征多受常染色体显性基因控制,并且这些特征所代表的不同变异类型的数量 较少在人类进化的长期过程中,极易受到遗传漂变( Genetic drift)和群体之间基因交流 收稿日期:199502-21 )01994-2006ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
3期刘武等:DNA与人类起源和演化—现代分子生物学技术在人类学研究中的应用·267 溶和的影响。在过去的十几年中,随着分子生物学技术的发展及日益成熟,DNA序列资 料得到大量积累并使得我们可以在DNA水平上直接研究生物的进化过程。这些成果使得 人类对于自身体质特征的遗传和演化规律有了更加深入的理解。这些理论与技术在人类学 研究领域也得到了应用.遗传学家和人类学家都试图通过对人类DNA中蕴藏的遗传信息 的分析来揭示整个人类的形成与演化过程。这些研究主要围绕以下几方面的内容开展: 11细胞核DNA( Nuclear dna) 细胞核是细胞内最大的细胞器。在真核细胞中除红细胞外,都含有细胞核。细胞核是 遗传信息贮存、复制和表达的主要场所。其主要成分包括脱氧核铐核酸(DNA)和少量 的核糖核酸(RNA)。DNA与核蛋白相结合以染色你的形式存在。人类细胞核内有22 对常染色体( Autosome)和一对性柒色体 Sex chromosone).存在于常染色体内的DNA称 为常染色体DNA( Autosornai dna):而存在于性染色体内的DNA称为性染色体 DNA(Sexchromosome DNA).其中存在于男性Y染色体内的DNA称为Y-DNA DNA是生物的遗传基础,生物机体的遗传特征以密码(Code)形式编码在DNA分 子上,表现为特定的碱基排列顺序并且通过DNA复制( Replication)把遗传信息由亲代传 递给子代,因此,对人类DNA的分析将揭示出人类个体和群体特征的众多信息量和复杂 的变异。除此之外,非编码区( Noncoding region)具有更广泛的多态性,生物体在进化和 世代更替过程中形成了自己独特的区别于其他个体的DNA碱基顺序,这种DNA碱基顺 序的差异性即为DNA多态性 DNA polymorphisms).DNA多态性表现为三种类型:(1) 单碱基突变:DNA在某一顺序上有一个或几个单碱基存在差异;(2)碱基顺序发生突 变:DNA序列中由一个或几个碱基对的插入、缺失或移位而产生的多态性;(3)可变数 目串联重复序列( Variable number of tandem repeats VNtRs):在基因组DNA内含有高 变区( Hypervariable regions HⅤRs),它由多个串联的重复顺序组成,有些重复顺序的重 复数目在个体或群体间存在差异。串联重复有3种类型:a编码区内基因片段的串联 复,如人甲胎蛋白基因;b编码区内完整基因的串联重复,如rRNA基因。这两种类型 的 VNTRS造成的DNA多态比较少;c非编码区的串联重复, VNTRS主要发生在非编 码区,重复单位长度长的可达数十个碱基,最短仅为两个碱基对(2bp).重复数差异也很 悬殊,少者数次,多者数百次。基于上述原理, Jeffreys等人率先将在人体基因组中高度 可变的小卫星区域( Minisa tellite region)用于个体识别并创立了DNA指纹①DNA fingerprints)技术( Jeffreys,1985),这一技术已被广泛用于法医个人识别和亲子鉴定(G诅 era,1985;李伯龄等,1991).细胞核DNA除具有高度的个体变异外,还具有广泛的 群体特征。 Wainscot等人( Vainscoat et al.1986)对来自世界各地八个不同人群的常染色 体β球蛋白基因组上一组紧密连锁的核DNA多态性基因频率的分析表明:所有非洲人 群都具有一个有限数量的普通单倍体型( Haplotype),而非洲人群拥有的占主导地位的单 倍体型在非洲以外的其他人群却没有发现,还有研究( Balazs et al,1989)显示:使用 DNA探针在人类基因组可识别出若干高变位点( Hypervaria ble loci)这些等位基因频率 的分布具明显的种族特异性,提示核DNA在人类群体遗传及人类演化历史研究上有巨大 的潜力。但是,目前对核DNA的研究还有许多尚未克服的理论与技术上的困难,使其距 离直接用于揭示人类演化过程还相距甚远。这些困难包括:用来揭示人类演化过程的核基 因的突变积累缓慢;毎代均通过父母双方遗传,这种每代双亲混合的结果是重组 )01994-2006ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cenki.net
268 人类学学报 14卷 ( Recombination)的产生,这样使我们难以追踪特定的DNA片段的演化历史.通过对比 核DNA来估计遗传距离是基于人群内部和人群间分子变异频率的差异。而这种基因频率 的差异可能受到重组、遗传漂变、选择及迁移的影响。所以,根据核DNA计算的遗传距 离不能像根据mDNA那样推断时间和突变距离之间的直接关系。另外,在对细胞核 DNA进行测序分析时,因等位基因之间的序列可能存在差异,必须用克隆方法纯化出单 的DNA分子才能进行测序分析.而线粒体DNA的均一性为直接测序提供了方便, 12线粒体DNA(简写 mtDNA) 线粒体是真核生物细胞中的一种细胞器,其功能是产生能量以持细熙的活动。根据 细胞需要能量强度的不同,一个细胞中所含线粒体的数目可以有很大的差异,变化范围约 是1000—10000个.每个线粒体中都含有一个 mtDNA分于,所以,在一个细胞中可以 含有100013090个 ratNA分子,人类mNA基因组由16569个碱基对组成,只相 当于核DNA基因组的0.005%,然而, mtDNA在进化上的重要性却远远超过其对全部 人类基因组的贡献( Anderson et al,198l; Stoneking,1993). mtDNA具有若干与核DNA 不同并使其在进化研究上具有特殊意义的特征 (1)mDNA是单倍体( Haploid),由母系遗传,因为精子的线粒体都在精子的尾部 而受精时只有精子的头部进入卵子.由于线粒体DNA只是由母体而来,因而它显示出来 的差别不是由于基因的重组合,而是由于基因的突变。因此,对 mtDNA的系统分析可 以直接反映出人群或种族的母系历史.同时也意味着对 mtDNA基因组而言,其有效群 体大小( Effective po pulation size)是核DNA的四分之一,这就导致了高度的随机遗传漂 变引起的mDNA地区性群体差异 (2)mDNA的演变速率比核DNA快5-10倍,因而在相同的一段时间内,它比核 DNA能积累更多的变化,使得易于区别和测量。同时, mtDNA序列的高速演化也加速 了群体之间差异的形成.关于这一点,值得一提的是有两种方式来表达 mt DNA演化的 速率。即祖先和后代之间mDNA突变的数量及两种 mtDNA类型之间发生的突变数 前者是发生于一个血统( lineage)的演化和变化的数量;如转换成时间,则合适的度量单位 是进化率( rate of evolution).后者则为歧异或偏离的数量( amount of divergence),或两个 血统之间的变异.其时间单位是歧异率或偏离率( rate of divergence)由于歧异率代表着 两个血统之间的差异,所以,它是进化率的两倍 (3) mtDNA比核DNA拥有更多的拷贝数,所以对 mtDNA的检验比对核DNA的 检验具有更髙的灵敏度并使其适于古代DNA或化石DNA的分析 (4) mtDNA是目前为止了解得最为清楚的真核细胞基因组,它的整个序列和基因结 构已为人类所知( Anderson et al,19831,1982小,因此可以通过将观察到的限制性片段图谱 与那些已经发表的整个片段进行比较而构建详细的高分辨率限制酶谱,从而准确地推断出 使其产生限制性位点多态性的核苷酸所在位置。另外,由于PCR(多聚酶链状反应)技 术的问世使酶扩增已知其侧翼( Flanking)核苷酸序列的任何DNA片段成为可能,因此全 部人类 mtDNA序列的知识意味着可以用PCR技术分析任何需要的 mtDNA区域。 对世界范围内的 mtDNA调查在以下两个方面充实了我们对人类基因库的知识 (1) mtDNA的个体特异性 研究表明:在 mtDNA中存在着个体之间的差异( Cann et al.,1987; Horai and o1994-2006ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net
3期刘武等:DNA与人类起源和演化—现代分子生物学技术在人类学研究中的应用·269 Hayasaka,1990)。大多数变异不是随机的,而主要集中于 mtDNA非编码区D-环 ( D-loop)的两个高变片段( Vigilant et al,l989). Higuchi等人首先将人类 mtDNA D-环 在不需克隆的条件下进行扩增,用扩增产物直接测序.其研究表明:不同个体间存在序列 差异,而同一个体血液与毛发 mtDNAD-环区的序列相同.从而证明检验 mtDNA的碱 基序列差异可以用于法医个人识别( Higuch et a.,1988).这种通过DNA序列差异进行个 人识别鉴定的方法比以往DNA限制长度多态性( Restriction Fragment Length Polymorphism-RFLP)检验又向精确方向前进了一步,FRLP研究的内容是串联序列 所导致的DNA长度变化,而序列测定研究是个体之间DNA碱基排列啊序的差异 ( Sullivan et al.,1992).1991年, Stoneking等人( Stoneking,M,etat,19}采用酶扩增特 异序列寡核苷酸探针方法进行了 ntDNAD一环区域的研究。他们使用了23个SSO探针 ( Sequence-SpccifIc olig onucleoti e Fiobe)捡测了来自非洲、亚洲、髙加索、日本和墨西 哥五个地区55个个体的D-环区的序列。揭示出一个巨大的变异,并能观察到带有歧变 价值的274个mDNA型存在于这些个体中。就每个群体而言,歧异率超过95%,由于 mtDNA通过母系遗传,所以,同一母亲所生的子女应具有相同的 mtDNA序列,即都与 母亲的序列相同.由此可以进行母系单亲的亲子关系鉴定。他们用上述方法成功地对一起 儿童走失案件进行了鉴定。 (2) mtDNA的种族群体特征 人类 mtDNA所具有的母系单倍体遗传特点使其有效群体大小仅为核DNA的四分 之一.在随机遗传漂变的作用下,产生了高度的地区性群体差异,而 mt DNA序列高速 演化的特点将加速这种群体间的差异。表明mDNA不仅在全球人类水平上,而且也在 不同的种族群体水平上可以揭示出人类遗传构造和演化历史( Stoneking et a,1990),近年 来,国外学者采用不同的方法对人类 mtDNA分子的序列多态性进行了详细的研究并发 现mDNA分子核苷酸序列在不同区域的碱基排列都有差别.据此,可以根据每一区域 碱基序列的差异将mDNA划分为许多不同的类型系统。进一步的研究发现这些类型或 其频率分布具有明显的种族特异性。在近10年中,采用限制性酶切图谱、寡核苷酸探针 及酶扩增测序等方法对人类 mtDNA的研究揭示出许多具有种族群体特异性的序列或结 构特征。这些特征有些在非洲、亚洲及欧洲等洲际水平上刻画了mDNA所代表的种族 特点,也有一些特征或其频率分布呈现出地区性的群体间差异( Balaz et aL,1989; Brown et aL., 1992; Denaro et aL., 1981; Harihara et al., 1988; Horai and Hayasaka, 1990; Piercy et aL. 1993; Rienzo and Wilson, 1991; Scozzari et aL, 1988; Stine et aL., 1992; Stoneking et aL. 99l; vigilant et a,1989).对于人类 mtDNA类型种族群体特征的研究主要集中在亚洲 及太平洋地区人类群体,揭示出许多存在于mDNA不同区域的种族特征.其中最为重 要的发现是在人类 mtDNA COII和tRNA区域之间的第五非编码区存在一个九个碱基对 的缺失序列(9 base- pair sequence deletion) Cann and wilson,1983).进一步的研究表明 这一序列缺失是由于在复制期间滑动错配产生长度的突变,丢失了9bp序列中两个相邻 拷贝之一所致.系统分析显示这一缺失序列在从现代人 mt dNA祖先进化的过程中只发 生一次并且是东亚人类的重要标记(表1、表2)( Harihara et ai,1992; Hertzberg et al 1989, Wrischnik et al.,1987; Horai and Matsunaga,l986).其他研究显示这一缺失序列也 出现于西伯利亚和北极地区人类,美洲印第安人、太平洋岛民及部分南亚人类( Passarino 201994-2006ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
70 人类学学报 14卷 etal,1993; Schurr et al!,1990; Shields et al,1992; Stoneking et a.,1990),表明这些人群 的起源与早期东亚人类密切相关。这一缺失序列尚未在非洲人和欧洲人中发现。 表1人类mDNA第五非编码区的长度多态性序列 区域V的长度 mIDNA型 正常型 1,47,100 CACCCCCTCTA CCCCCTCTAGAG 缺失型 8,79,80,8 CACCCCCTCTAGAG 122,177,R-1 CACCCCCCCCCCCTA CCCCCTCTAGAG 表2亚洲人类群体 mtDNA9bp缺失型的出现频率 人群 例数 bp缺失型 出现例数 百分 美洲印第安人 马来酉亚华人 台湾汉族 日本人 12 西藏人 阿伊奴人 朝鲜人 7.8 马来人 尼格利陀人 尼伯尔塔鲁人 维达人 波利尼西亚人 930 斐济人 23 新英格兰人 溴大利亚土著 新儿内亚人 表中数据引自 Ballinger et aL..1992; Harhara et a,1992; Passarino et al,1993; Shields et al,199 Torroni et al. 1994 最近,以美国埃默里大学 Emory University)遗传学家 Wallace为首的研究组对包括 这一9bp序列缺失在内的人类 mtDNA序列的亚洲蒙古人种特征进行了更为深入的研究 (Ballinger et aL., 1992; Torroni et aL., 1992, 1993a, 1993b, 1994; Schurr et al, 1990 wallace etal.1985),他们的研究结果显示在人类 mtdNA分子Aul/DdlI区域具有的两个古老 的多态类型为所有亚洲人类共有,其中一个类型还见于非洲人类。表明所有亚洲人类拥有 共同的祖先。此外,研究结果还揭示这两种 mtDNA类型在越南人具有最大的变异和最 高的频率,表明越南人是这一地区最为古老的人类.也提示华南及东南亚是蒙古人种的起 源地并且是现代人类 mtDNA的一个次级扩散的中心,他们的研究还表明9bp缺失序列 Publishing House. All rights