基因组学与应用生物学,2011年,第30卷,第6期,第748-758页 cs and Ap ology,2011,vol.30,No.6,748-75 评述与展望 Review and Progress DNA条形码研究进展 程希婷王爱民顾志峰王嫣战欣石耀华 热带生物资源教育部重点实验室,海南省热带水生生物技术重点实验室,海南大学海洋学院,海口,570228 通讯作者,sone70@126com 摘要DNA条形码是应用有足够变异的标准化短基因片段对物种进行快速、准确鉴定的新的生物身份识 别系统。2003年,加拿大 Guelph大学 Hebert等首次正式提出了DNA条形码概念,2004年成立了生物条形 码联盟,目前有来自50个国家的两百多个组织成为其成员,2007年5月加拿大 Guelph大学组建了世界上 第一个 dna barcoding鉴定中心,2009年1月正式启动“国际生命条形码计划”,中国科学院代表中国与加 拿大、美国和欧盟共同为iBOL4个中心节点。线粒体细胞色素C氧化酶基因COI具有引物通用性高和进 化速率快等优点,是理想的动物DNA条形码,不过,COⅠ在植物中应用效果较差,因此,核糖体IS序列和 质体tbcL、maK和tmH-psbA等序列也相继被引入植物的DNA条形码研究。虽然DNA条形码研究还处于 起步阶段,面临巨大挑战,但是,越来越多的研究表明DNA条形码可以广泛应用于生物的分类和鉴定,是 种简便、高效、准确的物种鉴定技术,已经在动物、植物和微生物等硏究中取得了显著成果,是生命科学领域 发展最快的学科前沿之一。本文从DNA条形码的开发、应用、国内相关文献研究现状、DNA条形码面临的挑 战以及发展前景等进行了综合分析,以期推动我国DNA条形码和分类学研究的发展。 关键词DNA条形码,分类学,物种鉴定 Current Progress of DNa barcoding Cheng Xiting Wang Aimin Gu Zhifeng Wang Yan Zhan Xin Shi Yaohua The Key Laboratory of Tropic Biological Resources, Minister of Education, Hainan Key Laboratory of Tropical Hydrobiology Technology, the Ocean College, Hainan University, Haikou, 570228 *Correspondingauthorstone70@126.com Ol:10.3969/gab.030000748 Abstract DNa barcoding is a new life identification system which can distinguish species rapidly and accurately by analyzing standard short DNA sequences with enough variation. In 2003, the concept of dNa barcoding was formally proposed by Hebert and his colleagues, Canada biologists from University of Guelph. In 2004, Consor- tium for the Barcode of Life(CBOL) was subsequently constructed. There are more than 200 group members from 50 different countries in CBOL. The first dNa barcode identifying center came into existence in the University of Guelph in May, 2007. In January, 2009, International Barcode of Life(iBOL) was started up. Chinese Academy of Sciences, deputy of China, was one of four subcenter of iBOL, the same as others in Canda, USA and European Union. Mitochondrion cytochrome c oxidase subunit I(co I) was ideal DNa barcoding sequence for animal because of its various advantages, such as high primer universality and evolutionary rate. However, coI was not so good dNA barcoding in plant as in animal. Thus, ribosome Internal Transcribed Spacer (ITS) and plastid rb- cL, matK, trnH-psbA sequences were used as DNA barcoding in plant studying. Although it is on the initial phase for DNA barcoding, facing great challenge, more and more studies showed that DNA barcoding can be widely used in life taxonomy and identification. DNA barcoding, a simple effective accurate species identification method, is now one of the fastest development discipline hot in biological study. Here, in order to promote devel- opment of Chinese study in DNA barcoding and taxonomy, we introduced DNA barcoding screening, application, 基金项目:本研究由国家科技支撑计划项目(2009BAB44B00)和海南大学“211工程”创新人才计划项目共同资助 91994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
基因组学与应用生物学,2011 年,第 30 卷,第 6 期,第 748-758 页 Genomics and Applied Biology, 2011, Vol.30, No.6, 748-758 评述与展望 Review and Progress DNA 条形码研究进展 程希婷 王爱民 顾志峰 王嫣 战欣 石耀华 * 热带生物资源教育部重点实验室, 海南省热带水生生物技术重点实验室, 海南大学海洋学院, 海口, 570228 * 通讯作者, stone70@126.com 摘 要 DNA 条形码是应用有足够变异的标准化短基因片段对物种进行快速、准确鉴定的新的生物身份识 别系统。2003 年,加拿大 Guelph 大学 Hebert 等首次正式提出了 DNA 条形码概念,2004 年成立了生物条形 码联盟,目前有来自 50 个国家的两百多个组织成为其成员,2007 年 5 月加拿大 Guelph 大学组建了世界上 第一个 DNA barcoding 鉴定中心,2009 年 1 月正式启动“国际生命条形码计划”,中国科学院代表中国与加 拿大、美国和欧盟共同为 iBOL 4 个中心节点。线粒体细胞色素 C 氧化酶基因 COⅠ具有引物通用性高和进 化速率快等优点,是理想的动物 DNA 条形码,不过,COⅠ在植物中应用效果较差,因此,核糖体 ITS 序列和 质体 rbcL、matK 和 trnH-psbA 等序列也相继被引入植物的 DNA 条形码研究。虽然 DNA 条形码研究还处于 起步阶段,面临巨大挑战,但是,越来越多的研究表明 DNA 条形码可以广泛应用于生物的分类和鉴定,是一 种简便、高效、准确的物种鉴定技术,已经在动物、植物和微生物等研究中取得了显著成果,是生命科学领域 发展最快的学科前沿之一。本文从 DNA 条形码的开发、应用、国内相关文献研究现状、DNA 条形码面临的挑 战以及发展前景等进行了综合分析,以期推动我国 DNA 条形码和分类学研究的发展。 关键词 DNA 条形码, 分类学, 物种鉴定 Current Progress of DNA Barcoding Cheng Xiting Wang Aimin Gu Zhifeng Wang Yan Zhan Xin Shi Yaohua * The Key Laboratory of Tropic Biological Resources, Minister of Education, Hainan Key Laboratory of Tropical Hydrobiology Technology, the Ocean College, Hainan University, Haikou, 570228 * Corresponding author, stone70@126.com DOI: 10.3969/gab.030.000748 Abstract DNA barcoding is a new life identification system which can distinguish species rapidly and accurately by analyzing standard short DNA sequences with enough variation. In 2003, the concept of DNA barcoding was formally proposed by Hebert and his colleagues, Canada biologists from University of Guelph. In 2004, Consortium for the Barcode of Life (CBOL) was subsequently constructed. There are more than 200 group members from 50 different countries in CBOL. The first DNA barcode identifying center came into existence in the University of Guelph in May, 2007. In January, 2009, International Barcode of Life (iBOL) was started up. Chinese Academy of Sciences, deputy of China, was one of four subcenter of iBOL, the same as others in Canda, USA and European Union. Mitochondrion cytochrome c oxidase subunit Ⅰ(COⅠ) was ideal DNA barcoding sequence for animal because of its various advantages, such as high primer universality and evolutionary rate. However, COⅠ was not so good DNA barcoding in plant as in animal. Thus, ribosome Internal Transcribed Spacer (ITS) and plastid rbcL, matK, trnH-psbA sequences were used as DNA barcoding in plant studying. Although it is on the initial phase for DNA barcoding, facing great challenge, more and more studies showed that DNA barcoding can be widely used in life taxonomy and identification. DNA barcoding, a simple effective accurate species identification method, is now one of the fastest development discipline hot in biological study. Here, in order to promote development of Chinese study in DNA barcoding and taxonomy, we introduced DNA barcoding screening, application, 基金项目:本研究由国家科技支撑计划项目(2009BAB44B00)和海南大学“211 工程”创新人才计划项目共同资助
DNA条形码研究进展 Current Progress of DNA Barcoding present studying status in China, challenges and future prospects for DNA barcoding development Keywords DNA barcoding, Taxonomy, Species identification 科学准确地鉴别区分物种是开展进一步深入研验,只有经过长期的专业训练才能培养精通于某些 究和利用的前提与基础。自林奈建立双名法命名体特定生物门类的分类学专家。对巨大的需求而言,由 系以来,虽然已经鉴定了大约一百七十万种生物于竞争资助经费等方面的劣势,传统分类学的吸引 ( Hawksworth,1995),但是,地球上生物种类丰富,物力日渐衰退(任保青和陈之端,2010),大大制约了分 种数量高达上千万种,甚至可能更多,已鉴定分类的类学的发展,进而影响系统学、进化生物学和保护生 物种仅占生物总数约15% Gregory,2005;任保青和物学等许多相关学科的发展。因此,DNA条形码的 陈之端,2010),人类仍然没有认识鉴定的物种占绝大提出得到了普遍的关注。 多数,尤其是深海、原始丛林中的物种。对数量庞大的 未知生物和已知物种的鉴定分类和修订仍然是一项非1DNA条形码的筛选开发 常艰巨的基础性工作( Blaxter,2003; Tautzet al,2003)。 传统的生物分类主要依据生物的形态学特征, 11DNA条形码标准 并辅之以比较解剖学特性等,在形态特征显著的脊 原核生物基因组常常超过10°bp,而真核生物更 椎动物、高等植物以及昆虫等生物类群中应用效果加巨大,往往超过10°bp。生物演化过程中,不同的 较好,研究也比较深入,但是,对形态差异较小的微DNA序列进化速率存在差异,有的DNA区段进化 小生物则常常差强人意(任保青和陈之端,2010)。不较快,有的区段则较为保守,只有进化速率适宜的 仅如此,许多生物的形态特征容易受环境的影响,同DNA序列才能够用做DNA条形码。DNA条形码的 类群的生物可能由于生境条件的差异或者对同一理想序列有3个基本判断标准:(1)序列变异水平适 生境的反应和适应能力不同而呈现显著的形态学特宜,可以将不同物种彼此区分开来,同时种内变异较 征差异,影响正确的鉴定分类。因此,生物内在遗传小;(2)变异区域两端的序列高度保守,可以设计在众 物质组成日渐在分类学上得到重视,并取得了越来多物种中稳定扩增的通用引物:(3)扩增序列尽量短 越丰硕的成果。 最好一个反应可以完成测序。据此,已有研究表明 自上世纪50年代DNA双螺旋结构提出以来,编码线粒体细胞色素C氧化酶Ⅰ( cytochrome c oxi- 人类对遗传物质的认识与日俱增,尤其是PCR技 dase I,COI)基因是许多鱼类( Savolainen et al, 术、测序技术和生物信息学技术的飞速发展(任保青2005 Ward et al,2005)、昆虫( Smith et al,2005; Ahrens 和陈之端,2010),极大地推动了利用DNA蕴藏的信etal,2007; Elias et al,2007;张媛等,2011)和鸟类 息进行系统发育研究的分子系统学的快速发展,并( Hebert et al,2004; Tavares and Baker,2008)等动物 逐渐应用至生物分类研究( Tautz et al,2002;2003)。分类与鉴别的理想DNA条形码。对于植物而言,线 条形码技术是应现代零售业发展的需求而产生粒体基因进化速率较慢,不宜用做条形码,主要应用 的,在零售业的商品管理与销售中发挥了无法替代叶绿体基因和核糖体DNA的IIS等开展DNA条形 的关键作用,生物分类学家从中得到了启示:DNA码研究( Kress et al,2005; Sass et al,2007; Hollings 分子一级结构上的线性核苷酸排列可以建立类似的 orth et al.,2009) 生物条形码,应用于快速鉴别生物。DNA分子一级 线粒体基因的种内遗传距离往往小于1%,极 结构是由ATC阳G4种脱氧核糖核苷酸线性排列组少高于2%( Avise,2000 Hebert等(2003b)比较了 成的,理论上,15个核苷酸就有415种完全不同的排13320个亲缘关系很近的同属物种的COI序列,也 列组合,足以区分地球上所有生物种类。基于此,加发现种内差异基本上不到1%,大于2%非常少,而种 拿大 Guelph大学教授 Hebert等(2003a)首次提出了间差异高达1l.3%。在鸟类( Kerr et al,2007)、鳞翅目 DNA条形码 dNA barcode)的概念:利用有足够变异昆虫( Hajibabaei et al,2006)、鱼类( Ward et al,2005) 且容易扩增的相对较短的标准DNA片段,在种内的和甲壳纲动物 Cywinska et al,2006等类群中也存在 特异性与种间的多样性中建立的一种新的生物身份相似的种内和种间序列差异性。鸟类COI基因的种间 识别系统,从而实现了对物种进行快速、准确的识别差异是种内差异平均值的18倍( Hebert et al.,2004),在 和鉴定(任保青和陈之端,2010)。传统分类学研究十淡水鱼COI中甚至高达27倍( Hubert et al,2008)。 分依赖形态特征齐全的标本和分类学家的知识与经因此,利用COI基因条形码鉴定物种时,种间遗传 91994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
present studying status in China, challenges and future prospects for DNA barcoding development. Keywords DNA barcoding, Taxonomy, Species identification 科学准确地鉴别区分物种是开展进一步深入研 究和利用的前提与基础。自林奈建立双名法命名体 系以来,虽然已经鉴定了大约一百七十万种生物 (Hawksworth, 1995),但是,地球上生物种类丰富,物 种数量高达上千万种,甚至可能更多,已鉴定分类的 物种仅占生物总数约 15% (Gregory, 2005; 任保青和 陈之端, 2010),人类仍然没有认识鉴定的物种占绝大 多数,尤其是深海、原始丛林中的物种。对数量庞大的 未知生物和已知物种的鉴定分类和修订仍然是一项非 常艰巨的基础性工作(Blaxter, 2003; Tautz et al., 2003)。 传统的生物分类主要依据生物的形态学特征, 并辅之以比较解剖学特性等,在形态特征显著的脊 椎动物、高等植物以及昆虫等生物类群中应用效果 较好,研究也比较深入,但是,对形态差异较小的微 小生物则常常差强人意(任保青和陈之端, 2010)。不 仅如此,许多生物的形态特征容易受环境的影响,同 一类群的生物可能由于生境条件的差异或者对同一 生境的反应和适应能力不同而呈现显著的形态学特 征差异,影响正确的鉴定分类。因此,生物内在遗传 物质组成日渐在分类学上得到重视,并取得了越来 越丰硕的成果。 自上世纪 50 年代 DNA 双螺旋结构提出以来, 人类对遗传物质的认识与日俱增,尤其是 PCR 技 术、测序技术和生物信息学技术的飞速发展(任保青 和陈之端, 2010),极大地推动了利用 DNA 蕴藏的信 息进行系统发育研究的分子系统学的快速发展,并 逐渐应用至生物分类研究(Tautz et al., 2002; 2003)。 条形码技术是应现代零售业发展的需求而产生 的,在零售业的商品管理与销售中发挥了无法替代 的关键作用,生物分类学家从中得到了启示:DNA 分子一级结构上的线性核苷酸排列可以建立类似的 生物条形码,应用于快速鉴别生物。DNA 分子一级 结构是由 A/T/C/G 4 种脱氧核糖核苷酸线性排列组 成的,理论上,15 个核苷酸就有 415 种完全不同的排 列组合,足以区分地球上所有生物种类。基于此,加 拿大 Guelph 大学教授 Hebert 等(2003a)首次提出了 DNA 条形码(DNA barcode)的概念:利用有足够变异 且容易扩增的相对较短的标准 DNA 片段,在种内的 特异性与种间的多样性中建立的一种新的生物身份 识别系统,从而实现了对物种进行快速、准确的识别 和鉴定(任保青和陈之端, 2010)。传统分类学研究十 分依赖形态特征齐全的标本和分类学家的知识与经 验,只有经过长期的专业训练才能培养精通于某些 特定生物门类的分类学专家。对巨大的需求而言,由 于竞争资助经费等方面的劣势,传统分类学的吸引 力日渐衰退(任保青和陈之端, 2010),大大制约了分 类学的发展,进而影响系统学、进化生物学和保护生 物学等许多相关学科的发展。因此,DNA 条形码的 提出得到了普遍的关注。 1 DNA 条形码的筛选开发 1.1 DNA 条形码标准 原核生物基因组常常超过 106 bp,而真核生物更 加巨大,往往超过 109 bp。生物演化过程中,不同的 DNA 序列进化速率存在差异,有的 DNA 区段进化 较快,有的区段则较为保守,只有进化速率适宜的 DNA 序列才能够用做 DNA 条形码。DNA 条形码的 理想序列有 3 个基本判断标准:(1)序列变异水平适 宜,可以将不同物种彼此区分开来,同时种内变异较 小;(2)变异区域两端的序列高度保守,可以设计在众 多物种中稳定扩增的通用引物;(3)扩增序列尽量短, 最好一个反应可以完成测序。据此,已有研究表明, 编码线粒体细胞色素 C 氧化酶Ⅰ (cytochrome c oxidase Ⅰ, COⅠ)基因是许多鱼类(Savolainen et al., 2005; Ward et al., 2005)、昆虫(Smith et al., 2005; Ahrens et al., 2007; Elias et al., 2007; 张媛等, 2011) 和鸟类 (Hebert et al., 2004; Tavares and Baker, 2008) 等动物 分类与鉴别的理想 DNA 条形码。对于植物而言,线 粒体基因进化速率较慢,不宜用做条形码,主要应用 叶绿体基因和核糖体 DNA 的 ITS 等开展 DNA 条形 码研究(Kress et al., 2005; Sass et al., 2007; Hollingsworth et al., 2009)。 线粒体基因的种内遗传距离往往小于 1%,极 少高于 2% (Avise, 2000)。Hebert 等(2003b)比较了 13 320 个亲缘关系很近的同属物种的 COⅠ序列,也 发现种内差异基本上不到 1%,大于 2%非常少,而种 间差异高达 11. 3%。在鸟类(Kerr et al., 2007)、鳞翅目 昆虫(Hajibabaei et al., 2006)、鱼类(Ward et al., 2005) 和甲壳纲动物(Cywinska et al., 2006)等类群中也存在 相似的种内和种间序列差异性。鸟类 COⅠ基因的种间 差异是种内差异平均值的 18 倍(Hebert et al., 2004),在 淡水鱼 COⅠ中甚至高达 27 倍(Hubert et al., 2008)。 因此,利用 COⅠ基因条形码鉴定物种时,种间遗传 DNA 条形码研究进展 Current Progress of DNA Barcoding 749
750基因组学与应用生物学 nomics and Applied Biology 距离应大于种内遗传距离10倍,最小种间遗传距离且许多生物的形态特征有一定的生长发育阶段性, 为2%( Hebert et al,2003a)。 仅仅依据形态特征进行传统物种分类时可能出错 12DNA条形码的开发程序 ( Knowlton,1993),而且,形态学方法无法鉴定隐存 种。不仅如此,分类学家识别能力有限,能准确鉴定 DNA条形码开发包括如下几个基本过程(Fang超过1000种生物的分类学家凤毛麟角,而传统分类 etal,2002 Hajibabaei et al,206:(材料的采集和学很难得到项目资助的现实使从事分类学研究的学 DNA提取。样品要具有代表性,覆盖尽可能多的地者愈来愈少(肖金花等,200,大大制约了分类学和 理群体:(2)设计与合成扩增引物。引物要具有通用性相关学科的发展。与传统的形态学分类相比,DNA 和特异性,在目标类群中容易扩增,条带单一,并且条形码能够更准确快捷地鉴定物种,具有明显的优 产物大小适宜,一般不要超过700bp:(3)PCR扩增。点( autz et al,2003消金花等,2004 Itt et al,2006 筛选引物,优化反应条件:4直接进行DNA测序,或莫帮辉等,2008间化学和于杰,200:(1准确性高。 者连接质粒载体克隆后测序;(5)序列加工。根据测序 每种生物DNA序列具有特异性和稳定性,不会出现 峰图比对序列,进行必要的人工校正,去掉载体和不 传统分类时因趋同或者环境影响而产生的表型差异 可靠的核苷酸:(6)序列分析。采用MEGA或PAUP 等软件计算比较不同分类阶元上的遗传距离(例如,种 引起的物种鉴定错误;(2)区别和鉴定物种十分快捷, 鉴定效率高,非分类学家也可以很快掌握:(3)样品要 内和种间的Kma-2 parameter distance(2P)Mey求低。条形码分析提取DNA的样品有0lg甚至更 er and Paulay,2005 haye et a009,构建Neg少就足够了,而且无组织和器官的特异性和完整性 bour-joining tree(NJ树)等分支图,数据很多时进行 多元尺度分析,更直观地用图展示鉴定效果( Hebert 要求,甚至毛发、粪便、尿液都可以用于准确鉴定,许 etal,2003):()结果提交。将相关的条形码序列和多死亡后的组织也符合要求:(4)不受个体发育阶段 样本信息等数据提交数据库(肖金花等,204宁淑萍影响。所有生物同个体的DNA组成在不同生长发 等,2008)。 序列分析时,一般应检验 barcoding ga,即检验码序列不会发生变化(5)能有效鉴定传统形态学分 属内种间遗传变异与种内个体间遗传变异的差异是类难以区分的个体很小或者形态相似的生物,例如 微生物、珊瑚等共生和寄生生物:(6)发现、鉴定新种 这可以使用常规的统计软件和 Taxon dNA软件与隐存种,建立完善生物的演化关系(Bta.2005 Meier et al,200)完成。除K2P外,种内距离分析还 Johnson et al,2008 Schlei et al,200:陈军等,2010) 常常采用平均值和平均溯祖度( average coalesce有些不同类群的生物由于生境等相似而出现趋同进 dcp山,前者是某个物种个体间K2P平均值,消除了化,呈现相似的外表形态特征,大大影响了基于形态 因样品数量差异导致的物种间偏差:后者则指物种特征的传统分类的可靠性。例如,营埋栖生活的帘蛤 内最大K2P值,体现物种内最大变异值。 科等异齿亚纲贝类很容易受到底质环境的影响而产 目前BOLD(barcodeoflifedatabasehttp://www.生趋同进化(陈军等,2010):()为系统发生树的构建 boldsystems or是仅有的动物条形码数据库,提交该提供丰富的可靠“树叶”:(8)可以分析动物肠道包含 数据库的内容主要包括:(1)所需材料的物种名称:(2)物和排泄物,揭示生物之间的食物链关系:(9通过建 标本的目录号与馆藏号等信息:(3)采集人、采集日立数据库,实现数据的不断补充完善和信息化管理。 期、纬度与海拔高度GPS定位参数等标本采集信息;各个物种的数据明确充分,检索鉴定方便、准确,可 (4)至少500bp的DNA条形码序列:(5标本鉴定人;实现快速大批量鉴定,并不断补充完善数据库,推动 (6)PCR扩增引物:()测序的原始峰图( Ratnasingham生物分类学持续深入地发展。 and Hebert,2007)。如果还提供标本的照片以及标本22DNA条形码的应用 采集生境的描述等信息则更好。 DNA条形码最主要和最根本目的是进行生物 2DNA条形码的应用 分类,快速准确地鉴定单个物种,可以更加可靠地发 现隐形种,在动植物和微生物等各类生物中正得到 21DNA条形码的优点 越来越广泛的应用。在此基础上,DNA条形码进 生物的代表性表型特征具有一定的可塑性,而步应用于与生物鉴定分类相关的生态学、保护生物 91994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
基因组学与应用生物学 Genomics and Applied Biology 距离应大于种内遗传距离 10 倍,最小种间遗传距离 为 2% (Hebert et al., 2003a)。 1.2 DNA 条形码的开发程序 DNA 条形码开发包括如下几个基本过程(Fang et al., 2002; Hajibabaei et al., 2006):(1)材料的采集和 DNA 提取。样品要具有代表性,覆盖尽可能多的地 理群体;(2)设计与合成扩增引物。引物要具有通用性 和特异性,在目标类群中容易扩增,条带单一,并且 产物大小适宜,一般不要超过 700 bp;(3) PCR 扩增。 筛选引物,优化反应条件;(4)直接进行 DNA 测序,或 者连接质粒载体克隆后测序;(5)序列加工。根据测序 峰图比对序列,进行必要的人工校正,去掉载体和不 可靠的核苷酸;(6)序列分析。采用 MEGA 或 PAUP 等软件计算比较不同分类阶元上的遗传距离(例如, 种 内和种间的 Kimura-2-parameter distance (K2P) (Meyer and Paulay, 2005; Lahaye et al., 2008),构建 Neighbour-joining tree (NJ 树)等分支图,数据很多时进行 多元尺度分析,更直观地用图展示鉴定效果(Hebert et al., 2003a);(7)结果提交。将相关的条形码序列和 样本信息等数据提交数据库(肖金花等, 2004; 宁淑萍 等, 2008)。 序列分析时,一般应检验 barcoding gap,即检验 属内种间遗传变异与种内个体间遗传变异的差异是 否显著(Meyer and Paulay, 2005; Lahaye et al., 2008a), 这可以使用常规的统计软件和 Taxon DNA 软件 (Meier et al., 2006)完成。除 K2P 外,种内距离分析还 常常采用平均 θ 值和平均溯祖度(average coalescen depth),前者是某个物种个体间 K2P 平均值,消除了 因样品数量差异导致的物种间偏差;后者则指物种 内最大 K2P 值,体现物种内最大变异值。 目前 BOLD (barcode of life database, http://www. boldsystems.org)是仅有的动物条形码数据库,提交该 数据库的内容主要包括:(1)所需材料的物种名称;(2) 标本的目录号与馆藏号等信息;(3)采集人、采集日 期、纬度与海拔高度 GPS 定位参数等标本采集信息; (4)至少 500 bp 的 DNA 条形码序列;(5)标本鉴定人; (6) PCR 扩增引物;(7)测序的原始峰图(Ratnasingham and Hebert, 2007)。如果还提供标本的照片以及标本 采集生境的描述等信息则更好。 2 DNA 条形码的应用 2.1 DNA 条形码的优点 生物的代表性表型特征具有一定的可塑性,而 且许多生物的形态特征有一定的生长发育阶段性, 仅仅依据形态特征进行传统物种分类时可能出错 (Knowlton, 1993),而且,形态学方法无法鉴定隐存 种。不仅如此,分类学家识别能力有限,能准确鉴定 超过 1 000 种生物的分类学家凤毛麟角,而传统分类 学很难得到项目资助的现实使从事分类学研究的学 者愈来愈少(肖金花等, 2004),大大制约了分类学和 相关学科的发展。与传统的形态学分类相比,DNA 条形码能够更准确快捷地鉴定物种,具有明显的优 点(Tautz et al., 2003; 肖金花等, 2004; Witt et al., 2006; 莫帮辉等, 2008; 闫化学和于杰, 2010):(1)准确性高。 每种生物 DNA 序列具有特异性和稳定性,不会出现 传统分类时因趋同或者环境影响而产生的表型差异 引起的物种鉴定错误;(2)区别和鉴定物种十分快捷, 鉴定效率高,非分类学家也可以很快掌握;(3)样品要 求低。条形码分析提取 DNA 的样品有 0.1 g 甚至更 少就足够了,而且无组织和器官的特异性和完整性 要求,甚至毛发、粪便、尿液都可以用于准确鉴定,许 多死亡后的组织也符合要求;(4)不受个体发育阶段 影响。所有生物同一个体的 DNA 组成在不同生长发 育阶段是否存在显著形态学差异都是相同的,条形 码序列不会发生变化;(5)能有效鉴定传统形态学分 类难以区分的个体很小或者形态相似的生物,例如 微生物、珊瑚等共生和寄生生物;(6)发现、鉴定新种 与隐存种,建立完善生物的演化关系(Ball et al., 2005; Johnson et al., 2008; Schlei et al., 2008; 陈军等, 2010)。 有些不同类群的生物由于生境等相似而出现趋同进 化,呈现相似的外表形态特征,大大影响了基于形态 特征的传统分类的可靠性。例如,营埋栖生活的帘蛤 科等异齿亚纲贝类很容易受到底质环境的影响而产 生趋同进化(陈军等, 2010);(7)为系统发生树的构建 提供丰富的可靠“树叶”;(8)可以分析动物肠道包含 物和排泄物,揭示生物之间的食物链关系;(9)通过建 立数据库,实现数据的不断补充完善和信息化管理。 各个物种的数据明确充分,检索鉴定方便、准确,可 实现快速大批量鉴定,并不断补充完善数据库,推动 生物分类学持续深入地发展。 2.2 DNA 条形码的应用 DNA 条形码最主要和最根本目的是进行生物 分类,快速准确地鉴定单个物种,可以更加可靠地发 现隐形种,在动植物和微生物等各类生物中正得到 越来越广泛的应用。在此基础上,DNA 条形码进一 步应用于与生物鉴定分类相关的生态学、保护生物 750
DNA条形码研究进展751 Current Progress of DNA Barcoding 学等学科领域。 文4篇,其余为正式发表论文。发表的论文综述约占 DNA条形码分类高效简便,能够可靠评估物种一半,为45篇。综述和研究论文发表数量按年份总 多样性和遗传多样性,开展生态学以及生物地理学体上均呈逐年递增趋势,研究论文增长较快(表1;图1)。 研究。DNA条形码能够区分近缘种,使生物多样性112篇国内期刊论文中,动物类的论文为55篇,植物 分析更加细致全面( Bucklin et al,2010)。通过分析类的论文为35篇,真菌和微生物论文7篇。 DNA条形码的种内和种间多态性与遗传距离等可 以准确揭示生物的遗传多样性( Valdez-Moreno et al,表1国内期刊发表的DNA条形码文章数量 2009; Yuan et al,2009)。生态学研究首先需要对取样 Table 1 Numbers of dNa barcoding paper published in inland professional periodicals each year 区内的生物种类进行鉴定,采用传统方法时,要求研 究人员具有很高的专业分类学水平,而生态学家往 200620072008200920102011 往很难达到这一要求:DNA条形码技术则很好地解研究论文 决了这个问题,具有基本的生物学知识就可以很容 Research paper 综述论文 易地掌握DNA条形码鉴定方法 Review paper 在保护生物学中,DNA条形码可以正确评价濒会议论文 危物种的遗传多样性,为其科学保护和种群恢复提 Meeting paper 供可靠依据( Vogler and Monaghan,2007; Naro- Maciel学位论文 etal,2009)。同时,应用DNA条形码进行生物食谱 Degree paper 分析,可以了解生态系统中形成的食物链关系,促进合计 珍稀生物保护( Witt et al,2006)。采用粪便和毛发等oa 样品进行DNA条形码分析,可以在不伤害动物的同 时进行保护生物学研究,例如, Valiere等(2003)利用 Research 粪便和毛发样品,在法国和瑞士进行了狼范围扩大 的跟踪研究。 监督动植物产品的非法交易,提升海关等政府組 部门对珍稀物种的有效监控和保护(Naro- Maciel et al,2009)。许多动植物产品只能观察到毛发等局部组 年份 织,很难通过极其有限的局部形态结构特征来判断 产品是否为禁止交易生物,DNA条形码分析使这些维普资讯网) 图1国内期刊每年发表的DNA条形码论文数量(综合CNKI和 问题迎刃而解。例如,美国应用DNA条形码分析发 Figure 1 Paper numbers about dna barcoding searched from 现23%的鱼子酱标注的鱼类名称错误,有的还有濒 CNKI and vIP information 危鱼类成分 Birstein et al,2000)。 3.1.1国内动物DNA条形码文献 此外,DNA条形码技术还可以应用于食品安全 领域,实现食品的快速检测和鉴别( Smith et al,2008b 55篇动物类论文主要是水生动物和昆虫的研究 1g and Ha200生物安全领域DNA条形和综述论文,各有18篇。昆虫条形码论文主要是关 码可以科学准确鉴定外来物种,尤其是难以用形态于鞘翅目( Coleoptera)、直翅目 Orthoptera)、半翅目 学分类鉴定的卵和幼虫的鉴定。 ( Hemiptera)鳞翅目( Lepidoptera)的天蛾和卷蛾、双翅 目( Diptera)实蝇与寄蝇、膜翅目中国榕小蜂的相关研 3国内外DNA条形码研究文献现状 究或者进展。水生动物的18篇论文中,有5篇是中 国鲚属( Coilia)、鲟鱼( Acipenser sturio L.)、亚东鲑 3.1国内DNA条形码研究文献现状 ( Salmo trutta fraio)东亚特有鲤科( Cyprinidae)类群和 2011年12月4日在CNK中国知网htp210.鲤科鲐属( Culter淡水鱼类DNA条形码的研究论文; 3732.25/knso/ index.aspx/)和维普资讯网(htp:/210.有关海水鱼类的论文有4篇,分别研究石首鱼科 373223:8080 /index. asp.)上输入“条形码”后再输入( Sciaenidae)鱼类、中国南海裸胸鳝属( Gymnothorax)鱼 “DNA进行搜索,共得到2006年以来的论文112篇,类、台湾鲻科( mugilidae)的分类和卵形鲳鲹( Trach- 其中硕士学位论文和博士学位论文各1篇,会议论 inotus ovatus L)线粒体COI基因全长序列的克隆与分 91994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
DNA 条形码研究进展 Current Progress of DNA Barcoding 学等学科领域。 DNA 条形码分类高效简便,能够可靠评估物种 多样性和遗传多样性,开展生态学以及生物地理学 研究。DNA 条形码能够区分近缘种,使生物多样性 分析更加细致全面(Bucklin et al., 2010)。通过分析 DNA 条形码的种内和种间多态性与遗传距离等可 以准确揭示生物的遗传多样性(Valdez-Moreno et al., 2009; Yuan et al., 2009)。生态学研究首先需要对取样 区内的生物种类进行鉴定,采用传统方法时,要求研 究人员具有很高的专业分类学水平,而生态学家往 往很难达到这一要求;DNA 条形码技术则很好地解 决了这个问题,具有基本的生物学知识就可以很容 易地掌握 DNA 条形码鉴定方法。 在保护生物学中,DNA 条形码可以正确评价濒 危物种的遗传多样性,为其科学保护和种群恢复提 供可靠依据(Vogler and Monaghan, 2007; Naro-Maciel et al., 2009)。同时,应用 DNA 条形码进行生物食谱 分析,可以了解生态系统中形成的食物链关系,促进 珍稀生物保护(Witt et al., 2006)。采用粪便和毛发等 样品进行 DNA 条形码分析,可以在不伤害动物的同 时进行保护生物学研究,例如,Valière 等(2003)利用 粪便和毛发样品,在法国和瑞士进行了狼范围扩大 的跟踪研究。 监督动植物产品的非法交易,提升海关等政府 部门对珍稀物种的有效监控和保护(Naro-Maciel et al., 2009)。许多动植物产品只能观察到毛发等局部组 织,很难通过极其有限的局部形态结构特征来判断 产品是否为禁止交易生物,DNA 条形码分析使这些 问题迎刃而解。例如,美国应用 DNA 条形码分析发 现 23%的鱼子酱标注的鱼类名称错误,有的还有濒 危鱼类成分(Birstein et al., 2000)。 此外,DNA 条形码技术还可以应用于食品安全 领域,实现食品的快速检测和鉴别(Smith et al., 2008b; Wong and Hanner, 2008);在生物安全领域 DNA 条形 码可以科学准确鉴定外来物种,尤其是难以用形态 学分类鉴定的卵和幼虫的鉴定。 3 国内外 DNA 条形码研究文献现状 3.1 国内 DNA 条形码研究文献现状 2011 年 12 月 4 日在 CNKI 中国知网(http://210. 37.32.25/kns50/index.aspx/)和维普资讯网(http://210. 37.32.23:8080/index.asp/)上输入“条形码”后再输入 “DNA”进行搜索,共得到 2006 年以来的论文 112篇, 其中硕士学位论文和博士学位论文各 1 篇,会议论 文 4 篇,其余为正式发表论文。发表的论文综述约占 一半,为 45 篇。综述和研究论文发表数量按年份总 体上均呈逐年递增趋势,研究论文增长较快(表 1;图1)。 112 篇国内期刊论文中,动物类的论文为 55 篇,植物 类的论文为 35 篇,真菌和微生物论文 7 篇。 3.1.1 国内动物 DNA 条形码文献 55 篇动物类论文主要是水生动物和昆虫的研究 和综述论文,各有 18 篇。昆虫条形码论文主要是关 于鞘翅目(Coleoptera)、直翅目(Orthoptera)、半翅目 (Hemiptera)、鳞翅目(Lepidoptera)的天蛾和卷蛾、双翅 目(Diptera)实蝇与寄蝇、膜翅目中国榕小蜂的相关研 究或者进展。水生动物的 18 篇论文中,有 5 篇是中 国 鲚 属 (Coilia)、鲟 鱼 (Acipenser sturio L.)、亚 东 鲑 (Salmo trutta fraio)、东亚特有鲤科(Cyprinidae)类群和 鲤科鲌属(Culter)淡水鱼类 DNA 条形码的研究论文; 有关海水鱼类的论文有 4 篇,分别研究石首鱼科 (Sciaenidae)鱼类、中国南海裸胸鳝属(Gymnothorax)鱼 类、台湾鲻科(mugilidae)的分类和卵形鲳鲹(Trachinotus ovatus L.)线粒体 COⅠ基因全长序列的克隆与分 表 1 国内期刊发表的 DNA 条形码文章数量 Table 1 Numbers of DNA barcoding paper published in inland professional periodicals each year 研究论文 Research paper 综述论文 Review paper 会议论文 Meeting paper 学位论文 Degree paper 合计 Total 2006 1 1 2007 2 2 2008 3 4 1 8 2009 6 6 1 1 14 2010 24 20 2 1 47 2011 25 15 40 图 1 国内期刊每年发表的 DNA 条形码论文数量(综合 CNKI和 维普资讯网) Figure 1 Paper numbers about DNA barcoding searched from CNKI and VIP information 751
基因组学与应用生物学 nomics and Applied Biology 析,其中台湾鲻科的分类研究是一篇会议论文;关于科( Nectriaceae)和腐霉科( Pythiaceae)的腐霉属(F)th 贝类的论文5篇,分别研究中国近海习见头足类、四ium)的DNA条形码,研究论文2篇,一篇是研究丛赤 角蛤蜊、蚌类、中国沿海缀锦蛤亚科( Tapetinae)以及壳科( Nectriaceae)的会议论文成果的正式发表,另 贻贝科( Mytilidae)等;其余4篇为关于龟鳖类、海参篇则是关于蓝舌病病毒的条形码和鉴定方面的研究。 和岩礁海藻附植动物等的研究论文和综述。这些动 3.2国外DNA条形码文献 物DNA条形码研究论文基本上是应用COI基因的 序列进行分析的,极少数采用了COⅡ基因,肯定了 2011年12月4日,分别在Ncbi(http:/www DNA条形码在这些物种中的有效性 ncbinlmnih.gov/pubmed)fSciencedirect(http://www 3.1.2国内植物DNA条形码文献 sciencedirect. com)网上查询2003年至今的DNA条 形码文献,在NCB中共查题目中含有“ barcoding”或 国内的植物类DNA条形码论文共35篇,其中 者“ barcode的DNA条形码论文165篇,其中研究论 综述13篇,硕士论文1篇。综述文章主要论述的是 文122篇,综述43篇:在 Sciencedirect中共查到题目 DNA条形码技术在整个植物类群中的应用,仅仅涉 及苔藓植物或者大型海洋藻类的综述各1篇,有2篇 或者摘要中含有“ barcoding”或者" barcode”的DNA 综述为DNA条形码在中药鉴定中的应用,还有1篇条形码论文138篇,其中研究论文116篇,综述22 为DNA条形码在植物检疫中的应用。21篇研究论篇。无论是NCBI还是 Sciencedirect,研究论文在 文中,研究海水生绿潮藻的论文1篇,以IS和rps4 2008年以前数量呈逐渐增加趋势,但是论文数量增加 序列研究地衣和苔藓条形码的论文3篇,应用叶绿较慢,2009年论文和2010年研究论文数量显著增加, 体 trnH-psbA序列研究石杉科论文1篇:其余均是关截至2011年12月初,研究论文有一定的增加,但是 于被子植物的研究,尤以姜科( Zingiberaceae)植物的增加数量不大。综述论文均呈起伏不定状态,没有表 研究较多,有4篇论文,其余为研究百合科(Lⅲ-现出明显的增加或者减少趋势,而且自200年起与 acae芸香科( Rutaceae)、锦葵科( Malvaceae、景天属研究论文数量的差距一直较大(图2.相比较而言,国 Scdm、石斛属( Dendrobium黄芪属( Astragalus)、重内查询到的条形码研究论文数量2009年以前的变化 楼属(Pai)龙胆科植物秦艽( Gentiana macrophylla较缓,2010年才显著增加:另一方面,国内研究论文数 Pal)l、毛茛科威灵仙( Clematis chinensis osbeck)、大量相对较少而综述相对较多 戟科京大戟(Eψ phobia pekinensis)、柑橘及其近缘属 NCB研究论文 植物条形码论文。 article 最近,中国科学院昆明植物研究所等国内19个 科研院所和高校组建了中国植物条形码研究团队 ( China Plant bol group),研究了42目75科141属 1757种共约6286个样本种子植物质体的tbL、10 maK、 trnH-psbA序列和核糖体的Is序列( China Plant BOL Group,2011)结果显示:3个质体DNA标 200320042005200620072008200920102011 记的通用性高达87.1%927%,而IS在被子植物 Year 中的通用性也高达79%,但是在裸子植物中较低;图2国外NCBI和 Sciendirect期刊查找的关于DNA条形码 IS的物种分辩率最高,其与任何一个质体DNA标论文数量 记组合的物种鉴别水平为699%79.1%,显著高于 Figure2 Paper numbers about dNa barcoding searched from bcL+maK组合的497%,IS全序列难以获取时, 其部分序列IIS2也是物种鉴别的很好选择。据此, NCBI的条形码文献中仅仅涉及植物、动物和真 该文认为SI2应与已经广泛采用的质体rbcL菌的文献分别有33篇、79篇和10篇,其它的43篇则 和maK结合,共同作为种子植物的核心条形码 可能是关于多类生物或者DNA条形码的开发、软件 3.1.3国内真菌和微生物等DNA条形码文献 应用等。 Sciencedirect的条形码文献中仅仅涉及植物 真菌和微生物等论文较少,仅有7篇。其中,综动物和真菌的文献分别有29篇、77篇和7篇,其余 述论文3篇,介绍DNA条形码在真菌分类和病毒鉴25篇涉及两类以上生物以及条形码研究的取样数量 别中的应用;会议论文2篇分别研究真菌的丛赤壳估计等。有关动物条形码的论文较多,超过植物的相 91994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp:/www.cnki.net
基因组学与应用生物学 Genomics and Applied Biology 析,其中台湾鲻科的分类研究是一篇会议论文;关于 贝类的论文 5 篇,分别研究中国近海习见头足类、四 角蛤蜊、蚌类、中国沿海缀锦蛤亚科(Tapetinae)以及 贻贝科(Mytilidae)等;其余 4 篇为关于龟鳖类、海参 和岩礁海藻附植动物等的研究论文和综述。这些动 物 DNA 条形码研究论文基本上是应用 COⅠ基因的 序列进行分析的,极少数采用了 COⅡ基因,肯定了 DNA 条形码在这些物种中的有效性。 3.1.2 国内植物 DNA 条形码文献 国内的植物类 DNA 条形码论文共 35 篇,其中 综述 13 篇,硕士论文 1 篇。综述文章主要论述的是 DNA 条形码技术在整个植物类群中的应用,仅仅涉 及苔藓植物或者大型海洋藻类的综述各 1 篇,有 2篇 综述为 DNA 条形码在中药鉴定中的应用,还有 1 篇 为 DNA 条形码在植物检疫中的应用。21 篇研究论 文中,研究海水生绿潮藻的论文 1 篇,以 ITS 和 rps4 序列研究地衣和苔藓条形码的论文 3 篇,应用叶绿 体 trnH-psbA 序列研究石杉科论文 1 篇;其余均是关 于被子植物的研究,尤以姜科(Zingiberaceae)植物的 研究较多,有 4 篇论文,其余为研究百合科(Liliaceae)、芸香科(Rutaceae)、锦葵科(Malvaceae)、景天属 (Sedum)、石斛属(Dendrobium)、黄芪属(Astragalus)、重 楼属(Paris)、龙胆科植物秦艽(Gentiana macrophylla Pall.)、毛茛科威灵仙(Clematis chinensis Osbeck)、大 戟科京大戟(Euphorbia pekinensis)、柑橘及其近缘属 植物条形码论文。 最近,中国科学院昆明植物研究所等国内 19 个 科研院所和高校组建了中国植物条形码研究团队 (China Plant BOL Group),研究了 42 目 75 科 141 属 1 757 种共约 6 286 个样本种子植物质体的 rbcL、 matK、trnH-psbA 序 列 和 核 糖 体 的 ITS 序 列(China Plant BOL Group, 2011)。结果显示:3 个质体 DNA 标 记的通用性高达 87.1%~92.7%,而 ITS 在被子植物 中的通用性也高达 79%,但是在裸子植物中较低; ITS 的物种分辩率最高,其与任何一个质体 DNA 标 记组合的物种鉴别水平为 69.9%~79.1%,显著高于 rbcL+matK 组合的 49.7%,ITS 全序列难以获取时, 其部分序列 ITS2 也是物种鉴别的很好选择。据此, 该文认为 ITS/ITS2 应与已经广泛采用的质体 rbcL 和 matK 结合,共同作为种子植物的核心条形码。 3.1.3 国内真菌和微生物等 DNA 条形码文献 真菌和微生物等论文较少,仅有 7 篇。其中,综 述论文 3 篇,介绍 DNA 条形码在真菌分类和病毒鉴 别中的应用;会议论文 2 篇分别研究真菌的丛赤壳 科(Nectriaceae)和腐霉科(Pythiaceae)的腐霉属(Fythium)的 DNA 条形码,研究论文 2 篇,一篇是研究丛赤 壳科(Nectriaceae)的会议论文成果的正式发表,另一 篇则是关于蓝舌病病毒的条形码和鉴定方面的研究。 3.2 国外 DNA 条形码文献 2011 年 12 月 4 日,分别在 NCBI (http://www. ncbi.nlm.nih.gov/pubmed/)和 Sciencedirect (http://www. sciencedirect.com/)网上查询 2003 年至今的 DNA 条 形码文献,在 NCBI 中共查题目中含有“barcoding”或 者“barcode”的 DNA 条形码论文 165 篇,其中研究论 文 122 篇,综述 43 篇;在 Sciencedirect 中共查到题目 或者摘要中含有“barcoding”或者“barcode”的 DNA 条形码论文 138 篇,其中研究论文 116 篇,综述 22 篇。无论是 NCBI 还是 Sciencedirect,研究论文在 2008 年以前数量呈逐渐增加趋势,但是论文数量增加 较慢,2009 年论文和 2010 年研究论文数量显著增加, 截至 2011 年 12 月初,研究论文有一定的增加,但是 增加数量不大。综述论文均呈起伏不定状态,没有表 现出明显的增加或者减少趋势,而且自 2009 年起与 研究论文数量的差距一直较大(图 2)。相比较而言,国 内查询到的条形码研究论文数量 2009 年以前的变化 较缓,2010 年才显著增加;另一方面,国内研究论文数 量相对较少而综述相对较多。 NCBI 的条形码文献中仅仅涉及植物、动物和真 菌的文献分别有 33 篇、79 篇和 10 篇,其它的 43 篇则 可能是关于多类生物或者 DNA 条形码的开发、软件 应用等。Sciencedirect 的条形码文献中仅仅涉及植物、 动物和真菌的文献分别有 29 篇、77 篇和 7 篇,其余 25 篇涉及两类以上生物以及条形码研究的取样数量 估计等。有关动物条形码的论文较多,超过植物的相 图 2 国外 NCBI 和 Sciendirect 期刊查找的关于 DNA 条形码 论文数量 Figure 2 Paper numbers about DNA barcoding searched from NCBI and Sciencedirect 752