植物遗传资源学报2019,20(6)1355-1371 Journal of plant genetic resources DO1:10.13430 cnki. jpg20190822001 主要农作物驯化硏究进展与展望 贾冠清,孟强,汤沙,张仁梁 (中国农业科学院作物科学研究所,北京100081) 摘要:农作物的驯化过程与农耕文明的发端密切相关,是作物种质资源遗传基础不断丰富衍化,利用价值不断完善 要途径之一。本文重点从作物驯化的主要性状、基因组遗传区段、重要驯化基因的克隆、作物驯化后的传播与基因渗透、作物 驯化理论与研究方法以及作物驯化硏究的新趋势等方面评述近年来取得的主要硏究进展,讨论硏究存在的主要问题并对深入 开展作物驯化研究进行展望。 关键词:作物驯化;形态学性状位点;数量性状;基因克隆 Current Advances and Future Perspectives on Crop domestication JIA Guan-qing, MENG Qiang, TANG Sha, ZHANG Ren-liang Institute of Crop Sciences, Chinese Academy of Agricultural Sciences, Beijing 100081 Abstract: Crop domestication has laid the fundamental basis of agricultural initiation and human civilization. Taking advantage of recent achievements on studies of crop domestication, this article reviewed the characterization of major domesticated-associated morphological traits, identification of important genomic segments, and isolation of domestication genes as well as the global spreading of cultivated crops post domestication. Furthermore, the advances on theoretical principals and fundamental methodologies as well current research focuses have been reviewed, and the future perspectives have been proposed Key words: crop domestication; morphological traits; QTL; gene cloning 人类文明的发展进步经历了直立行走、工具的然而,在作物的驯化过程中,究竟发生了什么?作物 使用、狩猎采摘以及种养农业等发展阶段。大约距是如何从野生状态(野生近缘种)逐渐演变成栽培状 今1万多年前,人类社会经历了从游动性的猎取采态(地方品种)并被人类选择利用的?这些科学问题 摘到相对定居性的种养农业的生产生活方式的转至今仍然没有得到确切的答案。近年来,围绕作物的 变口,这一转变过程最突出的特征便是大量作物被驯化过程,一些遗传学研究已经深入展开,为解开农 驯化栽培。已有的考古及作物多样性研究证据表作物驯化之谜提供了大量实验线索和判定依据。 明,主要农作物的驯化存在多个起源中心241:中东 新月沃地区起源了多种麦类作物(大麦、小麦、燕麦1作物驯化性状的解析 等),中国起源了大量的粮食作物(谷子、糜子、水稻、1.1驯化综合表征 大豆等),北美墨西哥地区起源了玉米,南美起源了 驯化综合表征是指作物由野生状态驯化为栽培 甘薯、马铃薯和花生等作物,非洲中部起源了高粱等状态后,表型性状的综合改变5一般情况下,野 作物。这些古老作物的驯化极大丰富了人类的膳食生种经过人为的选择和驯化后,往往表现为落粒性 结构,为人类文明的繁衍发展提供了食物安全保障。的丢失6、分支分蘗性的减少3、果实增大{9、种 收稿日期:2019-08-22修回日期:2019-09-20网络出版日期:2019-0909 Url:http://doiorg/10.13430/j.cnki.jpgr.2019082200 第一作者研究方向为谷子基因资源发掘,E-mail:jiaguanqing@caas.cn 基金项目:国家重点研发计划(2018YFD1000706,2018YFD00070);国家自然科学基金(31871630,31522040);国家谷子高粱产业技术体系 (CARS06-13.5-A4) Foundation project: National Key R&D Program of China(2018YFD1000706, 2018YFD1000700), National Natural Science Foundation (31871630, 31522040), China Agriculture Research System( CARS-06-135A4
植物遗传资源学报 2019,20(6):1355-1371 Journal of Plant Genetic Resources DOI:10.13430/j.cnki.jpgr.20190822001 主要农作物驯化研究进展与展望 贾冠清,孟 强,汤 沙,张仁梁 (中国农业科学院作物科学研究所,北京 100081) 摘要:农作物的驯化过程与农耕文明的发端密切相关,是作物种质资源遗传基础不断丰富衍化,利用价值不断完善的主 要途径之一。本文重点从作物驯化的主要性状、基因组遗传区段、重要驯化基因的克隆、作物驯化后的传播与基因渗透、作物 驯化理论与研究方法以及作物驯化研究的新趋势等方面评述近年来取得的主要研究进展,讨论研究存在的主要问题并对深入 开展作物驯化研究进行展望。 关键词:作物驯化;形态学性状位点;数量性状;基因克隆 Current Advances and Future Perspectives on Crop Domestication JIA Guan-qing,MENG Qiang,TANG Sha,ZHANG Ren-liang (Institute of Crop Sciences,Chinese Academy of Agricultural Sciences,Beijing 100081) Abstract:Crop domestication has laid the fundamental basis of agricultural initiation and human civilization.Taking advantage of recent achievements on studies of crop domestication,this article reviewed the characterization of major domesticated-associated morphological traits,identification of important genomic segments,and isolation of domestication genes as well as the global spreading of cultivated crops post domestication.Furthermore,the advances on theoretical principals and fundamental methodologies as well current research focuses have been reviewed,and the future perspectives have been proposed. Key words:crop domestication;morphological traits;QTL;gene cloning 收稿日期:2019-08-22 修回日期:2019-09-20 网络出版日期:2019-09-09 URL:http://doi.org/10.13430/j.cnki.jpgr.20190822001 第一作者研究方向为谷子基因资源发掘,E-mail :jiaguanqing@caas.cn 基金项目:国家重点研发计划(2018YFD1000706,2018YFD1000700);国家自然科学基金(31871630,31522040);国家谷子高粱产业技术体系 (CARS-06-13.5-A4) Foundation project:National Key R&D Program of China(2018YFD1000706,2018YFD1000700),National Natural Science Foundation (31871630,31522040),China Agriculture Research System(CARS-06-13.5-A4) 人类文明的发展进步经历了直立行走、工具的 使用、狩猎采摘以及种养农业等发展阶段。大约距 今 1 万多年前,人类社会经历了从游动性的猎取采 摘到相对定居性的种养农业的生产生活方式的转 变[1] ,这一转变过程最突出的特征便是大量作物被 驯化栽培。已有的考古及作物多样性研究证据表 明,主要农作物的驯化存在多个起源中心[2-4]:中东 新月沃地区起源了多种麦类作物(大麦、小麦、燕麦 等),中国起源了大量的粮食作物(谷子、糜子、水稻、 大豆等),北美墨西哥地区起源了玉米,南美起源了 甘薯、马铃薯和花生等作物,非洲中部起源了高粱等 作物。这些古老作物的驯化极大丰富了人类的膳食 结构,为人类文明的繁衍发展提供了食物安全保障。 然而,在作物的驯化过程中,究竟发生了什么?作物 是如何从野生状态(野生近缘种)逐渐演变成栽培状 态(地方品种)并被人类选择利用的?这些科学问题 至今仍然没有得到确切的答案。近年来,围绕作物的 驯化过程,一些遗传学研究已经深入展开,为解开农 作物驯化之谜提供了大量实验线索和判定依据。 1 作物驯化性状的解析 1.1 驯化综合表征 驯化综合表征是指作物由野生状态驯化为栽培 状态后,表型性状的综合改变[5] 。一般情况下,野 生种经过人为的选择和驯化后,往往表现为落粒性 的丢失[6] 、分支分蘖性的减少[7-8] 、果实增大[9] 、种
1356 植物遗传资源学报 卷 子休眠性的丧失0、株型的直立与强壮121、籽粒豆、菜豆等作物中(表2)。其中,二代基因组测序技 灌浆增加{311等综合的改变,在自然和人工选择压术结合核心种质群体的群体遗传分析已经成为主 力下,驯化综合表征特指现存的野生近缘种与地方流,代表性的进展如: Huang等采用二代基因组 品种间的表型差异,该差异一般显著大于野生近缘重测序手段,通过系统解析野生稻群体与栽培稻群 种与地方品种群体内部的性状遗传差异,并表现体的全基因组核酸多样性的变异情况,解析出了55 出在野生近缘种和地方品种间非连续变异的特征。个水稻受到驯化选择的基因组区段,并且通过分析 已有的遗传研究表明,多数驯化综合表征性状是由发现,水稻已知驯化相关基因如BH4(种皮色)SH4 单基因或少数主效基因位点控制的,并且遗传效应(落粒性)、 PROG I(匍匐生长习性)、qSW5(种子宽 不受遗传背景和环境因素的影响6] 度)、OsC(叶鞘颜色)等均位于这些驯化相关基因 12作物特色驯化性状 组区段内,该研究从侧面证实了采用群体遗传分析 除了上述提到的性状外,驯化综合表征在不同手段解析作物驯化相关遗传区段的准确性、有效性 作物驯化过程中的表现并不完全相同。例如在水稻和必要性; Hufford等采用二代基因组重测序技 中,野生稻驯化为栽培稻往往经历了由匍匐生长向直术,解析出了484个与玉米驯化紧密相关的基因组 立生长的转变2、芒长的变短m穗型结构的变区段,这些基因组区段占到玉米基因组的76%,平 化籽实灌浆能力1的变化等过程;在玉米中,主要均长度为322kb,平均涵盖34个注释基因结果显 经历了株型、穗型及行粒数的改变20,籽粒外稃消示,玉米驯化过程中,存在除了TB(分支分蘖性) 失1,颖壳硬度降低(21等过程;小麦中经历了穗粒TG4(坚硬外稃)等已知基因之外的更多的基因, 数与易收获性的改变3;大豆经历了种皮透水性增有待进行深入的解析和研究,为深入认识和分析玉 强1,无限生长习性的克服的过程;谷子则经历了米的驯化过程提供了候选基因组区段;Zhou等3 抽穗期的延迟、穗粒数的增多、刚毛变短等过程;高采用二代基因组重测序技术,使用 XP-CLR算法 粱则表现了茎秆持汁性增强的变化等。可以说,分析出了121个与大豆驯化直接相关的基因组位 不同作物的驯化性状具有鲜明的特色性,提示我们不点,并且发现这些驯化基因组位点与多个已知驯化 同作物可能经历了完全不同的驯化过程(表1 基因位置重合,得到的驯化区段定位精度远远超过 表1主要作物驯化相关性状 传统QL分析方法,具有更高的解析效率。该研究 Table 1 Domestication-related traits of important crop 同时采用了全基因组关联分析的手段,发现了多个 控制大豆籽粒油分含量,籽粒重量及茎秆建成紧密 粒用作物根及块茎作物果实作物相关的信号位点受到了驯化选择,为认识大豆的驯 Seed crop Root and tuber Fruit化过程提供了候选基因组区段; Schmutz等2采用 驯化性状种子大小 味改变风味改变二代基因组重测序技术对菜豆种质资源开展研究, 养分调配 养分调配养分调配利用滑框分析方法,获得了930个在野生种及栽培 种皮厚度,柔软度 淀粉含量 种子大小 种间基因组多样性参数及选择分化系数显著差异 穗型、穗数 适种性 果实大小 分支数量 繁殖周期 的基因组区段,累积影响了超过74Mb的菜豆基因 休眠性 果实硬度组,约占整个菜豆基因组的八分之一。此外,还发现 落粒性 了209个驯化区段的平均长度超过100kb,系统解 有限生长习性 析了普通菜豆两个独立驯化亚群的驯化区段相似 修改自参考文献231 度,提出了菜豆两次独立驯化的遗传证据;Li等131 fied from reference[21 采用二代基因组测序技术对桃种质资源开展测序 2作物驯化基因研究 采用滑框分析方法,鉴定出了142个在野生种及栽 培种间基因组多样性参数极显著差异的基因组区 21驯化相关基因组位点研究进展 段,累积影响了超过424Mb的桃基因组,约占整个 目前,对作物驯化基因组区段的解析研究主要桃基因组的186%。通过全基因组关联分析,鉴定 通过基于基因组重测序的群体遗传学分析途径和基出了多个与桃果实大小和风味相关的遗传位点受到 于连锁遗传理论的数量性状位点研究手段开展,近了驯化选择。这一研究为认识桃的驯化起源过程提 年来取得的突破性进展主要集中在水稻、玉米、大供了新的遗传证据
1356 植 物 遗 传 资 源 学 报 20 卷 子休眠性的丧失[10] 、株型的直立与强壮[11-12] 、籽粒 灌浆增加[13-14] 等综合的改变,在自然和人工选择压 力下,驯化综合表征特指现存的野生近缘种与地方 品种间的表型差异,该差异一般显著大于野生近缘 种与地方品种群体内部的性状遗传差异[15] ,并表现 出在野生近缘种和地方品种间非连续变异的特征。 已有的遗传研究表明,多数驯化综合表征性状是由 单基因或少数主效基因位点控制的,并且遗传效应 不受遗传背景和环境因素的影响[16] 。 1.2 作物特色驯化性状 除了上述提到的性状外,驯化综合表征在不同 作物驯化过程中的表现并不完全相同。例如在水稻 中,野生稻驯化为栽培稻往往经历了由匍匐生长向直 立生长的转变[11-12] 、芒长的变短[17] 、穗型结构[18] 的变 化、籽实灌浆能力[13] 的变化等过程;在玉米中,主要 经历了株型[19] 、穗型及行粒数的改变[20] ,籽粒外稃消 失[21] ,颖壳硬度降低[22] 等过程;小麦中经历了穗粒 数与易收获性的改变[23];大豆经历了种皮透水性增 强[24] ,无限生长习性的克服[25] 的过程;谷子则经历了 抽穗期的延迟、穗粒数的增多、刚毛变短等过程[26] ;高 粱则表现了茎秆持汁性增强[27] 的变化等。可以说, 不同作物的驯化性状具有鲜明的特色性,提示我们不 同作物可能经历了完全不同的驯化过程(表 1)。 表 1 主要作物驯化相关性状 Table 1 Domestication-related traits of important crop species 粒用作物 Seed crop 根及块茎作物 Root and tuber 果实作物 Fruit 驯化性状 Traits 种子大小 养分调配 种皮厚度,柔软度 穗型、穗数 产量 休眠性 落粒性 有限生长习性 风味改变 养分调配 淀粉含量 适种性 分支数量 风味改变 养分调配 种子大小 果实大小 繁殖周期 果实硬度 修改自参考文献[28] Modified from reference[28] 2 作物驯化基因研究 2.1 驯化相关基因组位点研究进展 目前,对作物驯化基因组区段的解析研究主要 通过基于基因组重测序的群体遗传学分析途径和基 于连锁遗传理论的数量性状位点研究手段开展,近 年来取得的突破性进展主要集中在水稻、玉米、大 豆、菜豆等作物中(表 2)。其中,二代基因组测序技 术结合核心种质群体的群体遗传分析已经成为主 流,代表性的进展如:Huang 等[29]采用二代基因组 重测序手段,通过系统解析野生稻群体与栽培稻群 体的全基因组核酸多样性的变异情况,解析出了 55 个水稻受到驯化选择的基因组区段,并且通过分析 发现,水稻已知驯化相关基因如 BH4(种皮色)、SH4 (落粒性)、PROG1(匍匐生长习性)、qSW5(种子宽 度)、OsC1(叶鞘颜色)等均位于这些驯化相关基因 组区段内,该研究从侧面证实了采用群体遗传分析 手段解析作物驯化相关遗传区段的准确性、有效性 和必要性;Hufford 等[30] 采用二代基因组重测序技 术,解析出了 484 个与玉米驯化紧密相关的基因组 区段,这些基因组区段占到玉米基因组的 7.6%,平 均长度为 322 kb,平均涵盖 3.4 个注释基因,结果显 示,玉米驯化过程中,存在除了 TB1(分支分蘖性)、 TGA1(坚硬外稃)等已知基因之外的更多的基因, 有待进行深入的解析和研究,为深入认识和分析玉 米的驯化过程提供了候选基因组区段;Zhou 等[31] 采用二代基因组重测序技术,使用 XP-CLR 算法, 分析出了 121 个与大豆驯化直接相关的基因组位 点,并且发现这些驯化基因组位点与多个已知驯化 基因位置重合,得到的驯化区段定位精度远远超过 传统 QTL 分析方法,具有更高的解析效率。该研究 同时采用了全基因组关联分析的手段,发现了多个 控制大豆籽粒油分含量,籽粒重量及茎秆建成紧密 相关的信号位点受到了驯化选择,为认识大豆的驯 化过程提供了候选基因组区段;Schmutz 等[32] 采用 二代基因组重测序技术对菜豆种质资源开展研究, 利用滑框分析方法,获得了 930 个在野生种及栽培 种间基因组多样性参数及选择分化系数显著差异 的基因组区段,累积影响了超过 74 Mb 的菜豆基因 组,约占整个菜豆基因组的八分之一。此外,还发现 了 209 个驯化区段的平均长度超过 100 kb,系统解 析了普通菜豆两个独立驯化亚群的驯化区段相似 度,提出了菜豆两次独立驯化的遗传证据;Li 等[33] 采用二代基因组测序技术对桃种质资源开展测序, 采用滑框分析方法,鉴定出了 142 个在野生种及栽 培种间基因组多样性参数极显著差异的基因组区 段,累积影响了超过 42.4 Mb 的桃基因组,约占整个 桃基因组的 18.6%。通过全基因组关联分析,鉴定 出了多个与桃果实大小和风味相关的遗传位点受到 了驯化选择。这一研究为认识桃的驯化起源过程提 供了新的遗传证据
贾冠清等:主要农作物驯化研究进展与展望 1357 表2主要作物驯化基因组位点的定位与鉴定 Table 2 Identification of genomic segments associated with crop domestication 种质(群体)数量种质(群体)类型驯化区段或 分析内容 参考文献 Crops Type of accessions QT accessions( families)( families) Number of QTLs Methods Analysis performed Reference 水稻 野生种(446),地 代基因组重测序,SNP鉴定,Fx,全基因[29] 方品种(1083) 测序深度:野生种(平组关联分析,进化树,主 均2×),地方品种成分分析,遗传多样性 (平均1×) (),选择性鉴定(T T。),遗传距离 野生种(22),地 二代基因组重测序,SNP鉴定,遗传多样性[34] 方品种(44) 测序深度:野生种(平(8),Fsr,LDRs 均1.5×),地方品种 (平均1.5×) 玉米 野生种(17),地 代基因组重测序,SNP鉴定,F,进化树,[30] Maize 方品种(23),育 测序深度:野生种(平连锁不平衡, XP.CLR 成品种(35) 均5×).地方品种遗传多样性() (平均5×).育成品种 (平均5×) 野生种ⅹ栽培 72个 SNP标记 Q∏L定位,比较遗传[35] 种,BC2S3RILs 小析 野生种(62),地 代基因组重测序,SNP鉴定,Fx,主成分分[31] Soybean 方品种(130),育 测序深度:野生种(平析,进化树,遗传多样性 成品种(110) 均11x),地方品种(m),CNV,连锁不平 (平均11×),育成品衡, XP-CLR,全基因组 种(平均11×) 关联分析,选择性鉴定 野生种(72),地 140个 SLAF基因组重测序,SNP鉴定,进化树,群36] 方品种(36),育 测序深度:野生种(平体结构,遗传多样性 成品种(404) 均6.4×).地方品种(), Fu and L'sD* (平均6.14×),育成 Fu and li'sF*,主 品种(平均6.14×)分析,Fsr,连锁不平衡 基因流动,全基因组关 联分析,选择性鉴定 野生种(8),地方 394个 代基因组重测序,SNP鉴定,群体结构,[37] 品种(8),育成品 测序深度:野生种(平进化树,Fsr,遗传多样 种(9) 均5x),地方品种性(m),主成分分析 (平均5×),育成品种选择性鉴定(/m。) 野生种(6),地方206个 代基因组重测序,SNP鉴定,Fx,进化树,[38 品种(4).育成品 测序深度:野生种(平遗传多样性()选择 种(6) 均17×),地方品种性鉴定(。/。) (平均17×),育成品 种(平均17×) 野生种(60),地 930个 二代基因组重测序,SNP鉴定,CNV,遗传[32] 方品种(100) 测序深度:野生种(平多样性(m),全基因组 均4x),地方品种关联分析选择性鉴定, (平均4 连锁不平衡
6 期 贾冠清等:主要农作物驯化研究进展与展望 1357 表 2 主要作物驯化基因组位点的定位与鉴定 Table 2 Identification of genomic segments associated with crop domestication 作物 Crops 种质(群体)数量 Amount of accessions(families) 种质(群体)类型 Type of accessions (families) 驯化区段或 QTLs Number of QTLs 鉴定手段 Methods 分析内容 Analysis performed 参考文献 Reference 水稻 Rice 1529 野生种(446),地 方品种(1083) 55 个 二代基因组重测序, 测序深度:野生种(平 均 2×),地 方 品 种 (平均 1×) SNP 鉴定,FST,全基因 组关联分析,进化树,主 成分分析,遗传多样性 (π),选择性鉴定(πw / πc),遗传距离 [29] 66 野 生 种(22),地 方品种(44) 399 个 二代基因组重测序, 测序深度:野生种(平 均 1.5×),地 方 品 种 (平均 1.5×) SNP 鉴定,遗传多样性 (θ),FST,LDRs, [34] 玉米 Maize 75 野 生 种(17),地 方 品 种(23),育 成品种(35) 484 个 二代基因组重测序, 测序深度:野生种(平 均 5×),地 方 品 种 (平均 5×),育成品种 (平均 5×) SNP 鉴定,FST,进化树, 连锁不平衡,XP-CLR, 遗传多样性(π) [30] 866 野生种×栽培 种,BC2S3 RILs 72 个 QTLs SNP 标记 QTL 定 位,比 较 遗 传 分析 [35] 大豆 Soybean 302 野 生 种(62),地 方品种(130),育 成品种(110) 121 个 二代基因组重测序, 测序深度:野生种(平 均 11×),地 方 品 种 (平均 11×),育成品 种(平均 11×) SNP 鉴定,FST,主成分分 析,进化树,遗传多样性 (π),CNV,连 锁 不 平 衡,XP-CLR,全基因组 关联分析,选择性鉴定 [31] 512 野 生 种(72),地 方 品 种(36),育 成品种(404) 140 个 SLAF 基因组重测序, 测序深度:野生种(平 均 6.14×),地方品种 (平 均 6.14×),育 成 品种(平均 6.14×) SNP 鉴 定,进 化 树,群 体 结 构,遗 传 多 样 性 (π),Fu and Li′s D*, Fu and Li′s F*,主 成 分 分析,FST,连锁不平衡, 基因流动,全基因组关 联分析,选择性鉴定 [36] 25 野生种(8),地方 品种(8),育成品 种(9) 394 个 二代基因组重测序, 测序深度:野生种(平 均 5×),地 方 品 种 (平均 5×),育成品种 (平均 5×) SNP 鉴 定,群 体 结 构, 进化树,FST,遗传多样 性(π),主成分分析, 选择性鉴定(πw /πc) [37] 16 野生种(6),地方 品种(4),育成品 种(6) 206 个 二代基因组重测序, 测序深度:野生种(平 均 17×),地 方 品 种 (平均 17×),育成品 种(平均 17×) SNP 鉴定,FST,进化树, 遗传多样性(π),选择 性鉴定(πw /πc) [38] 菜豆 Common bean 160 野 生 种(60),地 方品种(100) 930 个 二代基因组重测序, 测序深度:野生种(平 均 4×),地 方 品 种 (平均 4×) SNP 鉴 定,CNV,遗 传 多样性(π),全基因组 关联分析,选择性鉴定, 连锁不平衡 [32]
1358 植物遗传资源学报 卷 表2(续) 作物 种质(群体)数量种质(群体)类型驯化区段或 Type of accessions 鉴定手段 分析内容 参考文献 Amount o QTLs Crops Methods accessions( families families Number of QTls Analysis performed Reference 野生种(52)地 代基因组重测序,SNP鉴定,主成分分析,[33 方品种(213),育 测序深度:野生种(平进化树,Fsr,遗传多样 品种(215) 均64×),地方品种性(τ),连锁不平衡,全 (平均64X)育成品基因组关联分析,选择 种(平均6.4×) 性鉴定(w/m。),CLR 梨 种(57)地 代基因组重测序,SNP鉴定,主成分分[39] 方品种(56)(候选基因)测序深度:野生种(平析,进化树,Fsr,遗传 均11×),地方品种多样性(m),连锁不平 (平均11×) 衡,基因漂流,ROD,群 体结构,IBD 柑橘 野生种(13) 1600个二代基因组重测序,主成分分析,进化树,[40] Orans 地方品种(91) 测序深度:野生种(平Fx,遗传多样性() 均35×),地方品种SNP鉴定, XP-CLR,基 (平均35×) 因漂流 野生种(5)地方 代基因组重测序,SNP鉴定,主成分分析 Cotton 品种(43),育成 测序深度:野生种(平进化树,群体结构,F 品种(95) 均5.17×)地方品种遗传多样性(m),选择 (平均517×),育成性鉴定(c/m 品种(平均5.17×) 大麦 野生种(344),地137个 umina enrichment SNP鉴定,主成分分[42] 方品种(89) 析,群体结构,CLR,遗 传多样性(T),选择性 鉴定(w/re) 野生种(188) 个SNP芯片 SNP鉴定,Fr,lnRH,进[43] 地方品种(84) 匕树 育成品种(429) 野生种ⅹ栽培 7个Q∏ LS SSR及DArT Q∏定位,比较遗传[44] 种,RI 谷子 野生种x栽培10个 QTLs SNP,SSR及 RFLPS QTL定位,上位性效应,[16] Foxtail millet 环境互作效应 饭豆 野生种×栽培73个 QTLS SSR及AFLP Q∏定位,比较遗传[45] Rice bean 种,BC1F1 188(F2)/190野生种x栽培153个QTLs QL定位,比较遗传[46 Yardlong bean (BC FI) 种,F2及BC1F1 分析 花生 142(87BCJF1and野生种x栽培95个 QTLs SSR Q∏L定位,比较遗传[47] Peanu 55BC2F2) 种,44BC2F1 分析 野生种x栽培61个 QTLs Illumina Golden Gate,Q∏定位,比较遗传[48] Safflower 种,F SNP 分析
1358 植 物 遗 传 资 源 学 报 20 卷 作物 Crops 种质(群体)数量 Amount of accessions(families) 种质(群体)类型 Type of accessions (families) 驯化区段或 QTLs Number of QTLs 鉴定手段 Methods 分析内容 Analysis performed 参考文献 Reference 桃 Peach 480 野生种(52),地 方品种(213),育 成品种(215) 142 个 二代基因组重测序, 测序深度:野生种(平 均 6.4×),地 方 品 种 (平均 6.4×),育成品 种(平均 6.4×) SNP 鉴定,主成分分析, 进化树,FST,遗传多样 性(π),连锁不平衡,全 基因组关联分析,选择 性鉴定(πw /πc),CLR [33] 梨 Pear 113 野生种(57),地 方品种(56) 1082 个 (候选基因) 二代基因组重测序, 测序深度:野生种(平 均 11×),地 方 品 种 (平均 11×) SNP 鉴 定,主 成 分 分 析,进 化 树,FST,遗 传 多样性(π),连锁不平 衡,基因漂流,ROD,群 体结构,IBD [39] 柑橘 Orange 104 野生种(13), 地方品种(91) 1600 个 二代基因组重测序, 测序深度:野生种(平 均 35×),地 方 品 种 (平均 35×) 主成分分析,进化树, FST,遗传多样性(π), SNP 鉴定,XP-CLR,基 因漂流 [40] 棉花 Cotton 143 野生种(5),地方 品种(43),育成 品种(95) 109 个 二代基因组重测序, 测序深度:野生种(平 均 5.17×),地方品种 (平 均 5.17×),育 成 品种(平均 5.17×) SNP 鉴定,主成分分析, 进化树,群体结构,FST, 遗传多样性(π),选择 性鉴定(πrace /πcultivar) [41] 大麦 Barley 433 野生种(344),地 方品种(89) 137 个 Illumina enrichment resequencing SNP 鉴 定,主 成 分 分 析,群体结构,CLR,遗 传多样性(π),选择性 鉴定(πw /πc) [42] 小麦 Wheat 701 野生种(188), 地方品种(84), 育成品种(429) 7984 个 SNP 芯片 SNP 鉴定,FST,lnRH,进 化树 [43] 152 野生种 × 栽培 种,RILs 27 个 QTLs SSR 及 DArT QTL 定 位,比 较 遗 传 分析 [44] 谷子 Foxtail millet 182 野生种 × 栽培 种,RILs 10 个 QTLs SNP,SSR 及 RFLPs QTL 定位,上位性效应, 环境互作效应 [16] 饭豆 Rice bean 198 野生种 × 栽培 种,BC1F1 73 个 QTLs SSR 及 AFLP QTL 定 位,比 较 遗 传 分析 [45] 长豇豆 Yardlong bean 188(F2)/190 (BC1F1) 野生种 × 栽培 种,F2 及 BC1F1 153 个 QTLs SSR QTL 定 位,比 较 遗 传 分析 [46] 花生 Peanut 142(87 BC3F1 and 55 BC2F2) 野生种 × 栽培 种,44 BC2F1 后代 95 个 QTLs SSR QTL 定 位,比 较 遗 传 分析 [47] 红花 Safflower 276 野生种 × 栽培 种,F2 61 个 QTLs Illumina GoldenGate, SNP QTL 定 位,比 较 遗 传 分析 [48] 表 2(续)
贾冠清等:主要农作物驯化研究进展与展望 1359 除群体遗传学硏究手段外,连锁遗传分析作为实际贡献很低,研究结果认为,作物的驯化过程之所 经典的遗传分析手段,仍然在驯化基因组区段解析以相对漫长,不是由于有限的驯化基因间的上位性 研究中发挥着基础性作用,如:Xu等3对玉米远互作导致的,也不是由于驯化基因位点过多,或单个 缘杂交衍生BC2S3群体开展了雄穗建成驯化性状位点效应过低导致的,而是可能与人类历史及文化 的Q∏Ls定位,明确了玉米雄穗驯化的关键控制位发展紧密相关。这一研究结果,使我们对作物驯化 点候选基因及其遗传与表型效应,为深入开展关键过程相对漫长的历史原因有了更加清晰的认识。 驯化基因的克隆奠定了基础; Doust等1采用连锁22驯化相关基因克隆进展 分析的方法,通过对一个谷子及其近缘野生种青狗 近年来,作物驯化相关基因克隆研究进展迅速, 尾草远缘杂交群体的精细鉴定,获得了2个控制落主要研究手段包括QIL克隆、全基因组关联分析及 粒性的主效Q∏L位点以及8个控制抽穗期的主效候选基因鉴定等(表3),其中QTL定位技术作为主 QTL位点,并对位点间的上位性互作效应进行了解流研究手段被广泛应用,在主要驯化性状关键基因 析,研究发现环境效应及上位性互作效应对表型的的克隆方面取得的代表性进展如下。 表3主要作物驯化基因克隆与功能分析 Table 3 Cloning and characterization of functional genes on crop domestication 是否存在 选择证据 作物 基因 基因类别 性状 变异类型 平行驯化 鉴定手段 参考文献 Genes Annotation its Types of variations Parallel Methods References on selection domestication SHAT转录因子落粒性蛋白移码突变未明确Q1L定位未明确 LHDI 转录因子抽穗期 氨基酸变化 未明确 Q定位未明确50] OsgI 转录因 顺式调控元件 未明确 QTL定位 未明确 LAB/ 细胞分裂素芒长 蛋白移码突变 未明确 QTL定位 活化酶 转录因子落粒性蛋白移码突变 未明确 QTL定位 未明确 OScIL 细胞壁蔗糖酶灌浆 氨基酸变化 未明确同源性分析有 膜蛋白株型穗型蛋白移码突变 未明确 [53] OsGSK 2 蛋白激酶中胚轴 氨基酸变化 未明确全基因组关联有 [54] 伸长 PROG 转录因子匍匐性 顺式调控 未明确 QL定位 [55] 核蛋白 木眠性 氨基酸变化 未明确 QTL定位 转运蛋白种皮色蛋白移码突变 未明确 有有有有 PROGI 转录因子 氨基酸改变 未明确 [112 (功能丧失) SwEET4己醣跨膜 灌浆 转录组结合 Maize 选择区段定位 UPA12 转录因子 株型 顺式调控 未明确 QTL定位 [58] 转录因子 型 顺式调控 [19.59] 转录因子 种子 〔基酸改变 未明确 裸露性 有有有有 转录因子花序结构不明确(很可能是未明确候选基因 顺式调控)
6 期 贾冠清等:主要农作物驯化研究进展与展望 1359 除群体遗传学研究手段外,连锁遗传分析作为 经典的遗传分析手段,仍然在驯化基因组区段解析 研究中发挥着基础性作用,如:Xu 等[35]对玉米远 缘杂交衍生 BC2S3 群体开展了雄穗建成驯化性状 的 QTLs 定位,明确了玉米雄穗驯化的关键控制位 点候选基因及其遗传与表型效应,为深入开展关键 驯化基因的克隆奠定了基础;Doust 等[16] 采用连锁 分析的方法,通过对一个谷子及其近缘野生种青狗 尾草远缘杂交群体的精细鉴定,获得了 2 个控制落 粒性的主效 QTL 位点以及 8 个控制抽穗期的主效 QTL 位点,并对位点间的上位性互作效应进行了解 析,研究发现环境效应及上位性互作效应对表型的 实际贡献很低,研究结果认为,作物的驯化过程之所 以相对漫长,不是由于有限的驯化基因间的上位性 互作导致的,也不是由于驯化基因位点过多,或单个 位点效应过低导致的,而是可能与人类历史及文化 发展紧密相关。这一研究结果,使我们对作物驯化 过程相对漫长的历史原因有了更加清晰的认识。 2.2 驯化相关基因克隆进展 近年来,作物驯化相关基因克隆研究进展迅速, 主要研究手段包括 QTL 克隆、全基因组关联分析及 候选基因鉴定等(表 3),其中 QTL 定位技术作为主 流研究手段被广泛应用,在主要驯化性状关键基因 的克隆方面取得的代表性进展如下。 表 3 主要作物驯化基因克隆与功能分析 Table 3 Cloning and characterization of functional genes on crop domestication 作物 Crops 基因 Genes 基因类别 Annotation 性状 Traits 变异类型 Types of variations 是否存在 平行驯化 Parallel domestication 鉴定手段 Methods 选择证据 Evidence on selection 参考文献 References 水稻 Rice SHAT1 转录因子 落粒性 蛋白移码突变 未明确 QTL 定位 未明确 [49] LHD1 转录因子 抽穗期 氨基酸变化 未明确 QTL 定位 未明确 [50] OsLG1 转录因子 穗型 顺式调控元件 未明确 QTL 定位 未明确 [18] LABA1 细胞分裂素 活化酶 芒长 蛋白移码突变 未明确 QTL 定位 有 [17] GL4 转录因子 落粒性 蛋白移码突变 未明确 QTL 定位 未明确 [51] OsCIN1 细胞壁蔗糖酶 灌浆 氨基酸变化 未明确 同源性分析 有 [52] qPE9-1 膜蛋白 株型穗型 蛋白移码突变 未明确 QTL 定位 未明确 [53] OsGSK2 蛋白激酶 中胚轴 伸长 氨基酸变化 未明确 全基因组关联 分析 有 [54] PROG7 转录因子 匍匐性 顺式调控 未明确 QTL 定位 有 [55] Sdr4 核蛋白 休眠性 氨基酸变化 未明确 QTL 定位 有 [56] Bh4 转运蛋白 种皮色 蛋白移码突变 未明确 QTL 定位 有 [57] PROG1 转录因子 株型 氨基酸改变 (功能丧失) 未明确 QTL 定位 有 [11-12] 玉米 Maize ZmSWEET4c 己醣跨膜 转运蛋白 灌浆 未明确 是 转录组结合 选择区段定位 有 [14] UPA2 转录因子 株型 顺式调控 未明确 QTL 定位 有 [58] tb1 转录因子 株型 顺式调控 是 QTL 定位 有 [19,59] tga1 转录因子 种子 裸露性 氨基酸改变 未明确 QTL 定位 有 [21] ra1 转录因子 花序结构 不明确(很可能是 顺式调控) 未明确 候选基因 有 [60]