第 扬州大学学报(农业与生命科学版) Vol.24 No.2 loureal of Ya Jun 2003 数量性状遗传基础研究的回顾与思考 一后基因组时代数量遗传领域的挑战 莫惠栋 (扬州大学数重传解究蜜,江苏杨州,2509) 精委:回顾了100多年来数量性状遗传研究的发展,数腰性状的遗传研克长期落后于质量性状的研究,主要是对其速传燕暗的 的:世纪年代开始分子标记大开发,候T为手因的位参点促进了状传基 这种准璃的谁传刷分提俱T必要的条件。 关:数件状:意传或结构:数性状座位:数性状基因数性状核苷酸:准作 中图分黄号,Q38 文献标识码:入 文编号:1671-4852(2003)02002108 LOOK BACK AND REFLECT ON GENETIC RESEARCHES OF VARIATION FOR QUANTITATIVE TRAITS A CHALLENGE FOR QUANTITATIVE GENETICS IN POST-GENOME ERA MO Hul-domg ABSTRACT,The gunetic researches of variation for quantitative traits were retrospected aince 1885.The rese itittieraitagodthato galtatietraiaocer peaking.consderable DNA fragme containing multipex gene s.Further (OTN) and trom to q Eieyd molecular pcsinge oide polymorp (P)and sequences in model organisms will greatly advance accurately genetic dissection for quantitative tra 数性状是现非缕性变异的一类性状。作物的前、棉袖产,高意的肉、.蛋产质,以及人类对于心病、高中 压,籍尿病等疾病的性等,都是数量性状。数量性状的遗传研究,对于动、植物的资源保护和传改良以及在不久的 收日203-03-15 男,青江面岭人,扬州大半饭复博毕,主要从率数量速传华和生物选计学研究。 E-mall qtla@yeu.edu.cn 万方数据
第24卷第2期 2003年6月 扬州大学学报(农业与生命科学版) Journal of Yangzhou University(Agricultural and Life Sciences Edition) V01.24 No 2 Jun 2003 数量性状遗传基础研究的回顾与思考 ——后基因组时代数量遗传领域的挑战 莫惠栋 (扬州大学数量遗传研究室,江苏扬州,225009) 摘要:回顾了100多年来数量性状遗传研究的发展。数量性状的遗传研究长期落后于质量性状的研究,主要是对其遗传基础缺 乏必要的r解。20世纪80年代开始.DNA分子标记的大量开发,提供了遍布于基因组的位置参照点,促进了数量性状遗传基础 研究的迅速发展。迄今至少已对68个生物种的很多数量性状(包括动、植物的重要经济性状和人类疾病)作过全基因组的数量性 状座位(QTL)扫描,建立了QTL图谱.但是一般地说,QTL仍然是一个相当大的DNA片断,往往含有多个基因。遗传基础的进 一步研究应当从QTL到数量性状基因(QTG),再从QTG到相应于等位基因的数量性状核苷酸(QTN).逐步深入下去。这是后 基因组时代数量遗传领域的主要挑战。基因组上数以万汁的DNA序列变异(侧女flSNP)以及模式生物全基因组溯序的完成,已为 这种准确的遗传剖分提供了必要的条件。 关键词:数帚性状;遗传基础或结构;数量性状座位;数量性状基因;数最性状核苷酸;准确作图 中围分类号:Q 348 文献标识码:A 文章编号:1671—4652(2003)02 0024 08 LooK BACK AND REFLECT oN GENETIC RESEARCHES OF VARIATIoN FOR QUANTITATIVE TRAITS A CHALLENGE FOR QUANTITATIVE GENETICS IN POST—GENOME ERA MO Hui~dong (Lab ofQuantitative geneticst Yangzhou Univ,Yangzhou,225009,China) ABSTRACT:The genetic researches of variation for quantitative traits were retrospected since 1885 The researches on qu;Lntitative traits lagged chat on qualitative traits o、rer long time because of poorly understanding of the genetic basis or architecture for quantitative variation.Since late 1980s,the DNA sequence variants,i.e.,the molecular markers,were detected on a large—scale.and provided densely positional controlls over whole—genome.Thus,genetic basis researches for quantitative traits weEe strongly promoted.Up to now,many quantitative traits in 68 species of living things at least,including many important economic traits in plants and animals,and human diseases,have been conducted on the whole—genome scan for quantitative trait loci(QTL),and QTL mappings were established.However,in generally speaking,a QTL is still a considerable DNA fragmt,nt frequently containing multiplex genes.Further investigations oil tile genetic basis should be deepened:i.e.,from Q7FL to quantitative trait genes(QTG)and from QTG to quantitative t rait nucleotides(QTN)corresponding to alleles or paralogs.This is a major challenge for quantitative genetics in the post—genome era.Extremely abundant molecular polymorphisms such as single nucleotide polymorphisms(SNP)and complete genome sequences in model organisms will greatly advance accurately genetic dissection for quantitative trait variation. KEY WORDS:quantitative trait}genetic basis or architecture;quantitative trait locus tative trait nudeotide;accurate mapping 数量性状是呈现连续性变异的一类性状。作物的粮、棉、油产量,畜禽的肉、奶、蛋产量,以及人类对于心脏病、高血 压、糖尿病等疾病的敏感性等,都是数量性状。数量性状的遗传研究,对于动、植物的资源保护和遗传改良以及在不久的 收藕日期 基金项目 作者简介 E—mall 2003 03 l 5 国家自热科学基金资助项且(30270704) 奠惠栋(1934一),男,浙江温岭人,扬州大学教授、博导,主要从事数量遗传学和生物统计学研究. qtls@yzu.edu.an 万方数据
第2期 莫惠栋:数霞性状传基础研究的回网与思专 25 将来建立个人化医疗保健基迪档案等,都是必不可缺的,数量性状与人举生活的关联,要比诸如皮、毛榜色或其一结征的 有无等非连续的质量性状里为广泛,更为密切.笔者鸟做100多年来数量遗传学的发展,特别悬20世纪0年代以后的发 展,并探讨数量性状遗传研究在后基因组时代所面临的任务和捷战。熟砖引玉,以维同好 传统数量遗传学对数量性状的遗传基础缺乏必需的了解 数量性状的遗传研究可追到19世纪。 个后的身高关系 ,其后,Pc 13 异的分布 是数量遗传研究的先行者,但当时并没有遗传学 理论作指导 发现,数量传 表米上的室,提出了母 说,认为数 无尔方式遗传的。其后,E 在玉米和烟上也得到类 出献的英者则有 下的 不 bc在1941年别出多基因(ol ),按着又表述了多基因理论4。这一理论的基本点包括:O连续性变异的 的,该系统由很多各具相等微效且对环境反应版感的等位基因组成,②多基因系绕可 的各个微因仍都条舌徽分 方式遗传,虽然个别微装基因的遗传效应不能识别或追宗,但作为多基因系统整体,其遭传特征是明显的,可研 影其因理论的提出,有力地很进了生物转计兰与海传学的你复知结合,清就了0世纪四五十年代颜量清传研农的 一个繁零希盛时扇,并延续到六七十华代,它的突出贡献是,通过一些精妙的遗传设计和统计模型,将数服性状表型的总 狡应、总方差,分解为属于基因型的、环境的、加性的、是性的、上位性的以及多效性的等分量,并在此其础上估计了资化 率,显性度,透传进度(选择响应)、造传相关等参数,使-个数量性状的表型遗传特征得到较全面的描述。由此建立了传 统的数盘遗传学。其详细内容可从数量遗传学历次金议的论文集 中檐索。在此期问,数量清传学也对动.抽物的合 件作出了重大或献。中图科学能已故院士,著名玉米育种家李竞埃以管指出:靠了数量透传学的发展,才使育种方法的 创新和武化有了深厚的限基:没有数量遗传学,就没有玉米的杂种优势利用。传统数量流传学对于动、植物的育种实践 迄今仍有相当大的应用空间。 但是,以上研究只是一种“爆箱”的结果,它没有或几乎没有涉及数最性状的遵传基础,即数最性状基因的变异。一个 数量性状受多少个基因控制,它们位于何处,如何发生作用等,人们不清楚,也无法精清楚.因为按网多基因理论,个别数 量基因的效应小到难以度量,当然更不可能分折它对表型变异的作用。所以,当质量性状的遗传研究,从孟德尔的个休水 ,到细水 染色体水平,基因水平分子水平,步步深人时,数量性状的遗传研究却处于“迷茫“之中,不能同步跟上 说明 个问题:科学习 论可以促进科学的发展,但如果不能与时俱进,到了一定阶段,它的某些缺陷或不足就可能限制 或阻碍科学的 步发展 上·多基 、等教应理论并非未曾受过质疑,Robert 在1967年就曾提出:数量基因效应的分布更可能是近 于指数 即少 具有大应,能 说明该性状的大部分变异,其余基因则随着其效应减 少,济因数目愈来多。但当附并未引起数流传学界的足注意 2DNA分子多态性标记的发现推动了数量性状遗传基硒研究的迅速发展 20世纪80年代,由于生物技术的发展,特别是人类基因组计划的起动(1991),基因组的DNA序列在分子水平上的 遗传变异,即分子多态性,被大量开发出来.限制性片晰长度多态性(RFLP),随机扩增多态DNA(RAPD)等分子标记 在一个生物种内一般都能达到数百个甚至上千个,并適布于整个基因组),这些分子标记是基因组上位置的参照点,现 如公路上的里程碑,为将数量性状座位(QTL)落实到基因组的相应位登上建立了基础.20世纪末的最后10多年,数最性 状透传基础研究的主要发展,可以说就是QTL分析,包括构建QTL图谱、分析QTL效应和研究QTL作用特征等。由 QTL分析而得的对于数量性状透传的一些新认识,笔者曾作过简要报道细 ,现在又过去?年,据检累,作过QTL分析的 生物种至少已达68个。根据在此期间出版的代表性著作 和有关研究报告,其主要发展可补充归纳如下。 2.」关于构建QTL图潜的方法 DNA分子标记在基因组上的位置和基因型(孩称为类别,因为标记通常不是基因)是已知的,数量性状表型是可观 暴或测傲的,面QTL的位置和效应则为未知。构建QTL图谱,就是根据标记基因型和数量表型,虚用一定的统计方法 在遗传连锁图上标定有关QTL的位置,并估计其效应。这简称为QTL作图。其善本统计方法称为标记性状关联分析 (markerratoayis),基本原遵是:如果在某标记座位M附近有着一个影响某性状数量大小的QTL,则在 万方数据
第2期 莫惠栋:数量性状遗传基础研究的回顾与思考 25 将来建立个人化医疗保健基础档案等,都是必不可缺的。数量性状与人类生活的关联,要比诸如皮、毛颜色或某一特征的 有无等非连续的质量性状更为广泛、更为密切。笔者鸟瞰100多年来数量遗传学的发展,特别是20世纪80年代以后的发 展,井探讨数量性状遗传研究在后基因组时代所面临的任务和挑战。抛砖引玉,以飨同好。 1传统数量遗传学对数量性状的遗传基础缺乏必需的了解 数量性状的遗传研究可追溯到19世纪。1885年Gahon…报道了205对父母与其930个后裔的身高关系。其后.Pcar— son”叫1陆续提出了13种密度函数,用以描述数量变异的分布。他们可算是数量遗传研究的先行者,但当时并没有遗传学 理论作指导,人们也没有把他们看作是数量遗传学家。 l 900年,盂德尔遗传定律在尘封35年后被重新发现,数量遗传研究开始迅速发展。1 909年,Nilsso㈣Ehl㈣根据在 麦类上的研究,提出了数量性状遗传的多因子学说,认为数量性状受多个具有累加作用的因子控制,而这些因子也是按 盂德尔方式遗传的。其后,Emerson等”1和East”1在玉米和烟草上也得到类同的实验验证。而在数量遗传理论上作出杰 出贡献的奠基者则有Fisher【8棚、Wright[1““1和Haldane【l 21等人。当时,数量性状的遗传研究,并不落后于质量性状。 在总结前人研究的基础上,Mather“”在1941年提出多基因(polygene)一词.以区别于盂德尔式的寡基因(oligo gene);接着又表述了多基因理论[1“”]。这一理论的基本点包括:①连续性变异的数量性状是由一个多基因系统控制 的,该系统由很多各具相等微效且对环境反应敏感的等位基因组成;②多基因系统中的各个微效基因仍都遵循盂德尔 方式遗传.虽然个别微效基因的遗传效应不能识别或追踪,但作为多基因系统整体,其遗传特征是明显的,可研究的。 多基因理论的提出,有力地促进了生物统计学与遗传学的交叉和结合,造就了20世纪四五十年代数量遗传研究的 一个繁荣鼎盛时期,并延续到六七十年代。它的突出贡献是,通过一些精妙的遗传设计和统计模型,将数量性状表型的总 效应、总方差,分解为属于基因型的、环境的、加性的、显性的、上位性的以及多效性的等分量,并在此基础上估计了遗传 率、显性度、遗传进度(选择响应)、遗传相关等参数,使一个数量性状的表型遗传特征得到较全面的描述。由此建立了传 统的数量遗传学。其详细内容可从数量遗传学历次会议的论文集“卜“1中检索。在此期间,数量遗传学也对动、植物的育 种作出了重大贡献。中国科学院已故院士、著名玉米育种家李竞雄“”曾指出:靠了数量遗传学的发展,才使育种方法的 创新和演化有了深厚的根基;没有数量遗传学,就没有玉米的杂种优势利用。传统数量遗传学对于动、植物的育种实践, 迄今仍有相当大的应用空间。 但是,以上研究只是一种“黑箱”的结果,它没有或几乎没有涉及数量性状的遗传基础,即数量性状基因的变异。一个 数量性状受多少个基因控制,它们位于何处,如何发生作用等,人们不清楚,也无法搞清楚。因为按照多基因理论,个别数 量基因的效应小到难以度量,当然更不可能分析它对表型变异的作用。所以,当质量性状的遗传研究,从盂德尔的个体水 平,到细胞水平、染色体水平、基因水平、分子水平,步步深人时,数量性状的遗传研究却处于“迷茫”之中,不能同步跟上。 这说明一个问题:科学理论可以促进科学的发展,但如果不能与时俱进,到了一定阶段,它的某些缺陷或不足就可能限制 或阻碍科学的进一步发展。 事实上,多基因、等效应理论并非未曾受过质疑。Robertson[2”在1967年就曾提出:数量基因效应的分布更可能是近 于指数式的,即少数基因座的等位基因对数量性状具有大效应,能说明该性状的大部分变异,其余基因则随着其效应减 少,基因数目愈来愈多。但当时并未引起数量遗传学界的足够注意。 2 DNA分子多态性标记的发现推动了数量性状遗传基础研究的迅速发展 20世纪80年代,由于生物技术的发展,特别是人类基因组计划的起动(1991),基因组的DNA序列在分子水平上的 遗传变异,即分子多态性,被大量开发出来。限制性片断长度多态性(RFLP)、随机扩增多态DNA(RAPD)等分子标记. 在一个生物种内一般都能达到数百个甚至上千个,并遍布于整个基因组““。这些分子标记是基因组上位置的参照点,犹 如公路上的里程碑,为将数量性状座位(QTL)落实到基因组的相应位置上建立了基础。20世纪末的最后10多年,数量性 状遗传基础研究的主要发展,可以说就是QTL分析,包括构建QTL图谱、分析QTL效应和研究QTL作用特征等。由 QTL分析而得的对于数量性状遗传的一些新认识,笔者曾作过简要报道““。现在又过去7年,据检索.作过QTI,分析的 生物种至少已达68个。根据在此期间出版的代表性著作o…”和有关研究报告,其主要发展可补充归纳如下。 2.1关于构建QTL图谱的方法 DNA分子标记在基因组上的位置和基因型(或称为类别,因为标记通常不是基因)是已知的,数量性状表型是可观 察或泓量的,而QTL的位置和效应则为未知。构建QTL图谱,就是根据标记基因型和数量表型,应用一定的统计方法, 在遗传连锁图上标定有关QTL的位置,并估计其效应。这简称为QTL作图。其基本统计方法称为标记一性状关联分析 (marker trait association analysm)。基本原理是:如果在某标记座位.!If附近有着一个影响某性状数量大小的QTL,则在 万方数据
26 场州大学学报(农业与生命科学饭) 第24卷 该与该Q均象合有发生共分离时,多使以的不同类别W,以和M当软表的大小 测验的不同类别同数景性状平均数的异成相 的粒重有显著差驿,是应用上述原推种皮 根据不同种皮颜色兼 型近有 当时还不知道该颜色 以各种形态生化标记(如园工)定位有关Q 位 每次一个方法有明显缺点:因为M和QT 更离的而不是同 ,则对双杂合 体M,M,Q,Q:的随机交配后裔(与纯系杂交的F世代相当),可以证明, 两种纯 类别MM, 的平 是Q基因的观和真实的加性效应,d和分别是相应的显性效空 以只要,≠0.即Q≠M,次一个方法估计的TL的位置和都是有编的 省鉴 共因组扫(h 灯法的实质是,在因的有标上的任 点上讲行索,控出与有美的重 ,=0的最可能座 而商了定位QTL的准确度,并能无偏地估计该Q的等位基因的a和4,M法是搜索QTL的统计方法台 但悬.当同-染色休上存在多个影响同一数量性状的QTL时,由于不同QT的效应的 相万 QTL的位置标错,产生所谓的幻影QTL,不同染色体上影响同一数量性状的QTL的遗传分离俗称“音测会 标记类别内的表型方差,降低发现QTL的效能Jansen等和乙em同时注意到此同题,并提出了复合区作图 mapping,CIM),即在IM分析模型中加人标记协因子(fctor),以便在某一标记区间搜素时,其他 有关库位的分商干扰得到统计控制。这是区创作图和多元线性回归的结合,这一思想电已推广到多种环境和多个性块的 QTL作图,应当注意的是,CM法(和M法)从本质上说仍然是“每次一个"方法,因为每一区问的检测依枕于包含 标记协因子,而标记协因子又是随检测区间而异的,研究者如选择不同的协因子和/或不同的视窗大小作图,结巢就会不 可,这是人为的“模型依粮”,所以,新近又已提出一种称为多区间作图(multiple interval mapping,MIM)的新方 法,据报道MM可使多个QTL的位置,效应和互作同时得到估计,并在全基因组稳定地收效,这可能是直正的~全基 因组扫播”,不过,模型的最佳配合(例如发现更多的QTL)往往可能是“过配合”(o¥r),不一定是对直实的最好焰近 统计结果只是一种额率意义上的引导,遗传学问题的最终证实主要应是生物学的和邀传学的,而不仅是统计学的。 应当指出,以上构建QTL图谱的方法主要适用于遗传基醴陕窄的作图群体,例如由2个近交系杂交而得的F,C R!和D州等群体。这类群体的每一座位上只可能有2种等位基因,遗传结构最为简单,但所得结果的局限性也最大(只可 能发现两亲等位基因不同的QTL),为了较金面地了解数量性状的適传变异,必须扩大作图群体的进传基础,例如利用四 句杂交们,多系杂交 构迷作图群体和考虑复等位基因情形等。近年来,这些复杂群体的QTL定位方法,也已有较大 的发展 ,它们将可能同时适用于近交和异交的生物群体 QT1.作图的另 种可选方法是连镂不平衡(linkage disequilibrium,LD)分析。由经典遗传学可知,如果2个基因序 位连锁且共分离, 一定发生亲本型配子和重组型配子的频率差异,即连锁导致的不平衡。上述标记性状关联分析的 据正源于此,标记类别间的性状表型差异正是标记座位和数量性状座位LD的反映。因此由标记-性状的LD也可以定位 QTL近年 ,由于标记数日的不断增多,应用LD作图也日见广泛,特别是在那些不能进行控制杂交和遗传操作的异交 生物种(如人类)上 D作图的本方法是:抽取研究群体的 个样本,测定它的每一个体的标记类别和数性状表型值:如架性状 的(dinary或c 标机 无之的 的箜异或相关的显著性 评定:如果性状是连续的,则LD由各标记类别的性状平均数或分布的差异或相关的呈著国 评 对于具有单 主基因 D作图 且十分有效 例如芬兰人群中 一种客染色体隐性 ,或从单 锁 十分紧 南LD的应 2.2 美于QTL 自Peterson等 发表对QT.(原称“主德尔因子")进行全蒸因组扫的首箱论文以来,查hp:∥proxy2bray, 万方数据
26 扬州大学学报(农业与生命科学版) 第24卷 该M与该QTL均杂合而发生共分离时,必使M的不同类别(M,M。、M,M。和M。M。)与该性状表现的大小构成关联;因此 测验M的不同类别间数量性状平均数的差异或相关,就可能发现此种关联。早在80年前,Sax[。71根据不同种皮颜色菜豆 的粒重有显著差异,就是应用上述原理推断种皮颜色和粒重的基因连锁。用今天的辞语表达,即:在种皮颜色座位M的 附近有一影响粒重高低的QTL;虽然当时还不知道该颜色座位在染色体的位置。在Sax之后,上述思想也被广泛应用于 以各种形态或生化标记(如同工酶)czs3定位有关QTL,俗称为每次一个方法(one at小time method)。 每次一个方法有明显缺点:因为M和QTI,一般是有距离的而不是同一的。若设QTL的基因型为Q。Q。.则对双杂合 体M,MzQlQz的随机交配后裔(与纯系杂交的Fz世代相当),可以证明:两种纯合标记类别肘。肘。和M2M。的平均表型差 异为n‘=(卜一2r)a,杂合标记类别M,^如和两种纯合标记类别的平均表型差异为∥一(1—2r)2dczs,z。2。这里的d‘和a分别 是Q基因的观察和真实的加性效应,d‘和d分别是相应的显性效应,r是M和Q间的重组率(可变换为遗传距离cM)。所 以只要r≠o,即Q≠M,每次一个方法估计的QTL的位置和效应都是有偏的。有鉴于此,Lander等m3将极大似然方法 和线性回归相结合,提出了检测QTL的区间作图法(interval mapping,1M),俗称全基因组扫描(whoIe genome scan)。 IM法的实质是,在基因组的所有标记上和标记间的任何一点上进行搜索,找出与有关Q的重组率r一0的最可能座位;因 而提高了定位QTL的准确度,并能无偏地估计该Q的等位基因的“和d。IM法是搜索QTL的统计方法的一个重要发展。 但是·当同一染色体上存在多个影响同一数量性状的QTL时,由于不同QTL的效应的相互干扰,IM法常常会把 QTL的位置标错,产生所谓的幻影QTL;而不同染色体上影响同一数量性状的QTL的遗传分离(俗称“噪音”)则会扩大 标记类别内的表型方差,降低发现QTL的效能。Jansen等o”和Zeng““同时注意到此问题,并提出了复合区间作图法 (compositeintervalmapping,CIM),即在1M分析模型中加入标记坍因子(cofaetor),以便在某一标记区间搜索时.其他 有关座位的分离干扰得到统计控制。这是区间作图和多元线性回归的结合。这一思想也已推广到多种环境和多个性状的 QTL作图o…。应当注意的是,CIM法(和IM法)从本质上说仍然是“每次一个”方法,因为每一区间的检测依赖于包含的 标记坍因子,而标记协因子又是随检测区间而异的。研究者如选择不同的协因子和/或不同的视窗太小作图,结果就会不 同[3“。这是人为的“模型依赖”。所以,新近又已提出一种称为多区间作图(multiple interval mapping,MIM)的新方 法”“。据报道MIM可使多个QTL的位置、效应和互作同时得到估计,并在全基因组稳定地收敛。这可能是真正的“全基 因组扫描”。不过t模型的最佳配合(例如发现更多的QTL)往往可能是“过配合”(overfit),不一定是对真实的最好趋近。 统计结果只是一种概率意义上的引导,遗传学问题的最终证实主要应是生物学的和遗传学的.而不仅是统计学的。 应当指出,以上构建QTL图谱的方法主要适用f遗传基础狭窄的作图群体,例如由2个近交系杂交而得的F。、BC、 RI和DH等群体。这类群体的每一座位上只可能有2种等位基因,遗传结构最为简单.但所得结果的局限性也最大(只可 能发现两亲等位基因不同的QTL)。为了较全面地了解数量性状的遗传变异,必须扩大作图群体的遗传基础,例如利用四 向杂交o…、多系杂交口“371构建作图群体和考虑复等位基因情形等。近年来,这些复杂群体的QTL定位方法,也已有较大 的发展口n“,它们将可能同时适用于近交和异交的生物群体。 QTI.作图的另一种可选方法是连锁不平衡(1inkage disequilibrium,LD)分析。由经典遗传学可知,如果2个基因座 位连锁且共分离,则一定发生亲本型配子和重组型配子的频率差异,即连锁导致的不平衡。上述标记一性状关联分析的根 据正源于此,标记类别间的性状表型差异正是标记座位和数量性状座位LD的反映。因此由标记一性状的LD也可以定位 QTL。近年来,由于标记数目的不断增多,应用LD作图也日见广泛,特别是在那些不能进行控制杂交和遗传操作的异交 生物种(如人类)上“2叫…。 LD作用的基本方法是:抽取被研究群体的一个样本,测定它的每一个体的标记类别和数量性状表型值;如果性状是 二歧的(dinary或dichotomous).即只有“有”或“无”之分的,则标记和性状的LD由各标记类别在“有”和“无”之间的基因 频率的差异或相关的显著性评定;如果性状是连续的,则LD由各标记类别的性状平均数或分布的差异或相关的显著性 评定‘4s,“3。 对于具有单一主基因的性状,LD作图不仅简单,而且十分有效。例如芬兰人群中的一种常染色体隐性遗传病DTD (diastrophic dysplasis),应用系谱内分离分析将该病基因定位于离标记座位CSFIR的1.6 cM内;而应用LD分析将该基 因定位于离CSFIR的0.05 cM内,并由该基因的克隆得到了证实,LD作图的精确度提高了32倍“7州。但对自然异交群 体而言,一个座位发生的新突变可因时间推移过程中的重组而使单倍型(haplotype)迅速消失。只有新近突变衍生的大群 体,或从单一突变祖先直接遗传的小规模隔离群体,以及突变基因与标记的连锁十分紧密(例如物理距离小于1 000 bp) 的群体,才能期望有较大的LD。因此其应用受到限制。对于典型的数量性状,由于一个性状通常有多个QTL,而单个 QTI,的效应叉小,亦直接影响LD的应用。 2.2关于QTL的效应和互作 自Peterson等“”发表对QTL(原称“盂德尔因子”)进行全基因组扫描的首篇论文以来,据查http:∥proxy2.1ibrary. 万方数据
第2期 莫惠栋:数量性快遗传基德研究的回顺与跟考 27 ”登录于SC1的报告就已有1555篇(含2003年54篇),至少莎及68个 ,由于植物群体比较容易透传操 ,故前期的QT 作图以物群体为多 ,但近年有关动物1 「关效应和互作的报道可概括简述于下 QTL 的 %或传总变异的20%以上的QTL,应称为“主要 与个了该性状的大都分 量性状的QT 主要QT 而且多数性状都悬相对少数的座位(倒如2 研穷可能制其 一数质性状 传结构的即 本特 的分1 接近于R 由少数座位的 大,说明衣型总查异在 的队 但是,数量性状的观赛识 布的认识仍 》QTL的多效性 有过 。如影响果 因连益威,可能是 传育义多不清被,至由 位性特征作出区分。为了了解散作 遗传学质,有应用话当的传材 传交配设计(例知对两个QTL座位,为分析加性×加性互作需配出种纯合基因 ,为分析所有互 作需配出9种著因型 进行验证。另外,QTL与因登、性别、环境的互作普迅存在。将一个实变等位基因导人若干种不同的野生型遗 中,该容位感因的结应可能被促进制.这路为因刑找是《。 QTL在不同性到和 同环境的表达不同则分别称为性别特异(sex即cc)和环域特异n cfC):前者如眼的体重,人的寿命戒 血清甘油三酯等性状,后者如玉米的至抽天数,籽粒湿度和数等性状(相反,籽粒产,德位高、株高性状的 QTL效应,被认为大多独立于环境)。因型、性别,环境特异的QTL效应或互作可能更便于利用 2.3关于0T1的遗传鉴定 QTL在本质上是 的那些段可能存在影响那些数 性状的07 至于其遗传意义,即这 OT 那出基因?以句种方式影响有美自 的 件事就是要 的Q蓬一进行传鉴定,即测一个QTL与一些已知的或可测 选基因是否同一?这就是透传互补测验或等位性测验 是制验候远基因的不同基因型是香与有关QL的表型共分离?如果发生了共分 高.可认为该候选基因就是该QTL的组分。例如蔗酶基因L5与影响蓄茄果实中葡和果糖含量的 Bn92-5共分南,从而证实Bx9-2-5即Ln5,二是测验候选基因的突变等位基因是百与有关QTL在功能上或 数量上互补:一般的推新是,互补为非等位,不作互补为等位。饲如,能解释王米和大色直 异的一个QT被定位于基因组上含有玉米突变基因b!的区段,雨以玉米为骨妖物建的含有该大刍草QTL的近等基因 系又不与玉米的b1系互补,证实该QTL即b1,0,将携带ORFX基因的柯斯较体(id)导人大果我培餐茄,转基因 植株的果安霞夏显若缝低,表明ORFX基因即基茄果雪的QTL.,21 应当指出,以上测验基本上是细胞链传学中研究质廉性状基因的常规方法,对于QTL区段,有时可能有很多个可提 名的候选基因,有时也可能没有明显的候选基因或存在尚未报进过的新基因,而不同基因的效应又可能大小悬殊,要用 上述方法确认所有QTL的候选基因,任务实在过于艰巨,所以自DNA序列变异开发以来,QTL作图发晨很快,QTL的 遗传鉴定却相当滞后,迄今尚块乏“工业化的”研究手段。但悬,使QTL成为明确的基因造传速位,是人类认识和操作数 量性状所必不可少的知识,又必须如速研光,近年有两项夹陵值得注意:一是在一些模式生物上发展了多种多样的单然 因藏除系(single gene knockouts)t),它们是以人工方法(例如改变已知基因的某些碱基)使某单一基因失活而背景 不变的遗传材料。以它们为测验种或直接分析它们的表型,都可能为对应于QTL的候选基因或新基因提供较严格的请 传学证明。二是许多生物种的基因组测序工作已经完成,通过基因表达标签(expressed scquence iag,EST)的正确聚类 以识别基因的方法也有了较大发腰切。它们提供的信息也将有力地促进候选基因的发现和QTL的遗传鉴定。 3后基因组时代数量性状遗传基础研究的主要挑战是破译QTL 截止2002年,已有114个生物种(大多为微生物)完成成基本完成全蒸因组测序,其中受到较广泛关注的有人类( ien,2,】亿bp)a】、第腹果蝇(Drosophila mela ow.】.2辽bn)1线中tC bp)】,报南芥(Arabidopis thaliana,l.25亿bpy则,栽培稻(ryaativ,4.20一4.66亿bp)na和银(6 mucul,25 亿即))、人类基因细测序的完成,标志着测序已是一种常规的技术操作,用于任何生物都不会再有大的障得,生物学。 万方数据
第2期 莫惠栋:数量性状遗传基础研究的回顾与思考 27 uiue.edu:Z500/CIW.cgi,以主题词“QTLmapping”登录于SCI的报告就已有l 555篇(含2003年54篇),至少涉及68个 生物种。一般而占,由于植物群体比较容易遗传操作,故前期的QTL作图以植物群体为多‘50-531,但近年有关动物m叫,1 和人类1”“”的QTL作图迅速增多。其中有关效应和互作的报道可概括简述于下。 1)QTL的效应:Tanksley““建议.能够说明表型总变异的10%或遗传总变异的20%以上的QTL,应称为“主要 QTL”(major QTL)。绝大多数数量性状的QTL分析都发现了主要QTL,而且多数性状都是相对少数的座位(例如2~ 5个)贡献了该性状的大部分遗传变异。由此说明,QTL效应的分布比较接近于Robertson模式m】,由少数座位的深人 研究就可能了解某一数量性状遗传结构的最基本特征。这是与传统数量遗传学不相同的认识。但是,数量性状的观察误 差大,说明表型总变异在3%以下的QTL一般尚难发现,故目前对QT[。效应分布的认识仍是不全面的。 2)QTL的多效性:有不少QTL,尤其是与生长发育过程有关的一些QTL,往往具有明显的多效性,例如影响果蝇 刚毛发育的QTI,,也对中心神经系统、性别和眼、翅等的发育有作用““。多效性并不一定由多个基因连锁造成,可能是一 个编码某种内源激素的基因,也可能是不同染色体间存在相互联系的座位网络等。需要深入研究。 3)QTL的互作:几乎在所有生物上都发现有显著的QTL间的互作,即上位性(例如:人旧]、鼠Ⅲ]、稻Ⅲ]、果蝇m3和 线虫”“等)。但这类互作的基本性质是统计学的,其遗传意义多不清楚,甚至也不能像盂德尔遗传学那样对双基因的上 位性特征作出区分【6“。为了了解数量互作的遗传学性质,有必要应用适当的遗传材料(例如区间特异的同质系m3)和遗 传交配设计(例如对两个QTL座位,为分析加性×加性互作需配出4种纯合基因型,为分析所有互作需配出9种基因型) 进行验证。另外,QTL与基因型、性别、环境的互作普遍存在。将一个突变等位基因导入若干种不同的野生型遗传背景 中,滚突变等位基因的效应可能被促进或抑制,这称为基因型特异(genotype specific)t7…。而同一QTL在不同性别和不 同环境的表达不同则分别称为性别特异(sex specific)和环境特异(environment—specific);前者如鼠的体重、人的寿命或 血清甘油三酯等性状[7“7”,后者如玉米的至抽雄天数、籽粒湿度和穗效等性状(相反,籽粒产量、穗位高、株高性状的 QTI。效应,设认为大多独立于环境)”…。基因型、性别、环境特异的QTL效应或互作可能更便于利用。 2.3关于QTL的遗传鉴定 QTL在本质上是一个统计意义座位,QTL图谱只是以概率标准说明在基因组的那些区段可能存在影响那些数量 性状的QTI|。至于其遗传意义,即这些QTL包含那些基因?以何种方式影响有关的数量性状?则仍然是“黑箱”,有待证 实。因此,继续研究的第一件事就是要对定位的QTL逐一进行遗传鉴定,即测验~个QTL与一些已知的或可预测的候 选基因是否同一?这就是遗传互补测验或等位性测验。 遗传互补测验的常用方法有二:一是测验候选基因的不同基因型是否与有关QTL的表型共分离?如果发生丁共分 离.可认为该候选基因就是该QTL的组分。例如蔗糖酶基因Lin5与影响蕃茄果实中葡萄糖和果糖含量的一个QTL Bmx9~2—5共分离,从而证实Brix9—2 5即Lin5”“。二是测验候选基因的突变等位基因是否与有关QTL在功能上或 数量上互补;一般的推断是:互补为非等位,不能互补为等位。例如,能解释玉米和大刍草(feosintF)雄花序形态大部分差 异的一个QTL被定位于基因组上含有玉米突变基因tbl的区段,而以玉米为背景构建的含有该大刍草QTL的近等基因 系又不与玉米的tbl系互补,证实该QTL即tbl口“76]。将携带ORFX基因的柯斯载体(eosmid)导人大果栽培蕃茄,转基因 植株的果实重量显著降低.表明ORFX基因即蕃茄果重的QTL:^,2.2L”】。 应当指出,以上测验基本上是细胞遗传学中研究质量性状基因的常规方法。对于QTL区段,有时可能有很多个可提 名的候选基因.有时也可能没有明显的候选基因或存在尚未报道过的新基因,而不同基因的效应叉可能太小悬殊。要用 上述方法确认所有QTL的候选基因,任务实在过于艰巨。所以自DNA序列变异开发以来,QTL作图发展很快,QTL的 遗传鉴定却相当滞后,迄今尚缺乏“工业化的”研究手段。但是,使QTL成为明确的基因遗传座位,是人类认识和操作数 量性状所必不可少的知识,叉必须加速研究。近年有两项突破值得注意:一是在一些模式生物上发展了多种多样的单基 因敲除系(single gene knockouts)”¨“j,它们是以人工方法(例如改变已知基因的某些碱基)使某单一基因失活而背景 不变的遗传材料。以它们为测验种或直接分析它们的表型,都可能为对应于QTL的候选基因或新基因提供较严格的遗 传学证明。二是许多生物种的基因组测序工作已经完成,通过基因表达标签(expressed sequence tag,EST)的正确聚类 以识别基因的方法也有了较大发展[85~。“。它们提供的信息也将有力地促进候选基因的发现和QTL的遗传鉴定。 3后基因组时代数量性状遗传基础研究的主要挑战是破译QTL 截止2002年,已有114个生物种(大多为微生物)完成或基本完成全基因组测序,其中受到较广泛关注的有人类(Ho 删D sapiens,29.1亿bp)m3、黑腹果蝇(1xosophila melanogaster,1.2亿by)m1、线虫(Caenorhabditls elegans,0 97亿 bp)…]、拟南芥(Arabidopsis thaliana,1.25亿hp)m]、栽培稻(Oryza sativa,4 20~4.66亿bp)[93Ⅲ3和鼠(Mus m“$CUzns,25 亿hp)C”1。人类基因组测序的完成,标志着测序已是一种常规的技术操作,用于任何生物都不会再有大的障碍,生物学、 万方数据
28 扬州大学学报(农业与生命科学饭) 第24卷 逾传学的基瑞研究进人了后基因组时代。数量流传研究在后基因组时代面临什么情况?有塞些挑战?个人管见如下 3.1研究的基遭 在数量透传研究领城,当前我们必须注意到两个燕本情况 1)QT1,有多大?如果我们把QTL.作图时统计数L0D或F,X等)达到和短过显著阔限的区何作为一个QTL的 可能范图,则在绝大多数Q几图谱上都可对其作出估计。根据最近有关黑腹果蝇(这是遗传研究最为透彻的一个生物 种)QT分析的7箱告 QTL显若的平均区间为8.9cM或446×10bp,变异围为0.1~44.7cM9.8 ,含1.36×10个基因 以8800去除上述QTL显著的区,即可得到:每一QTL平均含有446×10/880 11个基因,至多含有1928×10/8800=2191个基因.因此不论上述计算误差多大,我们都可以说,对于发现一个数量 基因而言,QT1.实在是太大了.,这也可能是以往有些QTL分析重复性差的重要原因之一 CM区作为情细作 的标准,似乎1M已是非常短的片段,实则不然,根据遗传 bp计期2 入是1 几百分之一成至几千分之一,以上说明,以往业已定位的一大批QT1,豫少数类似 QTL的准确位置都将是有待深人湾索的 2)分子标记有多少?DNA序列分子变异的检测,最初是从应用southern印迹的RFLP开始的,属于以百计数景级 ,检测重点已放到直接发现D A年列的变异上,如短核苷酸币获重复(short nucleotide tendem repea》或简单 它们 多态性,如人类基因组上单核苷多态性(。 ,SNP标记超过200万个 单核苷 也翅过140万个,使每一染色体上有着几万乃至几十万个标记。SNP检测简便,结果准确,重复性好,又适于工量提傻分 析。因此,现在可以大容量地检测标记和鉴定标记基因型,不备粗心基因组的标记不足面限制研究进展。 3.2研究的目与 现代数:遗传学主要研究生物的DN人序列变异和表型数量变异的关联。在后基因组时代,作为遮传基础研究,其主 委目桥应 数恭因(数目,位置和作用方式等)变异的分子基暗,即破译QT ,这里又有相互联系的两项内容:一号 到数量性状基因 G到相应于等位基 名的候选基因和/或新基因进行遗传鉴定,直至克隆QT心,这是研究才 QTG到QTN是明确复等位基因体暴(基因内变异)及其对表型变异的不同作用,在单基因序列分析完成后应当不会有 太多困雅,但据一些先导研究,基因内的多态性相当半高,如:著茄果重的ORFX/e2.2QTL在两亲本间有42个核骨 9-26在484bp中有11种分子变异 入英脂蛋白脂酶基因已发现8 都是复等位四合处 对数得表型的效应大小实更以上目标的香占工作可能 1)要发展在标记损其密集(例知标记平均间距在Q.O1cM以下)平台上准确构建QTL图港的综合枝术,使QTL的 定位精度能够达到0.1M或更小,这是深入析QTG最重菱的基确. 要如速Q 包指应用染色休代换 基因导人系 、单基因除系 等可以缩小检测区段 的传能尽 性执 是多基因性状,诸多基因不可能都是独立地、分散地起作用而没有任何“分工”。膜仿 的 ,个基因地分幅升析,恰当与否,值得反思 )婴加强学科问的合作和德透.数量遗传学原本是以速传学和生物统计学的交叉而发展起来的,在后基因组时代 要在分子 研究数量变异,要把这种父义节大到绍器学、分子生物学传学,分子遗传学,甚至人类学,动节 ,从QTL到QTG,从QTG到QTN,每一进展都是有挑战性的,表心有 梦考文献」 ediocrity in he ute.1885,15:246-253 nt to a memoir on akew variati a [1.Philos Trans,1901.A:197-443 万方数据
28 扬州大学学报(农业与生命科学版) 第24卷 遗传学的基础研究进入了后基因组时代。数量遗传研究在后基因组时代面临什么情况?有哪些挑战?个人管见如下: 3.1研究的基础 在数量遗传研究领域.当前我们必须注意到两个基本情况: 1)QTI,有多大?如果我们把QTL作图时统计数(LOD或F、t、z2等)达到和超过显著阈限的区间作为一个QTL的 可能范围,则在绝大多数QTL图谱上都可对其作出估计。根据最近有关黑腹果蝇(这是遗传研究最为透彻的一个生物 种)QTL分析的7篇报告“6’9卜loll,QTL显著的平均区间为8.9 cM或4,i6×10‘bp,变异范围为0 1~44.7 cM或(9.8~ l 928)×104bp。新近报告”“果蝇基因组DNA有1.2×108bp(1989年曾报告为1 8×108bp[·。23),舍1.36×lO·个基因; 因此每一基因的平均大小是1.2x1 0s/1.36×104≈8 800 bp(包含所有非编码的空白区、重复区等,故是很夸大的数字)。 以8 800去除上述QTL显著的区问,即可得到:每--QTL平均含有446×104/8 800.≈-507个基因,至少含有9.8×10·/8800 ≈11个基因t至多含有1 928×10‘/8 800≈2191个基因。因此不论上述计算误差多大,我们都可以说,对于发现一个数量 基因而言,QTI。实在是太大了。这也可能是以往有些QTL分析重复性差的重要原因之一。 在文献中还常有将QTL定位于l cM区间作为精细作图的标准,似乎l cM已是非常短的片段。实则不然。根据遗传 距离和物理距离的估计”州,平均而言,l cM所包含的bp数,在果蝇是43万(按1.8×108bp计则为65万),人类是112 万,水稻是28万,玉米是185万,普通小麦是582万。而一个基因的bp数一般只有几百至多几千,仅及l cM所含bp数的 几百分之一或至几千分之一。以上说明,以往业已定位的一大}[tQTI,,除少数类似于质量性状基因的QTL外,绝大多数 QTL的准确位置都将是有待深入搜索的。 2)分子标记有多少?DNA序列分子变异的检测,最初是从应用southern印迹的RFLP开始的,属于以百计数量级。 1 997年后,检测重点已放到直接发现DNA序列的变异上,如短核苷酸串联重复(short nucleotide tendem rep洲t)或简单 序列重复(simple sequence repeats,SSR),俗称微卫星(microsatellites)标记;长串联重复(10nger tendem repeats).俗称 小卫星(minisatellites)标记。它们的数目可达千或万计数量级。新近在很多生物种上都发现DNA在单核苷酸水平上极 富多态性,如人类基因组上单核苷酸多态性(single nucleotide polymorphism,SNP)标记超过200万个Ⅲ·”“.水稻的SNP 也超过1 40万个,使每一染色体上有着几万乃至几十万个标记。SNP检测简便,结果准确,重复性好,又适于工业规模分 析。因此,现在可以大容量地检测标记和鉴定标记基因型,不需担心基因组的标记不足而限制研究进展。 3.2研究的目标 现代数量遗传学主要研究生物的DNA序列变异和表型数量变异的关联。在后基因组时代,作为遗传基础研究,其主 要目标应是探明数量基因(数目、位置和作用方式等)变异的分子基础,即破译QTL。这里又有相互联系的两项内容:一是 从QTL到数量性状基因(quantitative trait gene,QTG),二是从QTG到相应于等位基因或其对应物(paralog)的数量性 状核苷酸(quantitative trait nueleotide,QTN)。从QTL到QTG是使QTL成为QTG的遗传座位。这就要对一系列可提 名的候选基因和/或新基因进行遗传鉴定.直至克隆QTG。这是研究水平的一次质的飞跃,任重道远n0“,已如前述。从 QTG到QTN是明确复等位基因体系(基因内变异)及其对表型变异的不同作用,在单基因序列分析完成后应当不会有 太多困难。但据一些先导研究,基因内的多态性相当丰富。如:蕃茄果重的ORFX/fw2.2QTL在两亲本问有42个核苷 酸差异”“,而果实特异蔗糖酶基因Lin5/Brix9 2 5在484 bp中有11种分子变异体”‘];人类脂蛋白脂酶基因已发现88 个变异位点““],而Ⅱ型糖尿病敏感基因CAPNl0至少有108个变异位点“”1;果蝇刚毛数QTL”4有27种多态性‘los], 而D』有53种多态性[1州等。如果这些多态性或变异体都是复等位基因,综合处理也是有难度的,至少需要区分不同QTN 对数量表型的效应大小。实现以上目标的重点工作可能有: 1)要发展在标记极其密集(例如标记平均间距在0 01 cM以下)平台上准确构建QTL图谱的综合技术,使QTL的 定位精度能够达到0.1 cM或更小。这是深入剖析QTG最重要的基础。 2)要加速QTI。的遗传鉴定。包括应用染色体代换系……、基因导人系0n]、单基因敲除系m州t1等可以缩小检测区段 的各种特异遗传材料和发展鉴定候选基因和/或新基因的新技术,使QTL与QTG的遗传座位能够尽快匹配起来。 3)要创新研究理念。在数量变异遗传基础的综合分析中,可能有必要引入网络和混沌的概念和方法。因为数量性状 是多基因性状.诸多基因不可能都是独立地、分散地起作用而没有任何“分工”。模仿质量性状的研究,对QTG也是一个 一个基因地分解分析,恰当与否,值得反思。 4)要加强学科问的合作和渗透。数量遗传学原本是以遗传学和生物统计学的交叉而发展起来的。在后基因组时代, 要在分子水平上研究数量变异,需要把这种交叉扩大到细胞学、分子生物学、细胞遗传学、分子遗传学、甚至人类学、动物 学、植物学等学科,才可能事半功倍,相得益彰。从QTL到QTG,从QTG到QTN,每一进展都是富有挑战性的,衷心希 望不同学科的有志者能够加盟这一领域的研究。 参考文献 [1]Galton F Regression towards mediocrity in hereditary stat…[J]J of Anthropological Institute,1885,1 5:246--)63 [2]Pearson K Skew variation in homogeneous material【J]Philos Tram,1895,A:186--343. [3]Pearson K.Supplement to a memoir oll skew variation[J].Philos Trans,1901,Al 197--443. 万方数据