遗传HEREDITAS(Beng27(1):130~136,2005 技术与方法 植物数量性状遗传体系的分离分析方法研究 盖钧镒 (南京农业大学国家大豆改良中心,南京210095) 摘要:在传统的数量性状多基因遗传模型基础上提出主基因多基因遗传模型具普遍性,纯主基因或纯多基因遗 传模型只是其特例。由此初步建立了植物数量性状遗传体系分离分析方法。目前该方法可以检验2~3个主基因 的个别遗传效应、多基因整体的遗传效应和两者的遗传率。介绍这种分离分析方法的研究经过、主要进展及应用 效果,并以实例说明其分析步骤、方法和效果 关键词:植物数量性状:主基因多基因遗传模型:分离分析 中图分类号:Q75 文献标识码:A 文章编号:0253.9772(2005)01.0130.07 Segregation Analysis of Genetic System of Quantitative Traits in Plants GAlJumr Yi (National Cener for soybean mprovemen.Narjing Agricutural University.Nanjing 210095.China) Abstract:Based on the traditional polygene inheritance model of quantitative traits,the mixed major gene and poly gene inheritance model was raised and considered as the general model.while pure major gene or pure polygene im heritance model being ony the specific case of the general model.From the proposed theory,the segregation analysis effects of polygenes as well as their heritability values.The present paper imroduces the process of the establishment of the procedure,main achievements and application results.An example was given to illustrate the steps,methods and effectiveness of the procedure. traits of mixed maor gene and polygene analysi 在全世界范围影向最大的是玉米育种的发展特别 1研究经过 是杂种优势和亲本配合力的理论、遗传率和选择进 植物有种目标性状,包括产量、品质、生有 度的理论、群体收良与轮回洗择的理论对亲本的改 期、抗病虫性、耐逆性等大部分是数量性状。数量 良、选择效率的提高,以及有种策略的取舍都起了 性状的遗传研究对植物有种的理论、方法和策略至 重要的指导作用。1987年第二届国际数量遗传学 关重要。20世纪70年代是数量遗传学发展的盛 大会在美国北卡罗来纳州立大学举行,这次大会交 期。1976年在美国衣阿华州立大学、1978年在英 流数量遗传在动、植物各方面的理论和应用的研究 国剑桥大学分别召开第一届国际数量遗传学大会和 进展。90年代两个方面的研究进展吸引了作者的 生统遗传学大会。数量遗传学与植物育种相结合, 注意,一是Ekind&Cahaner于l986年提出了一 收稿日期:203-10-08:接国日期:20406- 金日因家自然科学基金重 和 nau.edu.cn 1994-2009China Academic Joural Electronie Publishing House.All rights reserved.http://www.cnki.net
遗 传 HEREDITAS( Beijing) 27 (1) :130~136 ,2005 技术与方法 收稿日期 :2003 10 08 ;修回日期 :2004 06 03 基金项目 :国家自然科学基金重大项目(9390013 和 30490250) [ Supported by NSFC Key Project (No . 9390013 and 30490250) ] 作者简介 :盖钧镒(1936 —) ,男 ,江苏无锡人 ,教授 ,院士 ,研究方向 :数量遗传和大豆遗传育种研究。Tel & Fax : 025284395405 , E2mail : sri @ njau. edu. cn 植物数量性状遗传体系的分离分析方法研究 盖钧镒 (南京农业大学国家大豆改良中心 ,南京 210095) 摘 要 :在传统的数量性状多基因遗传模型基础上提出主基因2多基因遗传模型具普遍性 ,纯主基因或纯多基因遗 传模型只是其特例。由此初步建立了植物数量性状遗传体系分离分析方法。目前该方法可以检验 2~3 个主基因 的个别遗传效应、多基因整体的遗传效应和两者的遗传率。介绍这种分离分析方法的研究经过、主要进展及应用 效果 ,并以实例说明其分析步骤、方法和效果。 关键词 :植物数量性状 ;主基因2多基因遗传模型 ;分离分析 中图分类号 :Q75 文献标识码 :A 文章编号 :0253 - 9772 (2005) 01 - 0130 - 07 S e g r e g a ti o n Anal ysis of Ge ne ti c S yst e m of Qua ntit a ti v e Tr aits i n Pl a nts GAIJ un2Yi ( National Center for soybean Improvement , Nanjing Agricultural University , Nanjing 210095 , China) Abstr a c t :Ba sed on the traditional polygene inheritance model of quantitative traits , the mixed major gene and poly2 gene inheritance model wa s raised and considered a s the general model , while pure major gene or pure polygene in2 heritance model being only the specific ca se of the general model. From the proposed theory , the segregation analysis procedure wa s e stablished for studying the genetic system of quantitative traits of plants. At pre sent this procedure can be used to evaluate the genetic effects of individual major gene s (up to 2~3 major gene s) and the collective genetic effects of polygene s a s well a s their heritability value s. The pre sent paper introduce s the proce ss of the e stablishment of the procedure , main achievements and application re sults. An example wa s given to illustrate the step s , methods and effectivene ss of the procedure . Ke y w or ds :quantitative traits of plants; mixed major gene and polygene inheritance model ; segregation analysis 1 研究经过 植物育种目标性状 , 包括产量、品质、生育 期、抗病虫性、耐逆性等大部分是数量性状。数量 性状的遗传研究对植物育种的理论、方法和策略至 关重要。20 世纪 70 年代是数量遗传学发展的盛 期。1976 年在美国衣阿华州立大学、1978 年在英 国剑桥大学分别召开第一届国际数量遗传学大会和 生统遗传学大会。数量遗传学与植物育种相结合 , 在全世界范围影响最大的是玉米育种的发展 , 特别 是杂种优势和亲本配合力的理论、遗传率和选择进 度的理论、群体改良与轮回选择的理论对亲本的改 良、选择效率的提高 , 以及育种策略的取舍都起了 重要的指导作用。1987 年第二届国际数量遗传学 大会在美国北卡罗来纳州立大学举行 , 这次大会交 流数量遗传在动、植物各方面的理论和应用的研究 进展。90 年代两个方面的研究进展吸引了作者的 注意 , 一是 Elkind & Cahaner 于 1986 年提出了一
1期 盖钧镒等:植物数量性状遗传体系的分离分析方法研究 131 个单基因与多基因的遗传模型,另一是数量性状基 性状遗传体系分离分析后Bergerson教授提出拟将 因可以用分子标记得到检测。这启发作者对数量性 她的拟南芥试实数据用分离分析法分析以与其Q 状遗传体系的认识,从单纯微效多基因改变为主基 标记结果相对照。这一提议启示我们进一步研究分 因多基因遗传体系 离分析与标记方法间的关系及结果的可比性。目 1993年国内莫惠栋开始报道了“质量数量性 前在大豆棉花、玉米的一些工作中体现了所获结 状”的遗传分析,显然这是指性状的遗传基础为主基 果的相对一致性,条件是必须控制好群体的代表性 因和多基因共同控制的一类数量性状,因为性状本 和试验的偏差与误差。 身不可能同时用属性描述和数量描述。这类研究结 果推动了作者在他们的基础上组织研究生从推演和 2 主要研究结果 应用两方面探索。1996年初步完成了这项探索。 2.1在前人关于数量性状存在单基因与多基因遗 王建康在图形分析基础上建立了单个分离世代分析 传模型的基础上,归纳、提出植物数量性状的泛主基 方法的原则和步骤12],提出了由确定成分分布裁 因多基因遗传理论,即数量性状可以由效应大小不 再确定遗传模型的二步分析法,所研究的群体包括 等的多对基因控制,大者表现为可个别检测的主基 F223B1+B2,进一步还提出了、P2F2 因,小者表现为难以在实验条件下个别检测的微效 5世代和P1、P2、F1、F2、B、B26世代的联合分析 基因主基因与名基因的风分是相对的依式实条件 法),世代联合分析法为直接确定遗传模型的 一步 和实验精确性而转移,在一种环境下表现为主基因 法。所考虑的责传模型包括有一对主基因、二对主 在另一种条件下可表现为微效基因,在精确实验条 基因、多基因和一对主基因加多基因4类。根据算 件下表现为主基因在误差干扰下表现不出主基因 法程序还编制了计算软件,以供选用。多位研究生 特点而归为微效多基因,因而数量性状由主基因与 将这套方法应用于学位论文增添了许多有意义的 名基因共同控制是数量性状遗传的基本模型或普调 遗传信息。进一步便发现 一对主基因加多基因的遗 模型,而纯主基因或纯多基因的遗传模型只是其特 传模型不敖应用,亟须在主基因数方面扩展。章元 例。以此理论为依据,在导出的分离分析方法中穷 期作了多方面的发展,包括将DM算法改进为EC 举出所有可能模型与试验数据作配合,从中挑选出 算法),将单个分离世代分析的两步法改为一步 最佳最适模型并估计其相应的遗传参数 法增加了DH群体和RL样体,将遗传模型扩展到 2,2在汲取前人知识积累的基础上建立了数量性 两对主基因加多基因,在RL群体还扩展到3对主 状主基因多基因遗传分离分析的基本体系,包括以 基因加多基因,为克服数量性状误差大精确性低而 下5个主要环节 发展了P1、P2FF23B12和B26家系多世代有重 (1)分离代的分布由若干个主基因型分布温 复实验的分析方法,进一步重新按新旧遗传模型编 合组成,每个主基因型的分布为受多基因和环境修 写了计算程序和软件,~8)。模型扩展以后,适用 饰的正态分布因而分离世代的分布为若干个正态 范围更加广泛,进 一步得到国内学者和研究生们的 分布的混合分布 应用。鉴于论文受版面限制,不可能将公式推导详 (2)建立一个或多个分离世代联合的各种可能 细列出,为将此研究作一完整介绍,把全部研究成果 遗传模型条件下的似然函数,似然函数中包含有各 写成《植物数量性状遗传体系》专门著作由科学出版 个成分分布的频率、平均数和方差,这些是有待根 社于2003年1月出版11。 据试验数据作出估计的分布参数。已推导得角解出这 在作者致力于以分离分析遗传实验为手段的数 些待估分布参数的遗传模型有7类,即一对主基因 量基因研究时,QL分子标记的研究迅速发展。以 (A)、2对主基因(B)、多基因(C)、一对主基因 往因为实验数据误差控制不力而使许多遗传有种 加多基因(D)、2对主基因加多基因(E)、3对主 作者对Q卫标记疑虑重重的情况已根本改变。广 基因(、3对主基因加多基因(G,每类模型中 大遗传有种工作者诱过那些过眼烟云的工作看到了 又按分离世代类型和主基因及多基因的加、显、上 分子标记的真正潜力。1999年作者应芝加哥大学 位性效应的有无、相对大小而进一步分为若干个模 龙漫远教授邀请在该校S.Wright实验室报告数量 型(表1、表2)。 194-2009China Academic Joua Eleetronie Publishing House.All rights reserved. http://www.cnki.net
个单基因与多基因的遗传模型 , 另一是数量性状基 因可以用分子标记得到检测。这启发作者对数量性 状遗传体系的认识 , 从单纯微效多基因改变为主基 因2多基因遗传体系。 1993 年国内莫惠栋开始报道了“质量2数量性 状”的遗传分析 ,显然这是指性状的遗传基础为主基 因和多基因共同控制的一类数量性状 ,因为性状本 身不可能同时用属性描述和数量描述。这类研究结 果推动了作者在他们的基础上组织研究生从推演和 应用两方面探索。1996 年初步完成了这项探索。 王建康在图形分析基础上建立了单个分离世代分析 方法的原则和步骤[1 ,2 ] ,提出了由确定成分分布数 再确定遗传模型的二步分析法 ,所研究的群体包括 F2 、F2∶3、B1 + B2 ,进一步还提出了 P1 、P2 、F1 、F2 、F2∶3 5 世代和 P1 、P2、F1 、F2 、B1、B2 6 世代的联合分析 法[3 ] ,世代联合分析法为直接确定遗传模型的一步 法。所考虑的遗传模型包括有一对主基因、二对主 基因、多基因和一对主基因加多基因 4 类。根据算 法程序还编制了计算软件 ,以供选用。多位研究生 将这套方法应用于学位论文 ,增添了许多有意义的 遗传信息。进一步便发现一对主基因加多基因的遗 传模型不敷应用 ,亟须在主基因数方面扩展。章元 明作了多方面的发展 ,包括将 EM 算法改进为 IECM 算法[3 ] ,将单个分离世代分析的两步法改为一步 法 ,增加了 DH群体和 RIL 群体 ,将遗传模型扩展到 两对主基因加多基因 ,在 RIL 群体还扩展到 3 对主 基因加多基因 ,为克服数量性状误差大精确性低而 发展了 P1、P2、F1 、F2∶3、B1∶2和 B2∶26 家系多世代有重 复实验的分析方法 ,进一步重新按新旧遗传模型编 写了计算程序和软件[1 , 4~8 ] 。模型扩展以后 ,适用 范围更加广泛 ,进一步得到国内学者和研究生们的 应用。鉴于论文受版面限制 ,不可能将公式推导详 细列出 ,为将此研究作一完整介绍 ,把全部研究成果 写成《植物数量性状遗传体系》专门著作由科学出版 社于 2003 年 1 月出版[1 ] 。 在作者致力于以分离分析遗传实验为手段的数 量基因研究时 ,QTL 分子标记的研究迅速发展。以 往因为实验数据误差控制不力而使许多遗传育种工 作者对 QTL 标记疑虑重重的情况已根本改变。广 大遗传育种工作者透过那些过眼烟云的工作看到了 分子标记的真正潜力。1999 年作者应芝加哥大学 龙漫远教授邀请在该校 S. Wright 实验室报告数量 性状遗传体系分离分析后 ,Bergerson 教授提出拟将 她的拟南芥试实数据用分离分析法分析以与其 QTL 标记结果相对照。这一提议启示我们进一步研究分 离分析与标记方法间的关系及结果的可比性。目 前 ,在大豆、棉花、玉米的一些工作中体现了所获结 果的相对一致性 ,条件是必须控制好群体的代表性 和试验的偏差与误差。 2 主要研究结果 211 在前人关于数量性状存在单基因与多基因遗 传模型的基础上 ,归纳、提出植物数量性状的泛主基 因2多基因遗传理论 ,即数量性状可以由效应大小不 等的多对基因控制 ,大者表现为可个别检测的主基 因 ,小者表现为难以在实验条件下个别检测的微效 基因 ,主基因与多基因的区分是相对的 ,依试实条件 和实验精确性而转移 ,在一种环境下表现为主基因 , 在另一种条件下可表现为微效基因 ,在精确实验条 件下表现为主基因 ,在误差干扰下表现不出主基因 特点而归为微效多基因 ,因而数量性状由主基因与 多基因共同控制是数量性状遗传的基本模型或普遍 模型 ,而纯主基因或纯多基因的遗传模型只是其特 例。以此理论为依据 ,在导出的分离分析方法中穷 举出所有可能模型与试验数据作配合 ,从中挑选出 最佳最适模型并估计其相应的遗传参数。 212 在汲取前人知识积累的基础上建立了数量性 状主基因2多基因遗传分离分析的基本体系 ,包括以 下 5 个主要环节 : (1) 分离世代的分布由若干个主基因型分布混 合组成 ,每个主基因型的分布为受多基因和环境修 饰的正态分布 ,因而分离世代的分布为若干个正态 分布的混合分布。 (2) 建立一个或多个分离世代联合的各种可能 遗传模型条件下的似然函数 , 似然函数中包含有各 个成分分布的频率、平均数和方差 , 这些是有待根 据试验数据作出估计的分布参数。已推导得解出这 些待估分布参数的遗传模型有 7 类 , 即一对主基因 (A) 、2 对主基因 (B) 、多基因 (C) 、一对主基因 加多基因 (D) 、2 对主基因加多基因 (E) 、3 对主 基因 (F) 、3 对主基因加多基因 ( G) , 每类模型中 又按分离世代类型和主基因及多基因的加、显、上 位性效应的有无、相对大小而进一步分为若干个模 型 (表 1、表 2) 。 1 期 盖钧镒等 :植物数量性状遗传体系的分离分析方法研究 131
132 遗传HEREDITAS(Beijing)200 27卷 表数量性状主基因+多基因混合遗传分离分析的遗传模型 Table 1 Genetic models in segregation analysis of inheritance of quantitative traits 模型代号Code of model 主因数目 主基因一阶传参发 多基因一阶遗传参 order genetic parameter of 1*order genetic 多基因不存在 多基因存在 No.major genes major gene parameter of polygene Without polygene With polygene 0 IdlIhl GI m.d,h .[J.Iq..I D m.d.h [d].Ih] m,d,(h=0 {d].[b] m,d,(h=d) [d].[h] D3 m,d.(h.d) [d].[h] 4 D4 (dl,[h],fil,(jl,(] E m.da.ds.ha.hs.i.jab,jta .I IdlIh] m,da.ds,he.hs d B2 m,d,d,(h。=h=0j I dlIh B-3 m.d(=d.-d) Id.b 4 m,da(=ha),do(=h) Id].[h) B-5 E5 m.d(=d.h,d h) Id]Ih] 6 E6 表2DH或RL群体的数量性状主基因+多基因混合遗传分离分析的遗传模型 Table 2 Genetic models in segregation analysis of inheritance of quantitative traits for DH or RIL population 模型代号Code of model 主基因数目 一阶遗传参数 No.major genes 多基因不存在 多基因存在 1"order genetic parameter With polygene m,d 加性上位性Add epistasi m.d B--1 E- m,da ds B-I-2 E12 第加性Eal additive m,d(=d=dy) B--3 E1-3 显性上位Dom nan epistasis 隐性上位Recessive epistasis m.d,.d. B-5 E-5 累加作用Cumuative m,d(=da=ds)i B--6 E1-6 互补作用Comple mentary m.i B1-7 E1-7 重叠作用 m.i. B-1-8 m,i B-1- 加性-上位性Additive epistasi m.d..ds.de.i.i. m,da,do,.de G2 等性1)5 ual additive(1) m.d=d.=d=d. E3 G3 等加性(2)5(2 m.di=d=do.da=de F4 G4 注:两对主括因间无连镜时模型用B-X或E下X表示:否则用B2X或E上X表示,”包括加性和加性X加性 Note:B-I-Xor EI-X denotes model without linkage.while B-2-Xor E2-X denotes model with linkage.i includes additive and additive Xad ditive effects 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.ne
表 1 数量性状主基因 + 多基因混合遗传分离分析的遗传模型 Ta ble 1 Ge ne tic models in s egr e ga ti on a nalysis of inhe rit a nc e of qua ntit a ti ve tr aits 主基因数目 No . major genes 主基因一阶遗传参数 1 st order genetic parameter of major gene 多基因一阶遗传参数 1 st order genetic parameter of polygene 模型代号 Code of model 多基因不存在 Without polygene 多基因存在 With polygene 0 m [ d ] ,[ h] ,[ i] ,[ j] ,[ l] 2 C m [ d ] ,[ h] 2 C21 1 m , d , h [ d ] ,[ h] ,[ i] ,[ j] ,[ l] A21 D m , d , h [ d ] ,[ h] A21 D21 m , d ,( h = 0) [ d ] ,[ h] A22 D22 m , d ,( h = d) [ d ] ,[ h] A23 D23 m , d ,( h = - d) [ d ] ,[ h] A24 D24 2 m , da , db , ha , hb , i , j ab , jba , l [ d ] ,[ h] ,[ i] ,[ j] ,[ l] B21 E m , da , db , ha , hb , i , j ab , jba , l [ d ] ,[ h] B21 E21 m , da , db , ha , hb [ d ] ,[ h] B22 E22 m , da , db ,( ha = hb = 0) [ d ] ,[ h] B23 E23 m , d( = da , = db ) [ d ] ,[ h] B24 E24 m , da ( = ha ) , db ( = hb ) [ d ] ,[ h] B25 E25 m , d( = da = ha = db = hb ) [ d ] ,[ h] B26 E26 表 2 DH 或 RIL 群体的数量性状主基因 + 多基因混合遗传分离分析的遗传模型 Ta ble 2 Ge ne tic models in s egr e ga ti on a nalysis of inhe rit a nc e of qua ntit a ti ve tr aits f or DH or RIL p op ula ti on 主基因数目 No . major genes 一阶遗传参数 1 st order genetic parameter 模型代号 Code of model 多基因不存在 Without polygene 多基因存在 With polygene 1 m , d A21 D21 2 加性2上位性 Additive2epistasis m , da , db , i B2121 E2121 加性 Additive m , da , db B2122 E2122 等加性 Equal additive m , d ( = da = db ) B2123 E2123 显性上位 Dominant epistasis m , da , db B2124 E2124 隐性上位 Recessive epistasis m , da , db B2125 E2125 累加作用 Cumulative m , d ( = da = db ) , i B2126 E2126 互补作用 Complementary m , i 3 B2127 E2127 重叠作用 Duplicate m , i 3 B2128 E2128 抑制作用 Inhibitory m , i 3 B2129 E2129 3 加性2上位性 Additive epistasis m , da , db , dc , i ab , i ac , ibc , i abc F21 G21 加性 Additive m , da , db , dc F22 G22 等加性(1) Equal additive (1) m , d = da = db = dc F23 G23 等加性(2) Equal additive (2) m , d1 = da = db , d2 = dc F24 G24 注 :两对主基因间无连锁时模型用 B212X或 E212X表示 ;否则用 B222X或 E222X表示。i 3包括加性和加性 ×加性。 Note : B212X or E212X denotes model without linkage , while B222X or E222X denotes model with linkage . i 3 includes additive and additive ×ad2 ditive effects. 132 遗 传 HEREDITAS ( Beijing) 2005 27 卷
1期 盖钧镒等植物数量性状遗传体系的分离分析方法研究 133 (3)采用DM算法估计混合分布中各成分分布 表3植物数量性状主基因+多基因混合 的分布数。为解决计算中有效收敛的问题,提出采 遗传分离分析的试验世代类型 用迭代的E(期望)步骤和CM(条件极大化)步骤的 Table 3 Types and combinations of hybrid 计算方法(ECM法)。其中E步骤与M算法的E generations used in segregation analysis 步骤相同,M步骤由2~3个CM步骤组成,CM是 分离分析方法 实验世代类型 在周定名基因方差组分和环境方差的条件下用迭代 方法求分布平均数的条件极大似然估计,C是在 院适分分布数的个别 固定环境方差和CM估计结果条件下用迭代方法 B nt distnbutions 求多基因方差组分的条件极大似然估计,Q4是在 52a for singe segregation generation 固定CM,和CM,估计结果条件下用迭代方法求环 墙方差的极大似处估计。经反复代直到收敛到 餐德榄型的个别世马, P .P2 F1.F2 相对稳定一致的计算结果。 r singe seg- Pi.P:.F1.F23 p,P,DH或RL (4)对实得的一组实验数据进行各种可能遗传 多个分高世代联合的分离分P,F,P2BBF(易条交的作物 模型的极大似然分析,采用AIC准则(Akaike'sfo 析法 mation Criterion).似然比检验以及一组适合性测验 alysis for 验误 个统计量U、、U、nW和D)从各种可能模型中 应用效果 选出最佳最适模型及其相应的一组成分分布参数。 3 (5)按入选的遗传模型及其相应的遗传参数与 3.1综合情况 成分分布参数间的关系式由入洗模型的成分分布 本方法自1996年起迄今共有19位本组的博硕 参数通过最小二乘法估计相应的遗传参数,包括各 土生用于他们学位论文研究工作依次获得了如下结 个主基因的加、显、上位性效应,多基因集体的加、 果山:杂交水稻抗白叶枯病的遗传、栽培稻广亲和性 品、上位性效应、主基因遗传率、多基因遗传率等。 的遗传、大豆对食叶性害虫抗性的遗传、大豆茎生长 除以上5个主要环节外,在1对主基因+多基 习性的遗传、大豆对SMW数量抗性的遗传、大豆豆 因遗传模型时可以通过贝叶斯后验概率估计,对个 产量的责传等均表明受】对主基因加多基因共同招 体作主基因型归类。对单个分离世代还做了分布图 制:大豆对斜纹夜蛾抗性植株反应的遗传、大豆对斜 形分析,可从实验数据的表型分布对遗传模型作出 纹夜蛾抗性虫体反应(抗生性)的遗传、油菜芥酸含量 大致估计。 的遗传等受2对独立主基因加多基因的共同控制:大 2.3 建立了以下单个分离世代及其亲本的分离分 豆株高、百粒重每节荚数、油脂含量的遗传分别由 析整套公式和计算方法,包括:1)F2世代,2)回交B 对连锁的主基因加多基因共可控制:大豆开花期、大 +B2世代,3)F23世代,4)回交衍生家系B12+B2: 豆全生育期、大豆节数的遗传分别由3对主基因加多 世代,5)DH或RL群体(表3)。 基因共同控制。采用这套分离分析方法解决了水稻 2.4建立了P1D2F12235世代联合分析的整套 大豆、油菜、玉米等作物重要数最性状的贵传分析 公式和计算方法:建立了B,BB1和B26世代 题,改进了遗传分析的效果,提取了新的遗传信息 联合分析的整套公式和计算方法;建立了P、P2、F、 以下列出部分主宫原有分析信息的事例门 3B12和B26家系世代联合分析(包括有重复实验) (1)对水稻“南京6号广丛”株高遗传研究,原 的整套公式和计算方法(表3)。 采用高株、透株定性的孟德尔分析方法为一对主基 2.5应用Turbo C++语言编制了以上所有单个 因控制,经本研究P,、P2F,F2B1B26世代联合分 分离世代、多个分离世代联合分析方法的软件系 离分析结果发现有一对效应大的主基因,一对效应 统。 较小的主基因和多基因共同控制,在F,时主基因遗 本方法将孟德尔关于质量性状分离分析方法延 传率为94.45%,多基因遗传率为5.31%,两者合计 伸到数量性状的分离分析体系。 99.760%. 1994 09 China cademic Journal Electronie Publishing House .All rights reserved.http://www.cnki.net
(3) 采用 EM 算法估计混合分布中各成分分布 的分布数。为解决计算中有效收敛的问题 ,提出采 用迭代的 E(期望) 步骤和 CM(条件极大化) 步骤的 计算方法 (IECM 法) 。其中 E 步骤与 EM 算法的 E 步骤相同 ,CM 步骤由 2~3 个 CM 步骤组成 ,CM1 是 在固定多基因方差组分和环境方差的条件下用迭代 方法求分布平均数的条件极大似然估计 ,CM2 是在 固定环境方差和 CM1 估计结果条件下用迭代方法 求多基因方差组分的条件极大似然估计 ,CM3 是在 固定 CM1 和 CM2 估计结果条件下用迭代方法求环 境方差的极大似然估计。经反复迭代 ,直到收敛到 相对稳定一致的计算结果。 (4) 对实得的一组实验数据进行各种可能遗传 模型的极大似然分析 ,采用 AIC 准则(Akaike’s Infor2 mation Criterion) ,似然比检验以及一组适合性测验 (均匀性检验、Smirnov 检验和 Kolmogorov 检验的 5 个统计量 U 2 1、U 2 2、U 2 3、nW 2 和 Dn ) 从各种可能模型中 选出最佳最适模型及其相应的一组成分分布参数。 (5) 按入选的遗传模型及其相应的遗传参数与 成分分布参数间的关系式 ,由入选模型的成分分布 参数通过最小二乘法估计相应的遗传参数 ,包括各 个主基因的加、显、上位性效应、多基因集体的加、 显、上位性效应、主基因遗传率、多基因遗传率等。 除以上 5 个主要环节外 ,在 1 对主基因 + 多基 因遗传模型时可以通过贝叶斯后验概率估计 ,对个 体作主基因型归类。对单个分离世代还做了分布图 形分析 ,可从实验数据的表型分布对遗传模型作出 大致估计。 213 建立了以下单个分离世代及其亲本的分离分 析整套公式和计算方法 ,包括 :1) F2 世代 ,2) 回交 B1 +B2 世代 ,3) F2∶3世代 ,4) 回交衍生家系 B1∶2 + B2∶2 世代 ,5) DH或 RIL 群体(表 3) 。 214 建立了 P1、P2、F1、F2、F2 :3 5 世代联合分析的整套 公式和计算方法;建立了 P1、P2、F1、F2、B1 和 B2 6 世代 联合分析的整套公式和计算方法;建立了 P1、P2、F1、 F2∶3、B1∶2和B2∶2 6 家系世代联合分析(包括有重复实验) 的整套公式和计算方法(表 3) 。 215 应用 Turbo C + + 语言编制了以上所有单个 分离世代、多个分离世代联合分析方法的软件系 统。 本方法将孟德尔关于质量性状分离分析方法延 伸到数量性状的分离分析体系。 表 3 植物数量性状主基因 + 多基因混合 遗传分离分析的试验世代类型 Ta ble 3 Typ e s a nd c ombina ti ons of hybri d ge ne r a ti ons us e d in s egr e ga ti on a nalysis 分离分析方法 Method 实验世代类型 Generation 加入不分离世代后 With non2segregating generation 确定最适成分分布数的个别 世代分离分析法 No. of component distributions for single segregation generation F2 B1 &B2 F2∶3 2 2 2 确定最优遗传模型的个别世 代分离分析法 Optimum model for single seg2 regating generation F2 B1 & B2 F2∶3 B1∶2 & B2∶2 DH或 RIL P1 ,P2 ,F1 ,F2 2 P1 ,P2 ,F1 ,F2∶3 2 P1 ,P2 ,DH或 RIL 多个分离世代联合的分离分 析法 Segregation analysisfor multiple generations P1 ,F1 ,P2 ,B1 ,B2 ,F2 (易杂交的作物) P1 ,F1 ,P2 ,F2 ,F2∶3 (杂交困难的作物) P1 ,F1 , P2 ,B1∶2 ,B2∶2 , F2∶3 (控制实验误 差) 3 应用效果 311 综合情况 本方法自 1996 年起迄今共有 19 位本组的博、硕 士生用于他们学位论文研究工作 ,依次获得了如下结 果[1 ] :杂交水稻抗白叶枯病的遗传、栽培稻广亲和性 的遗传、大豆对食叶性害虫抗性的遗传、大豆茎生长 习性的遗传、大豆对 SMV 数量抗性的遗传、大豆豆腐 产量的遗传等均表明受 1 对主基因加多基因共同控 制;大豆对斜纹夜蛾抗性植株反应的遗传、大豆对斜 纹夜蛾抗性虫体反应(抗生性)的遗传、油菜芥酸含量 的遗传等受 2 对独立主基因加多基因的共同控制;大 豆株高、百粒重、每节荚数、油脂含量的遗传分别由 2 对连锁的主基因加多基因共同控制;大豆开花期、大 豆全生育期、大豆节数的遗传分别由 3 对主基因加多 基因共同控制。采用这套分离分析方法解决了水稻、 大豆、油菜、玉米等作物重要数量性状的遗传分析问 题 ,改进了遗传分析的效果 ,提取了新的遗传信息。 以下列出部分丰富原有分析信息的事例[1 ] 。 (1) 对水稻“南京 6 号 ×广丛”株高遗传研究 ,原 采用高株、矮株定性的孟德尔分析方法为一对主基 因控制 ,经本研究 P1 、P2 、F1 、F2 、B1 、B2 6 世代联合分 离分析结果发现有一对效应大的主基因 ,一对效应 较小的主基因和多基因共同控制 ,在 F2 时主基因遗 传率为 94145 % ,多基因遗传率为 5131 % ,两者合计 99176 %。 1 期 盖钧镒等 :植物数量性状遗传体系的分离分析方法研究 133
134 遗传HEREDITAS(Beijing)200 27卷 (2)对大豆抗豆秆黑潜蝇的遗传研究,原采用抗 步还研究了分离分析方法的测验能力问题2。 感定性的孟德尔分析方法为一对显性主基因控制经 3.2应用实例 PP235世代联合分离分析结果发现有一 为说明分析方法的全过程,以下列出一个实际 对主基因,并有多基因共同控制,主基因遗传率在五 实验分析的步骤和结果】 为44.2%72.9%,多基因遗传率0~13%。 ()实验数据以南京农业大学朱立宏教授提 (3)对油菜芥酸含量的遗传研究,以往按孟德尔 供的南京6号(P)广丛(P2)杂交组合6世代的株 分析方法结果为2对主基因控制,经P1、P2、F 高数据为例,其次数分布如表4。最初按孟德尔方 23B12B226家系世代联合分离分析,证实有2 法分析,认为高亲为显性,人工地在125cm(峰谷) 对主基因控制但一对效应较大另一对约为其1/2 处将个体归为二组B,归入显性组B2为11分离 主基因遗传率在F23为51.33%,同时还受多基因控 2呈3】分离,因而认为矮秆由1对隐性基因控 制,多基因遗传率为47.81% 制。这种人为划线分组方法不尽合理,因而采用主 近3年有30多位外单位研究者索要本方法分析 基因多基因模型分离分析法。 软件用于博、硕士学位论文及博士后研究,内容涉及 (2)模型配合(对数似然函数值和AC值)对 不结球白菜维生素C和可溶性糖含量、小麦赤需酸不 以上数据按5类24种模型进行极大对数似然估计 敏感性、云南稻种小白谷耐冷性指标性状、小麦品种 的配合,采用ECM算法得相应的极大对数似然函 纹枯病抗性玉米雄穗性状与产量性状、花生种子抗 数值和AC值如表5。巳2模型(两对主基因+多基 黄曲霉侵染性状棉花品质纤维性状等的主基因与多 因的混合遗传模型)具有最小AC值,为可能最佳 基因遗传分析II。Wang,Podhch,Cooper等进 模型。与之相近的还有D2、D1D、E1等。 表4水稻南京6号(P)广丛(P)的6世代株高次数分布 Table 4 Distributions of plant height of six generations of the rice cross studied 80-859095-100105110115120125-130135-140145150-155-160-165-170175-180-185 32 2 317 8 1111318 5 20142413123 110182718112 131419221141 5 915131311141482994130698572502362 表了用IECM算法估计各种遗传模型的极大对数似然函数值和AIC值 Table 5 The values of maximum likelihood function and values of AIC obtained from IECM algorithm 模型 极大对数似然值 积型 极大对数似然值 AIC AIC d Model aamnikelihood 6523.8 ·3185.9 6395.90 3460.4 926.9 10 324g 6469.6d 3433 .3381.1 113 6864.46 E2 .117.0 6166.13 34d40 600.13 E3 326.75 641.0 B-6 .3389.06 6784.12 E4 .3254.5 6525.03 .3287.47 6582.93 E5 .3195.23 6408.46 ,3290.6 6587.30 E6 3337.26 6690.51 1994-2009 China academic Journal electronie publishins House all rights reserved. http://www.cnki.ne
(2)对大豆抗豆秆黑潜蝇的遗传研究 ,原采用抗、 感定性的孟德尔分析方法为一对显性主基因控制 ,经 P1、P2、F1、F2、F2∶3 5 世代联合分离分析结果发现有一 对主基因 ,并有多基因共同控制 ,主基因遗传率在 F2 为 4412 %~7219 % ,多基因遗传率 0~13 %。 (3) 对油菜芥酸含量的遗传研究 ,以往按孟德尔 分析方法结果为 2 对主基因控制 ,经 P1 、P2 、F1 、 F2∶3、B1∶2 、B2∶2 6 家系世代联合分离分析 ,证实有 2 对主基因控制 ,但一对效应较大 ,另一对约为其1/ 2 , 主基因遗传率在 F2∶3为 51133 % ,同时还受多基因控 制 ,多基因遗传率为 47181 %。 近 3 年有 30 多位外单位研究者索要本方法分析 软件用于博、硕士学位论文及博士后研究 ,内容涉及 不结球白菜维生素 C和可溶性糖含量、小麦赤霉酸不 敏感性、云南稻种小白谷耐冷性指标性状、小麦品种 纹枯病抗性、玉米雄穗性状与产量性状、花生种子抗 黄曲霉侵染性状、棉花品质纤维性状等的主基因与多 基因遗传分析[9~11 ]。Wang , Podhch , Cooper 等进一 步还研究了分离分析方法的测验能力问题[12 ]。 312 应用实例 为说明分析方法的全过程 ,以下列出一个实际 实验分析的步骤和结果[1 ] 。 (1) 实验数据 以南京农业大学朱立宏教授提 供的南京 6 号(P1 ) ×广丛(P2 ) 杂交组合 6 世代的株 高数据为例 ,其次数分布如表 4。最初按孟德尔方 法分析 ,认为高亲为显性 ,人工地在 125 cm (峰谷) 处将个体归为二组 ,B1 归入显性组 ,B2 为 1∶1 分离 , F2 呈 3∶1 分离 ,因而认为矮秆由 1 对隐性基因控 制。这种人为划线分组方法不尽合理 ,因而采用主 基因2多基因模型分离分析法。 (2) 模型配合(对数似然函数值和 AIC 值) 对 以上数据按 5 类 24 种模型进行极大对数似然估计 的配合 ,采用 IECM 算法得相应的极大对数似然函 数值和 AIC 值如表 5。E22 模型(两对主基因 + 多基 因的混合遗传模型) 具有最小 AIC 值 ,为可能最佳 模型。与之相近的还有 D22、D21、D、E21 等。 表 4 水稻南京 6 号( P1 ) ×广丛( P2 ) 的 6 世代株高次数分布 Ta ble 4 Distri buti ons of pla nt height of six ge ne r a ti ons of t he ric e c r oss st udie d 80~ 85~ 90~ 95~ 100~ 105~ 110~ 115~ 120~ 125~ 130~ 135~ 140~ 145~ 150~ 155~ 160~ 165~ 170~ 175~ 180~ 185 P1 4 5 32 22 2 F1 3 17 8 4 P2 1 11 13 18 5 B1 20 14 24 13 12 3 B2 1 10 18 27 18 11 2 1 3 14 19 22 11 4 1 F2 5 9 15 13 13 11 14 14 8 2 9 9 41 30 69 85 72 50 23 6 2 表 5 用 IECM 算法估计各种遗传模型的极大对数似然函数值和 AIC 值 Ta ble 5 The value s of ma ximum likelihood f unc ti on a nd value s of AIC obt aine d fr om IECM al gorit hm 模型 Model 极大对数似然值 Maximum likelihood AIC 模型 Model 极大对数似然值 Maximum likelihood AIC A21 - 3257194 6523187 D - 3185195 6395190 A22 - 3460148 6926197 D21 - 3185130 6388160 A23 - 3300169 6607137 D22 - 3185130 6386160 A24 - 3631170 7269140 D23 - 3264198 6545197 B21 - 3224181 6469163 D24 - 3422124 6860148 B22 - 3225194 6463188 E - 3185193 6407187 B23 - 3381116 6770132 E21 - 3183180 6397160 B24 - 3422123 6864146 E22 - 3172106 6366112 B25 - 3444106 6902112 E23 - 3226175 6471150 B26 - 3389106 6784112 E24 - 3254151 6525103 C - 3287147 6582193 E25 - 3195123 6408146 C21 - 3290165 6587130 E26 - 3337126 6690151 134 遗 传 HEREDITAS ( Beijing) 2005 27 卷