第29卷第6期 作物学报 Vol 29,No 6 2003年11月884-891页 ACTA AGRONOMICA SINICA p884-891ow.,203 作物品种区域试验中品种均值估计的模型和方法 一算术平均值、加权最小二乘估值和BLUP的比较 张群远孔繁玲,·杨付新 (1中国农业大学植物遗传育种系,北京10094:2中国农业科学院棉花研究所,河南安阳455112) 摘要针对作物区域试验中的品种均值估计问题,根据混合线性模型的一般原理,总结和提出多种加权最小二乘估计 (WSE)和最佳线性无偏预测(BLP)的方法,推导了这些方法的平衡数据计算简式:同时,利用14套2年多点的棉花区 试资料和一套4年多点的棉花品 试验对这些方法的预测效果进行验证比较。结果表明 ,与算术平均值相比,以环境内 误差方差倒数加权的WSE估值的预测精度(包括预测差的大小和品种排名的一致性)明显不同,但其高低因数据而异 其他WLSE估值以及BHUP的预测结果差别不大,和算术平均值以及相互间的相关系数和秩相关系数均在0,93以上。 关健词区域试验:算术平均值:加权最小二乘估计:P 中图分类号:0212 文南献标识马:A Models and Methods for Estimating Variety Means in Regional Crop Trials -Comparisons of Arithmetic Mean,Weighted Least Squares Estimates and BLUPs ZHANG Qun-Yuan'KONG Fan-Ling'YANG Fu-Xin g,Ha455112,ia) Abstract Based on the mixed linear model,several weighted least squares estimates(WISEs)and best linear unbiase predictors(BLUPs)were summarized and proposed for estimating variety means in regional crop trials,and the correspond- ing calculating fomle were derived and presented for balanced data.The daa of 14 oundsof2-year-muli-loction gional cotton trials and a 4-year-multi-location cotton trial were used to compare the predictive efficiencies of arithmeti means,WISEs and BLUPs.The results showed that the predictive differences and variety ranks of the WISE weighted by within env ents(WISEe)differed significantly from that of the arithmetic eans,but the predictive accuracy of WISEe increased or decreased iregularly in different trials:the predictive results of other WLSEs and BLUPs were similar to that of the arithmetic means,the correlation coefficients and rank correlation coefficients betweer them were all above 0.93 Key words Regional trial:Arithmetic mean:Weighted least squares estimate:BLUP:Prediction 作物品种区域试验(简称区试)中,品种×环境 用我国区试数据,对品种×环境组合均值的几种主 组合均值(即某品种在某参试环境中的性状均值)和 要估计方法作过比文2知,本文则专门深讨区试中品 品种均值(即某品种在所有参试环境中的性状均值) 种均值估计的模型和方法问题,并利用我国区试数 是两种最基本的统计数,是分析和评价品种的主要 据和专设的多年多点试验数据对名种方法的精度作 依据。通常,它们都由算术平均的方法获得,但算术 比较,旨在为区试中品种均值估计方法的选择或改 平均值不一定是最精确的估值2]。张群远等曾利 讲作探素。 基金项目:家自然科学基金资助项目(307043) 作者荷介:张群远(1970: ,男,云南宜成人,博士,副教授,研究方向:生物统计学和统计遗传学。·通讯作者:孔繁玲,女,教授,博士生导
!"#$%&,’"$( ))$ **+ , *&- ’".$,%//0 作 物 学 报 1231 1456’67821 98’821 第 %& 卷 第 ( 期 %//0 年 -- 月 **+ , *&- !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 页 作物品种区域试验中品种均值估计的模型和方法 ———算术平均值、加权最小二乘估值和 !"#$ 的比较 张群远- 孔繁玲-," 杨付新% (-中国农业大学植物遗传育种系,北京 -///&+;%中国农业科学院棉花研究所,河南安阳 +::--%) 摘 要 针对作物区域试验中的品种均值估计问题,根据混合线性模型的一般原理,总结和提出多种加权最小二乘估计 (;<9=)和最佳线性无偏预测(><?@)的方法,推导了这些方法的平衡数据计算简式;同时,利用 -+ 套 % 年多点的棉花区 试资料和一套 + 年多点的棉花品种试验对这些方法的预测效果进行验证比较。结果表明,与算术平均值相比,以环境内 误差方差倒数加权的 ;<9= 估值的预测精度(包括预测差的大小和品种排名的一致性)明显不同,但其高低因数据而异; 其他 ;<9= 估值以及 ><?@ 的预测结果差别不大,和算术平均值以及相互间的相关系数和秩相关系数均在 /A&0 以上。# 关键词 区域试验;算术平均值;加权最小二乘估计;><?@ 中图分类号:6%-% 文献标识码:1 %&’()* +,’ %(-.&’* /&0 1*-23+-2,4 5+02(-6 %(+,* 2, 7(42&,+) 80&9 :02+)* ———8&39+02*&,* &/ ;02-.3(-2< %(+,,=(24.-(’ "(+*- >?@+0(* 1*-23+-(* +,’ !"#$* BC1’4 DEFGHEIF - J6’4 KIFG<LFM - H1’4 KEGNLF % (- !"#$%&’"(& )* +,$(& -"("&./0 $(1 2%""1.(3,45.($ 63%./7,&7%$, 8(.9"%0.&:,2".;.(3 -///&+;% <(0&.&7&" )* 4)&&)(,45.("0" 6/$1"’: )* 63%./7,&7%$, =/."(/",6(> :$(3,?"($( +::--%,45.($) ;A*-0+<- >IOPQ "F RSP TLUPQ #LFPIV T"QP#,OP.PVI# WPLMSRPQ #PIOR OXEIVPO PORLTIRP(O ;<9=O)IFQ YPOR #LFPIV EFYLIOPQ )VPQLZR"V(O ><?@O)WPVP OETTIVL[PQ IFQ )V")"OPQ \"V PORLTIRLFM .IVLPR] TPIFO LF VPML"FI# ZV") RVLI#O,IFQ RSP Z"VVPO)"FQG LFM ZI#ZE#IRLFM \"VTE#IP WPVP QPVL.PQ IFQ )VPOPFRPQ \"V YI#IFZPQ QIRIA 3SP QIRI "\ -+ V"EFQO "\ %G]PIVGTE#RLG#"ZIRL"F VPG ML"FI# Z"RR"F RVLI#O IFQ I +G]PIVGTE#RLG#"ZIRL"F Z"RR"F RVLI# WPVP EOPQ R" Z"T)IVP RSP )VPQLZRL.P P\\LZLPFZLPO "\ IVLRSTPRLZ TPIFO,;<9=O IFQ ><?@OA 3SP VPOE#RO OS"WPQ RSIR RSP )VPQLZRL.P QL\\PVPFZPO IFQ .IVLPR] VIF^O "\ RSP ;<9= WPLMSRPQ Y] RSP VPZL)V"ZI#O "\ PVV"V .IVLIFZPO WLRSLF PF.LV"FTPFRO(;<9=P)QL\\PVPQ OLMFL\LZIFR#] \V"T RSIR "\ RSP IVLRSTPRLZ TPIFO,YER RSP )VPQLZRL.P IZZEVIZ] "\ ;<9=P LFZVPIOPQ "V QPZVPIOPQ LVVPME#IV#] LF QL\\PVPFR RVLI#O;RSP )VPQLZRL.P VPOE#RO "\ "RSPV ;<9=O IFQ ><?@O WPVP OLTL#IV R" RSIR "\ RSP IVLRSTPRLZ TPIFO,RSP Z"VVP#IRL"F Z"P\\LZLPFRO IFQ VIF^ Z"VVP#IRL"F Z"P\\LZLPFRO YPRWPPF RSPT WPVP I## IY".P /A&0A B(6 C&0’* 5PML"FI# RVLI#;1VLRSTPRLZ TPIF;;PLMSRPQ #PIOR OXEIVPO PORLTIRP;><?@;@VPQLZRL"F 作物品种区域试验(简称区试)中,品种 _ 环境 组合均值(即某品种在某参试环境中的性状均值)和 品种均值(即某品种在所有参试环境中的性状均值) 是两种最基本的统计数,是分析和评价品种的主要 依据。通常,它们都由算术平均的方法获得,但算术 平均值不一定是最精确的估值[-,%] 。张群远等曾利 用我国区试数据,对品种 _ 环境组合均值的几种主 要估计方法作过比较[%] ,本文则专门探讨区试中品 种均值估计的模型和方法问题,并利用我国区试数 据和专设的多年多点试验数据对各种方法的精度作 比较,旨在为区试中品种均值估计方法的选择或改 进作探索。 #基金项目:国家自然科学基金资助项目(0//‘/+00)。 作者简介:张群远(-&‘/ a ),男,云南宣威人,博士,副教授,研究方向:生物统计学和统计遗传学。" 通讯作者:孔繁玲,女,教授,博士生导 师,3P#:(%*&00&‘。 5PZPL.PQ万方数据 (收稿日期):%//%G/&G/:,1ZZP)RPQ(接受日期):%//%G--G-%A
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 885 1材料与方法 阵:©为误差向量,通常假设其均值为0,具有方差协 差阵R:I为单位矩阵。通过广义最小二乘方程组 1.1品种均值估计的模型和方法 和混合模型方程组可获得固定效应b的最佳线性 作物品种区试是在多环境中实施同一套试验方 无偏估计(best linear unbiased estimate,BLUE)以及随 案,其品种均值的估计属于多套试验的合并分析问 机效应u的最佳线性无偏预测值(best linear unbi- 颗。以往的研究或应用中,除算术平均外,品种均伯 ased prediction BLUP- 估计的其他一些方法基本上是基于加权平均的思 估计品种均值,就是要估计(1)式中的总均值: 想,所采用的权”有误差方差倒数、环境内剩余方差 与品种效应g:之和。以通常为固定效应,包含在 倒数、环境内遗传力、与参照环境的距离的倒数 (2)式的b中::若为固定效应,也包含在b中,若 等)。这些加权方法是经验性的,缺乏完整的统 为随机效应,则包含在“中,所以品种均值的估计 计学依据,为此,本文利用混合线性模型的理论来统 受方差协差阵G和R的影响。G和R的构成是由 一阐述品种均值估计方法。 不同效应的固定或随机以及误差方差的同质或异质 区试中第:个品种在第个环境中的第k次重 的假设来决定的,不同假设下G和R的组成不同 复观测值的线性模型可写为: 由此也就产生了品种均值的不同估计方法。品种效 送=+g:+e;+0+e话 (1) 应固定假设下得到的品种均值为BUE:品种效应随 为观测值的总体均值:g:为第个品种的效 机假设下得到的品种均值为BUP。 应:为第j个环境的效应:0,为第i个品种与第j 考虑到计算和应用的方便,本文附录中对)个 个环境的基因型×环境(GE)互作效应:E为第i个 品种、个环境的平衡数据,以次重复均值为基 品种在第个环境中的第k次重复观测值的误差。 础,推导了混合模型的几种主要假设下品种均值的 上式也可表达为更为一般的混合线性模型6的矩 计算简式。将附录中各公式的误差方差(。2和。) 阵形式: 替换成单个观测值的误差方差除以重复数,的形式 Y Xb Zu le (/r和)/r),即可得到品种均值的各种估算公 Y为观测值向量:b为固定效应向量:X为固定 式,列于表1。表中:均为固定效应,误差均为随材 效应的系数矩阵:为随机效应向量,通常假设其均 效应:表示环境j内的误差方差:误差同质(或 值为0,具有方差协差阵G:Z为随机效应的系数矩 异质)指各环境中的试验误差方差同质(或异质):剩 表1混合线性模型几种主要假设下品种均值估值的名称及平衡数据计算简式 Table 1 Calculating formule for balanced data under several main of mixed linear model 模型假设 估值类型 品种的均值计算式 Types ofe 品种和环境圆定,误差同质 最小二乘估计(算术平均) 品种和环境定,误差异质 加权最小二乘估计 品会 品种和环境固定,剩余方差异质 加权最小二乘估计 WLSE 会高 小二乘估计 品种因定,环墙随机,利金方差异而 加权最小二乘估计 / WLSE 2+合+ 品种和环境随机,误差同质 最佳线性无偏预测 P四I 了+e+i+-D
! 材料与方法 !"! 品种均值估计的模型和方法 作物品种区试是在多环境中实施同一套试验方 案,其品种均值的估计属于多套试验的合并分析问 题。以往的研究或应用中,除算术平均外,品种均值 估计的其他一些方法基本上是基于加权平均的思 想,所采用的“权”有误差方差倒数、环境内剩余方差 倒数、环境内遗传力、与参照环境的距离的倒数 等[! " #] 。这些加权方法是经验性的,缺乏完整的统 计学依据,为此,本文利用混合线性模型的理论来统 一阐述品种均值估计方法。 区试中第 ! 个品种在第 " 个环境中的第 # 次重 复观测值的线性模型可写为: $!"# $ ! % %! % &" %"!" %#!"# (&) !为观测值的总体均值;%! 为第 ! 个品种的效 应;&" 为第 " 个环境的效应;"!" 为第 ! 个品种与第 " 个环境的基因型 ’ 环境(())互作效应;#!"# 为第 ! 个 品种在第 " 个环境中的第 # 次重复观测值的误差。 上式也可表达为更为一般的混合线性模型[*,+]的矩 阵形式: ! $ "# % $% % !& (,) ! 为观测值向量;# 为固定效应向量;" 为固定 效应的系数矩阵;% 为随机效应向量,通常假设其均 值为 -,具有方差协差阵 ’;$ 为随机效应的系数矩 阵;!为误差向量,通常假设其均值为 -,具有方差协 差阵 (;& 为单位矩阵。通过广义最小二乘方程组 和混合模型方程组可获得固定效应 # 的最佳线性 无偏估计(./01 234/56 74.350/8 /013951/,:;<))以及随 机效应 % 的最佳线性无偏预测值(./01 234/56 74.3= 50/8 >6/83?13@4 :;<A)[* " B] 。 估计品种均值,就是要估计(&)式中的总均值! 与品种效应 %! 之和。! 通常为固定效应,包含在 (,)式的 # 中;%! 若为固定效应,也包含在 # 中,若 为随机效应,则包含在 % 中,所以品种均值的估计 受方差协差阵 ’ 和 ( 的影响。’ 和 ( 的构成是由 不同效应的固定或随机以及误差方差的同质或异质 的假设来决定的,不同假设下 ’ 和 ( 的组成不同, 由此也就产生了品种均值的不同估计方法。品种效 应固定假设下得到的品种均值为 :;<);品种效应随 机假设下得到的品种均值为 :;<A。 考虑到计算和应用的方便,本文附录中对 ’ 个 品种、( 个环境的平衡数据,以 ) 次重复均值为基 础,推导了混合模型的几种主要假设下品种均值的 计算简式。将附录中各公式的误差方差($, 和$, " ) 替换成单个观测值的误差方差除以重复数 ) 的形式 ($, / C) 和$, (/ ")C)),即可得到品种均值的各种估算公 式,列于表 &。表中!均为固定效应,误差均为随机 效应;$, (/ ")表示环境 " 内的误差方差;误差同质(或 异质)指各环境中的试验误差方差同质(或异质);剩 表 ! 混合线性模型几种主要假设下品种均值估值的名称及平衡数据计算简式 #$%&’ ! ($&)*&$+,-. /012*&$’ /01 %$&$-)’3 3$+$ *-3’1 4’5’1$& 2$,- $44*26+,0-4 0/ 2,7’3 &,-’$1 203’& 模型假设 )DD/?10 50079>13@40 34 9@8/2 估值类型 EF>/0 @D /013951/0 品种 ! 的均值计算式 G52?725134H D@69725/ D@6 1I/ ! 1I J563/1F 9/54 品种和环境固定,误差同质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最小二乘估计(算术平均) ;M)(5631I9/13? 9/54) & ( ! ( " $ & "$!" 品种和环境固定,误差异质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)/ ! ( " $ & "$!" $, (/ ")C) ! ( " $ & & $, (/ ")C) 品种和环境固定,剩余方差异质 K563/13/0 548 /4J36@49/410 D3L/8 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M)O ! ( " $ & "$!" $, O(") ! ( " $ & & $, O(") 品种固定,环境随机,误差异质 K563/13/0 D3L/8,/4J36@49/410 6548@9 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)) ! ( " $ & "$!" $, ) %$, () %$, (/ ")C) ! ( " $ & & $, ) %$, () %$, (/ ")C) 品种固定,环境随机,剩余方差异质 K563/13/0 D3L/8,/4J36@49/410 6548@9 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M))O ! ( " $ & "$!" $, ) %$, O(") ! ( " $ & & $, ) %$, O(") 品种随机,环境固定,误差同质 K563/13/0 6548@9,/4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A- "$ % $, ( $, ( %$, ()C( %$, / C() ("$! P"$) 品种和环境随机,误差同质 K563/13/0 548 /4J36@49/410 6548@9 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A& "$ % $, ( $, ( %$, )C( %$, ()C( %$, / C() ("$! P"$) * 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 BB# 万方数据
886 作物学报 20卷 余方差指环境内互作和误差的混合方差:)为环 的习惯做法(即品种固定)不太一致,但也有其合理 境j内的GE互作和误差的混合方差:、、g品和 性。 分别指基因型、环境、GE互作以及误差的方差:s 1.2数据来源和试验方案 和,分别指环境数和环境内重复数,其余符号含义 见附录。 为比较表1中各种估值的统计精度,采用两类 从表1可看出,品种效应固定时的某品种均值 数据进行分析。一类是我国区试历史数据,即长江 的估计,都是加权平均值,而“权”就是对应模型假定 流域春棉1990~1997年,黄河流域春棉1986~1996 下品种i在环境j中的算术平均值了自身方差的倒 年以及黄河流域夏棉1986~1993年每2年为1轮的 区试资料(简称为区试数据):另外,考虑到以上区试 数,这意味着某环境中各个了自身的变异越小,其 的年份数只有2年,对于进行较长年份的预测效果 值对品种均值的贡献越大。品种效应随机时的品种 分析来说有一定局限,还采用了一套专设的4年多 均值的BP值,则是一种“收缩”的预测值,相当于 点的品种试验数据(简称专设试验数据)。该试验洗 用对应模型假定下品种均值的重复力对品种效应进 择建国以来黄河流域具有代表性的10个棉花品种, 行收缩”。若品种均值的重复力越小,对试验中的 连续进行了4年的4~6个地点的试验(表2),各点 品种表型效应估值(即了-Y)就越持“谨慎”态度, 次均采用随机完全区组设计,3~4次重复,3行区 也就是根据表型值对品种进行选择后获得的期望的 小区面积20m,种植管理和性状考察按国家区试标 遗传进展越小,这与我们的实际经验是吻合的。从 准进行。以上两类资料均采用皮棉产量,单位为kg 这一个角度看,尽管品种随机的假设与我们区试中 hm2。 表2 4年多点棉花品种验证试验的设置 Table 2 Inforr ation of the-yeami-ocatio cotto trial for validation 参试点 重复数 参试品种 19%6 沧州安阳西华临清 4 岱15,徐州1818,徐州142,鲁棉1号,鲁棉6 197 沧州安阳西华临清菏泽 3 号,冀棉8号,中棉所12号(种质库原种),中 198 沧州安阳西华临清荷泽运城 3 棉所12号CK(目前生产用种),中棉所19 1999 沧州安阳西华临清菏泽运城 3 号,石远321 1.3估值精度的比较方法 析获得:,则通过第j个地点的单一点次的方差 根据各轮历史区试中第1年的数据计算出各品 分析获得(即误差项均方MS.):剩余方差品,的计 种对应于表1中的7种估值,以之作为各品种未来 算采用Shukla((1972)的方法。 表现的7种预测值:然后,计算各品种在第2年试验 中的算术平均值,作为验证值。专设试验则依次根 2 结果与分析 据4年中的每一年计算出品种估值(即预测值),把 从表3中各种估值各轮验证的预测差来看,在 其他3年的各品种算术平均值作为验证值。计算各 18轮验证中,加权最小二乘估值(WSE)的预测差 种估计方法所得预测值与验证值之间差值的绝对值 小于SE估值(即算术平均值)的有16轮,但其中 (称为预测差)以及该差值占验证值的百分比(称为 相对预测差),并对每轮验证中所有品种的预测差求 WLSEr和WSE与LSE的差别不大,WISE和 平均:同时计算各种估值以及验证值之间的相关系 WSE则分别有3轮和7轮的预测差明显小于 数和秩相关系数。计算结果列于表3~表5。 LSE。预测精度的提高较为明显的(即预测差明显 以上计算中,需要估计表1公式中的客种方弟 小于LSE的),大多数是WSE.估值。比如用验证 组分,其西接数界品和通过一年多点的方差分 试验中1996年的W1SE.估值对1997-1998三年的
余方差指环境内互作和误差的混合方差;!! "(!)为环 境 ! 内的 #$ 互作和误差的混合方差;!! #、!! $、!! #$和 !! % 分别指基因型、环境、#$ 互作以及误差的方差;" 和 # 分别指环境数和环境内重复数,其余符号含义 见附录。 从表 & 可看出,品种效应固定时的某品种均值 的估计,都是加权平均值,而“权”就是对应模型假定 下品种 $ 在环境 ! 中的算术平均值!%$!自身方差的倒 数,这意味着某环境中各个!%$! 自身的变异越小,其 值对品种均值的贡献越大。品种效应随机时的品种 均值的 ’()* 值,则是一种“收缩”的预测值,相当于 用对应模型假定下品种均值的重复力对品种效应进 行“收缩”。若品种均值的重复力越小,对试验中的 品种表型效应估值(即!%$ +!%)就越持“谨慎”态度, 也就是根据表型值对品种进行选择后获得的期望的 遗传进展越小,这与我们的实际经验是吻合的。从 这一个角度看,尽管品种随机的假设与我们区试中 的习惯做法(即品种固定)不太一致,但也有其合理 性。 !"# 数据来源和试验方案 为比较表 & 中各种估值的统计精度,采用两类 数据进行分析。一类是我国区试历史数据,即长江 流域春棉 &,,- . &,,/ 年,黄河流域春棉 &,01 . &,,1 年以及黄河流域夏棉 &,01 . &,,2 年每 ! 年为 & 轮的 区试资料(简称为区试数据);另外,考虑到以上区试 的年份数只有 ! 年,对于进行较长年份的预测效果 分析来说有一定局限,还采用了一套专设的 3 年多 点的品种试验数据(简称专设试验数据)。该试验选 择建国以来黄河流域具有代表性的 &- 个棉花品种, 连续进行了 3 年的 3 . 1 个地点的试验(表 !),各点 次均采用随机完全区组设计,2 . 3 次重复,2 行区, 小区面积 !- 4! ,种植管理和性状考察按国家区试标 准进行。以上两类资料均采用皮棉产量,单位为 567 84! 。 表 # $ 年多点棉花品种验证试验的设置 %&’() # *+,-./&01-+ -, 02) $34)&.3/5(013(-6&01-+ 6-00-+ 0.1&( ,-. 7&(18&01-+ 年份 9%:;< 参试点 $=>%;?4%@:A ABC:@?BD< 重复数 "%>A?C:@?BD DE4F%;< 参试品种 $=>%;?4%@:A CEA@?G:;< &,,1 沧州 安阳 西华 临清 3 &,,/ 沧州 安阳 西华 临清 菏泽 2 &,,0 沧州 安阳 西华 临清 菏泽 运城 2 &,,, 沧州 安阳 西华 临清 菏泽 运城 2 岱 &H,徐州 &0&0,徐州 &3!,鲁棉 & 号,鲁棉 1 号,冀棉 0 号,中棉所 &! 号(种质库原种),中 棉所 &! 号 IJ(目前生产用种),中棉所 &, 号,石远 2!& !"9 估值精度的比较方法 根据各轮历史区试中第 & 年的数据计算出各品 种对应于表 & 中的 / 种估值,以之作为各品种未来 表现的 / 种预测值;然后,计算各品种在第 ! 年试验 中的算术平均值,作为验证值。专设试验则依次根 据 3 年中的每一年计算出品种估值(即预测值),把 其他 2 年的各品种算术平均值作为验证值。计算各 种估计方法所得预测值与验证值之间差值的绝对值 (称为预测差)以及该差值占验证值的百分比(称为 相对预测差),并对每轮验证中所有品种的预测差求 平均;同时计算各种估值以及验证值之间的相关系 数和秩相关系数。计算结果列于表 2 . 表 H。 以上计算中,需要估计表 & 公式中的各种方差 组分,其中!! #、!! $、!! #$和!! % 通过一年多点的方差分 析获得;!! (% !)则通过第 ! 个地点的单一点次的方差 分析获得(即误差项均方 &’();剩余方差!! "(!)的计 算采用 K8E5A(: &,/!)的方法[3] 。 # 结果与分析 从表 2 中各种估值各轮验证的预测差来看,在 &0 轮验证中,加权最小二乘估值(L(K$)的预测差 小于 (K$ 估值(即算术平均值)的有 &1 轮,但其中 L(K$$ 和 L(K$$" 与 (K$ 的差别不大,L(K$" 和 L(K$% 则分别有 2 轮和 / 轮的预测差明显小于 (K$。预测精度的提高较为明显的(即预测差明显 小于 (K$ 的),大多数是 L(K$% 估值。比如用验证 试验中 &,,1 年的 L(K$% 估值对 &,,/ . &,,0 三年的 001 作 物 学 报 !, 卷 万方数据
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 887 表3 几种品种均值估计方法的绝对预测差和相对预测 Table 3 Absolute and relative predictive differences PDs)for variety mean in different estimating metheds 试验类型 年份· 绝对预测差(上)和相对预测差(%(下) and relative PDe((below Trial type Years LSE BLUPO 1990K1991) 112.91 50.15 42.38 111.76 97.74 112.91 112.91 970 4.31 3.64 9.60 8.40 9.7 204.08 60.46 181.8 203.4 19921993) 199.13 204.0s 长江春棉区试 19.12 5.66 17.04 19.06 1994(19%5 134.53 30.28 342.83 4 196(197) 385 平均Aeng 168. 149.24 4s16 49.54 2.06 13.26 130 130 1170 1205 1305 208发1 380.30 31310 301.11 309.44 208发1 0N1 1985(1986) 27.01 34.38 2821 27.22 27.97 27.01 27.01 19%71988) 525.49 518.42 535.91 526.37 524.88 525.9 525.49 7.89 76.84 79.44 78.02 7n.80 n.89 1989(1990) 125.09 43.82 83.20 121.61 黄河春棉区试 14.06 4.93 9.35 191(192) 498.88 348.69 515.6 99.01 102.60 106.0 193(194 5 89 195(196) 8.38 9.2 27158 2m1.12 293.42 271.0 276.42 271.6 3404 34 2678 44 417 59.35 127.42 49.44 59.99 55.82 65.12 1986(1987) 82.48 6g0 14.82 5.15 6.98 6.49 g.9 1988(1989) 83.39 61.09 96.48 82.58 黄河夏棉区试 13.12 9.61 15.17 12.99 1990(1991) 84.94 95.55 129.56 84.99 10.5 11.87 16.10 10.5 19921993) 平均Amg 199697.9g,99) 05 51 199796,98,99) 215.60 217.35 ::: 21.48 2.57 5702 10430 201.4 199.52 1998(9%.97.99) 18.94 54.14 184 19.11 19.13 18.94 18.9 1999X96,97.98) 56.90 208.04 142.05 55.20 52.51 60.11 95.29 5.7 21.09 14.40 5.60 5.32 6.09 平均Aee 146.26 279.41 161.32 146.13 143.23 148.68 15.09 28.83 16.65 15.08 14.78 15.34 17.0m 84.0 232.43 19.66 184.1 184.77 185.2 191.0 用指号外年骨的告各种品种均值,对活内车份的 0.17 20.24 20.29 20.93 种试验均值 行预测(表4同)》 (table 4 i 万方数据
表 ! 几种品种均值估计方法的绝对预测差和相对预测差 "#$%& ! ’$()%*+& #,- .&%#+/0& 1.&-/2+/0& -/33&.&,2&((45()3). 0#./&+6 7&#, /, -/33&.&,+ &(+/7#+/,8 7&+9)-( 试验类型 !"#$% &’()* 年份! +)$"*! 绝对预测差(上)和相对预测差(,)(下) -.*/%0&) 12(* $./3))$45 ")%$) 12(* ,)(.)%/6) 789 :789) :789; :7899 :7899; <7=1> <7=1? 长江春棉区试 8("#4@ A/&&/4 &"#$%* #4 &B) CB$4@D#$4@ ;#3)" ")@#/4 ?EE(> ?EE?) ?EE(F ?EEG) ?EE(H ?EEI) ?EE(J ?EEK) 平均 -3)"$@) ??FLE? I>L?I HFLGM ???LKJ EKLKH ??FLE? ??FLE? ELK> HLG? GLJH ELJ> MLH> ELK> ELK> F>HL>M J>LHJ ?M?LMK F>GLHK ?EEL?G F>HL>M F>HL>M ?EL?F ILJJ ?KL>H ?EL>J ?MLJJ ?EL?F ?EL?F ?GHLIG G>LFM GHFLMG ?GFLF? ?FELKK ?GHLIG ?GHLIG ?>LKM FLHG FKLHK ?>LIE ?>LH> ?>LKM ?>LKM ?HKLKF GMIL?M ?G>LKM ?HELH? ?I>LJM ?HKLKF ?HKLKF ?>LJ> FKLJH ELGE ?>LKF ?>LM? ?>LJ> ?>LJ> ?HELIH ?JHLJ> ?JMLKK ?HELFH ?HIL?J ?HELIH ?HELIH ?FL>I ?GLFJ ?GLJ> ?FL>G ??LK> ?FL>I ?FL>I 黄河春棉区试 8("#4@ A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM(I ?EMJ) ?EM(K ?EMM) ?EM(E ?EE>) ?EE(? ?EEF) ?EE(G ?EEH) ?EE(I ?EEJ) 平均 -3)"$@) FEMLM? GM>LG> G?FL?> G>?L?? G>ELHH FEMLM? FEMLM? FKL>? GHLGM FMLF? FKLFF FKLEK FKL>? FKL>? IFILHE I?MLHF IGILE? IFJLGK IFHLMM IFILHE IFILHE KKLME KJLMH KELHH KML>F KKLM> KKLME KKLME ?FIL>E HGLMF MGLF> ?F>L?? ?F?LJ? ?FIL>E ?FIL>E ?HL>J HLEG ELGI ?GLI> ?GLJK ?HL>J ?HL>J HEMLMM GHMLJE I?ILJG HEEL>? HEMLHH HEMLMM HEMLMM ?>FLJ> K?LKF ?>JL>I ?>FLJG ?>FLI? ?>FLJ> ?>FLJ> ?IFLMI ?MILK> FHHLMG ?IGLMG ?JGLG? ?IFLMI ?IIL>M ?MLE? FFLEK G>LFM ?EL>G F>LF> ?MLE? ?EL?M JMLIE F>JL>K EELHE JMLJF KELIJ JEL>? KFLG> MLGM FIL?K ?FL?I MLGM ELKF MLHG MLMG FK?LIM FKKL?F FEGLHK FK?LI> FKJLHF FK?LJJ FKFLJI GHL>H GHLKG GJLKM GHL>G GHLJH GHL>I GHL?K 黄河夏棉区试 80NN)" A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM(J ?EMK) ?EM(M ?EME) ?EE(> ?EE?) ?EE(F ?EEG) 平均 -3)"$@) IELGI ?FKLHF HELHH IELEE IILMF JIL?F MFLHM JLE> ?HLMF ILKI JLEM JLHE KLIK ELIE MGLGE J?L>E EJLHM MFLIM E>LMG MGLGE MGLGE ?GL?F ELJ? ?IL?K ?FLEE ?HLFE ?GL?F ?GL?F MHLEH EILII ?FELIJ MHLEE MIL?> MHLEH MHLEH ?>LII ??LMK ?JL?> ?>LIJ ?>LIK ?>LII ?>LII ?GILKH F>FLMM IFLHJ ?GJL>G ?GMLGG ?GILKH ?GILKH F?LHK GFL>E MLG> F?LI? F?LMM F?LHK F?LHK E?LH? ??JLGH MMLHI E?LGE EGLHH EFLHJ EILJF ?FLIG ?ILEI ?FL?F ?FLIG ?FLM? ?FLJK ?GL?? 验证试验 O$%#5$&#/4 &"#$% ?EE(J EK,EM,EE) ?EE(K EJ,EM,EE) ?EE(M EJ,EK,EE) ?EE(E EJ,EK,EM) 平均 -3)"$@) ??GL>G J>LEF ?>HLJI ??>LK> ?>HLFF ??ELHK ?I?LFK ?FLKK JLME ??LMG ?FLI? ??LKM ?GLI> ?KL?> F?ILJ> FKMLH? F>HLGJ F?KLGI F?HLKJ F?ILJ> F?ILJ> FFLJJ FELFJ F?LHM FFLMH FFLIK FFLJJ FFLJJ ?EELIF IK>LFI ?EHLF> F>?LFI F>?LHH ?EELIF ?EELIF ?MLEH IHL?H ?MLHH ?EL?? ?EL?G ?MLEH ?MLEH IJLE> F>ML>H ?HFL>I IILF> IFLI? J>L?? EILFE ILKK F?L>E ?HLH> ILJ> ILGF JL>E ELJJ ?HJLFJ FKELH? ?J?LGF ?HJL?G ?HGLFG ?HMLJM ?JILHF ?IL>E FMLMG ?JLJI ?IL>M ?HLKM ?ILGH ?KL>K 总平均 !/&$% $3)"$@) ?MHLG> FGFLHG ?EELJJ ?MHL?K ?MHLKK ?MILF? ?E?L>I F>L?E FILHJ F?LMK F>L?K F>LFH F>LFE F>LEG 注:! 用括号外年份的数据估算各种品种均值,对括号内年份的品种试验均值进行预测(表 H 同)。 P/&)*:! !B) 5$&$ /Q &B) ’)$"* /0& /Q ."$AR)&* 6)") 0*)5 &/ )*&#N$&) 3$"#)&’ N)$4* &/ (")5#A& 3$"#)&’ )S()"#N)4&$% N)$4* #4 &B) ’)$"* #4 ."$AR)&*(&$.%) H #* &B) *$N))L J 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 MMK 万方数据
888 作物 学报 20卷 平均结果进行预测,其预测差平均为60.92kghm2, 预测差只是预测效果的一个方面,对于区试,还 相当于验证均值884kghm2的6.89%,而算术平均 要求预侧值的品种排名与后续年份中的表现一致 值的预测差平均为113.03kghm2,相当于验证均值 这对于品种比较和选择来说更为重要。为此,表4 的12.7%。就这一轮验证来看,WsE估值的预测 计算列出了各种估值和验证值的秩相关系数。从表 精度高出算术平均值近1倍。不过,预测差明显大 中可看出,秩相关系数比1SE有明显提高和降低 于ISE的,多数也发生在WSE.估值上。这说明 的,多数还是WISE和ISE.两种估值,而且依然 WISE.估值的预测精度比LSE提高或降低的状况不 是WLSE的波动大于WLSE的,这一点和预测差的 很稳定。正因为如此,从所有轮的总平均来看,WL 情况相似:但是,预测差小的情况下,秩相关系数不 SE。估值的预测差依然大于ISE。WISE也基本类 一定高,所有18轮的预测差和秩相关系数的相关系 似,但相对而言,预测精度明显提高和降低的情况较 数平均只有-0.005,说明二者之间没有明显相关。 少。ISE。和IS下则基本上没有顶测精度明显 不过,验证试验中用1996年的W1SE估值对1997 比LSE提高或降低的情况。至于BIUP预测值(包 1998三年的平均结果进行预测时,与LSE相比,其 括BUPO和BLUPI),在大多轮的验证中都和ISE 预测差从12.77%减小到6.89%的同时,预测值与 耳有相同的平均预测差,少数轮有变化,但变化都不 验证值的秩相关系数也从0.830提高到0.976。各 大。另外,各种估值(包括目前常用的算术平均值) 种估值与验证值的秩相关系数平均为0.811 的相对预测弟平均都在0以上,这从一个测面说 0.824,决定系数为0.66-0.68,说明1年的区试尚 明,仅根据 年的区试结果对品种表现作出估计,准 不能很好地反映品种在后续年份表现的相对优劣。 确性不高。 表4几种品种均值估值与验证值的秩相关系数 Table 4 s and validation data 各种估值与验证值之间的秩相关系数 试验类型 年份 WLSE 长江春棉 19901991) 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1992(1993】 0.900 0.900 0.600 0.900 0.800 0.900 0.900 10041095】 0700 0700 0.800 0.900 0.700 0.700 1996(1997) 0.571 0.690 0.524 0.57 571 长江春棉(总】 0.7 0.7 0.6 0.761 0 黄河春棉 1985(1986 0.738 0.6 0.738 0.738 0.7538 0.738 I9%8701988 0.476 0.57 0.595 0.476 0.474 0.476 0.47% 19891990 0.905 0.786 0.833 0.905 0.905 0.905 0.905 1991(1992) 0.7% 0.524 0.786 0.786 0.786 0.76 0.78% 1093(1004】 0.40 0.717 0.300 0.400 0.40 0.400 0.400 1995(1996 0.98 0.783 0.95 0.983 0.967 0.983 0.983 黄河春棉(总) 0.715 0.684 0.735 0.715 0.71 0.715 0.715 黄河夏棉 1986(1967 1.00 1.00 1.0m 1988(1989 0.943 0.886 0.829 0.943 0.945 19901991 0.929 0.786 0.929 0.929 0.857 0.929 0.92 19921993) 0.500 0.500 0.300 0.50 0.500 0.500 0.500 黄河夏棉(总) 0.881 0.806 0.821 0.881 0.851 0.881 0.81 验证试险 1006g7.08.09) 0.830 0g76 0.964 0.879 0820 080 1997(96.98.99) 0.915 0.939 0.915 0.915 .915 0 0.915 0.782 0.s06 0.806 996.97,98 003 验证试验) 0D.86 0.876 0.875 0.87 0.864 计 0.817 0.811 0.818 0.824 0.824 0.817 0.817
平均结果进行预测,其预测差平均为 !"#$% &’()*% , 相当于验证均值 ++, &’()*% 的 !#+$-,而算术平均 值的预测差平均为 ../#"/ &’()*% ,相当于验证均值 的 .%#00-。就这一轮验证来看,12345 估值的预测 精度高出算术平均值近 . 倍。不过,预测差明显大 于 234 的,多数也发生在 12345 估值上。这说明 12345 估值的预测精度比 234 提高或降低的状况不 很稳定。正因为如此,从所有轮的总平均来看,126 345 估值的预测差依然大于 234。12347 也基本类 似,但相对而言,预测精度明显提高和降低的情况较 少。12344 和 123447则基本上没有预测精度明显 比 234 提高或降低的情况。至于 829: 预测值(包 括 829:" 和 829:.),在大多轮的验证中都和 234 具有相同的平均预测差,少数轮有变化,但变化都不 大。另外,各种估值(包括目前常用的算术平均值) 的相对预测差平均都在 %"-以上,这从一个侧面说 明,仅根据一年的区试结果对品种表现作出估计,准 确性不高。 预测差只是预测效果的一个方面,对于区试,还 要求预测值的品种排名与后续年份中的表现一致, 这对于品种比较和选择来说更为重要。为此,表 , 计算列出了各种估值和验证值的秩相关系数。从表 中可看出,秩相关系数比 234 有明显提高和降低 的,多数还是 12345 和 12347 两种估值,而且依然 是 12345 的波动大于 12347 的,这一点和预测差的 情况相似;但是,预测差小的情况下,秩相关系数不 一定高,所有 .+ 轮的预测差和秩相关系数的相关系 数平均只有 ; "#""<,说明二者之间没有明显相关。 不过,验证试验中用 .$$! 年的 12345 估值对.$$0 = .$$+ 三年的平均结果进行预测时,与 234 相比,其 预测差从 .%#00- 减小到 !#+$- 的同时,预测值与 验证值的秩相关系数也从 "#+/" 提高到 "#$0!。各 种估值与验证值的秩相 关 系 数 平 均 为 "#+.. = "#+%,,决定系数为 "#!! = "#!+,说明 . 年的区试尚 不能很好地反映品种在后续年份表现的相对优劣。 表 ! 几种品种均值估值与验证值的秩相关系数 "#$%& ! ’#() *+,,&%#-.+( *+&//.*.&(-0 $&-1&&( 0&2&,#% 2#,.&-3 4&#( &0-.4#-&0 #(5 2#%.5#-.+( 5#-# 试验类型 >?@ABC 年份 D5A?C 各种估值与验证值之间的秩相关系数 7AE& FG??5BAH@GE FG5II@F@5EHC J5HK55E 5CH@*AH5C AEL MAB@LAH@GE LAHA 234 12345 12347 12344 123447 829:" 829:. 长江春棉 .$$(" .$$.) .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$$(% .$$/) "#$"" "#$"" "#!"" "#$"" "#+"" "#$"" "#$"" .$$(, .$$<) "#0"" "#0"" "#+"" "#$"" "#$"" "#0"" "#0"" .$$(! .$$0) "#<0. "#!$" "#<%, "#<0. "#<0. "#<0. "#<0. 长江春棉(总) "#0/0 "#0$0 "#!$" "#0!. "#0,$ "#0/0 "#0/0 黄河春棉 .$+(< .$+!) "#0/+ "#!,/ "#0/+ "#0/+ "#0/+ "#0/+ "#0/+ .$+(0 .$++) "#,0! "#<0. "#<$< "#,0! "#,0! "#,0! "#,0! .$+($ .$$") "#$"< "#0+! "#+// "#$"< "#$"< "#$"< "#$"< .$$(. .$$%) "#0+! "#<%, "#0+! "#0+! "#0+! "#0+! "#0+! .$$(/ .$$,) "#,"" "#0.0 "#<"" "#,"" "#,"" "#,"" "#,"" .$$(< .$$!) "#$+/ "#0+/ "#$<" "#$+/ "#$!0 "#$+/ "#$+/ 黄河春棉(总) "#0.< "#!+, "#0/< "#0.< "#0.. "#0.< "#0.< 黄河夏棉 .$+(! .$+0) .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$+(+ .$+$) "#$,/ "#++! "#+%$ "#$,/ "#$,/ "#$,/ "#$,/ .$$(" .$$.) "#$%$ "#0+! "#$%$ "#$%$ "#+<0 "#$%$ "#$%$ .$$(% .$$/) "#<"" "#<"" "#/"" "#<"" "#<"" "#<"" "#<"" 黄河夏棉(总) "#++. "#+"! "#+%. "#++. "#+<. "#++. "#++. 验证试验 .$$(! $0,$+,$$) "#+/" "#$0! "#$!, "#+0$ "#$/$ "#+/" "#+/" .$$(0 $!,$+,$$) "#$.< "#$/$ "#$.< "#$.< "#$.< "#$.< "#$.< .$$(+ $!,$0,$$) "#+"! "#0// "#0+% "#+"! "#0$, "#+"! "#+"! .$$($ $!,$0,$+) "#$"/ "#+<< "#+/" "#$"/ "#$"/ "#$"/ "#$"/ 验证试验(总) "#+!, "#+0! "#+0/ "#+0! "#+++ "#+!, "#+!, 总 计 "#+.0 "#+.. "#+.+ "#+%, "#+%, "#+.0 "#+.0 +++ 作 物 学 报 %$ 卷 万方数据