第13卷第3期 生物数学学报 Vol.13 No.3 1998年8月 JOURNAL OF BIOMATHEMATICS Aug.1998 通用选择指数的通径分析化模型 宋世德周静芋袁志发郭满才 (西北农业大学基础科学系,陕西杨酸712100) 摘要通过对各种选择指数的通径分析化模型进行集统化的研究,建立了通 用选择指数的通径分析化模型,并给出了各种选择指数及其通径分析化的统一表示 形式.用该摸型可以充分利用各种信息来源,别是在对各种信息来源需作各种约来 时,为选种和评定优种提供了行之有效的计算方法和统一程序,避免了在实际应用中 因计算体亲不同而导致的混乱 关键词选择指数通径分析多信息来源 选择指数理论自Hazel L H于1943年提出至今,已经有了长足发展,人们相继提出了合 并选择指数、约束选择指数、最宜选择指数、理想选择指数、通用选择指数、个体育种值估计、复 合育种值估计和综合育种值估计等,这些理论已被广泛地应用于动植物育种实践之中,并获得 了一定成效.1988年袁志发等提出了选择指数与相关遗传进展分解原理,把选择指数的制订 与通径分析有效地结合起来,形成了一种新的统计学方法.孙世怿、周静芋等分别于1993和 1995年提出了综合选择指数的通径分析化方法和约束选择指数的通径分析化方法.1988年陈 瑶生等针对种畜选择研究中开支大、样本材料少,为充分利用多信息来源(如祖先资料和各种 亲属资料等)而进行的选择,提出了通用选择指数原理,改善了使用传统选择指数理论不得不 舍弃一些宝贵的信息资源的情况,并将其应用于绵羊育种中种公羊的选种决策中,并论证了约 束向量L的取值范围是整个实数域(-∞,+∞).同时,根据L的取值范围初次提出了超级选 择指数和反向选择指数的概念,并指出选择不同的L值,可对畜群作定向选择,使其向人们所 希望的方向变化,本文试图通过把通径分析化原理与通用选择指数原理相结合,形成一种新 的、系统化的通用选择指数通径分析化方法,以期能对动植物育种实践工作提供一种通用的、 能充分利用各种可能获得的育种选择相关信息的选择指数通径分析化模型. 1通用选择指数的通径分析化模型 设x=1x1,x2,·,xmT为综合育种值中各生产性状的育种值组成的列向量,m为综合 育种值中生产性状的数目,且x一Nn(,三p):g=g1,g2,,gmT-Nn(μ,)e={e1,e2 ,enm}T~Nn(0,Σ,),其中x=g+e,g与e独立,Σp=g+E,g与e分别是x的育种值和 环境离差向量,三p,三。与8,分别为x的表型、遗传和环境协方差阵,且均正定y={y,y2, ,y4,…,1y2,,y%,T为各信息性状组成的列向量,r为信息来源途径数,5(i=1,2。 ,r)为第:种信息来源的性状数,且0≤,≤m+,n为选种辅助性状数.令t=三1 收精后韩数锡,-10-08
第13卷第3期 1998年8月 生物数学学报 JOURNAl。OF BIOMATHEMATICS V01.13 No.3 Aug.1998 通用选择指数的通径分析化模型 宋世德周静芋袁志发 郭满才 (西北农业大学基础科学系.陕西杨陵712100) 摘要通过对各种选择指数的通径分析化模型进行系统化的研究。建立了通 用选择指数的通径分析化模型,并给出了各种选择指数及其通径分析化的统一表示 形式.用该模型可以充分利用各种信息来源,特别是在对各种信息来源需作各种约束 时.为选种和评定优种提供了行之有效的计算方法和统一程序,避免了在实际应用中 因计算体系不同而导致的混乱. 关键词选择指数通径分析多信息来源 选择指数理论自Hazel L H于1943年提出至今,已经有了长足发展.人们相继提出了合 并选择指数、约束选择指数、最宜选择指数、理想选择指数、通用选择指数、个体育种值估计、复 合育种值估计和综合育种值估计等.这些理论已被广泛地应用于动植物育种实践之中,并获得 了一定成效.1988年裒志发等提出了选择指数与相关遗传进展分解原理,把选择指数的制订 与通径分析有效地结合起来,形成了一种新的统计学方法.孙世铎、周静芋等分别于1993和 1995年提出了综合选择指数的通径分析化方法和约束选择指数的通径分析化方法.1988年陈 瑶生等针对种畜选择研究中开支大、样本材料少,为充分利用多信息来源(如祖先资料和各种 亲属资料等)而进行的选择,提出了通用选择指数原理,改善了使用传统选择指数理论不得不 舍弃一些宝贵的信息资源的情况,并将其应用于绵羊育种中种公羊的选种决策中,并论证了约 束向量L的取值范围是整个实数域(一∞,+∞).同时,根据L的取值范围初次提出了超级选 择指数和反向选择指数的概念,并指出选择不同的L值,可对畜群作定向选择。使其向人们所 希望的方向变化.本文试图通过把通径分析化原理与通用选择指数原理相结合,形成一种新 的、系统化的通用选择指数通径分析化方法,以期能对动植物育种实践工作提供一种通用的、 能充分利用各种可能获得的育种选择相关信息的选择指数通径分析化模型. 1通用选择指数的通径分析化模型 设z={z,,z2,…,z。。}T为综合育种值中各生产性状的育种值组成的列向量,m为综合 育种值中生产性状的数目,且z~N。(∥,互p);g={gl,92,…,g。}‘1~N。(户,毛);e={e1,e2, …,g。}T~N。(0,邑),其中z=g+e,g与P独立,三p=乏+三。。g与e分别是工的育种值和 环境离差向量,三p,三量与五分别为z的表型、遗传和环境协方差阵,且均正定.Y={y11,y12, …,Yk,…,yrl’3,r2’…。Y。}T为各信息性状组成的列向量,r为信息来源途径数,5f(i=1。2, …,r)为第i种信息来源的性状数,且0≤s,≤研+靠,,z为选种辅助性状数.令z=三s,. 收稿日期:1997—10—08 万方数据
第3期 宋世德等:通用选择指数的通径分析化模型 301 x的聚合遗传型值H为 H=w1gI w282+.+wmgm wTg, 选择指数I为 I=b1y1+b2y12+…+b,y1,+…+6yn,=6「y, 其中w=(w1,2,…,wm)T为已知的经济权重向屉,b=(b1,b2,,b,)T为待估计的指数权 重向量. 育种的目的是利用与综合育种值相关的信息向量y的组合值【最佳地估计综合育种值 H,换而言之,就是在一定条件,要使选择指数I与聚合遗传型值H的相关系数rm达到最大。 由于 D(I)=D(6Ty)=6TEb. D(H)=D(wTg)=uTΣw COV(I,H)=COV(bTy,(@Tg)T)=6TDZA@, 这里(三,)x:为各信息性状y的表型协方差阵,(三。)m×m为各生产性状x的遗传方差阵, (EA),×m为各信息性状y与各生产性状x间的遗传协方差阵,D=diagd1,dz,,d,}为各信 息来源与被估测个体间的亲缘系数对角阵,故通用选择指数的数学模型就成为这样一个条件 极值问题: bDEAw H = ==bTD∑Aw=max, √bT2b√wT20 bTDEAC =(.L2,.)=LT 1bTΣb=1, wTZw =1. 其中L是一个g维列向量,它规定了被约束的q个性状当达到:(i=1,2,“,q)所规定的水 平以后就不再变化.C为1×g阶约束矩阵,假若在选择中要对t个选择性状的前g个进行约 束,则C矩阵是由上半部分为q×q阶的单位阵,下半部分为(:~q)×q阶零矩阵构成的矩 阵.则目标函数为 f=bTDΣAw-(6TE,b-1)-(6TDΣAC-LT)a 式中,、A分别为拉格朗日乘数法的系数和列向量 由多元函数极值原理得正则方程组: b DEA(w CA), (1) 如果,可逆,则 b=;DEA(w -Ca), (2) 其中 A=(CTΣD2,DEAC)-(CTEADS,DΣAu-L). 令a=k可,,如'=w-C以,并对方程组(1)的第j个方程两边同除以可j=1,2,…t).则 方程组(1)变为 万方数据
第3期 宋世德等:通用选择指效的通径分析化模型 30l z的聚合遗传型值H为 H。∞19l+cI,292+…+∞,,毋m 2∞Tg, 选择指数jr为 ,=blYlI+b2.y12+…+6s。YIj。+…+btyH=bVy, 其中cc,=(∞1,∞2,…,叫。)T为已知的经济权重向量,b=(bI,b2,…,b,)T为待估计的指数权 重向量. 育种的目的是利用与综合育种值相关的信息向量y的组合值.『最佳地估计综合育种值 H,换而言之。就是在一定条件,要使选择指数,与聚合遗传型值H的相关系数,-珊达到最大. 由于 D(f)=D(bTy)=bT三≯, D(H)=D(∞Tg)=T三一, coy(,,/4)=COV(bTY,(∞Tg)T)=bTDZA∞, 这里(毛)。。。为各信息性状y的表型协方差阵,(磊)。。。为各生产性状z的遗传方差阵, (矗)。×。为各信息性状j,与各生产性状z间的遗传协方差阵,D=diagt dl,d2,…,d,}为各信 息来源与被估测个体间的亲缘系数对角阵.故通用选择指数的数学模型就成为这样一个条件 极值问题: J啊:焉窑笔i:bTDIAO,:m娃, P 2万写i耳2 ~鹕 {bTDZAC=(zl。z2,…。zq)=LT, l 6T鄱=1。 . 1∞T跏=1, 其中L是一个g维列向量,它规定了被约束的g个性状当达到Z,(i=1,2,…,g)所规定的水 平以后就不再变化.C为t×口阶约束矩阵,假若在选择中要对t个选择性状的前q个进行约 束,则C矩阵是由上半部分为q×q阶的单位阵,下半部分为(t—q)×q阶零矩阵构成的矩 阵.则目标函数为 ,=bvD匹A∞一号(6T三卢一1)一(OrDZAC—LT)A 式中u、A分别为拉格朗日乘数法的系数和列向量. 由多元函数极值原理得正则方程组: 三夕=DZA(叫一a), 如果三。可逆,则 b=三;1D匹A(∞一a), 其中 (1) (2) A=(cT三五D三;1DZAC)一1(CTZTDZ;,‘DZA叫一L). 令q 2 k乒历,∞7=ct,一a,并对方程组(1)的第歹个方程两边同除以厄(J=1,2,…£).则 方程组(1)变为 万方数据
302 生物数学学报 第13卷 a1++.+=w'CGS1 w'2CGS2(1)++w'mCGSm(1). y+a2++y=w'CGS1(2)w'2CGS2+.+w'mCGSm(2). (3) (rya1+rya2++ar=w'CGS1()+w'2CGS2()+.+w'mCGS(). 其中k为选择强度,CGS)(i=1,2,…,m;j=1,2,,t)为对y的选择使x:获得的相关遗 传进展.对的选择使H获得的相关遗传进展CGSH)为 CGSH()='1CGS1()+w'2CGS2()++w'mCGSm() 若令y的表型相关阵为R,=(r)×,a=(a1,a2,…,a,)T, 而 CGSH =(CGSH()CGSH(2),CGSH))T 则方程组(3)可写为 Ra=CGSH (4) (3)和(4)式描述了通用选择指数的相关遗传进展分解原理,即 通用选择指数的通径分析化模型.该原理表明:由于对y(= 1,2,,t)的选择,使综合育种值H获得的总遗传进展为 CGSHU),其中含有m个组分,这m个组分分别为由于对y的 01 选择而使x,(i=1,2,,m)获得的相关遗传进展CGSU,0H 为y对H的直接贡献,它是由通径》→H实现的,贡献率为 a/CGSHU):afy,是业通过y对H的间接贡献,它是由通径 “%一H实现的,贡献率为cGS .通径图如图1所示, 图1通用选舞指数的通径 2与选择有关的几个参数的计算公式 1)令y=ding.o.l, a=ka,6,6=0,三,=oRR=2p 2)通用指数1的表型方差:,=bT功=2aFR4. 聚合遗传型值H的方差:o=uT I与H的协方差:m=bTD2A 由正则方程组(1)与,=bT,b有 Om =6TE+6TDEACA =0+6TDEAC 可见,1与H的协方差由两部分构成,其中一部分是I的表型方差,另一部分是由于约束而 引起的方差的改变,其大小为bTDΣACa 3)I对H的相关系数 bTDEAw TIH %+6D2C bTΣ,b√uTΣa GIOH 可见相关系数亦是由两都分构成,第一部分为不加约束时相关系数的计算公式,为二,第二部 万方数据
302 生物数学学报 第13卷 f口l+012口2+…+Tylaf=∞’1CGSl+∞72cIGs2(1)+…+w'.CGSm(1)- j‰口l+口2+.”+‰口,=‘O’lCGSl(2)+∞72CGS2+’“+‘£'’mcGsm(2), [ry。lal+■2口2+…+口f=ct,7lCGSl(1)+‘c’72CGS2(r)+…+ "mCGSm(f), (3) 其中走为选择强度,CGSi(j)(i=1,2,…,m;J=1,2,…,t)为对yi的选择使.Tfi获得的相关遗 传进展.对∞的选择使H获得的相关遗传进展CGSH(j)为 CGSH(j)=‘c,’1CGSlo)+cc,72CGS20)+…+w'.CGS。(J). 若令Y的表型相关阵为R,=(rv),。。,口=(口1,口2,…,n,)T, 而 CGSH=(CGSH(I),CGSH(2),…,CGSH(1))‘。 则方程组(3)可写为 Rya=CGSn. (4) (3)和(4)式描述了通用选择指数的相关遗传进展分解原理,即 通用选择指数的通径分析化模型.该原理表明:由于对Yi(i= 1,2,…,t)的选择,使综合育种值H获得的总遗传进展为 CGSH(j),其中含有m个组分,这m个组分分别为由于对M的 选择而使zf(i=1,2,…,m)获得的相关遗传进展CGS内),aj。, 为了i对H的直接贡献,它是由通径yi—H实现的,贡献率为 aj/CGSH(j);ajry是f通过∞对 Y 的间接贡献,它是由通径. H n:r., Yi一为一H实现的,贡献率为万:}L.通径图如图I所示. ouOH(f) 2与选择有关的几个参数的计算公式 图I通用选择指数的通径图 1)令口,5 diag[√口,。,,、/盯y笠,…,、/口y。}, 则 口=koyb, 6=寺;1口, 三,=口止办, R,=口;垤,;1. 2)通用指数Jr的表型方差: 盯己2 bT2flb 2刍aTRya. 聚合遗传型值H的方差:盯备=叫T三∥ ,与H的协方差: alH=bTD匹Acc, 由正则方程组(1)与口;=bT三≯有 口JH=bT三夕+bTD互,AC.2=仃;.+bTD互^CA 可见,,与H的协方差由两部分构成,其中一部分是,的表型方差d;,另一部分是由于约束而 引起的方差的改变。其大小为bTD三Aa. 3) J对H的相关系数 bTD三^cE, d唧 一,。 bTD2^Ca 啪2万亏i亏2丽2 a—H+可‘ 可见相关系数亦是由两部分构成,第一部分为不加约束时相关系数的计算公式,为·,第二部 万方数据
第3期 宋世德等:通用选择指数的通径分析化模型 303 分也是由于约束而使相关系数发生改变的变化量,其大小为TD2C 4)1的遗传力h7及直接遗传进展GS,为 G51=koh3= k如i 1, 5)通过I的选择使H获得的相关遗传(经济)进展为 CGSm -Gs,+DC 01 ,, =koDEaCa 或 CGSHD)=k+TDEACA √6TΣ,b 其中,前一部分也是无约束时的遗传进展如,或k√6T,,后一部分为由于约束而使遗传进 展发生变化的改变量,大小为如FDEC或如'D匹C √6T3,b 6)通过I的选择使x:获得的相关遗传(生物学)进展为 (CGS)CGSa)CGS)TDGS ol, 7)乡为CGSHU)的贡献率(直接贡献)为 J,=a/CGSH)(G=1,2,…,t). 当通过”对CGSHU)的贡献率(间接贡献)为 Jm=ary./CGSH0)(i≠j,i,j=1,2,…,t) 8)【对H的决定系数遗传力为 n”-鼎-op o为月 H关于y的决定系数遗传力为 hH(i)=CGS/2 (i=1,2,…,m). 3通用选择指数的几种简化情况 3.1只含自身成绩记录,且不含辅助性状的情况 由于这时D为单位阵,且有x=y,m=t,A=三g,,=p.可分以下四种情况讨论: 1)当9=0,即不加约束时为综合无约束选择指数.这时 b=,Σ0. 2)当9≠0,且q<t,L=0时为约束选择指数.这时 ∫b=pΣ(w-Cx), A=(CTΣΣ,C)-lCT2ΣΣw 3)当9≠0,且q<t,L≠0时为最宜选择指数.这时 |b=ΣΣ.(w-C), 万方数据 A=(CTExΣC)1(CTΣΣ,Σw-L)
第3期 宋世德等:通用选择指数的通径分析化模型 303 一—————————————————————————————————————————————————一 分也是由于约束而使相关系数发生改变的变化量,其大小为鱼二考擎. 4),的遗传力h;及直接遗传进展GSI为 口{ 一 ka; h;2彳,GSI 2 kolph 2彳 5)通过I的选择使H获得的相关遗传(经济)进展为 或 一,=考一考等=半=kalp+半 娜H¨)“√61矽+面’ 其中,前一部分也是无约束时的遗传进展kal或足石T三卢,后一部分为由于约束而使遗传进 展发生变化的改变量,大小为丝半器. 6) 通过,的选择使z;获得的相关遗传(生物学)进展为 (CGSl(J)’CGs:㈤,…,CGs删))T=学s,=譬./ 7) ∞为CGSH(J)的贡献率(直接贡献)为 乃=aj/CGSH(j)(歹=1,2,…,t). ∞通过yf对CGSH(J)的贡献率(间接贡献)为 Lf=口fry/CGSH(j)(i≠歹,i,歹=1,2,…,z)· 8) f对H的决定系数遗传力为 H关于M的决定系数遗传力为 ‰=哮酽=袅=而翻· hH(i)=cGs备“)/k2口备 (i=1,2,…,ITS). 3通用选择指数的几种简化情况 3.1 只含自身成绩记录。且不含辅助性状的情况 由于这时D为单位阵,且有z=y,m=t,ZA=乙,毛=o.可分以下四种情况讨论: 1) 当q=0,即不加约束时为综合无约束选择指数.这时 b=三;1三∥. 2) 当q≠0,且q<t,L=0时为约束选择指数.这时 f b=三;乏g(cc,一a), lA=(cT犁;≮c)。1C丁苹;%. 3) 当9≠0,且g<t,L≠0时为最宜选择指数.这时 f b=三;1磊(∞一Ca), 万方数据 IA=(CT三≯;它gc)一1(cT三互;它gct,一L).
304 生物数学学报 第13卷 4)当q≠0,且q=t,L≠0,C=I时为理想选择指数,这时 6=gL. 3,2具有多信惠来源途径的情况 1)合并选择指数:这时各种亲属资料只含一个性状,故有m=1,w=1,t=r,q=0(不 加约束),C=0,则可得: b=ΣyDEA. 2)合并约束选择指数:这时含有约束性状,即q≠0,q<t,且L=0,C≠0,则可得 1b=ΣyD2a(1-Ca), |λ=(CTΣHDE,DEaC)-1CTΣDEDEA. 3)合并最宜选择指数:这时有q≠0,且q<t,且L≠0,C≠0,则可得 Ib=,D2a(1-C), =(CTEADE,'DEAC)-(CTEADE,'DEA -L) (4)合并理想选择指数:这时有q≠0,且q=t,L≠0,C=1,则可得 b=D-1ΣAL (5)无约束复合选择指数:这时由于不加约束,故有q=0,C=0,L=0,可得: b=DEAC (6)约束复合选择指数:这时含有约束性状,即q≠0,g<t,且L=0,C≠0,可得 Ib=ΣyDEa(w-Ca), A=(CTΣDE,DEAC)-lCTΣADE,DEAu (7)最宜复合选择指数:这时有q≠0,且q<t,L≠0,C≠0,可得 b=DEA(a-Ca), =(CTSADE,'DEAC)(CTEADE;'DEA -L). (8)理想复合选择指数:这时有q≠0,且q=t,L≠0,C=I,可得 6=D-IEA'L. 以上十二种选择指数均为人们已经熟知的选择指数,它们都是通用选择指数的特例 4两个结论 1)通用选择指数及其通径分析化模型涵盖了目前用到的所有选择指数,它为充分利用各 种信息来源进行育种选择提供了一个行之有效的计算方法,并可编制通用的计算程序,为广大 育种者提供了方便.特别是其通径分析化模型除了可以分析各种选择类型情况下选择指数[ 与聚合遗传型值H之间的全部路径信息以确定主选性状拟或是限制性状外,还可以分析出各 选择性状y对各目标性状x的相关遗传进展以及各选择性状y对H的相关遗传总(经济)进 展及其相对(直接的和间接的)贡献率 2)选择指数【与聚合遗传型值H之间的协方差、相关系数和通过对I的选择使H获得 的相关遗传进展,在各种约束选择情况下均可分解为两大部分:第一部分怡好是不加约束情况 下的公式,而第二部分纯粹是由于施加了约束而引起改变的变化量.因此,第二部分的符号与 大小直接体现了约束对选择所施加的影响效力.可见,若要增加(或减少)约束效力,应首先考 虑从第部盆拾手,因为这三个指标都是衡量指数效力的关键指标,对不同的性状或不同的性
生物数学学报 第13卷 4)当q≠0,且q=t,L:X=0,C=,。时为理想选择指数。这时 b=三;1L. 3.2具有多信息来源途径的情况 1) 合并选择指数:这时各种亲属资料只含一个性状,故有m=1,∞=1,t=r,q=0(不 加约束),C=0,则可得: b=三;1D2a. 2) 合并约束选择指数:这时含有约束性状,即q≠0,q<t,且L=0,C≠0,则可得 f b=三;1D匹A(1一a), I A=(CT三五脏;1肱Ac)。1CT三五脏;忱A. 3) 合并最宜选择指数:这时有q=/=O。且q<t,且L:/=O,C≠0,则可得 f b=三;1D匹A(1一Ca), lA=(CT三五脏;1磁Ac)一1(CTzSTD2;1陇A—L). (4)合并理想选择指数:这时有口≠0,且q=t,L≠0,C=,。则可得 b=D一1三二1L. (5)无约束复合选择指数:这时由于不加约束.故有q=0,C=0,L=0,可得: b=三;1D匹∥. (6)约束复合选择指数:这时含有约束性状,即q≠0,q<t。且L=0,C≠0,可得 f b=三;1髓A(c‘.一Ca), IA=(CT互五脏;1雎Ac)qCT三五庞;1D.SAo口. (7)最宜复合选择指数:这时有q≠0,且q<t,L≠0,C≠O,可得 / f b=三;1D2A(∞一Ca), IA=(CT三艟;1磁Ac)一1(cT三j臃;1D.SAoJ—L). (8)理想复合选择指数:这时有口≠0,且q=t,L≠0,C=j,。,可得 b=D一1三二1L. 以上十二种选择指数均为人们已经熟知的选择指数,它们都是通用选择指数的特例. 4两个结论 1)通用选择指数及其通径分析化模型涵盖了目前用到的所有选择指数,它为充分利用各 种信息来源进行育种选择提供了一个行之有效的计算方法,并可编制通用的计算程序,为广大 育种者提供了方便.特别是其通径分析化模型除了可以分析各种选择类型情况下选择指数, 与聚合遗传型值H之间的全部路径信息以确定主选性状拟或是限制性状外,还可以分析出各 选择性状v对各目标性状z的相关遗传进展以及各选择性状Y对H的相关遗传总(经济)进 展及其相对(直接的和间接的)贡献率. 2)选择指数,与聚合遗传型值H之间的协方差、相关系数和通过对f的选择使H获得 的相关遗传进展,在各种约束选择情况下均可分解为两大部分:第一部分恰好是不加约束情况 下的公式。而第二部分纯粹是由于施加了约束而引起改变的变化量.因此,第二部分的符号与 大小直接体现了约束对选择所施加的影响效力.可见,若要增加(或减少)约束效力,应首先考 虑从第二部分入手,因为这三个指标都是衡量指数效力的关键指标.对不同的性状或不同的性 万方数据