第八章基因变异的群体行为 基因变异是人类进化的基础,构成了群体中的个体多样性.由于 群体是由一群可以相互婚(交)配的个体组成,如果仅仅从个体的遗 传结构是难以解释群体的遗传组成及其随时间和空间的变化规律,而 且基因型和表型存在复杂关系,因此,研究群体中基因的分布及逐代 传递中影响基因频率和基因型频率的因素,追踪基因变异的群体行 为,应用数学手段研究基因频率和相对应的表型在群体中的分布特征 和变化规律,这就是群体遗传学的研究内容,也是人类遗传学、人类 进化和后基因组学研究的中心任务。 第一节群体的遗传平衡 按照遗传学的分离率和自由组合率,当两个杂合个体婚配后,子 代3A4表现显性性状,14表现为隐性性状,因此在群体中随着隐性性 状的减少,显性性状将会增加,最终大多数为显性性状;然而实际上 并非如此;在随机婚配的大群体中,没有受到外在因素影响的情况下 显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在 一代代传递中保持稳定,这就是Hady- Weinberg平衡律。 、 Hardy-Weinberg平衡律 Hardy- Weinberg平衡律是1908年由英国数学家 GH Hardy和德国 内科医生 WEinberg分别提出的,它是遗传学中最基本的原理之 奠定了现代群体遗传学最重要的理论基础;即在一个大群体中,如果 是随机婚配,没有突变,没有自然选择,没有大规模迁移所致的基因 流,群体中的基因频率和基因型频率一代代保持不变 假设在一个理想的群体中,某个基因座上的两个等位基因A和a, 其频率分别为p和q;因为一个基因座只有两个等位基因,因此p+q=1
第八章 基因变异的群体行为 基因变异是人类进化的基础,构成了群体中的个体多样性.由于 群体是由一群可以相互婚(交)配的个体组成,如果仅仅从个体的遗 传结构是难以解释群体的遗传组成及其随时间和空间的变化规律,而 且基因型和表型存在复杂关系,因此,研究群体中基因的分布及逐代 传递中影响基因频率和基因型频率的因素,追踪基因变异的群体行 为,应用数学手段研究基因频率和相对应的表型在群体中的分布特征 和变化规律,这就是群体遗传学的研究内容,也是人类遗传学、人类 进化和后基因组学研究的中心任务。 第一节 群体的遗传平衡 按照遗传学的分离率和自由组合率,当两个杂合个体婚配后,子 代 3/4 表现显性性状,1/4 表现为隐性性状,因此在群体中随着隐性性 状的减少,显性性状将会增加,最终大多数为显性性状;然而实际上 并非如此;在随机婚配的大群体中,没有受到外在因素影响的情况下, 显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在 一代代传递中保持稳定,这就是 Hardy-Weinberg 平衡律。 一、Hardy-Weinberg 平衡律 Hardy-Weinberg 平衡律是1908 年由英国数学家 GH Hardy 和德国 内科医生 W Weinberg 分别提出的,它是遗传学中最基本的原理之一, 奠定了现代群体遗传学最重要的理论基础;即在一个大群体中,如果 是随机婚配,没有突变,没有自然选择,没有大规模迁移所致的基因 流,群体中的基因频率和基因型频率一代代保持不变。 假设在一个理想的群体中,某个基因座上的两个等位基因 A 和 a, 其频率分别为p 和q;因为一个基因座只有两个等位基因,因此p+q=1
这一群体中的每种基因型频率可以通过不同等位基因的组合得出(表 8-1)。 表8-1第一代的两个等位基因频率和基因型频率 卵A(p) AA (p2) Aa(pq) 子a(q) Aa(pq a(q2) 从表8-1可得到不同基因型频率,这是精子和卵子随机婚配的第 代基因型频率。如果这些个体相互婚配,可以得到第二代基因型频 率并发现基因型的分布特点(表8-2、8-3) 表8-2第二代基因型频率 AA(p) AAXAA(p) AA×Aa(2p2q) AAaa(pq) AaxAA(2pq) Aa×Aa(4p2q2) Aaxaa(2pg,) a(q2) aaxAA(p-q2) aaaA(2pg) aaaa(g) 表8-3各种婚配的后代基因型分布 婚配类型 频率 AAXAA AAXAa 4pq 2pq 2pq AAX aa 2pq Aa xAa 4pq aax aa 4 表中结果显示:AA后代=p+2pq+pq2p3(p32+2pq+q2)→p3(p+q}=p2; Aa后代=2pq+4p2q2+2pq3=2pq(p2+2pq+q2)2pq(p+q)2=2pq;而Aa后代 p2q2+2pq3+q4=q(p2+2pq+q2)=q(p+q)=q2
这一群体中的每种基因型频率可以通过不同等位基因的组合得出(表 8-1)。 表 8-1 第一代的两个等位基因频率和基因型频率 精 子 A(p) a(q) 卵 A(p) AA(p²) Aa(pq) 子 a(q) Aa(pq) aa(q²) 从表 8-1 可得到不同基因型频率,这是精子和卵子随机婚配的第 一代基因型频率。如果这些个体相互婚配,可以得到第二代基因型频 率并发现基因型的分布特点(表 8-2、8-3)。 表 8-2 第二代基因型频率 AA(p²) Aa(2pq) aa(q²) AA( p²) AA×AA(p4 ) AA×Aa(2p³q) AA×aa(p²q²) Aa(2pq) Aa×AA(2p³q) Aa×Aa(4p²q²) Aaxaa(2pq³) aa(q²) aaxAA(p²q²) aaxAa(2pq³) aaxaa(q 4 ) 表 8-3 各种婚配的后代基因型分布 婚配类型 频率 后 代 AA Aa aa AA×AA AA×Aa AA×aa Aa×Aa Aa×aa aa×aa p 4 4p³q 2p²q² 4p²q² 4pq³ q 4 p 4 2p³q p²q² 2p³q 2p²q² 2p²q² 2pq³ p²q² 2pq³ q 4 表中结果显示:AA 后代=p 4+2p³q+p²q²=p²(p²+2pq+q²)=p²(p+q)²=p²; Aa 后代=2p³q+4p²q²+2pq³=2pq(p²+2pq+q²)=2pq(p+q)²=2pq;而 Aa 后代 =p²q²+2pq³+q 4=q²(p²+2pq+q²)=q²(p+q)²=q²
从表8-2和表8-3可以看出在这一群体中第一代和第二代的基因 型频率是一致的。实际上无论经过多少代,基因型频率将保持不变, 每种基因型的个体数量随着群体大小而增减,但是相对频率不变,这 就是 Hardy- Weinberg平衡的推理。当证明每个基因型的相对比例保持 不变,即p2、2pq和q的比例,那么这个群体可以说是处于 Hardy- Weinberg平衡。 Hardy- Weinberg平衡的应用 Hardy- Weinberg平衡最重要的医学应用是通过某一性状(疾病) 频率在群体中的分布情况,确定等位基因频率和杂合子频率,然而首 先必须判定该群体的基因型和等位基因频率是否处于 Hardy-Weinber 平衡。 (一) Hardy- Weinberg平衡的判定 当鉴定了某一群体特定性状的基因型频率,就可以得知这个群体 的该性状是否处于 Hardy- Weinberg平衡。假设某一基因座的一对等位 基因A和a,有三种基因型AA,Aa/aA和a,在随机1000人的群 体中,观察的基因型分布如下:AA为600人、Aa/aA为340人、aa 为60人。 从这个数据可以得到A等位基因频率p是(2×600+340)/2000 等于0.77,而等位基因a的频率q是(2×60+340)/2000等于023, 这些数据是在该群体中的观察值,如果是 Hardy-Weinberg平衡,预期 值如表8-4 表8-4不同基因型频率的预期值和观察值 基因型 预期值 观察值 5929(p2×1000 Aaaa 354.2(2pq×1000 60 X=1.607p>0.05
从表 8-2 和表 8-3 可以看出在这一群体中第一代和第二代的基因 型频率是一致的。实际上无论经过多少代,基因型频率将保持不变, 每种基因型的个体数量随着群体大小而增减,但是相对频率不变,这 就是 Hardy-Weinberg 平衡的推理。当证明每个基因型的相对比例保持 不变,即 p²、2pq 和 q²的比例,那么这个群体可以说是处于 Hardy-Weinberg 平衡。 二、Hardy-Weinberg 平衡的应用 Hardy-Weinberg 平衡最重要的医学应用是通过某一性状(疾病) 频率在群体中的分布情况,确定等位基因频率和杂合子频率,然而首 先必须判定该群体的基因型和等位基因频率是否处于 Hardy-Weinberg 平衡。 (一)Hardy-Weinberg 平衡的判定 当鉴定了某一群体特定性状的基因型频率,就可以得知这个群体 的该性状是否处于 Hardy-Weinberg 平衡。假设某一基因座的一对等位 基因 A 和 a,有三种基因型 AA,Aa/aA 和 aa,在随机 1000 人的群 体中,观察的基因型分布如下:AA 为 600 人、Aa/aA 为 340 人、aa 为 60 人。 从这个数据可以得到 A 等位基因频率 p 是(2×600+340)/2000 等于 0.77,而等位基因 a 的频率 q 是(2×60+340)/2000 等于 0.23, 这些数据是在该群体中的观察值,如果是 Hardy-Weinberg 平衡,预期 值如表 8-4。 表 8-4 不同基因型频率的预期值和观察值 基因型 预期值 观察值 AA 592.9(p 2×1000) 600 Aa/aA 354.2(2pq×1000) 340 aa 52.9(q2×1000) 60 X 2 =1.607 p>0.05
用检验等位基因频率和基因型频率分布是否符合 Hardy- Weinberg平衡,根据值查分布表得到p值;当p>005 时,表示预期值和观察值之间没有显著差异,可以认为等位基因频率 和基因型频率分布符合 Hardy-Weinberg平衡,当p<0.05时,表示预 期值和观察值之间有显著差异,则认为等位基因频率和基因型频率分 布不符合 Hardy- Weinberg平衡 另假设某一基因座的一对等位基因B和b,在1000人群体中,该 基因型频率分布是:BB为600人、Bb/bB为320、bb为80人。 因此可以得到B和b等位基因频率分别是p=(2×600+320) 2000=0.76和q=(2×80+320)2000=024,通过比较基因型观察 值和期望值(表8-5),经Ⅺ检验证明有显著差异。因此,对于该基 因座随着BB纯合子的减少,Bb杂合子增加,该群体偏离了 Hardy- Weinberg平衡,原因可能是某些因素如杂合子优势或负性选型 婚配造成杂合子频率增加。通常对于大多数遗传性状,群体是处于 Hardy- Weinberg平衡的 表8-5不同基因型频率的预期值和观察值 预期值 观察值 5776(p2×1000 600 Bb/bB 3648(2pq×1000) 320 576(q2×1000) X=15.0816p<0.05 目前可采用HWE软件作2检验判定基因型的 Hardy-Weinberg平 衡吻合度( ttp: //inkage. rockefeller. edu/software/utilities)。此外,一群体 MN血型基因型的 Hardy-Weinberg平衡检验如表8-6。 表8-6MN血型的观察值和期望值的X2检验
用 X2 检 验 等 位 基 因 频 率 和 基 因 型 频 率 分 布 是 否 符 合 Hardy-Weinberg 平衡,根据 X2 值查 X2分布表得到 p 值;当 p>0.05 时,表示预期值和观察值之间没有显著差异,可以认为等位基因频率 和基因型频率分布符合 Hardy-Weinberg 平衡,当 p<0.05 时,表示预 期值和观察值之间有显著差异,则认为等位基因频率和基因型频率分 布不符合 Hardy-Weinberg 平衡。 另假设某一基因座的一对等位基因 B 和 b,在 1000 人群体中,该 基因型频率分布是:BB 为 600 人、Bb/bB 为 320、bb 为 80 人。 因此可以得到 B 和 b 等位基因频率分别是 p=(2×600+320) /2000=0.76 和 q=(2×80+320)/2000=0.24,通过比较基因型观察 值和期望值(表 8-5),经 X2 检验证明有显著差异。因此,对于该基 因座随着 BB 纯合子的减少,Bb 杂合子增加,该群体偏离了 Hardy-Weinberg 平衡,原因可能是某些因素如杂合子优势或负性选型 婚配造成杂合子频率增加。通常对于大多数遗传性状,群体是处于 Hardy-Weinberg 平衡的。 表 8-5 不同基因型频率的预期值和观察值 预期值 观察值 BB 577.6(p 2×1000) 600 Bb/bB 364.8(2pq×1000) 320 bb 57.6(q2×1000) 80 X 2 =15.0816 p< 0.05 目前可采用 HWE 软件作X2检验判定基因型的Hardy-Weinberg平 衡吻合度(fttp://linkage.sockefeller.edu/software/utilities)。此外,一群体 MN 血型基因型的 Hardy-Weinberg 平衡检验如表 8-6。 表 8-6 MN 血型的观察值和期望值的 X2 检验
MM MN NN 合计 观察值(O) 400 765 335 1500 405.6 5.6 1500 预期值(E) (p2×1500 (2pq×1500) (q2×1500 (O-E/E 0.077 0.35 0.32 X2=0.747 p=(400×2+765)/3000=0.52;q=235×2+765)/3000=0.48p>0.05 (二)等位基因频率和杂合子频率的计算 当已知一群体某一性状的频率,就可以确定等位基因频率和杂合 子频率。例如常染色体隐性遗传病囊性纤维化在欧洲白种人的发病率 约12000说明患者为突变基因的纯合子q2=1200,则q=√1/2000 145=0.022,p=1-1/45=4445=0,978,杂合子即携带突变基因的个体 pq2×4445×1/45=123=0043。因此,白种人中有4%为囊性纤维化 突变基因携带者,他们的生存和婚配是囊性纤维化突变基因遗传的重 要原因,因此对囊性纤维化家族的遗传咨询十分重要。 对于罕见的隐性遗传病(q2≤0.0001,p近似于1,因此,杂合 子频率(2pq)约为2q,也就是说杂合子频率是突变基因频率q的2 倍;所以,群体中杂合携带者的数量2q远远高于患者q3。如表8-7 所示,随着隐性遗传病的发病率下降(q2),携带者和患者的比率升高, 由此可见,对于隐性遗传病在制定筛查计划时有重要意义 表8-7基因型频率对携带者患者比率的影响 患病率 基因频率(q) 携带者频率(2pq)携带者/患者(2pq/) 1/1000 1/32 l/16 1000/16=62.5 1/5000 1/71 5000/36=139 1/10000 10000/50=200 1/50000 1/244 50000/112=446 l/100000 1/316 1/518 100000/158=633 Ⅹ连锁基因频率估计不同于常染色体基因,因为男性为半合子 男性发病率等于突变基因频率q。对于一种相对罕见的Ⅹ连锁隐性遗
MM MN NN 合计 观察值(O) 400 765 335 1500 预期值(E) 405.6 (p 2×1500) 748.8 (2pq×1500) 345.6 (q2×1500) 1500 (O—E)2 /E 0.077 0.35 0.32 X2=0.747 p=(400×2+765)/3000=0.52;q=(235×2+765)/3000=0.48 p>0.05 (二)等位基因频率和杂合子频率的计算 当已知一群体某一性状的频率,就可以确定等位基因频率和杂合 子频率。例如常染色体隐性遗传病囊性纤维化在欧洲白种人的发病率 约 1/2000,说明患者为突变基因的纯合子 q 2=1/2000,则 q=√1/2000 =1/45=0.022,p=1-1/45=44/45=0.978,杂合子即携带突变基因的个体 2pq=2×44/45×1/45=1/23=0.043。因此,白种人中有 4%为囊性纤维化 突变基因携带者,他们的生存和婚配是囊性纤维化突变基因遗传的重 要原因,因此对囊性纤维化家族的遗传咨询十分重要。 对于罕见的隐性遗传病(q 2≤0.0001),p 近似于 1,因此,杂合 子频率(2pq)约为 2q,也就是说杂合子频率是突变基因频率 q 的 2 倍;所以,群体中杂合携带者的数量 2q 远远高于患者 q 2。如表 8-7 所示,随着隐性遗传病的发病率下降(q 2),携带者和患者的比率升高, 由此可见,对于隐性遗传病在制定筛查计划时有重要意义。 表 8-7 基因型频率对携带者/患者比率的影响 患病率 基因频率(q) 携带者频率(2pq) 携带者/患者(2pq/q2 ) 1/1000 1/32 1/16 1000/16=62.5 1/5000 1/71 1/36 5000/36=139 1/10000 1/100 1/50 10000/50=200 1/50000 1/244 1/112 50000/112=446 1/100000 1/316 1/518 100000/158=633 X 连锁基因频率估计不同于常染色体基因,因为男性为半合子, 男性发病率等于突变基因频率 q。对于一种相对罕见的 X 连锁隐性遗