2520 15 10 L▣口 200 300 400 Alignment score 图68比对计分的统计比较。计算重排序列比对的计分值,产生该计分值出现的次数。用出 现次数对比对计分值作图。该图表示随机重排序列比对的积分分布。一链和肌红蛋白序列 比对计分(红色)远远高于随机重排的计分,强烈提示这两个蛋白序列相似性明显。 采用替代矩阵确定进化关系 上述打分方案只关心一致位点和缺口,没有考虑那些不一致的位点。但是,并不是所有 不一致位点(即替代位点)都是等效的。有些替代是保守替代,即用性质和结构相似的氨基 酸进行的替代。保守替代对蛋白质功能影响最小。有些替代用性质和结构完全不同的氨基酸 进行替代。此外,有些替代只需更换一个核苷酸,有些替代要更换两个或三个核苷酸。保守 替代或单核苷酸替代发生频率比非保守性替代的频率高。那么,当我们进行序列比对时,如 何评价不同的替代?要解决这个问题,首先要考察有进化关系的蛋白质分子中已经存在的氨 基酸替代。 基于序列适当比对的数据,人们提出了替代矩阵。在该矩阵中,那些发生频率高的替代, 得分高;那些发生频率非常少的替代,失分就多。图69是Blosum-62替代矩阵。从该表可 以看出半胱氨酸和色氨酸比丝氨酸和丙氨酸保守得多。而且结构上保守的替代,如赖氨酸替 代精氨酸、异亮氨酸替代颉氨酸,得分就比较高。在进行两个序列比对时,要给每个替代打 分。对缺口的打分也细化了。一个氨基酸残基缺口扣12分,在此基础上缺口每增加一个残 基加扣2分。采用这种打分方式,图6.6比对就能够获得115分。大多数替代是保守替代(得 分是正值),极少数替代是稀有替代(得分是负值)(图6.10)
图 6.8 比对计分的统计比较。计算重排序列比对的计分值,产生该计分值出现的次数。用出 现次数对比对计分值作图。该图表示随机重排序列比对的积分分布。链和肌红蛋白序列 比对计分(红色)远远高于随机重排的计分,强烈提示这两个蛋白序列相似性明显。 采用替代矩阵确定进化关系 上述打分方案只关心一致位点和缺口,没有考虑那些不一致的位点。但是,并不是所有 不一致位点(即替代位点)都是等效的。有些替代是保守替代,即用性质和结构相似的氨基 酸进行的替代。保守替代对蛋白质功能影响最小。有些替代用性质和结构完全不同的氨基酸 进行替代。此外,有些替代只需更换一个核苷酸,有些替代要更换两个或三个核苷酸。保守 替代或单核苷酸替代发生频率比非保守性替代的频率高。那么,当我们进行序列比对时,如 何评价不同的替代?要解决这个问题,首先要考察有进化关系的蛋白质分子中已经存在的氨 基酸替代。 基于序列适当比对的数据,人们提出了替代矩阵。在该矩阵中,那些发生频率高的替代, 得分高;那些发生频率非常少的替代,失分就多。图 6.9 是 Blosum-62 替代矩阵。从该表可 以看出半胱氨酸和色氨酸比丝氨酸和丙氨酸保守得多。而且结构上保守的替代,如赖氨酸替 代精氨酸、异亮氨酸替代颉氨酸,得分就比较高。在进行两个序列比对时,要给每个替代打 分。对缺口的打分也细化了。一个氨基酸残基缺口扣 12 分,在此基础上缺口每增加一个残 基加扣 2 分。采用这种打分方式,图 6.6 比对就能够获得 115 分。大多数替代是保守替代(得 分是正值),极少数替代是稀有替代(得分是负值)(图 6.10)
Score 15 圆 © 风 回 可 国 四 国 ⊙ 圆四回 a 圆 国 回 @ ▣四 ⊙ -¥V 1- 发 3 M1- ¥ -HW- EN -D -0 -5- LM- M 0 HR ER -NS 器 -NAV TGV -SA DH N5- RG TAM- R EKO TA c痛 留 ST AV LV- -1 AY ( -2一 P DA GPM 路 -PY DRG HRN PLY -DKT 贤 ACY 警 -3 6M -TGP PMY- -¥ 部 KQ 4 CIW 新 W 野 CMW 供 肤 響 GP ERN CP -5 CH 思 W 860 6 DHG DG -6 Figure6-9 Biochemistry,Sixth Edition 2007 W.H.Freeman and Company 图6.9Bl0sum-62替代矩阵。考察同源蛋白各种替代发生的机会,制定该打分方案。氨基酸 归为四类:带电氨基酸(红色);极性氨基酸(绿色);大的非极性氨基酸(蓝色);其它氨 基酸(黑色)。只需要改变一个核苷酸的替代用阴影标出。当你寻找一种替代应该给出的打 分时,你在顶部寻找原来的氨基酸(在每列的顶部),然后向下寻找替代氨基酸,从表格左 边查找相应的得分
图 6.9 Blosum-62 替代矩阵。考察同源蛋白各种替代发生的机会,制定该打分方案。氨基酸 归为四类:带电氨基酸(红色);极性氨基酸(绿色);大的非极性氨基酸(蓝色);其它氨 基酸(黑色)。只需要改变一个核苷酸的替代用阴影标出。当你寻找一种替代应该给出的打 分时,你在顶部寻找原来的氨基酸(在每列的顶部),然后向下寻找替代氨基酸,从表格左 边查找相应的得分