5.1.3描述相似性的记分矩阵 如果序列比较仅仅取决于序列间严格一致 的区域,那么我们可以将其转化为一种极为简 单的程序。然而,大多数序列对位排列不是仅 仅限制在子序列的范围内,而是涉及全长序列 的比较。有时,也不能简单理解为如何减少间 隔的数目,而要同时考虑对位排列后序列的生 物学意义。例如,某些氨基酸有时应放在非严 理与生 格一致的位置。 工程 院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 21 5.1.3 描述相似性的记分矩阵 如果序列比较仅仅取决于序列间严格一致 的区域,那么我们可以将其转化为一种极为简 单的程序。然而,大多数序列对位排列不是仅 仅限制在子序列的范围内,而是涉及全长序列 的比较。有时,也不能简单理解为如何减少间 隔的数目,而要同时考虑对位排列后序列的生 物学意义。例如,某些氨基酸有时应放在非严 格一致的位置
记分矩阵方法(scoring matrix)被广泛应用于 评价序列对位排列的质量。通常使用得分(+)、 无分(0)或罚分()来进行综合评价。考虑未匹配 和间隔的罚分以及权重不均衡等因素,记分矩 阵就更加复杂。人们已提出各种各样的记分矩 阵来进行不同目的序列对位排列。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 22
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 22 记分矩阵方法(scoring matrix)被广泛应用于 评价序列对位排列的质量。通常使用得分(+)、 无分(0)或罚分(-)来进行综合评价。考虑未匹配 和间隔的罚分以及权重不均衡等因素,记分矩 阵就更加复杂。人们已提出各种各样的记分矩 阵来进行不同目的序列对位排列
不同类型的字符替换,其代价或得分是不一 样的,特别是对于蛋白质序列。某些氨基酸可以 很容易地相互取代而不用改变它们的理化性质。 例如,考虑这样两条蛋白质序列,其中一条在某 一位置上是丙氨酸,如果该位点被替换成另一个 较小且疏水的氨基酸,比如缬氨酸,那么对蛋白 质功能的影响可能较小;如果被替换成较大且带 电的残基,比如赖氨酸,那么对蛋白质功能的影 理与生 响可能就要比前者大。 工 程 院 2025/5/27 BIOINFORMATICS 23
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 23 不同类型的字符替换,其代价或得分是不一 样的,特别是对于蛋白质序列。某些氨基酸可以 很容易地相互取代而不用改变它们的理化性质。 例如,考虑这样两条蛋白质序列,其中一条在某 一位置上是丙氨酸,如果该位点被替换成另一个 较小且疏水的氨基酸,比如缬氨酸,那么对蛋白 质功能的影响可能较小;如果被替换成较大且带 电的残基,比如赖氨酸,那么对蛋白质功能的影 响可能就要比前者大
直观地讲,比较保守的替换比起较随机替 换更可能维持蛋白质的功能,且更不容易被淘 汰。因此,在为比对打分时,我们可能更倾向 对丙氨酸与缬氨酸的比对位点给予一定的奖励, 而对于丙氨酸与那些大而带电氨基酸(比如赖 氨酸)的比对位点则相反。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 24
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 24 直观地讲,比较保守的替换比起较随机替 换更可能维持蛋白质的功能,且更不容易被淘 汰。因此,在为比对打分时,我们可能更倾向 对丙氨酸与缬氨酸的比对位点给予一定的奖励, 而对于丙氨酸与那些大而带电氨基酸(比如赖 氨酸)的比对位点则相反
理化性质相近的氨基酸残基之间替换的代 价显然应该比理化性质相差甚远的氨基酸残基 替换得分高,或者代价小。同样,保守的氨基 酸替换得分应该高于非保守的氨基酸替换。这 样的打分方法在比对非常相近的序列以及差异 极大的序列时,会得出不同的分值。这就是提 出得分矩阵(或者称为取代矩阵)的原由。 理与生物工程学 2025/5/27 BIOINFORMATICS 25
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 25 理化性质相近的氨基酸残基之间替换的代 价显然应该比理化性质相差甚远的氨基酸残基 替换得分高,或者代价小。同样,保守的氨基 酸替换得分应该高于非保守的氨基酸替换。这 样的打分方法在比对非常相近的序列以及差异 极大的序列时,会得出不同的分值。这就是提 出得分矩阵(或者称为取代矩阵)的原由