在得分矩阵中,详细地列出各种字符替换 的得分,从而使得计算序列之间的相似度更为 合理。在比较蛋白质时,我们可以用得分矩阵 来增强序列比对的敏感性。得分矩阵是序列比 较的基础,选择不同的得分矩阵将得到不同的 比较结果,而了解得分矩阵的理论依据将有助 于在实际应用中选择合适的得分矩阵。以下介 绍一些常用的得分矩阵或代价矩阵。 理与生 工程学院 2025/5/27 BIOINFORMATICS 26
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 26 在得分矩阵中,详细地列出各种字符替换 的得分,从而使得计算序列之间的相似度更为 合理。在比较蛋白质时,我们可以用得分矩阵 来增强序列比对的敏感性。得分矩阵是序列比 较的基础,选择不同的得分矩阵将得到不同的 比较结果,而了解得分矩阵的理论依据将有助 于在实际应用中选择合适的得分矩阵。以下介 绍一些常用的得分矩阵或代价矩阵
5.1.3.1核酸得分矩阵 设核酸序列所用的字母表为A={A,C,G,T)。 (1)等价矩阵 等价矩阵(见表5-1)是最简单的一种得分矩 阵,其中,相同核苷酸匹配的得分为“1”, 而不同核苷酸的替换得分为“0”(没有得 分)。 理与生物工程学 2025/5/27 BIOINFORMATICS 2
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 27 5.1.3.1 核酸得分矩阵 设核酸序列所用的字母表为A={A,C,G,T}。 (1) 等价矩阵 等价矩阵(见表5-1)是最简单的一种得分矩 阵,其中,相同核苷酸匹配的得分为“1” , 而不同核苷酸的替换得分为“0”(没有得 分)
表5-1等价矩阵 A T C G A 1 0 0 0 T 0 1 0 C 0 0 1 0 G 0 0 0 1 2025/5/27 BIOINFORMATICS 28
2025/5/27 BIOINFORMATICS 28 A T C G A 1 0 0 0 T 0 1 0 0 C 0 0 1 0 G 0 0 0 1 表5-1 等价矩阵
(2)BLAST矩阵 BLAST是目前最流行的核酸序列比较程序,表5-2是 其得分矩阵。这也是一个非常简单的矩阵,如果被比较 的两个核苷酸相同,则得分为“十5”,反之得分为“ 4”。 表5-2 BLAST矩阵 A T C G A 5 -4 -4 -4 T -4 5 -4 -4 C -4 -4 5 -4 G 4 -4 -4 5 2025/5/27 BIOINFORMATICS 29
2025/5/27 BIOINFORMATICS 29 (2) BLAST矩阵 BLAST是目前最流行的核酸序列比较程序,表5-2是 其得分矩阵。这也是一个非常简单的矩阵,如果被比较 的两个核苷酸相同,则得分为“+5” ,反之得分为“- 4” 。 A T C G A 5 -4 -4 -4 T -4 5 -4 -4 C -4 -4 5 -4 G -4 -4 -4 5 表5-2 BLAST矩阵
(3)转换一颠换矩阵 核酸的碱基按照环结构分为两类,一类是嘌呤 (腺嘌呤A,鸟嘌呤G),它们有两个环;另一类是 嘧啶(胞嘧啶C,胸腺嘧啶T),它们的碱基只有一 个环。如果DNA碱基的变化(碱基替换)保持环数 不变,则称为转换(transition),如A→G,C→T;如 果环数发生变化,则称为颠换(transversion),如 A→C,A→T等。在进化过程中,转换发生的频率远 数 比颠换高,而表5-3所示的矩阵正好反映了这种情况, 其中转换的得分为“-1”,而颠换的得分为“-5”。 工程学院 2025/5/27 BIOINFORMATICS 30
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 30 (3)转换—颠换矩阵 核酸的碱基按照环结构分为两类,一类是嘌呤 (腺嘌呤A,鸟嘌呤G),它们有两个环;另一类是 嘧啶(胞嘧啶C,胸腺嘧啶T),它们的碱基只有一 个环。如果DNA碱基的变化(碱基替换)保持环数 不变,则称为转换( transition),如A→G, C→T;如 果环数发生变化,则称为颠换(transversion),如 A→C, A→T等。在进化过程中,转换发生的频率远 比颠换高,而表5-3所示的矩阵正好反映了这种情况, 其中转换的得分为“-1” ,而颠换的得分为“-5”