般来说,相似性很高的两条序列往往具 有同源关系;但也有例外,即两条序列的相似 性很高,但它们可能并不是同源序列,这两条 序列的相似性可能是由随机因素所产生的,这 在进化上称为“趋同”(convergence),这样 对序列可称为同功序列。直系同源(orthologous) 数 序列是来自于不同种属的同源序列,而并系同 源(paralogous)序列则是来自于同一种属的序列, 与生 它是由进化过程中的序列复制而产生的。 程 院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 11 一般来说,相似性很高的两条序列往往具 有同源关系;但也有例外,即两条序列的相似 性很高,但它们可能并不是同源序列,这两条 序列的相似性可能是由随机因素所产生的,这 在进化上称为“趋同”(convergence),这样一 对序列可称为同功序列。直系同源(orthologous) 序列是来自于不同种属的同源序列,而并系同 源(paralogous)序列则是来自于同一种属的序列, 它是由进化过程中的序列复制而产生的
5.1.2点标方法分析两序列间的相似性 点标(dot plot)是两序列对位排列中最基 本也是最直观的方法。设序列A和B的长度不 同,但很接近。我们可以用二维坐标来标定每 个位点上的对位情况。如图5-1所示,序列A为 X轴,序列B为Y轴。如Ai=Bj,坐标(i,j)处赋 值为“*”,其余赋值为“空白”。逐个比较 所有的字符对,最终形成点阵列。 数理与生 工程学院 2025/5/27 BIOINFORMATICS 12
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 12 5.1.2 点标方法分析两序列间的相似性 点标(dot plot)是两序列对位排列中最基 本也是最直观的方法。设序列A和B的长度不 同,但很接近。我们可以用二维坐标来标定每 个位点上的对位情况。如图5-1所示,序列A为 X轴,序列B为Y轴。如Ai=Bj,,坐标(i, j)处赋 值为“*” ,其余赋值为“空白” 。逐个比较 所有的字符对,最终形成点阵列
米 ATCG ATCG G 图5-1序列比对的点阵图方式
图5-1 序列比对的点阵图方式
显然,如果两条序列完全相同,则在点矩 阵主对角线的位置都有标记;如果两条序列存 在相同的子串,则对于每一个相同的子串对, 有一条与对角线平行的由标记点所组成的斜线, 如图5.2中的斜线代表相同的子串“ATCC";而 对于两条互为反向的序列,则在反对角线方向 上有标记点组成的斜线,如图5.3所示。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 14
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 14 显然,如果两条序列完全相同,则在点矩 阵主对角线的位置都有标记;如果两条序列存 在相同的子串,则对于每一个相同的子串对, 有一条与对角线平行的由标记点所组成的斜线, 如图5.2中的斜线代表相同的子串“ATCC";而 对于两条互为反向的序列,则在反对角线方向 上有标记点组成的斜线,如图5.3所示
T 米 米 米 GATCCT 米 TATCCGA 米 A 米 G 米 图5-2相同子串点阵图
图5-2 相同子串点阵图