GCTA ATCG A G 图5-3反向序列点阵图
图5-3 反向序列点阵图
T米 C C 米 TAT-GCCT G TATCCGCCTC 米 米 。A T CC G CC T C 图5-4多个相同连续子串序列的点阵图
图5-4 多个相同连续子串序列的点阵图
除非已经知道待比较的序列非常相似,一 般先用点矩阵方法比较,因为这种方法可以通 过观察阵列的对角线迅速发现可能的序列比对。 两条序列中有很多匹配的字符对,因而在点矩 阵中会形成很多点标记。当对比较长的序列进 行比较时,这样的点阵图很快会变得非常复杂 数 和模糊。使用滑动窗口代替一次一个位点的比 较是解决这个问题的有效方法。 星 工程 院 2025/5/27 BIOINFORMATICS 18
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 18 除非已经知道待比较的序列非常相似,一 般先用点矩阵方法比较,因为这种方法可以通 过观察阵列的对角线迅速发现可能的序列比对。 两条序列中有很多匹配的字符对,因而在点矩 阵中会形成很多点标记。当对比较长的序列进 行比较时,这样的点阵图很快会变得非常复杂 和模糊。使用滑动窗口代替一次一个位点的比 较是解决这个问题的有效方法
假设窗口大小为10,相似度阈值为8。首先,将X轴序 列的第1~10个字符与Y轴序列的第1~10个字符进行比较。 如果在第一次比较中,这10个字符中有8个或者8个以上相 同,那么就在点阵空间(1,1)的位置画上点标记。然后窗 口沿X轴向右移动一个字符的位置,比较X轴序列的第2 ~11个字符与Y轴序列的第1~10个字符。不断重复这个过程, 直到X轴上所有长度为10的子串都与Y轴第1~10个字符组 成的子串比较过为止。 然后,将Y轴的窗口向上移动一个字符的位置,重复 数 以上过程,直到两条序列中所有长度为10的子串都被两两 理 比较过为止。基于滑动窗口的点矩阵方法可以明显地降低 点阵图的噪声,并且可以明确地指出两条序列间具有显著 物 相似性的区域。 院 2025/5/27 BIOINFORMATICS 19
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 19 假设窗口大小为10,相似度阈值为8。首先,将X轴序 列的第110个字符与Y轴序列的第110个字符进行比较。 如果在第一次比较中,这10个字符中有8个或者8个以上相 同,那么就在点阵空间(1,1)的位置画上点标记。然后窗 口沿X轴向右移动一个字符的位置,比较X轴序列的第2 11个字符与Y轴序列的第110个字符。不断重复这个过程, 直到X轴上所有长度为10的子串都与Y轴第110个字符组 成的子串比较过为止。 然后,将Y轴的窗口向上移动一个字符的位置,重复 以上过程,直到两条序列中所有长度为10的子串都被两两 比较过为止。基于滑动窗口的点矩阵方法可以明显地降低 点阵图的噪声,并且可以明确地指出两条序列间具有显著 相似性的区域
以上时论了如何利用单元矩阵来构建点阵 图。更加复杂的点阵图可基于不同的计分规则 而构建。这些计分规则规定了不同残基之间相 似性程度的分值。例如,可以根据不同残基之 间在进化关系、空间结构、理化性质等方面的 相似性来规定它们之间的相似性分数值。在这 种情况下,由于点阵图不只是简单的稀疏矩阵, 数 那些非主对角线点的信号和噪声同时得到放大, 与生 所以噪声过滤就变得十分重要。常用的方法是 引入滑动窗口作为平滑函数提高点阵图的信噪 程学 比。 2025/5/27 BIOINFORMATICS 20
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 20 以上讨论了如何利用单元矩阵来构建点阵 图。更加复杂的点阵图可基于不同的计分规则 而构建。这些计分规则规定了不同残基之间相 似性程度的分值。例如,可以根据不同残基之 间在进化关系、空间结构、理化性质等方面的 相似性来规定它们之间的相似性分数值。在这 种情况下,由于点阵图不只是简单的稀疏矩阵, 那些非主对角线点的信号和噪声同时得到放大, 所以噪声过滤就变得十分重要。常用的方法是 引入滑动窗口作为平滑函数提高点阵图的信噪 比