2)、假设有两条序列,要求判断是否有一条序列 的前缀与另一条序列的后缀相似,如果是,则分 别取出前缀和后缀。该操作常用于大规模DNA测 序中序列片段的组装。 (3)、假设有两条序列,要求判断其中的一条序列 是否是另一条序列的子序列。这种操作常用于搜 索特定的序列模式。 理 (④)、假设有两条序列,要求判断这两条序列中是 与生 否有非常相似的子序列。这种操作可用于分析保 守序列。 程 院 2025/5/27 BIOINFORMATICS 6
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 6 (2)、假设有两条序列,要求判断是否有一条序列 的前缀与另一条序列的后缀相似,如果是,则分 别取出前缀和后缀。该操作常用于大规模DNA测 序中序列片段的组装。 (3)、假设有两条序列,要求判断其中的一条序列 是否是另一条序列的子序列。这种操作常用于搜 索特定的序列模式。 (4)、假设有两条序列,要求判断这两条序列中是 否有非常相似的子序列。这种操作可用于分析保 守序列
当然,进行序列比较时,往往还需要说明 是采取全局比较,还是采取局部比较。全局比 较是比较两条完整的序列,而局部比较是找出 最大相似的子序列。 本章着重介绍通用的序列比较方法。了解 序列比较的原理对于正确、合理、灵活地使用 数 相关生物信息学资源和软件有重要的指导意义。 理 与生 工 程 院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 7 当然,进行序列比较时,往往还需要说明 是采取全局比较,还是采取局部比较。全局比 较是比较两条完整的序列,而局部比较是找出 最大相似的子序列。 本章着重介绍通用的序列比较方法。了解 序列比较的原理对于正确、合理、灵活地使用 相关生物信息学资源和软件有重要的指导意义
§5.1序列的相似性 5.1.1几个基本概念 序列的相似性可以是定量的数值,也可以 是定性的描述。相似度是一个数值,反映两条 序列的相似程度。关于两条序列之间的关系, 有许多名词,如相同、相似、同源、同功、直 系同源、并系同源等。 数理与生物工程学院 2025/5/27 BIOINFORMATICS
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 8 §5.1序列的相似性 5.1.1 几个基本概念 序列的相似性可以是定量的数值,也可以 是定性的描述。相似度是一个数值,反映两条 序列的相似程度。关于两条序列之间的关系, 有许多名词,如相同、相似、同源、同功、直 系同源、并系同源等
在很多时候,往往通过一个简单序列相似 性的比较就可以对未知序列进行初步的功能预 测,为后续实验确定初步的研究方向。本节将 主要讲述如何采用生物信息学技术对核酸序列 进行较为全面的分析。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 9
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 9 在很多时候,往往通过一个简单序列相似 性的比较就可以对未知序列进行初步的功能预 测,为后续实验确定初步的研究方向。本节将 主要讲述如何采用生物信息学技术对核酸序列 进行较为全面的分析
在进行序列比较时经常使用“同 源”(homology)和“相似”(similarity)这两个概 念,这是两个经常容易被混淆的不同概念。两 条序列同源是指它们具有共同的祖先。在这个 意义上,无所谓同源的程度,两条序列要么同 源,要么不同源。而相似则是有程度的差别, 如两条序列的相似程度达到30%或60%。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 10
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 10 在 进 行 序 列 比 较 时 经 常 使 用 “ 同 源”(homology )和“相似”(similarity)这两个概 念,这是两个经常容易被混淆的不同概念。两 条序列同源是指它们具有共同的祖先。在这个 意义上,无所谓同源的程度,两条序列要么同 源,要么不同源。而相似则是有程度的差别, 如两条序列的相似程度达到30%或60%