第一节:序列比对相关概念 000以 序列比对概念 序列比对(sequence alignment)就是运用某种特定的数 学模型或算法,找出两个或多个序列之间的最大匹配碱基 或残基数,比对的结果反映了算法在多大程度上提供序列 之间的相似性关系及它们的生物学特征。序列比对是序列 分析和数据库搜索的基础。 通过比较两条或多条序列之间是否具有足够的相似性,从 而判定它们之间是否具有同源性。进行多个蛋白质或核酸 序列的比对,可以找出序列中具有保守生物学功能的共同 基序(notif),还可以找出新测定序列中对了解其生物 学功能有帮助的基序。 2
第一节:序列比对相关概念 2 • 序列比对(sequence alignment)就是运用某种特定的数 学模型或算法,找出两个或多个序列之间的最大匹配碱基 或残基数,比对的结果反映了算法在多大程度上提供序列 之间的相似性关系及它们的生物学特征。序列比对是序列 分析和数据库搜索的基础。 • 通过比较两条或多条序列之间是否具有足够的相似性,从 而判定它们之间是否具有同源性。进行多个蛋白质或核酸 序列的比对,可以找出序列中具有保守生物学功能的共同 基序(motif),还可以找出新测定序列中对了解其生物 学功能有帮助的基序。 序列比对概念
第一节:序列比对相关概念 一、序列比对类型 (一)序列比对分类 global alignment 双序列比对 local alignment 多序列比对 3
第一节:序列比对相关概念 3 一、序列比对类型 (一)序列比对分类 双序列比对 多序列比对 global alignment local alignment
第一节:序列比对相关概念 一、序列比对类型 AGCACAC-A A-CACACTA Match (a,a) 字符匹配。 Delete (a,-) 一从第一条序列删除一个字符,或者在第二条序列相应的位置插 入空位。 Replace (a,b) 以第二条序列中的字符b替换第一条序列中的字符a,ab。 Insert(-,b)一在第一条序列插入空位字符,或删除第二条序列中对应字符b。 通过编辑操作计算的两条序列的距离称为编辑距离。 4
第一节:序列比对相关概念 4 一、序列比对类型 通过编辑操作计算的两条序列的距离称为编辑距离。 Match(a,a)——字符匹配。 Delete(a,-)——从第一条序列删除一个字符a,或者在第二条序列相应的位置插 入空位。 Replace(a,b)——以第二条序列中的字符b 替换第一条序列中的字符a,a≠b。 Insert(-,b)——在第一条序列插入空位字符,或删除第二条序列中对应字符b
第一节:序列比对相关概念 一、序列比对类型 1.1双序列比对 s:ATCTAC-TC ATC-TACTC t:A-CTACATC A-CTACATC Match (A,A) Match (A,A) Delete (T,- Delete(T,- Match (C,C) Match (C,C) Match (T,T) Insert(-,T) Match (A,A) Replace(T,A) Match (C,C) Replace(A,C) Insert (-,A) Replace(C,A) Match (T,T) Match (T,T) Match (C,C) Match (C,C) 序列ATCTACTC和ACTACATC的两种比对结果及对应的字符编辑操作 5
第一节:序列比对相关概念 5 一、序列比对类型 1.1 双序列比对 序列ATCTACTC 和ACTACATC 的两种比对结果及对应的字符编辑操作
第一节:序列比对相关概念 一、序列比对类型 1.1双序列比对 就不同类型的编辑操作定义函数w,表示代价 (cost)。 w(a,a)=0 w(a,b)=1(a≠b) w(a,-)=w(-,b)=1 另外,还可以使用函数p来表示得分(score),如下所示: p(a,a)=1 p(a,b)=0(a≠b) p(a,-)=p(-,b)=-1 6
第一节:序列比对相关概念 6 一、序列比对类型 1.1 双序列比对 就不同类型的编辑操作定义函数w,表示代价(cost)。 另外,还可以使用函数p 来表示得分(score),如下所示: