当前位置：和泉文库 > 生物 > 浏览文档

《生物信息学》课程教学资源（电子讲义）第八章系统发育分析

系统发生(或种系发生、系统发育,phylogeny是指生物形成或进化的历史。系统发生学(phylogenetics)研究物种之间的进化关系,其基本思想是比较物种的特征,并认为特征相似的物种在遗传学上接近。

文件格式：PDF，文件大小：389.52KB，售价：9.78元

文档详细内容（约34页）

寻找一棵最小方差树是一个NP-完全问题,需要采用近似的算法。下面讨论几种计算时间复杂度为多项式的启发式方法,即连锁聚类方法( linkage clustering)、非加权组平均法 ( UPGMA)和邻近归并法( Neighbor Joining 822连锁聚类方法及非加权分组平均法连锁聚类属于一般的聚类分析方法,当用来构建系统发生树时,其假定的前提条件是在进化过程中,核苷酸或氨基酸的替换速率是均等且恒定的,在每一次分歧发生后,从共同祖节点到两个分类单元间的分支长度一样。在构建系统发生树时,首先用n个叶节点表示n 个分类单元(序列),每个分类单元自成一类,然后通过反复的聚类使所有的分类单元都聚为一类,并将进化过程中的祖先赋予树的内部节点,最终得到一个完整的系统发生树。假设若干条序列是从一个共同的祖先进化而来,则系统发生树将是一个有根树,并且从根节点出发到所有叶节点路径的长度相同。对于给定的序列,通过序列之间的两两比对,计算序列之间的进化距离,然后根据距离矩阵构造系统发生树。算法的基本思路是首先从距离矩阵中选择距离最小的一对分类单元 (序列),令它们分别为x和y,然后将这两个分类单元合二为一,形成一个新的对象(代表这两个分类单元的祖先,记为z),并重新计算这个新的对象与其它分类单元(或对象 u表示)之间的距离d(z,u)。不同的实现方案采用不同的计算公式单连锁聚类 d (z, umin(d(x u),d(y, u)) 最大连锁聚类:d(z,u=max(dx,u)d(y,u)) (6-9) 平均连锁聚类:d(z,u)=(dx,u)+dy,u)/2 (6-10) 上述公式中z代表x和y的合并,u代表任意其它对象。每次合并所形成的新对象实际上是个聚类,以一个内部节点表示,该节点到x、y所在节点的距离相同,其值等于d(x,y) 的一半,而到其它节点的距离按照上述公式计算。每次合并后,修改距离矩阵。重复上述过程,直到所有的分类单元都被合并到一类为止

寻找一棵最小方差树是一个 NP-完全问题，需要采用近似的算法。下面讨论几种计算时间复杂度为多项式的启发式方法，即连锁聚类方法（linkage clustering）、非加权组平均法（UPGMA）和邻近归并法（Neighbor Joining）。 8.2.2 连锁聚类方法及非加权分组平均法连锁聚类属于一般的聚类分析方法，当用来构建系统发生树时，其假定的前提条件是：在进化过程中，核苷酸或氨基酸的替换速率是均等且恒定的，在每一次分歧发生后，从共同祖节点到两个分类单元间的分支长度一样。在构建系统发生树时，首先用 n 个叶节点表示 n 个分类单元（序列），每个分类单元自成一类，然后通过反复的聚类使所有的分类单元都聚为一类，并将进化过程中的祖先赋予树的内部节点，最终得到一个完整的系统发生树。假设若干条序列是从一个共同的祖先进化而来，则系统发生树将是一个有根树，并且从根节点出发到所有叶节点路径的长度相同。对于给定的序列，通过序列之间的两两比对，计算序列之间的进化距离，然后根据距离矩阵构造系统发生树。算法的基本思路是首先从距离矩阵中选择距离最小的一对分类单元（序列），令它们分别为 x 和 y，然后将这两个分类单元合二为一，形成一个新的对象（代表这两个分类单元的祖先，记为 z），并重新计算这个新的对象与其它分类单元(或对象，以 u 表示)之间的距离 d(z,u)。不同的实现方案采用不同的计算公式：单连锁聚类: d(z,u)=min(d(x,u),d(y,u)) （6-8）最大连锁聚类： d(z,u)=max(d(x,u),d(y,u)) （6-9）平均连锁聚类： d(z,u)=(d(x,u)+d(y,u))/2 （6-10）上述公式中 z 代表 x 和 y 的合并，u 代表任意其它对象。每次合并所形成的新对象实际上是一个聚类，以一个内部节点表示，该节点到 x、y 所在节点的距离相同，其值等于 d（x，y）的一半，而到其它节点的距离按照上述公式计算。每次合并后，修改距离矩阵。重复上述过程，直到所有的分类单元都被合并到一类为止

点击进入文档下载页（PDF格式）

共34页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录