第九章系统发育分析 页码,1/3 第九章系统发育分析 Mark A. Hershkovi tz and Detlef D Lei pe Nati onal Center for Biotechnol ogy I nformati on Nati onal Li brary of Medi ci ne Nati onal insti tutes of heal th Bethesda, Maryl and 系统发育学研究的是进化关系,系统发育分析就是要推断或者评估这些进化关系。通过系统 发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同 一谱系的进化关系,包括了分子进化(基因树)、物种进化以及分子进化和物种进化的综 合。因为”cade”这个词(拥有共同祖先的同一谱系)在希腊文中的本意是分支,所以系统 发育学有时被称为遗传分类学( cl adi stics)。在现代系统发育学研究中,研究的重点已经不 再是生物的形态学特征或者其他特性,而是生物大分子尤其是序列。 尽管本章的目的是想描述一个万能的系统发育分析方法,但是这个目标过于天真,是不可能 实现的( Hils et al.,1993)。虽然人们已经设计了大量的用于系统发育的算法、过程和计算 机程序,这些方法的可靠性和实用性还是依赖于数据的结构和大小,因此关于这些方法的优 点和缺点的激烈争论成了分类学和系统发育学期刊的热门课题( Avi se,1994: Sai tou,1996 Li,1997; Swofford et al.,1996a)。 Hillis等人(1993)曾经极其简单地介绍过系统发 育学 比起许多其它学科而言,用计算的方法进行系统发育分析很容易得到错误的结果,而且出错 的危险几乎是不可避免的;其它学科一般都会有实验基础,而系统发育分析不太可能会拥有 实验基础,至多也就是一些模拟实验或者病毒实验( Hillis et a.,194);实际上,系统 发育的发生过程都是已经完成的历史,只能去推断或者评估,而无法再现了。尽管现在的系 统发育分析的程序存在着很多缺陷,许多生物学著作中仍然大量引用系统发育分析得到的结 论,这些结论的源数据只是简单地应用了某一个系统发育的分析程序。只有在很偶然的情况 ,在应用某些软件处理数据时受到的困难会少一点,但是在概念上理解这些程序是如何处 理数据仍然是个难题。 本文中关于系统发育分析方法的指导有如下一些目的。首先,我们要介绍一个概念性的步 骤,这个步骤包含了当前在对生物序列进行系统发育分析时最广泛使用的方法中应用到的 些最重要的原理。这个步骤认为,所有的系统发育方法都刻画了一个模型去模拟真实的进化 过程,然后假定程序发现的序列之间的差异是模拟的进化结果,而这个模型本身就包含了方 法中固有的假定。对于一个好的使用的系统发育的分析方法,刻画一个正确的模型同描绘 个正确的进化树是同等重要的。另外,我们还将讨论一些比较通用的方法所刻画的模型,并 且讨论一下这些模型是如何影响对数据组的分析的。最后,我们会针对系统发育模型和进化 史的推论,提供一些具体方法应用的例子 系统发育模型的组成 系统发育的建树方法都会预先假定一个进化模型( Penny et al.1994)。比如,所有广泛 使用的方法都假定进化的分歧是严格分枝的,因此我们可以用树状拓扑发生图来描述已知的 数据。但是在一个给定的数据组中,因为存在着物种的杂交以及物种之间遗传物质的传递 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18
бゴ㋏㒳থ㚆ߚᵤ Mark A. Hershkovitz and Detlef D.Leipe National Center for Biotechnology Information National Library of Medicine National Institutes of Health Bethesda,Maryland ㋏㒳থ㚆ᄺⷨおⱘᰃ䖯࣪LTDˈLTD݇㒳থ㚆ߚᵤህᰃ㽕ᮁ㗙䆘Ԅ䖭ѯ䖯࣪LTD݇DŽ䗮䖛㋏㒳 থ㚆ߚᵤ᠔ᮁߎᴹⱘ䖯࣪LTD݇ϔ㠀⫼ߚᵱ㸼˄䖯࣪˅ᷥᴹᦣ䗄ˈ䖭Ͼ䖯࣪ᷥህᦣ䗄њৠ ϔ䈅㋏ⱘ䖯࣪ˈLTD݇ࣙᣀњߚᄤ䖯࣪˅ᷥ˄ǃ⠽⾡䖯࣪ҹঞߚᄤ䖯࣪⠽⾡䖯࣪ⱘ㓐 ড়DŽЎ”clade”䖭Ͼ䆡˄ᢹ᳝݅ৠ⼪ܜⱘৠϔ䈅㋏˅Ꮰ㜞᭛Ёⱘᴀᛣᰃߚˈᬃ᠔ҹ㋏㒳 থ㚆ᄺ᳝ᯊ㹿⿄Ў䘫Ӵߚ㉏ᄺ(cladistics)DŽ⦄ҷ㋏㒳থ㚆ᄺⷨおЁˈⷨおⱘ䞡⚍Ꮖ㒣ϡ ݡᰃ⫳⠽ⱘᔶᗕᄺ⡍ᕕ㗙݊Ҫ⡍ᗻˈ㗠ᰃ⫳⠽ߚᄤᇸ݊ᰃᑣ߫DŽ ሑㅵᴀゴⱘⳂⱘᰃᛇᦣ䗄ϔϾϛ㛑ⱘ㋏㒳থ㚆ߚᵤᮍ⊩ˈԚᰃ䖭ϾⳂᷛ䖛Ѣⳳˈᰃϡৃ㛑 ᅲ⦄ⱘ(Hills et al.,1993)DŽ㱑✊ҎӀᏆ㒣䆒䅵њ䞣ⱘ⫼Ѣ㋏㒳থ㚆ⱘㅫ⊩ǃ䖛䅵ㅫ ᴎᑣˈ䖭ѯᮍ⊩ⱘৃ䴴ᗻᅲ⫼ᗻ䖬ᰃձ䌪Ѣ᭄ⱘ㒧ᵘᇣˈℸ݇Ѣ䖭ѯᮍ⊩ⱘӬ ⚍㔎⚍ⱘ▔⚜ѝ䆎៤њߚ㉏ᄺ㋏㒳থ㚆ᄺᳳߞⱘ⛁䮼䇒乬˄Avise, 1994:Saitou, 1996; Li, 1997; Swofford et al., 1996a˅DŽHillisㄝҎ˄1993˅᳒㒣ᵕ݊ㅔऩഄҟ㒡䖛㋏㒳থ 㚆ᄺDŽ ↨䍋䆌݊ᅗᄺ⾥㗠㿔ˈ⫼䅵ㅫⱘᮍ⊩䖯㸠㋏㒳থ㚆ߚᵤᕜᆍᯧᕫࠄ䫭䇃ⱘ㒧ᵰˈ㗠Ϩߎ䫭 ⱘॅ䰽Тᰃϡৃ䙓ܡⱘ˗݊ᅗᄺ⾥ϔ㠀䛑Ӯ᳝ᅲ偠⸔ˈ㗠㋏㒳থ㚆ߚᵤϡৃ㛑Ӯᢹ᳝ ᅲ偠⸔ˈ㟇гህᰃϔѯᢳᅲ偠㗙⮙↦ᅲ偠˄Hillis et al., 1994˅˗ᅲ䰙Ϟˈ㋏㒳 থ㚆ⱘথ⫳䖛䛑ᰃᏆ㒣ᅠ៤ⱘग़ˈা㛑এᮁ㗙䆘Ԅˈ㗠᮴⊩ݡ⦃њDŽሑㅵ⦄ⱘ㋏ 㒳থ㚆ߚᵤⱘᑣᄬⴔᕜ㔎䱋ˈ䆌⫳⠽ᄺ㨫Ёҡ✊䞣ᓩ⫼㋏㒳থ㚆ߚᵤᕫࠄⱘ㒧 䆎ˈ䖭ѯ㒧䆎ⱘ⑤᭄াᰃㅔऩഄᑨ⫼њᶤϔϾ㋏㒳থ㚆ⱘߚᵤᑣDŽা᳝ᕜي✊ⱘᚙމ ϟˈᑨ⫼ᶤѯ䕃ӊ໘⧚᭄ᯊফࠄⱘೄ䲒Ӯᇥϔ⚍ˈԚᰃὖᗉϞ⧚㾷䖭ѯᑣᰃབԩ໘ ⧚᭄ҡ✊ᰃϾ䲒乬DŽ ᴀ᭛Ё݇Ѣ㋏㒳থ㚆ߚᵤᮍ⊩ⱘᣛᇐ᳝བϟϔѯⳂⱘDŽ佪ܜˈ៥Ӏ㽕ҟ㒡ϔϾὖᗉᗻⱘℹ 偸ˈ䖭Ͼℹ偸ࣙњᔧࠡᇍ⫳⠽ᑣ߫䖯㸠㋏㒳থ㚆ߚᵤᯊ᳔ᑓ⊯Փ⫼ⱘᮍ⊩Ёᑨ⫼ࠄⱘϔ ѯ᳔䞡㽕ⱘॳ⧚DŽ䖭Ͼℹ偸䅸Ўˈ᠔᳝ⱘ㋏㒳থ㚆ᮍ⊩䛑ࠏ⬏њϔϾൟএᢳⳳᅲⱘ䖯࣪ 䖛ˈ✊ৢ؛ᅮᑣথ⦄ⱘᑣ߫П䯈ⱘᏂᓖᰃᢳⱘ䖯࣪㒧ᵰˈ㗠䖭Ͼൟᴀ䑿ህࣙњᮍ ⊩Ё᳝ⱘ؛ᅮDŽᇍѢϔϾདⱘՓ⫼ⱘ㋏㒳থ㚆ⱘߚᵤᮍ⊩ˈࠏ⬏ϔϾℷ⹂ⱘൟৠᦣ㒬ϔ Ͼℷ⹂ⱘ䖯࣪ᷥᰃৠㄝ䞡㽕ⱘDŽˈ៥Ӏ䖬ᇚ䅼䆎ϔѯ↨䕗䗮⫼ⱘᮍ⊩᠔ࠏ⬏ⱘൟˈᑊ Ϩ䅼䆎ϔϟ䖭ѯൟᰃབԩᕅડᇍ᭄㒘ⱘߚᵤⱘDŽ᳔ৢˈ៥ӀӮ䩜ᇍ㋏㒳থ㚆ൟ䖯࣪ ⱘ䆎ˈᦤկϔѯԧᮍ⊩ᑨ⫼ⱘ՟ᄤDŽ ㋏㒳থ㚆ൟⱘ㒘៤ ㋏㒳থ㚆ⱘᓎᷥᮍ⊩䛑Ӯ乘؛ܜᅮϔϾ䖯࣪˄ൟPenny et al., 1994˅DŽ↨བˈ᠔᳝ᑓ⊯ Փ⫼ⱘᮍ⊩䛑؛ᅮ䖯࣪ⱘߚFAXᰃϹḐߚᵱⱘˈℸ៥Ӏৃҹ⫼ᷥ⢊ᢧᠥথ⫳ᴹᦣ䗄Ꮖⶹⱘ ᭄DŽԚᰃϔϾ㒭ᅮⱘ᭄㒘ЁˈЎᄬⴔ⠽⾡ⱘᴖѸҹঞ⠽⾡П䯈䘫Ӵ⠽䋼ⱘӴ䗦ˈ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ1/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第九章系统发育分析 页码,2/3 这个假定很可能会被推翻。因此,如果所观察的序列并非是严格遗传的话,大多数系统发育 方法就会得到错误的结果。 系统发育方法中固有的模型会导致一些额外的假定: 1.序列有指定的来源并且正确无误( Hel big and Sei bol d,1996; Hershkovi tz and Lewis, 1996: Sol tis et al. 1997) 2.序列是同源的(也就是说,所有的序列都起源于同一祖先序列);这些序列不是 paral og°( paral og指的是一个祖先序列通过复制等方法在基因组中产生的歧化序 列)的混合物。 3.序列比对中,不同序列的同一个位点都是同源的 4.在接受分析的一个序列组中,序列之间的系统发育史是相同的(比如,序列组中不存在 核序列与细胞器序列的混合)。 5.样本足以解决感兴趣的问题 6.样本序列之间的差异代表了感兴趣的宽组 7.样本序列之间的差异包含了足以解决感兴趣的问题的系统发育信号 还有一些假定,在某些方法中是默认的,但是在另外一些方法中是可以修正的 8.样本序列是随机进化的。 9.序列中的所有位点的进化都是随机的。 10.序列中的每一个位点的进化都是独立的 许多公开发表的系统发育分析结果的错误通常都是因为违反了上述假定,特别令人恼火的是 现有的方法并不能察觉对基本假定的违反。每一个序列组都必须根据上述基本假定进行评 估,并且同分析过程相协调。下面我们将会描述分析过程。 系统发育数据分析:比对,建立取代模型,建立进化树以及进 化树评估 对DNA序列进行系统发育分析的四个主要步骤是比对,建立取代模型,建立进化树以及进化树 评估。一般来说,执行这四个步骤的计算机程序都是相互独立的,但是他们都是进行系统发 育分析的有机部分 当前的讨论主要集中在分析DNA序列的方法上,这些方法基本上(不全是)仍然是通过碱基和 密码子的替代来考察序列的差异;这个方法同样应用于对蛋白质序列的分析,但是由于氨基 酸的生物化学多样性,我们必须引入更多的数学参数。因此,下面讨论的适用于核苷酸碱基 的方法同样适用于氨基酸和密码子,而关于蛋白质的一些特殊问题和程序会在别的地方得到 讨论( Fel sensei n,1996)。 因为建树的标准在一定程度上依赖比对和取代模型,因此一开始就应该介绍这些方法,这些 介绍非常必要。三种主要的建树方法分别是距离、最大节约( maxi mum parsi mony,MP)和最 大似然( maxi mum ike i hood,ML)。距离树考察数据组中所有序列的两两比对结果,通过 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18
䖭Ͼ؛ᅮᕜৃ㛑Ӯ㹿㗏DŽℸˈབᵰ᠔㾖ᆳⱘᑣ߫ᑊ䴲ᰃϹḐ䘫Ӵⱘ䆱ˈ᭄㋏㒳থ㚆 ᮍ⊩ህӮᕫࠄ䫭䇃ⱘ㒧ᵰDŽ ㋏㒳থ㚆ᮍ⊩Ё᳝ⱘൟӮᇐ㟈ϔѯ乱ⱘ؛ᅮ˖ 1. ᑣ᳝߫ᣛᅮⱘᴹ⑤ᑊϨℷ⹂᮴䇃˄Helbig and Seibold, 1996; Hershkovitz and Lewis, 1996; Soltis et al., 1997˅DŽ 2. ᑣ߫ᰃৠ⑤ⱘ˄гህᰃ䇈ˈ᠔᳝ⱘᑣ߫䛑䍋⑤Ѣৠϔ⼪ܜᑣ߫˅˗䖭ѯᑣ߫ϡᰃ “paralog“˄paralogᣛⱘᰃϔϾ⼪ܜᑣ߫䗮䖛ࠊㄝᮍ⊩㒘Ёѻ⫳ⱘ℻࣪ᑣ ߫˅ⱘ⏋ড়⠽DŽ 3. ᑣ߫↨ᇍЁˈϡৠᑣ߫ⱘৠϔϾԡ⚍䛑ᰃৠ⑤ⱘDŽ 4. ফߚᵤⱘϔϾᑣ߫㒘Ёˈᑣ߫П䯈ⱘ㋏㒳থ㚆ᰃⳌৠⱘ˄↨བˈᑣ߫㒘Ёϡᄬ Ḍᑣ߫Ϣ㒚㚲఼ᑣ߫ⱘ⏋ড়˅DŽ 5. ḋᴀ䎇ҹ㾷އ݈ᛳ䍷ⱘ䯂乬DŽ 6. ḋᴀᑣ߫П䯈ⱘᏂᓖҷ㸼њᛳ݈䍷ⱘᆑ㒘DŽ 7. ḋᴀᑣ߫П䯈ⱘᏂᓖࣙњ䎇ҹ㾷އ݈ᛳ䍷ⱘ䯂乬ⱘ㋏㒳থ㚆ֵোDŽ 䖬᳝ϔѯ؛ᅮˈᶤѯᮍ⊩Ёᰃ咬䅸ⱘˈԚᰃϔѯᮍ⊩Ёᰃৃҹׂℷⱘ˖ 8. ḋᴀᑣ߫ᰃ䱣ᴎ䖯࣪ⱘDŽ 9. ᑣ߫Ёⱘ᠔᳝ԡ⚍ⱘ䖯࣪䛑ᰃ䱣ᴎⱘDŽ 10. ᑣ߫Ёⱘ↣ϔϾԡ⚍ⱘ䖯࣪䛑ᰃ⣀ゟⱘDŽ 䆌݀ᓔথ㸼ⱘ㋏㒳থ㚆ߚᵤ㒧ᵰⱘ䫭䇃䗮ᐌ䛑ᰃЎ䖱ডњϞ䗄؛ᅮˈ⡍߿ҸҎᙐ☿ⱘᰃ ⦄᳝ⱘᮍ⊩ᑊϡ㛑ᆳ㾝ᇍᴀ؛ᅮⱘ䖱ডDŽ↣ϔϾᑣ߫㒘䛑ᖙ乏ḍϞ䗄ᴀ؛ᅮ䖯㸠䆘 ԄˈᑊϨৠߚᵤ䖛Ⳍण䇗DŽϟ䴶៥ӀᇚӮᦣ䗄ߚᵤ䖛DŽ ㋏㒳থ㚆᭄ߚᵤ˖↨ᇍˈᓎゟপҷൟˈᓎゟ䖯࣪ᷥҹঞ䖯 䆘Ԅᷥ࣪ ᇍDNAᑣ߫䖯㸠㋏㒳থ㚆ߚᵤⱘಯϾЏ㽕ℹ偸ᰃ↨ᇍˈᓎゟপҷൟˈᓎゟ䖯࣪ᷥҹঞ䖯࣪ᷥ 䆘ԄDŽϔ㠀ᴹ䇈ˈᠻ㸠䖭ಯϾℹ偸ⱘ䅵ㅫᴎᑣ䛑ᰃⳌѦ⣀ゟⱘˈԚᰃҪӀ䛑ᰃ䖯㸠㋏㒳থ 㚆ߚᵤⱘ᳝ᴎ䚼ߚDŽ ᔧࠡⱘ䅼䆎Џ㽕䲚ЁߚᵤDNAᑣ߫ⱘᮍ⊩Ϟˈ䖭ѯᮍ⊩ᴀϞ˄ϡܼᰃ˅ҡ✊ᰃ䗮䖛⺅ ᆚⷕᄤⱘ᳓ҷᴹ㗗ᆳᑣ߫ⱘᏂᓖ˗䖭Ͼᮍ⊩ৠḋᑨ⫼Ѣᇍ㲟ⱑ䋼ᑣ߫ⱘߚᵤˈԚᰃ⬅Ѣ⇼ 䝌ⱘ⫳⠽࣪ᄺḋᗻˈ៥Ӏᖙ乏ᓩܹⱘ᭄ᄺখ᭄DŽℸˈϟ䴶䅼䆎ⱘ䗖⫼ѢḌ㣋䝌⺅ ⱘᮍ⊩ৠḋ䗖⫼Ѣ⇼䝌ᆚⷕᄤˈ㗠݇Ѣ㲟ⱑ䋼ⱘϔѯ⡍⅞䯂乬ᑣӮ߿ⱘഄᮍᕫࠄ 䅼䆎˄Felsenstein, 1996˅DŽ ЎᓎᷥⱘᷛޚϔᅮᑺϞձ䌪↨ᇍপҷൟˈℸϔᓔྟህᑨ䆹ҟ㒡䖭ѯᮍ⊩ˈ䖭ѯ ҟ㒡䴲ᐌᖙ㽕DŽϝ⾡Џ㽕ⱘᓎᷥᮍ⊩߿ߚᰃ䎱⾏ǃ᳔㡖㑺˄maximum parsimony, MP˅᳔ Ԑ✊˄maximum likelihoodˈML˅DŽ䎱⾏ᷥ㗗ᆳ᭄㒘Ё᠔᳝ᑣ߫ⱘϸϸ↨ᇍ㒧ᵰˈ䗮䖛 бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ2/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第九章系统发育分析 页码,3/32 序列两两之间的差异决定进化树的拓扑结构和树枝长度。最大节约方法考察数据组中序列的 多重比对结果,优化出的进化树能够利用最少的离散步骤去解释多重比对中的碱基差异。最 大似然方法考察数据组中序列的多重比对结果,优化出拥有一定拓扑结构和树枝长度的进化 树,这个进化树能够以最大的概率导致考察的多重比对结果。这些方面将会在后面详细讨 论 建立数据模型(比对) 系统发育的序列数据通常会进行多重比对,也就是说,在系统发育的有关文献中通常会把那 些单独的比对好的碱基所占据的位置称作位点;在进行系统发育的理论讨论时这些位点等同 于特征符,而占据这些位点的真实的碱基或者空位被称为特征符状态;但是也有例外, STATALI GN程序( Thorne and ki shi no,1992)在进行系统发育分析时不会进行多重比对,它 使用原始的未比对过的序列。 多重比对在第七章中有详细讨论,在这里我们只讨论与系统发育分析有关的多重比对方法。 对准的序列位点将会被应用于系统发育分析,但是这只能描述一个先验的系统发育的结论, 因为位点本身(不是真实的碱基)都是假定为同源的( Mi ndel l,1991; Wheeler,1994)。 因此,出于系统发育的目的,比对程序只是系统发育分析的一部分。 建立一个比对模型的基本步骤包括:选择合适的比对程序;然后从比对结果中提取系统发育 的数据集,至于如何提取有效数据,取决于所选择的建树程序如何处理容易引起歧义的比对 区域和插入---删除序列(即所谓的inde状态或者空位状态) 多重比对程序 多重比对程序有如下一些属性: 计算机依赖性:无依赖;部分依赖;完全依赖 系统发育调用:无调用;先验调用;递归调用。 比对参数评估:先验评估;动态评估;递归评估。 比对特征:基本结构(比如序列);高级结构。 数学优化:统计优化:非统计优化。 在系统发育分析研究中,一个典型的比对过程包括:首先应用 CLUSTAL W程序,然后进行手工 比对,最后提交给一个建树程序。这个过程有如下特征选项:(1)、部分依赖于计算机(也 就是说,需要手工调整);(2)、需要一个先验的系统发育标准(也就是说需要一个前导 树):(3)、使用先验评估方法和动态评估方法(推荐)对比对参数进行评估;(4)、对 基本结构(序列)进行比对(对于亲水的氨基酸,推荐引入部分的二级结构特征);(5)、 应用非统计数学优化。这些特征选项的取舍都依赖于下面将要描述的具体的系统发育分析方 计算机依赖型 提倡进行完全的计算机多重比对的人常常有这样的依据,他们认为手工比对通常都是含混不 清的( Gatesy et al.,1993)。 MALI GN( Wheeler and gl adstei n,1994)和 TreeAl i gn (Hein,1990,1994)程序都试图在根据系统发育功能而优化比对的时候实现完全计算机 化,尤其是试图通过初步的多重比对而优化出一个最大节约树( MP tree)。一般来说,只有 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18
ᑣ߫ϸϸП䯈ⱘᏂᓖއᅮ䖯࣪ᷥⱘᢧᠥ㒧ᵘᷥᵱ䭓ᑺDŽ᳔㡖㑺ᮍ⊩㗗ᆳ᭄㒘Ёᑣ߫ⱘ 䞡↨ᇍ㒧ᵰˈӬߎ࣪ⱘ䖯࣪ᷥ㛑᳔߽⫼ᇥⱘ⾏ᬷℹ偸এ㾷䞞䞡↨ᇍЁⱘ⺅ᏂᓖDŽ᳔ Ԑ✊ᮍ⊩㗗ᆳ᭄㒘Ёᑣ߫ⱘ䞡↨ᇍ㒧ᵰˈӬߎ࣪ᢹ᳝ϔᅮᢧᠥ㒧ᵘᷥᵱ䭓ᑺⱘ䖯࣪ ᷥˈ䖭Ͼ䖯࣪ᷥ㛑ҹ᳔ⱘὖ⥛ᇐ㟈㗗ᆳⱘ䞡↨ᇍ㒧ᵰDŽ䖭ѯᮍ䴶ᇚӮৢ䴶䆺㒚䅼 䆎DŽ ᓎゟ᭄ൟ˄↨ᇍ˅ ㋏㒳থ㚆ⱘᑣ᭄߫䗮ᐌӮ䖯㸠䞡↨ᇍˈгህᰃ䇈ˈ㋏㒳থ㚆ⱘ᳝݇᭛⤂Ё䗮ᐌӮᡞ䙷 ѯऩ⣀ⱘ↨ᇍདⱘ⺅᠔ऴⱘԡ㕂⿄ԡ⚍˗䖯㸠㋏㒳থ㚆ⱘ⧚䆎䅼䆎ᯊ䖭ѯԡ⚍ㄝৠ Ѣ⡍ᕕヺˈ㗠ऴ䖭ѯԡ⚍ⱘⳳᅲⱘ⺅㗙ぎԡ㹿⿄Ў⡍ᕕヺ⢊ᗕ˗Ԛᰃг᳝՟ˈ STATALIGNᑣ˄Thorne and Kishino, 1992˅䖯㸠㋏㒳থ㚆ߚᵤᯊϡӮ䖯㸠䞡↨ᇍˈᅗ Փ⫼ॳྟⱘ↨ᇍ䖛ⱘᑣ߫DŽ 䞡↨ᇍϗゴЁ᳝䆺㒚䅼䆎ˈ䖭䞠៥Ӏা䅼䆎Ϣ㋏㒳থ㚆ߚᵤ᳝݇ⱘ䞡↨ᇍᮍ⊩DŽ ᇍޚⱘᑣ߫ԡ⚍ᇚӮ㹿ᑨ⫼Ѣ㋏㒳থ㚆ߚᵤˈԚᰃ䖭া㛑ᦣ䗄ϔϾܜ偠ⱘ㋏㒳থ㚆ⱘ㒧䆎ˈ Ўԡ⚍ᴀ䑿˄ϡᰃⳳᅲⱘ⺅˅䛑ᰃ؛ᅮЎৠ⑤ⱘ˄Mindell, 1991; Wheeler, 1994˅DŽ ℸˈߎѢ㋏㒳থ㚆ⱘⳂⱘˈ↨ᇍᑣাᰃ㋏㒳থ㚆ߚᵤⱘϔ䚼ߚDŽ ᓎゟϔϾ↨ᇍൟⱘᴀℹ偸ࣙᣀ˖䗝ᢽড়䗖ⱘ↨ᇍᑣ˗✊ৢҢ↨ᇍ㒧ᵰЁᦤপ㋏㒳থ㚆 ⱘ᭄䲚ˈ㟇Ѣབԩᦤপ᳝ᬜ᭄ˈপއѢ᠔䗝ᢽⱘᓎᷥᑣབԩ໘⧚ᆍᯧᓩ䍋℻Нⱘ↨ᇍ ऎඳᦦܹ----ߴ䰸ᑣ߫˄े᠔䇧ⱘindel⢊ᗕ㗙ぎԡ⢊ᗕ˅DŽ 䞡↨ᇍᑣ 䞡↨ᇍᑣ᳝བϟϔѯሲᗻ˖ 䅵ㅫᴎձ䌪ᗻ˖᮴ձ䌪˗䚼ߚձ䌪˗ᅠܼձ䌪DŽ ㋏㒳থ㚆䇗⫼˖᮴䇗⫼˗ܜ偠䇗⫼˗䗦ᔦ䇗⫼DŽ ↨ᇍখ᭄䆘Ԅ˖ܜ偠䆘Ԅ˗ࡼᗕ䆘Ԅ˗䗦ᔦ䆘ԄDŽ ↨ᇍ⡍ᕕ˖ᴀ㒧ᵘ˄↨བᑣ߫˅˗催㑻㒧ᵘDŽ ᭄ᄺӬ࣪˖㒳䅵Ӭ࣪˗䴲㒳䅵Ӭ࣪DŽ ㋏㒳থ㚆ߚᵤⷨおЁˈϔϾൟⱘ↨ᇍ䖛ࣙᣀ˖佪ܜᑨ⫼CLUSTAL Wᑣˈ✊ৢ䖯㸠Ꮉ ↨ᇍˈ᳔ৢᦤѸ㒭ϔϾᓎᷥᑣDŽ䖭Ͼ䖛᳝བϟ⡍ᕕ䗝乍˖˄˅ǃ䚼ߚձ䌪Ѣ䅵ㅫᴎ˄г ህᰃ䇈ˈ䳔㽕Ꮉ䇗ᭈ˅˗˄˅ǃ䳔㽕ϔϾܜ偠ⱘ㋏㒳থ㚆ᷛޚ˄гህᰃ䇈䳔㽕ϔϾࠡᇐ ᷥ˅˗˄˅ǃՓ⫼ܜ偠䆘Ԅᮍ⊩ࡼᗕ䆘Ԅᮍ⊩˄㤤˅ᇍ↨ᇍখ᭄䖯㸠䆘Ԅ˗˄˅ǃᇍ ᴀ㒧ᵘ˄ᑣ߫˅䖯㸠↨ᇍ˄ᇍѢ҆∈ⱘ⇼䝌ˈ㤤ᓩܹ䚼ߚⱘѠ㑻㒧ᵘ⡍ᕕ˅˗˄˅ǃ ᑨ⫼䴲㒳䅵᭄ᄺӬ࣪DŽ䖭ѯ⡍ᕕ䗝乍ⱘপ㟡䛑ձ䌪Ѣϟ䴶ᇚ㽕ᦣ䗄ⱘԧⱘ㋏㒳থ㚆ߚᵤᮍ ⊩DŽ 䅵ㅫᴎձ䌪ൟ ᦤ䖯㸠ᅠܼⱘ䅵ㅫᴎ䞡↨ᇍⱘҎᐌᐌ᳝䖭ḋⱘձˈҪӀ䅸ЎᎹ↨ᇍ䗮ᐌ䛑ᰃ⏋ϡ ⏙ⱘ˄Gatesy et al., 1993˅DŽMALIGN˄Wheeler and Gladstein, 1994˅TreeAlign ˄Hein, 1990, 1994˅ᑣ䛑䆩ḍ㋏㒳থ㚆ࡳ㛑㗠Ӭ࣪↨ᇍⱘᯊᅲ⦄ᅠܼ䅵ㅫᴎ ࣪ˈᇸ݊ᰃ䆩䗮䖛߱ℹⱘ䞡↨ᇍ㗠Ӭߎ࣪ϔϾ᳔㡖㑺ᷥ˄MP tree˅DŽϔ㠀ᴹ䇈ˈা᳝ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ3/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第九章系统发育分析 页码,4/3 当我们假定计算机程序能够进行正确的比对的时候,我们才会实行完全的计算机处理。之所 以还提倡进行手工比对(比如, Thompson et al.,1994),是因为现在的比对算法和程序还 不能满足系统发育分析的需要。 系统发育标准 许多计算机多重比对程序(比如 CLUSTAL, PileUp, ALI GN in ProPack)根据明确的系统发育 标准(一个前导树)进行比对,这个前导树是由双重比对得到的。但是SAM( Hughey et al 1996)和 MACAW( Lawrence et al.,1993)程序在进行多重比对时并不引入明确的系统发育 标准,虽然这些程序也可以模拟系统发育过程操作参数。 如果在进行系统发育分析的时候,比对中引入了前导树,那么通过这个比对推导出的进化树 逻辑上应该同前导树的拓扑结构相同。由 CLUSTALI比对得到的前导树(如图9.1)将会被转化 成 PHYLIP树的文件格式,然后输入到画树程序中,这些画树程序包括 TreeTool( x wi ndows) TreeDraw(Maci ntosh), PHYLODENDRON (Maci ntos), TREEVI EW(Maci ntosh, Mi crosof Wi ndows)或者PAUP(图9.1; Maci tosh, Mi crosoft wi ndows)的画树工具。按道理,我们应 该回过头来为 CLUSTAL比对再指定一个前导树,但是在实际操作中我们并不会这么做。有些程 序(比如 TreeAl i gn and MALI GN)为了得到优化的比对和系统发育树,程序本身就设计了交 叉(同步)递归优化的算法。理论上,能够解决比对-系统发育难题的同步优化算法或者 配套算法应该是存在的,但是递归算法必须冒一定的风险,它很可能会导致一个错误的或者 不完整的结果( Thorne and ki shi no,1992)。因此,根据比对结果建立进化树之后,必须 考虑另外的可能性,也就是说,如果根据其它的比对结果得到一个并不是最优化的进化树, 这个次优化的进化树是不是更能够满足研究的需要。 比对参数评估 在比对中会出现一些序列区域,其长度是可变的,如何处理这些区域中inde状态的位点是最 重要,这取决于进化模型的所有要素(比如,包括核苷酸转换/颠换速率),而且相关的参数 在前导树与比对推导的进化树中应该保持一致。比对参数应该随着进化的分叉动态变化 ( Thompson et al.,1994),只有这样才能保证碱基错配的几率能够满足序列趋异的需要; 比对参数应该随时调整( Thompson et al.1994, Hughey et al.,1996),以防止引入过 多的近似序列而导致比对序列的信息量不足,可以通过降低近似序列的比对分值权重来防止 这种情况。 CULSTAL程序兼顾了这两种情况(参数动态变化),而SAM程序引入了序列权重。 利用基本结构或者高级结构进行比对 根据二级或者三级序列结构进行比对,比起直接利用一级序列进行比对的可信度要好,因为 在同源性评估中,人们一直认为复杂结构的保守性高于简单特征(核苷酸,氨基酸)的同源 保守性,而且,立足于复杂结构的比对程序还可以搜索到一些特殊的关联位点,这些位点是 进化的功能区域。实际上,基于系统发育的结构多重比对并没有将问题简化,也就是说,序 列比对必须服从结构进化,而结构进化则同系统发育保持一致。有一个探索式的手工程序 (如图9.2),是用来对核糖体DNA进行结构比对的( Gutell et al.,1994),这个程序要考 察相关取代的样式,但是相关性必须通过系统发育树中的多个独立的补偿性突变推导得到 (cf. harvey and pagel 1991) 数学优化 有些比对程序(比如, MACAW,SAM)根据一个统计模型进行优化,但是这些统计同系统发育 模型的关系并不清楚。仅仅根据一个系统发育模型是没有办法比较多重比对方法的优劣的。 总结:对于系统发育分析,最好的比对程序是什么呢? file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18
ᔧ៥Ӏ؛ᅮ䅵ㅫᴎᑣ㛑䖯㸠ℷ⹂ⱘ↨ᇍⱘᯊˈ៥ӀᠡӮᅲ㸠ᅠܼⱘ䅵ㅫᴎ໘⧚DŽП᠔ ҹ䖬ᦤ䖯㸠Ꮉ↨ᇍ˄↨བˈThompson et al., 1994˅ˈᰃЎ⦄ⱘ↨ᇍㅫ⊩ᑣ䖬 ϡ㛑⒵䎇㋏㒳থ㚆ߚᵤⱘ䳔㽕DŽ ޚᷛ㒳থ㚆㋏ 䆌䅵ㅫᴎ䞡↨ᇍᑣ˄↨བCLUSTAL, PileUp,ALIGN in ProPack˅ḍᯢ⹂ⱘ㋏㒳থ㚆 ᷛޚ˄ϔϾࠡᇐᷥ˅䖯㸠↨ᇍˈ䖭Ͼࠡᇐᷥᰃ⬅ঠ䞡↨ᇍᕫࠄⱘDŽԚᰃSAM˄Hughey et al., 1996˅MACAW˄Lawrence et al., 1993˅ᑣ䖯㸠䞡↨ᇍᯊᑊϡᓩܹᯢ⹂ⱘ㋏㒳থ㚆 ᷛޚˈ㱑✊䖭ѯᑣгৃҹᢳ㋏㒳থ㚆䖛᪡খ᭄DŽ བᵰ䖯㸠㋏㒳থ㚆ߚᵤⱘᯊ↨ˈᇍЁᓩܹњࠡᇐᷥˈ䙷М䗮䖛䖭Ͼ↨ᇍᇐߎⱘ䖯࣪ᷥ 䘏䕥Ϟᑨ䆹ৠࠡᇐᷥⱘᢧᠥ㒧ᵘⳌৠDŽ⬅CLUSTAL↨ᇍᕫࠄⱘࠡᇐᷥ˄བ9.1˅ᇚӮ㹿䕀࣪ ៤PHYLIPᷥⱘ᭛ӊḐᓣˈ✊ৢ䕧ܹࠄᷥ⬏ᑣЁˈ䖭ѯ⬏ᷥᑣࣙᣀTreeTool(X windows), TreeDraw(Macintosh), PHYLODENDRON(Macintosh), TREEVIEW(Macintosh, Microsoft Windows) 㗙PAUP( 9.1˗Macintosh, Microsoft Windows)ⱘ⬏ᷥᎹDŽᣝ䘧⧚ˈ៥Ӏᑨ 䆹ಲ䖛༈ᴹЎCLUSTAL↨ᇍݡᣛᅮϔϾࠡᇐᷥˈԚᰃᅲ䰙᪡Ё៥ӀᑊϡӮ䖭МخDŽ᳝ѯ ᑣ˄↨བTreeAlign and MALIGN˅ЎњᕫࠄӬ࣪ⱘ↨ᇍ㋏㒳থ㚆ᷥˈᑣᴀ䑿ህ䆒䅵њѸ ঝ˄ৠℹ˅䗦ᔦӬ࣪ⱘㅫ⊩DŽ⧚䆎Ϟˈ㛑㾷އ↨ᇍ----㋏㒳থ㚆䲒乬ⱘৠℹӬ࣪ㅫ⊩㗙 䜡༫ㅫ⊩ᑨ䆹ᰃᄬⱘˈԚᰃ䗦ᔦㅫ⊩ᖙ乏ݦϔᅮⱘ亢䰽ˈᅗᕜৃ㛑Ӯᇐ㟈ϔϾ䫭䇃ⱘ㗙 ϡᅠᭈⱘ㒧ᵰ˄Thorne and Kishino, 1992˅DŽℸˈḍ↨ᇍ㒧ᵰᓎゟ䖯࣪ᷥПৢˈᖙ乏 㗗㰥ⱘৃ㛑ᗻˈгህᰃ䇈ˈབᵰḍ݊ᅗⱘ↨ᇍ㒧ᵰᕫࠄϔϾᑊϡᰃ᳔Ӭ࣪ⱘ䖯࣪ˈᷥ 䖭ϾӬ࣪ⱘ䖯࣪ᷥᰃϡᰃ㛑⒵䎇ⷨおⱘ䳔㽕DŽ ↨ᇍখ᭄䆘Ԅ ↨ᇍЁӮߎ⦃ϔѯᑣ߫ऎඳˈ݊䭓ᑺᰃৃবⱘˈབԩ໘⧚䖭ѯऎඳЁindel⢊ᗕⱘԡ⚍ᰃ᳔ 䞡㽕ˈ䖭পއѢ䖯࣪ൟⱘ᠔᳝㽕㋴˄↨བˈࣙᣀḌ㣋䝌䕀ᤶ乴ᤶ䗳⥛˅ˈ㗠ϨⳌ݇ⱘখ᭄ ࠡᇐᷥϢ↨ᇍᇐⱘ䖯࣪ᷥЁᑨ䆹ֱᣕϔ㟈DŽ↨ᇍখ᭄ᑨ䆹䱣ⴔ䖯࣪ⱘߚঝࡼᗕব࣪ ˄Thompson et al., 1994˅ˈা᳝䖭ḋᠡ㛑ֱ䆕⺅䫭䜡ⱘ⥛㛑⒵䎇ᑣ߫䍟ᓖⱘ䳔㽕˗ ↨ᇍখ᭄ᑨ䆹䱣ᯊ䇗ᭈ˄Thompson et al., 1994, Hughey et al., 1996˅ˈҹ䰆ℶᓩܹ䖛 ⱘ䖥Ԑᑣ߫㗠ᇐ㟈↨ᇍᑣ߫ⱘֵᙃ䞣ϡ䎇ˈৃҹ䗮䖛䰡Ԣ䖥Ԑᑣ߫ⱘ↨ᇍߚؐᴗ䞡ᴹ䰆ℶ 䖭⾡ᚙމDŽCULSTALᑣݐ乒њ䖭ϸ⾡ᚙމ˄খ᭄ࡼᗕব࣪ˈ˅㗠SAMᑣᓩܹњᑣ߫ᴗ䞡DŽ ߽⫼ᴀ㒧ᵘ㗙催㑻㒧ᵘ䖯㸠↨ᇍ ḍѠ㑻㗙ϝ㑻ᑣ߫㒧ᵘ䖯㸠↨ᇍˈ↨䍋Ⳉ߽⫼ϔ㑻ᑣ߫䖯㸠↨ᇍⱘৃֵᑺ㽕དˈЎ ৠ⑤ᗻ䆘ԄЁˈҎӀϔⳈ䅸Ўᴖ㒧ᵘⱘֱᅜᗻ催Ѣㅔऩ⡍ᕕ˄Ḍ㣋䝌ˈ⇼䝌˅ⱘৠ⑤ ֱᅜᗻˈ㗠Ϩˈゟ䎇Ѣᴖ㒧ᵘⱘ↨ᇍᑣ䖬ৃҹ᧰㋶ࠄϔѯ⡍⅞ⱘ݇㘨ԡ⚍ˈ䖭ѯԡ⚍ᰃ 䖯࣪ⱘࡳ㛑ऎඳDŽᅲ䰙ϞˈѢ㋏㒳থ㚆ⱘ㒧ᵘ䞡↨ᇍᑊ≵᳝ᇚ䯂乬ㅔ࣪ˈгህᰃ䇈ˈᑣ ߫↨ᇍᖙ乏᳡Ң㒧ᵘ䖯࣪ˈ㗠㒧ᵘ䖯࣪߭ৠ㋏㒳থ㚆ֱᣕϔ㟈DŽ᳝ϔϾ㋶ᓣⱘᎹᑣ ˄བ9.2˅ˈᰃ⫼ᴹᇍḌ㊪ԧDNA䖯㸠㒧ᵘ↨ᇍⱘ˄Gutell et al., 1994˅ˈ䖭Ͼᑣ㽕㗗 ᆳⳌ݇পҷⱘḋᓣˈԚᰃⳌ݇ᗻᖙ乏䗮䖛㋏㒳থ㚆ᷥЁⱘϾ⣀ゟⱘ㸹ٓᗻさবᇐᕫࠄ ˄cf. Harvey and Pagel, 1991˅DŽ ᭄࣪ᄺӬ ᳝ѯ↨ᇍᑣ˄↨བˈMACAW, SAM˅ḍϔϾ㒳䅵ൟ䖯㸠Ӭ࣪ˈԚᰃ䖭ѯ㒳䅵ৠ㋏㒳থ㚆 ൟⱘ݇㋏ᑊϡ⏙ἮDŽҙҙḍϔϾ㋏㒳থ㚆ൟᰃ≵᳝ࡲ↨⫣䕗䞡↨ᇍᮍ⊩ⱘӬࡷⱘDŽ ᘏ㒧˖ᇍѢ㋏㒳থ㚆ߚᵤˈ᳔དⱘ↨ᇍᑣᰃҔМਸ਼˛ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ4/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第九章系统发育分析 页码,5/32 对于一个给定的系统发育问题,如果预先不知道其中的系统发育关系,就很难知道最适用的 比对方法(cf. Morri son and ellis,1997)。一般来说,我们并不赞成直接把计算机比对 结果提交给建树程序,因为建树程序不能发现比对的错误;尤其是那些包含在比对程序包中 (比如, CLUSTAL and tree in ProPack)的建树程序,特别要注意这一点( Feng and Dooli ttle,1996),因为在这些程序包中的建树程序更加不严格。我们必须通过分子结构 �功能和碱基取代过程作出一些假定,并且结合另外一些独立的系统发育证据,对整个比 对进行考察。 从比对中提取系统发育数据集 在某些比对中,比对长度是可变的,这时,系统发育数据集同比对就不会完全吻合;即使在 些长度不变的比对中,数据集也可能同比对结果不一致--举一个很简单的例子,有时候我 们只需要处理第一个和第二个密码子位点,就不需要全部的比对结果,这个话题我们在后面 讨论取代模型的时候还会涉及到 如果比对中出现可变长度,我们通常会根据比对的不确定性程度和处理inde状态的原则这两 个标准对比对结果进行取舍,从中选择所需的系统发育数据集;其中针对 i ndel状态的处理方 法取决于建树方法以及从比对结果中发掘出的系统发育信息,最极端的方法是把包括空位在 内的所有 i ndel位点从比对中清除出去,在分析时不加考虑(cf. Swofford et al.,1996a),这 个方法的好处是可以把序列的变化包容在取代模型中,而不需要特别的模型来处理 i ndel状 态,但是它的缺点也很明显:inde区域的系统发育信息完全被忽略了, 在提取数据集时保留inde区域但是忽略所有的空位分值,将会保留包括空位在内的位点碱基 变化信息。某些长度可变区域在部分序列或者全部序列中很难对准,在这种情况下,这些难 以对准的碱基的分值应该清零;这个方法存在很大的缺陷,M和M建树方法会不加考虑地把 这些清零的或者被忽略的分值理解为零分歧,但是实际上隐藏在这些分值下面的实际的数据 (不管是空位还是难以对准的碱基),一般来说,反映出的分歧度都很大。PAUP4.0中的距 离建树方法(将在下文描述)允许通过非空位区域外推得到空位区域的距离。 最大节约(MP;见下)是允许把可比对的空位合并,并将其视为特征符的唯一方法;可以通 过两种方式达到目的:作为一个附加的特征符状态(第五种核酸碱基或者第二十一种氨基 酸),或者作为一套独立于碱基取代的特征符集。当空位占据了不止一个位点的时候,前一 个方法行不通,因为每一个空位位点都会被统计为一次独立的特征符状态变化。当比对的 列的局部出现很好的可比对的空位的时候,后一种方法非常有用。我们可以把一套空位特征 符附加到比对序列数据集中,也可以用额外的碱基程序在适当的位置对空位计分,但是在计 分的时候,空位位点中只有一个作为空位计分,其余的将会被忽略。PAUP将会执行这个方 法。 对于某些比对而言,比对程序会忽略所有的空位分值或者忽略所有低于预设值的空位分值 但是,还没有任何一种程序会忽略单个序列的单个位点。如果比对在序列组内部相当明确, 但是处身其中时却不太清楚,此时必须对比对做“手术”,确保同序列组相关的明确的信息 被保留,而除去模糊的信息。 图9.3给出了一个比对“手术”的例子。在空位区域,我们必须作出决定:在可供选择的比对 中,哪一个更加合理,尤其重要的是,哪一个更加适合于建立进化树分析。如果手工解决比 对的不确定性,就必须考虑系统发育关系、取代过程(比如,转换和颠换)和碱基组成;在 这个阶段,用系统发育证据解决不确定性非常合理。在倾向于变长的序列区域,关系非常疏 远的序列和序列组的比对就可以侧向展开(就是说,引入人工空位,并且忽略分值),最终 的结果使得只有关系很近的序列区域对准在一起。某些序列中的某些位点虽然对准了,但是 并不确定,他们的分值可以在计分时忽略;这个方法的优点是可以保留同这些序列相关的明 确信息,缺点是最大节约和最大似然的建树方法会把这些“缺失”的分值看做是零分歧 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18
ᇍѢϔϾ㒭ᅮⱘ㋏㒳থ㚆䯂乬ˈབᵰ乘ܜϡⶹ䘧݊Ёⱘ㋏㒳থ㚆݇㋏ˈህᕜ䲒ⶹ䘧᳔䗖⫼ⱘ ↨ᇍᮍ⊩˄cf. Morrison and Ellis, 1997˅DŽϔ㠀ᴹ䇈ˈ៥Ӏᑊϡ䌲៤Ⳉᡞ䅵ㅫᴎ↨ᇍ 㒧ᵰᦤѸ㒭ᓎᷥᑣˈЎᓎᷥᑣϡ㛑থ⦄↨ᇍⱘ䫭䇃˗ᇸ݊ᰃ䙷ѯࣙ↨ᇍᑣࣙЁ ˄↨བˈCLUSTAL and TREE in ProPack˅ⱘᓎᷥᑣˈ⡍߿㽕⊼ᛣ䖭ϔ⚍˄Feng and Doolittle, 1996˅ˈЎ䖭ѯᑣࣙЁⱘᓎᷥᑣࡴϡϹḐDŽ៥Ӏᖙ乏䗮䖛ߚᄤ㒧ᵘ �ࡳ㛑⺅পҷ䖛ߎϔѯ؛ᅮˈᑊϨ㒧ড়ϔѯ⣀ゟⱘ㋏㒳থ㚆䆕ˈᇍᭈϾ↨ ᇍ䖯㸠㗗ᆳDŽ Ң↨ᇍЁᦤপ㋏㒳থ㚆᭄䲚 ᶤѯ↨ᇍЁˈ↨ᇍ䭓ᑺᰃৃবⱘˈ䖭ᯊˈ㋏㒳থ㚆᭄䲚ৠ↨ᇍህϡӮᅠܼਏড়˗ेՓ ϔѯ䭓ᑺϡবⱘ↨ᇍЁˈ᭄䲚гৃ㛑ৠ↨ᇍ㒧ᵰϡϔ㟈--ВϔϾᕜㅔऩⱘ՟ᄤˈ᳝ᯊ៥ Ӏা䳔㽕໘⧚ϔϾѠϾᆚⷕᄤԡ⚍ˈህϡ䳔㽕ܼ䚼ⱘ↨ᇍ㒧ᵰˈ䖭Ͼ䆱乬៥Ӏৢ䴶 䅼䆎পҷൟⱘᯊ䖬Ӯ⍝ঞࠄDŽ བᵰ↨ᇍЁߎৃ⦃ব䭓ᑺˈ៥Ӏ䗮ᐌӮḍ↨ᇍⱘϡ⹂ᅮᗻᑺ໘⧚indel⢊ᗕⱘॳ߭䖭ϸ Ͼᷛޚᇍ↨ᇍ㒧ᵰ䖯㸠প㟡ˈҢЁ䗝ᢽ᠔䳔ⱘ㋏㒳থ㚆᭄䲚˗݊Ё䩜ᇍindel⢊ᗕⱘ໘⧚ᮍ ⊩পއѢᓎᷥᮍ⊩ҹঞҢ↨ᇍ㒧ᵰЁথᥬߎⱘ㋏㒳থ㚆ֵᙃˈ᳔ᵕッⱘᮍ⊩ᰃᡞࣙᣀぎԡ ݙⱘ᠔᳝indelԡ⚍Ң↨ᇍЁ⏙䰸ߎএˈߚᵤᯊϡࡴ㗗㰥˄cf. Swofford et al., 1996a˅ˈ䖭 Ͼᮍ⊩ⱘད໘ᰃৃҹᡞᑣ߫ⱘবࣙ࣪ᆍপҷൟЁˈ㗠ϡ䳔㽕⡍߿ⱘൟᴹ໘⧚indel⢊ ᗕˈԚᰃᅗⱘ㔎⚍гᕜᯢᰒ˖indelऎඳⱘ㋏㒳থ㚆ֵᙃᅠܼ㹿ᗑ⬹њDŽ ᦤপ᭄䲚ᯊֱ⬭indelऎඳԚᰃᗑ⬹᠔᳝ⱘぎԡߚˈؐᇚӮֱ⬭ࣙᣀぎԡݙⱘԡ⚍⺅ বֵ࣪ᙃDŽᶤѯ䭓ᑺৃবऎඳ䚼ߚᑣ߫㗙ܼ䚼ᑣ߫Ёᕜ䲒ᇍޚˈ䖭⾡ᚙމϟˈ䖭ѯ䲒 ҹᇍޚⱘ⺅ⱘߚؐᑨ䆹⏙䳊˗䖭Ͼᮍ⊩ᄬᕜⱘ㔎䱋ˈMPMLᓎᷥᮍ⊩Ӯϡࡴ㗗㰥ഄᡞ 䖭ѯ⏙䳊ⱘ㗙㹿ᗑ⬹ⱘߚ⧛ؐ㾷Ў䳊ߚˈFAXԚᰃᅲ䰙Ϟ䱤㮣䖭ѯߚؐϟ䴶ⱘᅲ䰙ⱘ᭄ ˄ϡㅵᰃぎԡ䖬ᰃ䲒ҹᇍޚⱘ⺅˅ˈϔ㠀ᴹ䇈ˈডߎⱘߚFAXᑺ䛑ᕜDŽPAUP 4.0Ёⱘ䎱 ⾏ᓎᷥᮍ⊩˄ᇚϟ᭛ᦣ䗄˅ܕ䆌䗮䖛䴲ぎԡऎඳᕫࠄぎԡऎඳⱘ䎱⾏DŽ ᳔㡖㑺˄MP˗㾕ϟ˅ᰃܕ䆌ᡞৃ↨ᇍⱘぎԡড়ᑊˈᑊᇚ݊㾚Ў⡍ᕕヺⱘଃϔᮍ⊩˗ৃҹ䗮 䖛ϸ⾡ᮍᓣ䖒ࠄⳂⱘ˖ЎϔϾ䰘ࡴⱘ⡍ᕕヺ⢊ᗕ˄Ѩ⾡Ḍ䝌⺅㗙Ѡकϔ⾡⇼ 䝌˅ˈ㗙Ўϔ༫⣀ゟѢ⺅পҷⱘ⡍ᕕヺ䲚DŽᔧぎԡऴњϡℶϔϾԡ⚍ⱘᯊࠡˈϔ Ͼᮍ⊩㸠ϡ䗮ˈЎ↣ϔϾぎԡԡ⚍䛑Ӯ㹿㒳䅵Ўϔ⣀ゟⱘ⡍ᕕヺ⢊ᗕব࣪DŽᔧ↨ᇍⱘᑣ ߫ⱘሔ䚼ߎ⦃ᕜདⱘৃ↨ᇍⱘぎԡⱘᯊৢˈϔ⾡ᮍ⊩䴲ᐌ᳝⫼DŽ៥Ӏৃҹᡞϔ༫ぎԡ⡍ᕕ ヺ䰘ࠄࡴ↨ᇍᑣ᭄߫䲚Ёˈгৃҹ⫼乱ⱘ⺅ᑣ䗖ᔧⱘԡ㕂ᇍぎԡ䅵ߚˈԚᰃ䅵 ߚⱘᯊˈぎԡԡ⚍Ёা᳝ϔϾЎぎԡ䅵ߚԭ݊ˈⱘᇚӮ㹿ᗑ⬹DŽPAUPᇚӮᠻ㸠䖭Ͼᮍ ⊩DŽ ᇍѢᶤѯ↨ᇍ㗠㿔ˈ↨ᇍᑣӮᗑ⬹᠔᳝ⱘぎԡߚؐ㗙ᗑ⬹᠔᳝ԢѢ乘䆒ؐⱘぎԡߚ˗ؐ Ԛᰃˈ䖬≵᳝ӏԩϔ⾡ᑣӮᗑ⬹ऩϾᑣ߫ⱘऩϾԡ⚍DŽབᵰ↨ᇍᑣ߫㒘ݙ䚼Ⳍᔧᯢ⹂ˈ Ԛᰃ໘䑿݊Ёᯊैϡ⏙Ἦˈℸᯊᖙ乏ᇍ↨ᇍخĀᴃāˈ⹂ֱৠᑣ߫㒘Ⳍ݇ⱘᯢ⹂ⱘֵᙃ 㹿ֱ⬭ˈ㗠䰸এ㊞ⱘֵᙃDŽ 9.3㒭ߎњϔϾ↨ᇍĀᴃāⱘ՟ᄤDŽぎԡऎඳˈ៥Ӏᖙ乏އߎᅮ˖ৃկ䗝ᢽⱘ↨ᇍ ЁˈાϔϾࡴড়⧚ˈᇸ݊䞡㽕ⱘᰃˈાϔϾࡴ䗖ড়Ѣᓎゟ䖯࣪ᷥߚᵤDŽབᵰᎹ㾷އ↨ ᇍⱘϡ⹂ᅮᗻˈህᖙ乏㗗㰥㋏㒳থ㚆݇㋏ǃপҷ䖛˄↨བˈ䕀ᤶ乴ᤶ˅⺅㒘៤˗ 䖭Ͼ䰊↉ˈ⫼㋏㒳থ㚆䆕㾷އϡ⹂ᅮᗻ䴲ᐌড়⧚DŽؒѢব䭓ⱘᑣ߫ऎඳˈ݇㋏䴲ᐌ⭣ 䖰ⱘᑣ߫ᑣ߫㒘ⱘ↨ᇍህৃҹջሩᓔ˄ህᰃ䇈ˈᓩܹҎᎹぎԡˈᑊϨᗑ⬹ߚ᳔ˈ˅ؐ㒜 ⱘ㒧ᵰՓᕫা᳝݇㋏ᕜ䖥ⱘᑣ߫ऎඳᇍޚϔ䍋DŽᶤѯᑣ߫Ёⱘᶤѯԡ⚍㱑✊ᇍޚњˈԚᰃ ᑊϡ⹂ᅮˈҪӀⱘߚৃؐҹ䅵ߚᯊᗑ⬹˗䖭Ͼᮍ⊩ⱘӬ⚍ᰃৃҹֱ⬭ৠ䖭ѯᑣ߫Ⳍ݇ⱘᯢ ⹂ֵᙃˈ㔎⚍ᰃ᳔㡖㑺᳔Ԑ✊ⱘᓎᷥᮍ⊩Ӯᡞ䖭ѯĀ㔎༅āⱘߚؐⳟخᰃ䳊ߚFAXDŽ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ5/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com