第十章利用核酸序列的预测方法 页码,1/16 10 利用核酸序列的预测方法 James W. Fickett Smi thk/ine beecham pharmaceuti cals King of Pruss a. Pennsy/ vania 这一章讨论的是解释DNA序列的方法,这些方法主要依赖于功能模式的检测,而不是与其它单 个序列的比较。这些方法中的绝大部分意在先寻找并遮蔽重复的和低复杂性的序列,再寻找 基因以及与其相关的调控区域。在针对单个序列的集中调查分析,以及为可能的基因、整个 基因组或相应较大区域建立初步清单的快速扫描过程中,这些方法都发挥了主要作用。由于 算法开发迅速,没有一种工具能完成全部有关的序列分析功能。因此,有必要将序列提呈给 多个不同的软件包加以分析,以利用最佳的计算机技术。为使这一过程效率更高,本章为 前常用的工具提供了简明的使用指导。一些有用的资料还能从 Wenti an Li编辑的在线书目 (见本章末“书目..”中所列资源中的URL地址)和参考文献中的相关综述中找到: Gel fand (1995), Cl averie(1996), Fickett和 Gui go(1996), Snyder和 Stormo(1996),以及 Gui go (1997) 这一章是这样安排的:首先,是对基本概念框架的描述,以将各不同工具安排在合适的位置 上;然后,是对主要的计算工具的评述,对每种工具,既讨论了其内在逻辑思想,也给出程 序应用的范例。当前的诸多工具虽很实用,但绝非完全可靠。例如,当前的发展中存在的一 个缺陷是许多序列分析软件开发者对功能域原型的描述来自DDBJ/EMBL/( Gen Bank等国际序列数 据库中对相应功能域的描述,然而这些数据库中的描述本身的部分却可以来源于序列的分 析,这样就导致了循环。在应用中,每种分析方法各自的优势和不足都该特别留意。一些最 常用的和可以从互联网上获得的计算工具列于章末。 框架 一个全面的基因搜寻方案,无论是由单个复合程序实现还是通过使用多个专门程序来实现, 以下的基本信息都是适用的。首先,搜寻基因的证据由多处收集而来: 一张标出重复序列位置的图谱表明了该处调控区域和编码蛋白质的区域不太可能岀现。 与其它基因或基因产物有序列相似性是外显子的强有力证据。 一段序列上存在着统计的规则性,表示为显著的“密码子偏好”是蛋白编码区最明显的 标志之 与模板模式相符可能指出DNA上功能性位点的位置。这类分析可以基于很简单的模式 (例如,众所周知的“ Tata box”和剪接点的保守序列)或基于相当复杂的推理(例 如,在后面将提到的启动子搜寻算法中)。 然后,全部收集到的信息汇总整理成总体上尽可能连贯的谱图。用于汇总整理阶段的准则属 于基本常识:例如,由“密码子偏好”分析出的外显子边界可能为了有一个更好的剪接位点 file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18
䖭ϔゴ䅼䆎ⱘᰃ㾷䞞DNAᑣ߫ⱘᮍ⊩ˈ䖭ѯᮍ⊩Џ㽕ձ䌪Ѣࡳ㛑ᓣⱘẔ⌟ˈ㗠ϡᰃϢ݊ᅗऩ Ͼᑣ߫ⱘ↨䕗DŽ䖭ѯᮍ⊩Ёⱘ㒱䚼ߚᛣܜᇏᡒᑊ䙂㬑䞡ⱘԢᴖᗻⱘᑣ߫ˈݡᇏᡒ ҹঞϢ݊Ⳍ݇ⱘ䇗ऎඳDŽ䩜ᇍऩϾᑣ߫ⱘ䲚Ё䇗ᶹߚᵤˈҹঞЎৃ㛑ⱘǃᭈϾ 㒘Ⳍᑨ䕗ऎඳᓎゟ߱ℹ⏙ऩⱘᖿ䗳ᠿᦣ䖛Ёˈ䖭ѯᮍ⊩䛑থњЏ㽕⫼DŽ⬅Ѣ ㅫ⊩ᓔথ䖙䗳ˈ≵᳝ϔ⾡Ꮉ㛑ᅠ៤ܼ䚼᳝݇ⱘᑣ߫ߚᵤࡳ㛑DŽℸˈ᳝ᖙ㽕ᇚᑣ߫ᦤਜ㒭 Ͼϡৠⱘ䕃ӊࡴࣙҹߚᵤˈҹ᳔߽⫼Շⱘ䅵ㅫᴎᡔᴃDŽЎՓ䖭ϔ䖛ᬜ⥛催ˈᴀゴЎᔧ ࠡᐌ⫼ⱘᎹᦤկњㅔᯢⱘՓ⫼ᣛᇐDŽϔѯ᳝⫼ⱘ䌘᭭䖬㛑ҢWentian Li㓪䕥ⱘ㒓кⳂ ˄㾕ᴀゴĀкⳂ…”Ё᠔߫䌘⑤ЁⱘURLഄഔ˅খ㗗᭛⤂ЁⱘⳌ݇㓐䗄Ёᡒࠄ˖Gelfand ˄1995˅ˈClaverie˄1996˅ˈFickettGuigó˄1996˅ˈSnyderStormo˄1996˅ˈҹঞ Guigó˄1997˅DŽ 䖭ϔゴᰃ䖭ḋᅝᥦⱘ˖佪ܜˈᰃᇍᴀὖᗉḚᶊⱘᦣ䗄ˈҹᇚϡৠᎹᅝᥦড়䗖ⱘԡ㕂 Ϟ˗✊ৢˈᰃᇍЏ㽕ⱘ䅵ㅫᎹⱘ䆘䗄ˈᇍ↣⾡Ꮉˈ᮶䅼䆎њ݊ݙ䘏䕥ᗱᛇˈг㒭ߎ ᑣᑨ⫼ⱘ㣗՟DŽᔧࠡⱘ䇌Ꮉ㱑ᕜᅲ⫼ˈԚ㒱䴲ᅠܼৃ䴴DŽ՟བˈᔧࠡⱘথሩЁᄬⱘϔ Ͼ㔎䱋ᰃ䆌ᑣ߫ߚᵤ䕃ӊᓔথ㗙ᇍࡳ㛑ඳॳൟⱘᦣ䗄ᴹ㞾DDBJ/EMBL/GenBankㄝ䰙ᑣ᭄߫ ᑧЁᇍⳌᑨࡳ㛑ඳⱘᦣ䗄ˈ✊㗠䖭ѯ᭄ᑧЁⱘᦣ䗄ᴀ䑿ⱘ䚼ߚৃैҹᴹ⑤Ѣᑣ߫ⱘߚ ᵤˈ䖭ḋህᇐ㟈њᕾ⦃DŽᑨ⫼Ёˈ↣⾡ߚᵤᮍ⊩㞾ⱘӬϡ䎇䛑䆹⡍߿⬭ᛣDŽϔѯ᳔ ᐌ⫼ⱘৃҹҢѦ㘨㔥Ϟ㦋ᕫⱘ䅵ㅫᎹ߫ѢゴDŽ Ḛᶊ ϔϾܼ䴶ⱘ᧰ᇏᮍḜˈ᮴䆎ᰃ⬅ऩϾড়ᑣᅲ⦄䖬ᰃ䗮䖛Փ⫼Ͼϧ䮼ᑣᴹᅲ⦄ˈ ҹϟⱘᴀֵᙃ䛑ᰃ䗖⫼ⱘDŽ佪ܜ᧰ˈᇏⱘ䆕⬅໘ᬊ䲚㗠ᴹ˖ z ϔᓴᷛߎ䞡ᑣ߫ԡ㕂ⱘ䈅㸼ᯢњ䆹໘䇗ऎඳ㓪ⷕ㲟ⱑ䋼ⱘऎඳϡৃ㛑ߎ⦃DŽ z Ϣ݊ᅗѻ⠽᳝ᑣ߫ⳌԐᗻᰃᰒᄤⱘᔎ᳝䆕DŽ z ϔ↉ᑣ߫Ϟᄬⴔ㒳䅵ⱘ㾘߭ᗻˈ㸼⼎Ўᰒ㨫ⱘĀᆚⷕᄤأདāᰃ㲟ⱑ㓪ⷕऎ᳔ᯢᰒⱘ ᷛᖫПϔDŽ z ϢᵓᓣⳌヺৃ㛑ᣛߎDNAϞࡳ㛑ᗻԡ⚍ⱘԡ㕂DŽ䖭㉏ߚᵤৃҹѢᕜㅔऩⱘᓣ ˄՟བˈӫ᠔਼ⶹⱘ“TATA box”࠾⚍ⱘֱᅜᑣ߫˅ѢⳌᔧᴖⱘ⧚˄՟ བˈৢ䴶ᇚᦤࠄⱘਃࡼᄤ᧰ᇏㅫ⊩Ё˅DŽ ✊ৢˈܼ䚼ᬊ䲚ࠄⱘֵᙃ∛ᘏᭈ⧚៤ᘏԧϞሑৃ㛑䖲䌃ⱘ䈅DŽ⫼Ѣ∛ᘏᭈ⧚䰊↉ⱘޚ߭ሲ Ѣᴀᐌ䆚˖՟བˈ⬅Āᆚⷕᄤأདāߚᵤߎⱘᰒᄤ䖍⬠ৃ㛑Ўњ᳝ϔϾདⱘ࠾ԡ⚍ 10 ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ James W. Fickett SmithKline Beecham Pharmaceuticals King of Prussia. Pennsylvania कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ1/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十章利用核酸序列的预测方法 页码,2/16 而进行轻微调整;在存在与已知蛋白序列的相似性时,序列的“密码子偏好”性也会更受重 视 对于特定的质询,诸多基因辨识程序中仅有少数可能与之相关。在构建一个方案时,一些主 要问题是值得注意的:(1)对真核生物序列,遮蔽重复序列应先于其它分析过程;(2)大 多程序都有特定生物物种适用性;(3)许多程序只能特定适用于基因组DNA数据或者只适用 于CDNA的数据;(4)序列的长度也是一个重要因素。例如,用鸟枪法测序得到的单个序列片 段很少能用设计为在序列中搜寻整个基因的老式程序加以分析 遮蔽重复序列 在进行任何真核生物序列的基因辨识分析之前,最好把散布和简单的重复序列找出来并从序列 中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶Ⅱ转录的部分区域,它们几乎不会覆 盖启动子和外显子编码区。这样,这些重复序列的定位能为其它基因特征的定位提供重要的 反面信息。重复序列还常常会搅乱其它分析,特别是在数据库搜索中 对于偶尔分析一个序列而言,基于电子邮件或Web网页的服务器就足够了。 CENSOR( Jurka 等,1996)与 Reper tAsker( Smi th,1996)就是这种能提供标识和遮蔽散布和简单重复序列 的服务器。可以通过电子邮件,或用Ww界面实现(地址见章末列表)。图10.1显示的是一个 有CENS0R进行重复序列分析和遮蔽的例子 对于大量分析工作而言,在本地安装分析软件就更有效和必要。显然,本地分析也大大增强 了保密性。从因特网上可以得到 XBLAST( Cl averi e,19%6)(不要与 BLASTX混淆)的源程 序。许多重复序列能从由J.Jka收集的 Repbase中得到。J.M. Cl averi e也在 XBLAST软件中包含 了一组收集整理的Au序列。对本地安装软件,把克隆载体序列加入收集的重复序列中也很有 用,以便使在进行分析时,把克隆载体也一并遮蔽 HUMCKMM1 HUMCKMM1 ggatcct tcctccttggcctcccaaagtgctgggat tacaggtgtgagccactgcacctg gcctattacccttctcaggctctggagtccatccttctgctctgtctccctcagttcaat tgttttttgttttttgttttttttttagacacagtctcgctctgtcaccaaggctggagt gcagcagtgcgatcacagctcaccgcagcctcacctcccaggctcaagtgatcctcccat ctcggcctctgagtagctgagactataggtgtgtccacatgtccggctaatttttgtatt tttag tagagacagggt ttcaccgcgttggccagggtggtcttgaactcctgagctcaag caatcctcctgcctcagcctccttgttttgatttttagatcccacaaataacttgtgatg tttgtctttctatacctggttcatttaacattttctttttcttttcttttcttttttttt ttttttgtgagactgagtcttgctctgtcactcaggctggagggcaatggtgcatctcag file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18
㗠䖯㸠䕏ᖂ䇗ᭈ˗ᄬϢᏆⶹ㲟ⱑᑣ߫ⱘⳌԐᗻᯊˈᑣ߫ⱘĀᆚⷕᄤأདāᗻгӮফ䞡 㾚DŽ ᇍѢ⡍ᅮⱘ䋼䆶ˈ䇌䕼䆚ᑣЁҙ᳝ᇥ᭄ৃ㛑ϢПⳌ݇DŽᵘᓎϔϾᮍḜᯊˈϔѯЏ 㽕䯂乬ᰃؐᕫ⊼ᛣⱘ˖˄˅ᇍⳳḌ⫳⠽ᑣ߫ˈ䙂㬑䞡ᑣ߫ᑨܜѢ݊ᅗߚᵤ䖛˗˄˅ ᑣ䛑᳝⡍ᅮ⫳⠽⠽⾡䗖⫼ᗻ˗˄˅䆌ᑣা㛑⡍ᅮ䗖⫼Ѣ㒘DNA᭄㗙া䗖⫼ ѢcDNAⱘ᭄˗˄˅ᑣ߫ⱘ䭓ᑺгᰃϔϾ䞡㽕㋴DŽ՟བˈ⫼右ᵾ⊩⌟ᑣᕫࠄⱘऩϾᑣ߫⠛ ↉ᕜᇥ㛑⫼䆒䅵Ўᑣ߫Ё᧰ᇏᭈϾⱘ㗕ᓣᑣࡴҹߚᵤDŽ 䙂㬑䞡ᑣ߫ 䖯㸠ӏԩⳳḌ⫳⠽ᑣ߫ⱘ䕼䆚ߚᵤП᳔ࠡདᡞᬷᏗㅔऩⱘ䞡ᑣ߫ᡒߎᴹᑊҢᑣ߫ Ё䰸এDŽ㱑✊䖭ѯ䞡ᑣ߫ৃ㛑ℷད㽚Ⲫњ⬅RNA㘮ড়䝊Ċ䕀ᔩⱘ䚼ߚऎඳˈᅗӀТϡӮ㽚 Ⲫਃࡼᄤᰒᄤ㓪ⷕऎDŽ䖭ḋˈ䖭ѯ䞡ᑣ߫ⱘᅮԡ㛑Ў݊ᅗ⡍ᕕⱘᅮԡᦤկ䞡㽕ⱘ ড䴶ֵᙃDŽ䞡ᑣ߫䖬ᐌᐌӮ᧙х݊ᅗߚᵤˈ⡍߿ᰃ᭄ᑧ᧰㋶ЁDŽ ᇍѢيᇨߚᵤϔϾᑣ߫㗠㿔ˈѢ⬉ᄤ䚂ӊWeb㔥义ⱘ᳡ࡵ఼ህ䎇њDŽCENSOR˄Jurka ㄝˈ1996˅ϢRepertMasker˄Smithˈ1996˅ህᰃ䖭⾡㛑ᦤկᷛ䆚䙂㬑ᬷᏗㅔऩ䞡ᑣ߫ ⱘ᳡ࡵ఼DŽৃҹ䗮䖛⬉ᄤ䚂ӊˈ⫼WWW⬠䴶ᅲ⦄˄ഄഔ㾕ゴ߫㸼˅DŽ10.1ᰒ⼎ⱘᰃϔϾ ᳝CENSOR䖯㸠䞡ᑣ߫ߚᵤ䙂㬑ⱘ՟ᄤDŽ ᇍѢ䞣ߚᵤᎹ㗠㿔ˈᴀഄᅝ㺙ߚᵤ䕃ӊህ᳝ᬜᖙ㽕DŽᰒ✊ˈᴀഄߚᵤгᔎ њֱᆚᗻDŽҢ⡍㔥ϞৃҹᕫࠄXBLAST˄Claverieˈ1996˅˄ϡ㽕ϢBLASTX⏋⎚˅ⱘ⑤ ᑣDŽ䆌䞡ᑣ߫㛑Ң⬅J.Jukaᬊ䲚ⱘRepbaseЁᕫࠄDŽJ.M.ClaverieгXBLAST䕃ӊЁࣙ њϔ㒘ᬊ䲚ᭈ⧚ⱘAluᑣ߫DŽᇍᴀഄᅝ㺙䕃ӊˈᡞܟ䱚䕑ԧᑣ߫ࡴܹᬊ䲚ⱘ䞡ᑣ߫Ёгᕜ᳝ ⫼ˈҹ֓Փ䖯㸠ߚᵤᯊˈᡞܟ䱚䕑ԧгϔᑊ䙂㬑DŽ (a) ; HUMCKMM1 HUMCKMM1 ggatccttcctccttggcctcccaaagtgctgggattacaggtgtgagccactgcacctg gcctattacccttctcaggctctggagtccatccttctgctctgtctccctcagttcaat tgttttttgttttttgttttttttttagacacagtctcgctctgtcaccaaggctggagt gcagcagtgcgatcacagctcaccgcagcctcacctcccaggctcaagtgatcctcccat ctcggcctctgagtagctgagactataggtgtgtccacatgtccggctaatttttgtatt tttagtagagacagggtttcaccgcgttggccagggtggtcttgaactcctgagctcaag caatcctcctgcctcagcctccttgttttgatttttagatcccacaaataacttgtgatg tttgtctttctatacctggttcatttaacattttctttttcttttcttttcttttttttt ttttttgtgagactgagtcttgctctgtcactcaggctggagggcaatggtgcatctcag कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ2/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十章利用核酸序列的预测方法 页码,3/16 ctcactgcaacctccacctcctaggttcaagcaattct tatgcctcagcctcctggctag ctgggat tacaggcgtgtgtcaccatgccaggctaatttttgtacttttagtagagatgg ggtt tcaccatgttggccaggctggtcttgaactcctggcctcaagtgatccacccgcct ccgcctctgcctcccaaagtgctgggat tacgggcctgagccactgtgcccggcccatct aacattttcactgtcaatcacaatgggat taaaactcctcccacagcccctagggaccal humckmm1 2 63 Alu-Jb 1 62 C humckmm1 67 119 L1MA2697751 C humckmm1 138 382 Al u-Jb 42 290C humckmm1 383 449 L1MA2 623 696C humckmm1 451 480(TTTTC)5 33 d humckmm1 481 775 Alu-Sz 1 290 C humckmm1 humckmm1 humckmm1 GXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTATXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTGTTTTTTGTTTTTTGTXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18
ctcactgcaacctccacctcctaggttcaagcaattcttatgcctcagcctcctggctag ctgggattacaggcgtgtgtcaccatgccaggctaatttttgtacttttagtagagatgg ggtttcaccatgttggccaggctggtcttgaactcctggcctcaagtgatccacccgcct ccgcctctgcctcccaaagtgctgggattacgggcctgagccactgtgcccggcccatct aacattttcactgtcaatcacaatgggattaaaactcctcccacagcccctagggacca1 (b) humckmm1 2 63 Alu-Jb 1 62 c humckmm1 67 119 L1MA2 697 751 c humckmm1 138 382 Alu-Jb 42 290 c humckmm1 383 449 L1MA2 623 696 c humckmm1 451 480 (TTTTC) 5 33 d humckmm1 481 775 Alu-Sz 1 290 c (c) ; humckmm1 ;humckmm1 humckmm1 GXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTATXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTGTTTTTTGTTTTTTGTXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ3/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十章利用核酸序列的预测方法 页码,4/16 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXCATCTAACATTTTCACTGTCAATCACAATGGGATTAAAACTCCTCCCACAGCCCCTAGGGACCAT 图10.1由CENS0R实现的重复序列分析:(a)输入序列,(b)由 CENSOR产生的特征列表,以 及(c)遮蔽了重复序列后的输出序列。 数据库搜索 搜寻已知同源体可能是最古老和最为广泛认识的编码蛋白的新基因的辨识方法(例如, Doolittle, 1986: Gi shFIStates, 1993: Robi son, 1994: Cl averi e, 1996: Gel fand -, 996),对于编码 SnRNA和rRNA的新基因也是这样。这类搜索仅依靠进化上的关系,因而广泛 适用。数据库搜索技术已在第七章中有所详述。这一部分仅评述它们在基因搜寻中的应用 完整的基因搜寻服务正开始把数据库搜索包含进来成为分析的一部分。然而,在某些情况 下,数据库搜索这一步还需要用户分开完成。对编码蛋白的基因而言,将序列以六种可能的 阅读框架翻译岀来,并把结果分别作为氨基酸序列和功能性Mtif数据库的搜索对象,这通常 是获取重要匹配序列最佳的第一步。一旦一个同源序列被找到, Procrustes( Gel fand等, 1996)可被用来找出已知基因产物与新基因之间最优的比对方式 找到同源产物的一大好处显然在于该基因的一些生物学性质可以马上被弄明白,但这里有两 点警告。首先,由相似性作出的注解可能会导致错误的传播(Bork,1996)。其次,新发现 的蛋白中大约只有一半能在已有数据库中找到同源者,并且这一比例看起来增长极为缓慢 Green等(1993)发现:(1)全体蛋白质中的大多数古保留片段(或称ACR,简单定义为蛋白 序列中表现高度良好同源性的部分)都已经被发现并能在当前的数据库中找到:(2)大约新 发现基因中的20%-50%包含至少一个数据库中已有描述的ACR;并且(3)很少表达的基因 比中等或高度表达的基因更缺乏包含ACR序列的可能。 种直接的核酸序列数据库搜索也很有用。在EST(部分cDNA序列)数据库中可能包含着全部 基因中大多数的碎片( Aaronson等,1996; Hillier等,1996)。因此它们是为多数基因部分 定位的重要资源。但这在为基因结构定界时能起多大作用尚不清楚。众所周知,核酸库搜索 是定位rRNA和 SnRNA的好方法(虽然假基因仍是个问题)。这种搜索在定位调控序列时也会有 用( Duret和 Bucher,1997)。 密码子偏好的检测 大多数计算识别编码蛋白质的基因的方法都着重于识别由于密码子使用时的偏好而产生的有 些弥散的编码区规则性。将密码子出现频率简单列表是所谓“编码测度”( codi ng measure)的一种,即指一种以计算出一个数或一个数列表用于总结这种规律性的规则。许多 “编码测度”规则都已被提出。其中,大约最有信息提取价值的包括:双密码子计数(即指 连续两个密码子对出现频率计数);一些直接量度周期性(这里的“周期性”指同一核苷酸 在相距3,6,9,…,bp位置上多次出现的趋势)的方法;均一性对复杂性的量测(如长同聚 区段计数);以及开放可读框架的出现( Fickett和Tung,1992)。 很多编码区检测程序主要是把一个或几个“编码测度”组合起来,(使用例如概率论原理, 多变量统计中的判别分析技术,或者人工智能领域的神经网方法)构成一个数,称作一个判 别式。例如,这种组合构成了有名的GRAL程序(Ⅺ等,1994)的基础。一般判别式在一个 滑动窗口”(即定长连续的子序列)中计算出来,并且将结果作成曲线(图10.2)。 为从编码测度判别式中获得更显著信息,需要获得有关大量碱基构成顺序的规律。更具体而 言,以下标准由 Fi ckett和rung(1992)建立:(1)将 GenBank库分解成连续108bp的窗口片 file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXCATCTAACATTTTCACTGTCAATCACAATGGGATTAAAACTCCTCCCACAGCCCCTAGGGACCA1 10.1⬅CENSORᅲ⦄ⱘ䞡ᑣ߫ߚᵤ˖˄D˅䕧ܹᑣ߫ˈ˄E˅⬅CENSORѻ⫳ⱘ⡍ᕕ߫㸼ˈҹ ঞ˄F˅䙂㬑њ䞡ᑣ߫ৢⱘ䕧ߎᑣ߫DŽ ᭄ᑧ᧰㋶ ᧰ᇏᏆⶹৠ⑤ԧৃ㛑ᰃ᳔স㗕᳔Ўᑓ⊯䅸䆚ⱘ㓪ⷕ㲟ⱑⱘᮄⱘ䕼䆚ᮍ⊩˄՟བˈ Doolittleˈ1986˗GishStatesˈ1993˗Robisonㄝˈ1994˗Claverieˈ1996˗Gelfandㄝˈ 1996˅ˈᇍѢ㓪ⷕsnRNArRNAⱘᮄгᰃ䖭ḋDŽ䖭㉏᧰㋶ҙձ䴴䖯࣪Ϟⱘ݇㋏ˈ㗠ᑓ⊯ 䗖⫼DŽ᭄ᑧ᧰㋶ᡔᴃᏆϗゴЁ᳝᠔䆺䗄DŽ䖭ϔ䚼ߚҙ䆘䗄ᅗӀ᧰ᇏЁⱘᑨ⫼DŽ ᅠᭈⱘ᧰ᇏ᳡ࡵℷᓔྟᡞ᭄ᑧ᧰㋶ࣙ䖯ᴹ៤Ўߚᵤⱘϔ䚼ߚDŽ✊㗠ˈᶤѯᚙމ ϟˈ᭄ᑧ᧰㋶䖭ϔℹ䖬䳔㽕⫼᠋ߚᓔᅠ៤DŽᇍ㓪ⷕ㲟ⱑⱘ㗠㿔ˈᇚᑣ߫ҹ݁⾡ৃ㛑ⱘ 䯙䇏Ḛᶊ㗏䆥ߎᴹˈᑊᡞ㒧ᵰ߿ߚЎ⇼䝌ᑣ߫ࡳ㛑ᗻMotif᭄ᑧⱘ᧰㋶ᇍ䈵ˈ䖭䗮ᐌ ᰃ㦋প䞡㽕ऍ䜡ᑣ᳔߫ՇⱘϔℹDŽϔᮺϔϾৠ⑤ᑣ߫㹿ᡒࠄˈProcrustes˄Gelfandㄝˈ 1996˅ৃ㹿⫼ᴹᡒߎᏆⶹѻ⠽ϢᮄП䯈᳔Ӭⱘ↨ᇍᮍᓣDŽ ᡒࠄৠ⑤ѻ⠽ⱘϔད໘ᰒ✊Ѣ䆹ⱘϔѯ⫳⠽ᄺᗻ䋼ৃҹ偀Ϟ㹿ᓘᯢⱑˈԚ䖭䞠᳝ϸ ⚍䄺ਞDŽ佪ܜ⬅ˈⳌԐᗻߎⱘ⊼㾷ৃ㛑Ӯᇐ㟈䫭䇃ⱘӴ᪁˄Borkˈ1996˅DŽ݊ˈᮄথ⦄ ⱘ㲟ⱑЁ㑺া᳝ϔञ㛑Ꮖ᭄᳝ᑧЁᡒࠄৠ⑤㗙ˈᑊϨ䖭ϔ↨՟ⳟ䍋ᴹ䭓ᵕЎ㓧᜶DŽ Greenㄝ˄1993˅থ⦄˖˄˅ܼԧ㲟ⱑ䋼Ёⱘ᭄সֱ⬭⠛↉˄⿄ACRˈㅔऩᅮНЎ㲟ⱑ ᑣ߫Ё㸼⦄催ᑺ㡃དৠ⑤ᗻⱘ䚼ߚ˅䛑Ꮖ㒣㹿থ⦄ᑊ㛑ᔧࠡⱘ᭄ᑧЁᡒࠄ˅˄˗㑺ᮄ থ⦄Ёⱘ20ˁˉ50ˁࣙ㟇ᇥϔϾ᭄ᑧЁᏆ᳝ᦣ䗄ⱘACR˗ᑊϨ˄˅ᕜᇥ㸼䖒ⱘ ↨Ёㄝ催ᑺ㸼䖒ⱘ㔎УࣙACRᑣ߫ⱘৃ㛑DŽ ϔ⾡ⳈⱘḌ䝌ᑣ᭄߫ᑧ᧰㋶гᕜ᳝⫼DŽEST˄䚼ߚcDNAᑣ߫˅᭄ᑧЁৃ㛑ࣙⴔܼ䚼 Ё᭄ⱘ⠛˄Aaronsonㄝˈ1996˗Hillierㄝˈ1996˅DŽℸᅗӀᰃЎ᭄䚼ߚ ᅮԡⱘ䞡㽕䌘⑤DŽԚ䖭Ў㒧ᵘᅮ⬠ᯊ㛑䍋⫼ᇮϡ⏙ἮDŽӫ᠔਼ⶹˈḌ䝌ᑧ᧰㋶ ᰃᅮԡrRNAsnRNAⱘདᮍ⊩˄㱑✊؛ҡᰃϾ䯂乬˅DŽ䖭⾡᧰㋶ᅮԡ䇗ᑣ߫ᯊгӮ᳝ ⫼˄DuretBucherˈ1997˅DŽ ᆚⷕᄤأདⱘẔ⌟ ᭄䅵ㅫ䆚߿㓪ⷕ㲟ⱑ䋼ⱘⱘᮍ⊩䛑ⴔ䞡Ѣ䆚߿⬅ѢᆚⷕᄤՓ⫼ᯊⱘأད㗠ѻ⫳ⱘ᳝ ѯᓹᬷⱘ㓪ⷕऎ㾘߭ᗻDŽᇚᆚⷕᄤߎ⦃乥⥛ㅔऩ߫㸼ᰃ᠔䇧Ā㓪ⷕ⌟ᑺā˄coding measure˅ⱘϔ⾡ˈेᣛϔ⾡ҹ䅵ㅫߎϔϾ᭄ϔϾ᭄߫㸼⫼Ѣᘏ㒧䖭⾡㾘ᕟᗻⱘ㾘߭DŽ䆌 Ā㓪ⷕ⌟ᑺā㾘߭䛑Ꮖ㹿ᦤߎDŽ݊Ёˈ㑺᳔ֵ᳝ᙃᦤপӋؐⱘࣙᣀ˖ঠᆚⷕᄤ䅵᭄˄ेᣛ 䖲㓁ϸϾᆚⷕᄤᇍߎ⦃乥⥛䅵᭄˅˗ϔѯⳈ䞣ᑺ਼ᳳᗻ˄䖭䞠ⱘĀ਼ᳳᗻāᣛৠϔḌ㣋䝌 Ⳍ䎱ˈˈˈĂˈbpԡ㕂Ϟߎ⦃ⱘ䍟˅ⱘᮍ⊩˗ഛϔᗻᇍᴖᗻⱘ䞣⌟˄བ䭓ৠ㘮 ऎ↉䅵᭄˅˗ҹঞᓔᬒৃ䇏Ḛᶊⱘߎ˄⦃FickettTungˈ1992˅DŽ ᕜ㓪ⷕऎẔ⌟ᑣЏ㽕ᰃᡞϔϾϾĀ㓪ⷕ⌟ᑺā㒘ড়䍋ᴹˈ˄Փ⫼՟བὖ⥛䆎ॳ⧚ˈ ব䞣㒳䅵Ёⱘ߸ߚ߿ᵤᡔᴃˈ㗙ҎᎹᱎ㛑乚ඳⱘ⼲㒣㔥ᮍ⊩˅ᵘ៤ϔϾ᭄ˈ⿄ϔϾ߸ ߿ᓣDŽ՟བˈ䖭⾡㒘ড়ᵘ៤њ᳝ৡⱘGRAILᑣ˄Xuㄝˈ1994˅ⱘ⸔DŽϔ㠀߸߿ᓣϔϾ Ā⒥ࡼにষā˄ेᅮ䭓䖲㓁ⱘᄤᑣ߫˅Ё䅵ㅫߎᴹˈᑊϨᇚ㒧ᵰ៤᳆㒓˄10.2˅DŽ ЎҢ㓪ⷕ⌟ᑺ߸߿ᓣЁ㦋ᕫᰒ㨫ֵᙃˈ䳔㽕㦋ᕫ᳝݇䞣⺅ᵘ៤乎ᑣⱘ㾘ᕟDŽԧ㗠 㿔ˈҹϟᷛޚ⬅FickettTung˄1992˅ᓎゟ˖˄˅ᇚGenBankᑧߚ㾷៤䖲㓁108bpⱘにষ⠛ कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ4/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十章利用核酸序列的预测方法 页码,5/16 段;(2)只有那些完全是编码区或完全不是编码区的片段被保留下来;(3)一半的窗口片 段用来设定如上所述四种测度线性组合成判别式所用的参数;(4)另一半用于检验判别式预 测的准确性。硏究得到了88%的预测准确性。因而编码测度给岀了一个较低分辨率的编码区 边界的图谱。然而,编码测度还可以合理应用于不完整的序列(例如,由鸟枪测序工程获得 的几百bp长的一个序列),并且这是一个重要的优点 许多编码测度程序是适用专门物种的,所以使用者要仔细确定该服务开发和测试用的是各类 物种中的哪一些 图10.2由 GenMark(一个通过电子邮件服务的编码区识别工具)得到的部分输出样例。 GenMark包含七个DA的概率模型,分别由编码区的六种阅读框和非编码区计数而来。该程序 计算出DNA上每个窗口是非编码区、或某种阅读框架的编码区的概率, 探査DNA中的功能性位点 编码测度与细胞识别和表达基因的方法大概基本上不同(虽然见 Knudsen和 Brunak,1997)。 如果我们能识别表达系统与核酸相互作用的位点,例如转录因子结合位点与内含子/外显子的 接头位点,这将对基因识别大有启发(并可能提高精度) 种归纳出这些位点位置(一般,基因识别算法开发者称之为“信号”)的方法是给出所谓 共有序列”,它是由特定的结合位点比对后得到各位置最常出现的碱基构成。共有序列是 很好的助记工具,但一般在用于从假位点中判别真正位点时还不太可靠,这部分是因为它没 包含各位点上其它三种碱基出现的可能性。许多算法采用能给出更佳判别的复杂技术。其中 种根据物理化学原理的技术是位置权重矩阵(Pw)技术。信号的各位置上每种可能出现的 核苷酸都分配一个分数。对一个特定序列,把它看作可能出现的信号,将各位置的相应分数 加和后给出该序列作为潜在位点的得分。一些情况下,这些分数大约与控制蛋白(核糖核蛋 白)的结合能成正比(见 Stormo,1990与 Von Hi ppe,1994的综述) 有一些研究(例如, Barri ck等,1994)表明PMM在估测单个特定结合位点时表现较好。然而 不幸的是,单独用PM来识别普通真核基因表达系统的复杂成分(例如,剪接位点和启动子序 列)时进获得艰难而有限的成果。主要问题可能在于上下文特异的表达机制和复合结合分子 之间的协作。 启动子 直到最近才能确定真核基因组序列大到足以包含许多基因。数据成为基因搜寻程序的新问 题:要从多基因中准确分割一组外显子。启动子是提供这一生物学功能的富含信息的信号序 列。计算机识别启动子(近有 Fi cket和 Hatzi georgi ou,1997的综述)部分以其能推进基因 识别而十分重要。很多复杂程序依赖于实验室提供的转录因子结合特性,和一些对启动子结 构的描述。但这些描述看上去并未抓住转录起始中的一些重要特性,并且也许令人吃惊的 是,主要依赖于简单寡核苷酸频率计数的程序表现也差不多。启动子识别仍是一个重大扒 战,在前面引用的综述中,用包含24个新确认的转录起始点的18个序列测试了当前的程序 这些程序最多找出了一半的启动子,假阳性率约为每千个碱基中一个。 内含子剪接位点 许多不同物种的研究小组汇集了剪接位点的PwM( Senapathy等,1990),这些可能是多物种 分析能得到的最重要资源。可惜PM分析剪接位点时特异性很低,主要由于存在多剪接机制 (一些对近期发现的回顾见 Ni son,19%6),以及调控下的交替剪接( McKeown,1992)。 file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18
↉˗˄˅া᳝䙷ѯᅠܼᰃ㓪ⷕऎᅠܼϡᰃ㓪ⷕऎⱘ⠛↉㹿ֱ⬭ϟᴹ˗˄˅ϔञⱘにষ⠛ ↉⫼ᴹ䆒ᅮབϞ᠔䗄ಯ⾡⌟ᑺ㒓ᗻ㒘ড়៤߸߿ᓣ᠔⫼ⱘখ᭄˗˄˅ϔञ⫼ѢẔ偠߸߿ᓣ乘 ⌟ⱘޚ⹂ᗻDŽⷨおᕫࠄњ88ˁⱘ乘⌟ޚ⹂ᗻDŽ㗠㓪ⷕ⌟ᑺ㒭ߎњϔϾ䕗Ԣߚ䕼⥛ⱘ㓪ⷕऎ 䖍⬠ⱘ䈅DŽ✊㗠ˈ㓪ⷕ⌟ᑺ䖬ৃҹড়⧚ᑨ⫼Ѣϡᅠᭈⱘᑣ߫˄՟བˈ⬅右ᵾ⌟ᑣᎹ㦋ᕫ ⱘⱒbp䭓ⱘϔϾᑣ߫˅ˈᑊϨ䖭ᰃϔϾ䞡㽕ⱘӬ⚍DŽ 䆌㓪ⷕ⌟ᑺᑣᰃ䗖⫼ϧ䮼⠽⾡ⱘˈ᠔ҹՓ⫼㗙㽕Ҩ㒚⹂ᅮ䆹᳡ࡵᓔথ⌟䆩⫼ⱘᰃ㉏ ⠽⾡ЁⱘાϔѯDŽ ……………… 10.2⬅GenMark˄ϔϾ䗮䖛⬉ᄤ䚂ӊ᳡ࡵⱘ㓪ⷕऎ䆚߿Ꮉ˅ᕫࠄⱘ䚼ߚ䕧ߎḋ՟DŽ GenMarkࣙϗϾDNAⱘὖ⥛ൟˈ߿ߚ⬅㓪ⷕऎⱘ݁⾡䯙䇏Ḛ䴲㓪ⷕऎ䅵᭄㗠ᴹDŽ䆹ᑣ 䅵ㅫߎDNAϞ↣Ͼにষᰃ䴲㓪ⷕऎǃᶤ⾡䯙䇏Ḛᶊⱘ㓪ⷕऎⱘὖ⥛DŽ ᶹDNAЁⱘࡳ㛑ᗻԡ⚍ 㓪ⷕ⌟ᑺϢ㒚㚲䆚߿㸼䖒ⱘᮍ⊩ὖᴀϞϡৠ˄㱑✊㾕KnudsenBrunakˈ1997˅DŽ བᵰ៥Ӏ㛑䆚߿㸼䖒㋏㒳ϢḌ䝌ⳌѦ⫼ⱘԡ⚍ˈ՟བ䕀ᔩᄤ㒧ড়ԡ⚍Ϣݙᄤᰒᄤⱘ ༈ԡ⚍ˈ䖭ᇚᇍ䆚߿᳝ਃথ˄ᑊৃ㛑ᦤ催㊒ᑺ˅DŽ ϔ⾡ᔦ㒇ߎ䖭ѯԡ⚍ԡ㕂˄ϔ㠀ˈ䆚߿ㅫ⊩ᓔথ㗙⿄ПЎĀֵোā˅ⱘᮍ⊩ᰃ㒭ߎ᠔䇧 Ā᳝݅ᑣ߫āˈᅗᰃ⬅⡍ᅮⱘ㒧ড়ԡ⚍↨ᇍৢᕫࠄԡ㕂᳔ᐌߎ⦃ⱘ⺅ᵘ៤DŽ᳝݅ᑣ߫ᰃ ᕜདⱘࡽ䆄ᎹˈԚϔ㠀⫼ѢҢ؛ԡ⚍Ё߸߿ⳳℷԡ⚍ᯊ䖬ϡৃ䴴ˈ䖭䚼ߚᰃЎᅗ≵ ࣙԡ⚍Ϟ݊ᅗϝ⾡⺅ߎ⦃ⱘৃ㛑ᗻDŽ䆌ㅫ⊩䞛⫼㛑㒭ߎՇ߸߿ⱘᴖᡔᴃDŽ݊Ё ϔ⾡ḍ⠽⧚࣪ᄺॳ⧚ⱘᡔᴃᰃԡ㕂ᴗ䞡ⶽ䰉˄PWH˅ᡔᴃDŽֵোⱘԡ㕂Ϟ↣⾡ৃ㛑ߎ⦃ⱘ Ḍ㣋䝌䛑ߚ䜡ϔϾߚ᭄DŽᇍϔϾ⡍ᅮᑣ߫ˈᡞᅗⳟৃ㛑ߎ⦃ⱘֵোˈᇚԡ㕂ⱘⳌᑨߚ᭄ ࡴৢ㒭ߎ䆹ᑣ߫Ў┰ԡ⚍ⱘᕫߚDŽϔѯᚙމϟˈ䖭ѯߚ᭄㑺Ϣࠊ㲟ⱑ˄Ḍ㊪Ḍ㲟 ⱑ˅ⱘ㒧ড়㛑៤ℷ↨˄㾕Stormoˈ1990ϢVon Hippelˈ1994ⱘ㓐䗄˅DŽ ᳝ϔѯⷨお˄՟བˈBarrickㄝˈ1994˅㸼ᯢPWMԄ⌟ऩϾ⡍ᅮ㒧ড়ԡ⚍ᯊ㸼⦄䕗དDŽ✊㗠 ϡᑌⱘᰃˈऩ⣀⫼PWMᴹ䆚߿᱂䗮ⳳḌ㸼䖒㋏㒳ⱘᴖ៤ߚ˄՟བˈ࠾ԡ⚍ਃࡼᄤᑣ ߫˅ᯊ䖯㦋ᕫ㡄䲒㗠᳝䰤ⱘ៤ᵰDŽЏ㽕䯂乬ৃ㛑ѢϞϟ᭛⡍ᓖⱘ㸼䖒ᴎࠊড়㒧ড়ߚᄤ П䯈ⱘणDŽ ਃࡼᄤ Ⳉࠄ᳔䖥ᠡ㛑⹂ᅮⳳḌ㒘ᑣ߫ࠄ䎇ҹࣙ䆌DŽ᭄៤Ў᧰ᇏᑣⱘᮄ䯂 乬˖㽕ҢЁޚ⹂ࡆߚϔ㒘ᰒᄤDŽਃࡼᄤᰃᦤկ䖭ϔ⫳⠽ᄺࡳ㛑ⱘᆠֵᙃⱘֵোᑣ ߫DŽ䅵ㅫᴎ䆚߿ਃࡼᄤ˄䖥᳝FickettHatzigeorgiouˈ1997ⱘ㓐䗄˅䚼ߚҹ݊㛑䖯 䆚߿㗠कߚ䞡㽕DŽᕜᴖᑣձ䌪Ѣᅲ偠ᅸᦤկⱘ䕀ᔩᄤ㒧ড়⡍ᗻˈϔѯᇍਃࡼᄤ㒧 ᵘⱘᦣ䗄DŽԚ䖭ѯᦣ䗄ⳟϞএᑊᡧԣ䕀ᔩ䍋ྟЁⱘϔѯ䞡㽕⡍ᗻˈᑊϨг䆌ҸҎৗⱘ ᰃˈЏ㽕ձ䌪ѢㅔऩᆵḌ㣋䝌乥⥛䅵᭄ⱘᑣ㸼⦄гᏂϡDŽਃࡼᄤ䆚߿ҡᰃϔϾ䞡ᣥ ˈࠡ䴶ᓩ⫼ⱘ㓐䗄Ёˈ⫼ࣙ24Ͼᮄ⹂䅸ⱘ䕀ᔩ䍋ྟ⚍ⱘ18Ͼᑣ߫⌟䆩њᔧࠡⱘᑣDŽ 䖭ѯᑣ᳔ᡒߎњϔञⱘਃࡼᄤˈ؛䰇ᗻ⥛㑺Ў↣गϾ⺅ЁϔϾDŽ ⚍ԡ࠾ᄤݙ 䆌ϡৠ⠽⾡ⱘⷨおᇣ㒘∛䲚њ࠾ԡ⚍ⱘPWM˄Senapathyㄝˈ1990˅ˈ䖭ѯৃ㛑ᰃ⠽⾡ ߚᵤ㛑ᕫࠄⱘ᳔䞡㽕䌘⑤DŽৃᚰPWMߚᵤ࠾ԡ⚍ᯊ⡍ᓖᗻᕜԢˈЏ㽕⬅Ѣᄬ࠾ᴎࠊ ˄ϔѯᇍ䖥ᳳথ⦄ⱘಲ乒㾕Nilsonˈ1996˅ˈҹঞ䇗ϟⱘѸ᳓࠾˄NcKeownˈ1992˅DŽ कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ5/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com