第十二章鼠类和人类公用物理图谱数据库的使用 页码,1/1 第十二章鼠类和人类公用物理图谱数据库的 使用 Li ncol n d. Stein Cold spring Harbor Laboratory Cold Spring Harbor, New York 几年前,几张已经制成的人类基因组图谱还只是在小面积上的低分辨率图。生物医学研究者 如果希望定位和克隆一个致病基因,总的说来就不得不对目的区域制图,而这是一个费时费 力的过程。这种情况在近几年发生了巨大的变化。现在已经有了高质量的人类基因组基因图 谱,它以单一序列重复多态性( Murray et al..1994: Dib et al.,1996)为基础,提供分 辨率达1-5b的图谱信息。此外,还有许多物理图谱分辨率在亚兆(sub-Mb)范围(参见 Hudson et al.1995;0′ Connell et al.,1996,及其它)。长约16000的表达序列的图谱现 在也可以得到。利用这些图,一个研究者,在很多情况下,可以只集中研究一个选定区域, 用几个小时来搜索公用图谱数据库,而不是用几个月时间做实验了 令人啼笑皆非的是,研究者的困难现在已经从基因组制图转到了使用一个巨大的未知领域。 它包括ww站点,FTP(文件传输协议 File transfer protocol)服务器和数据库。其中有大 型数据库,如 NCbI Entrez和GDB。也有小型数据库,可以提供由基因组中心发表的初级图 谱、由个体染色体委员会赞助的网址和由小型实验室使用,以发表特定区域详图的网址。每 种来源中的信息,即使与另一种中的相重复,也有其自身的价值。使用这个信息网并不容 个的潜在的相关文件。本章作为这些图谱的一个“简图”,用来引导读者穿过物理图谱数据 库的迷宫。 本章先对物理图谱制图方法作一简要回顾,然后讨论大型公用数据库 NCbI Entrez和GDB,这 些库提供了査找许多不同来源图谱的简捷途径,并能在这些来源中进行比较。接着,本章再 讨论一下由个体制图实验室所出版的资料,从在基因组范围做出制图努力的某些中心,一直 到对个体染色体做出制图努力的。因为作者的专业领域所限,本章集中讨论人类和鼠类的图 谱 物理图谱的类型 物理图谱有许多结构和形式。一个极端是限制性图谱( restriction map),用于对小区域、 如Kb量级做精细结构制图,另一个极端是细胞遗传学图( cytogenetic map),用于对以1 kb为长度量级的区域制图。但是,最常用的两种类型还是STS含量图( STS content map)和 放射性杂交图( radi ati on hybrid map),它们的分辨区域都大于1Mb,并且有能使用简易 PCR中的定位标记物的优点。 在STS含量图(图12.1)中,STS标记物通过多聚酶链反应所监测,在反应中它与一个大的插 入克隆基因库反应,如酵母人工染色体(TACs),细菌人工染色体(BACS)和粘粒等。如果 两个或多个STS被发现是存在于同一个克隆之中,那么这些标记位点紧密相邻的机会就很高 (不是100%,因为在制图过程中存在一些假象,如出现嵌合克隆体)。一段时期以来,根据 STS含量图已经建立起一系列重叠群,如含有STS的重叠簇克隆。这样一张图的分辨率和覆盖 度由一些因子决定,如STS的密度、克隆群体的大小、以及克隆文库的深度。通常STS含量图 以长1№b的插入YAC库为基础,分辨率为几百个bp。如果使用插入部分较小的克隆载体,图谱 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
कѠゴ 哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘ Փ⫼ Lincoln D. Stein Cold Spring Harbor Laboratory Cold Spring Harbor, New York ᑈࠡˈᓴᏆ㒣ࠊ៤ⱘҎ㉏㒘䈅䖬াᰃᇣ䴶⿃ϞⱘԢߚ䕼⥛DŽ⫳⠽एᄺⷨお㗙 བᵰᏠᳯᅮԡܟ䱚ϔϾ㟈⮙ˈᘏⱘ䇈ᴹህϡᕫϡᇍⳂⱘऎඳࠊˈ㗠䖭ᰃϔϾ䌍ᯊ䌍 ⱘ䖛DŽ䖭⾡ᚙމ䖥ᑈথ⫳њᎼⱘব࣪DŽ⦄Ꮖ㒣᳝њ催䋼䞣ⱘҎ㉏㒘 䈅ˈᅗҹऩϔᑣ߫䞡ᗕᗻ˄Murray et al.,1994; Dib et al., 1996˅Ў⸔ˈᦤկߚ 䕼⥛䖒ˉ5Mbⱘ䈅ֵᙃDŽℸˈ䖬᳝䆌⠽⧚䈅ߚ䕼⥛Ѯܚ˄sub-Mb˅㣗ೈ˄খ㾕 Hudson et al.,1995; O’Connell et al.,1996ˈঞ݊ᅗ˅DŽ䭓㑺16000ⱘ㸼䖒ᑣ߫ⱘ䈅⦄ гৃҹᕫࠄDŽ߽⫼䖭ѯˈϔϾⷨお㗙ˈᕜᚙމϟˈৃҹা䲚ЁⷨおϔϾ䗝ᅮऎඳˈ ⫼Ͼᇣᯊᴹ᧰㋶݀⫼䈅᭄ᑧˈ㗠ϡᰃ⫼Ͼ᳜ᯊ䯈خᅲ偠њDŽ ҸҎュⱚ䴲ⱘᰃˈⷨお㗙ⱘೄ䲒⦄Ꮖ㒣Ң㒘ࠊ䕀ࠄњՓ⫼ϔϾᎼⱘⶹ乚ඳDŽ ᅗࣙᣀwwwキ⚍ˈFTP˄᭛ӊӴ䕧ण䆂File Transfer Protocol˅᳡ࡵ఼᭄ᑧDŽ݊Ё᳝ ൟ᭄ᑧˈབNCBI EntrezGDBDŽг᳝ᇣൟ᭄ᑧˈৃҹᦤկ⬅㒘Ёᖗথ㸼ⱘ߱㑻 䈅ǃ⬅Ͼԧᶧ㡆ԧྨਬӮ䌲ࡽⱘ㔥ഔ⬅ᇣൟᅲ偠ᅸՓ⫼ˈҹথ㸼⡍ᅮऎඳ䆺ⱘ㔥ഔDŽ↣ ⾡ᴹ⑤ЁⱘֵᙃˈेՓϢϔ⾡ЁⱘⳌ䞡ˈг᳝݊㞾䑿ⱘӋؐDŽՓ⫼䖭Ͼֵᙃ㔥ᑊϡᆍ ᯧDŽ᳔䖥ˈϔ乍Alta Vist Web᧰㋶఼ϞخⱘᇍĀ㒘āϔ䆡ⱘ᧰㋶ህᡒࠄњ䍙䖛80000 Ͼⱘ┰ⱘⳌ݇᭛ӊDŽᴀゴЎ䖭ѯ䈅ⱘϔϾĀㅔāˈ⫼ᴹᓩᇐ䇏㗙こ䖛⠽⧚䈅᭄ ᑧⱘ䗋ᅿDŽ ᴀゴܜᇍ⠽⧚䈅ࠊᮍ⊩ϔㅔ㽕ಲ乒ˈ✊ৢ䅼䆎ൟ݀⫼᭄ᑧNCBI EntrezGDBˈ䖭 ѯᑧᦤկњᶹᡒ䆌ϡৠᴹ⑤䈅ⱘㅔ᥋䗨ᕘˈᑊ㛑䖭ѯᴹ⑤Ё䖯㸠↨䕗DŽⴔˈᴀゴݡ 䅼䆎ϔϟ⬅Ͼԧࠊᅲ偠ᅸ᠔ߎ⠜ⱘ䌘᭭ˈҢ㒘㣗ೈࠊߎخࡾⱘᶤѯЁᖗˈϔⳈ ࠄᇍϾԧᶧ㡆ԧࠊߎخࡾⱘDŽЎ㗙ⱘϧϮ乚ඳ᠔䰤ˈᴀゴ䲚Ё䅼䆎Ҏ㉏哴㉏ⱘ 䈅DŽ ⠽⧚䈅ⱘ㉏ൟ ⠽⧚䈅᳝䆌㒧ᵘᔶᓣDŽϔϾᵕッᰃ䰤ࠊᗻ䈅˄restriction map˅ˈ⫼Ѣᇍᇣऎඳǃ བkb䞣㑻خ㊒㒚㒧ᵘࠊˈϔϾᵕッᰃ㒚㚲䘫Ӵᄺ˄cytogenetic map˅ˈ⫼Ѣᇍҹ104 kbЎ䭓ᑺ䞣㑻ⱘऎඳࠊDŽԚᰃˈ᳔ᐌ⫼ⱘϸ⾡㉏ൟ䖬ᰃSTS䞣˄STS content map˅ ᬒᇘᗻᴖѸ˄radiation hybrid map˅ˈᅗӀⱘߚ䕼ऎඳ䛑Ѣ1MbˈᑊϨ᳝㛑Փ⫼ㅔᯧ PCRЁⱘᅮԡᷛ䆄⠽ⱘӬ⚍DŽ STS䞣˄12.1˅ЁˈSTSᷛ䆄⠽䗮䖛㘮䝊䫒ডᑨ᠔ⲥ⌟ˈডᑨЁᅗϢϔϾⱘᦦ ܹܟ䱚ᑧডᑨˈབ䝉↡ҎᎹᶧ㡆ԧ˄TACs˅ˈ㒚㦠ҎᎹᶧ㡆ԧ˄BACs˅㉬㉦ㄝDŽབᵰ ϸϾϾSTS㹿থ⦄ᰃᄬѢৠϔϾܟ䱚ПЁˈ䙷М䖭ѯᷛ䆄ԡ⚍㋻ᆚⳌ䚏ⱘᴎӮህᕜ催 ˄ϡᰃ100%ˈЎࠊ䖛Ёᄬϔѯ؛䈵ˈབߎ⦃ጠড়ܟ䱚ԧ˅DŽϔ↉ᯊᳳҹᴹˈḍ STS䞣Ꮖ㒣ᓎゟ䍋ϔ㋏߫䞡㕸ˈབ᳝STSⱘ䞡㇛ܟ䱚DŽ䖭ḋϔᓴⱘߚ䕼⥛㽚Ⲫ ᑺ⬅ϔѯᄤއᅮˈབSTSⱘᆚᑺǃܟ䱚㕸ԧⱘᇣǃҹঞܟ䱚᭛ᑧⱘ⏅ᑺDŽ䗮ᐌSTS䞣 ҹ䭓1MbⱘᦦܹYACᑧЎ⸔ˈߚ䕼⥛ЎⱒϾbpDŽབᵰՓ⫼ᦦܹ䚼ߚ䕗ᇣⱘܟ䱚䕑ԧˈ䈅 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ1/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,2/1 就会有一个更高的理论分辨率,但是覆盖基因组同样大小面积就需要更多的STS。虽然一般有 可能从STS含量图上得到标记物的相对顺序,但是相邻标记物之间的距离还是无法精确测得。 尽管如此,STS含量图还是有与克隆原相关的优点,并且可将其用于更进一步的硏究,如次级 克隆或DNA测序。到目前为止,STS含量图制图简单而使用最多的来源是巴黎的CEPH( centre d' etudes du pol ymorphi sme Humai n)中的YAC库。它是一个10×覆盖率的文库,平均插入 长度为-Mb。 放射性杂交图(图12.2;Cox,1992)对片段DNA的断点作图。在此技术中,一个人体细胞系 被致死性的gama射线照射,染色体DNA分成片段。然后该细胞系与一个仓鼠细胞系融合而被 救,并能繁殖几代。在这期间,人类细胞和仓鼠细胞的杂合体随机丢失其人类染色体片段。 这样一百个或更多的杂合细胞系克隆体中,每一个都有不同数量的染色体片段,筛选生长 后,就可以形成一套杂合组,供接下来的制图实验用了。 如果要在一个放射性杂交组中对一个STS作图,那就要将每种杂交组细胞系中的DNA进行STS的 PCR操作。细胞系中如果含有该STS的染色体片段,那么就能得到一个正的PCR信号。在基因组 中相邻很近的STS有相似的固位模式( retenti on pattern),因为放射性引起的断点落在它 们中间的几率很小。相邻较远的STS固位模式相似性降低,相邻很远的STS的固位模式将会截 然不同。与基因图谱所用方法类似,算法类的软件也能推出STS在放射性杂交图上的相对顺 序,并通过断点落在其中间的可能性,用某一距离系统计算相邻标记物之间的距离。放射性 杂交图还能提供一个标记物位于某一个特殊位点的可能值(优势对数值)。一个放射性杂交 图的分辨率依赖于杂交体片断的大小,而这又依赖于人体细胞系所受的辐射量。一般对基因 组大小作图的细胞系分辨率为~1M。 除STS含量图和放射性杂交图外还有几个方法可用于制作人类物理图谱。克隆图谱使用与STS 含量图不同的技术来决定克隆体的接近程度。例如, CEPH YAC图谱法( Chumakoy et a 1995)综合利用指纹法( fingerprinti ng)、间一Au产物杂交法( inter-Au product hybri di zati on)和STS含量图法来制作一张重叠的YAC克隆体图谱。缺失和体细胞杂交图依赖 于大型基因组重组(可以人工引进或由实验本身引起),从而将标记物放在由染色体断点所 限定的bin?中( Vol l rath et al.,1992)。FSH图谱( Li cher et a.,1990)使用一个荧 光信号来探测克隆体的间期DNA扩散时的杂交情况,从而以细胞遗传学图中一条带的位置定出 克隆体的位置 研究者捕捉致病基因时对转录序列图谱有特别的兴趣。这些序列是由已表达序列,和那些从 已转化成STS并置于传统物理图谱的已知基因衍生而来的。近来一些制作大量EST( Adams et al.1991: Houl gatte et al.1995; Hillier et al.,1996)的工程已经使制图实验室能 够得到数以万计的单一表达序列。一旦一个致病位点被鉴定出来后,这些转录序列图谱就能 明显加快对目标基因的研究速度。 YAC库可用于STS的排序,但其克隆体中的高嵌合率和高删除率使它们不能用于DNA测序。去年 高分辨率、可用于测序的质粒和BAC图谱则发展很快。因为它们所需的克隆工艺水平很低。除 了几个特例,如染色体19的 Lawrence li vemore实验室质粒图外,其它图谱都还只处在初级阶 段 大型公用数据库中的基因组范围图谱 人类基因组物理图谱信息的主要来源是由NCB|( Nati onal Center for Bi technol ogy I nformati on国家生物技术信息中心)和GDB( Genome Data Base基因组数据基地,见注释) 提供的大型公用数据库。这些数据库提供各种图谱的来源,使研究者能够用一个多用户界面 交互系统在图谱中进行比较。在一定程度下,这些数据库还能进行图谱的综合及分析。NCB Entrez和GDB将在本节介绍。由个体中心维持的数据库可提供更为详尽的信息,并将在下一节 “从个体来源的基因组范围的图谱”中介绍 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
ህӮ᳝ϔϾ催ⱘ⧚䆎ߚ䕼⥛ˈԚᰃ㽚Ⲫ㒘ৠḋᇣ䴶⿃ህ䳔㽕ⱘSTSDŽ㱑✊ϔ㠀᳝ ৃ㛑ҢSTS䞣Ϟᕫࠄᷛ䆄⠽ⱘⳌᇍ乎ᑣˈԚᰃⳌ䚏ᷛ䆄⠽П䯈ⱘ䎱⾏䖬ᰃ᮴⊩㊒⹂⌟ᕫDŽ ሑㅵབℸˈSTS䞣䖬ᰃ᳝Ϣܟ䱚ॳⳌ݇ⱘӬ⚍ˈᑊϨৃᇚ݊⫼Ѣ䖯ϔℹⱘⷨおˈབ㑻 ܟ䱚DNA⌟ᑣDŽࠄⳂࠡЎℶˈSTS䞣ࠊㅔऩ㗠Փ⫼᳔ⱘᴹ⑤ᰃᏈ咢ⱘCEPH˄centre d’Etudes du Polymorphisme Humain˅ЁⱘYACᑧDŽᅗᰃϔϾ10×㽚Ⲫ⥛ⱘ᭛ᑧˈᑇഛᦦܹ 䭓ᑺЎ~1MbDŽ ᬒᇘᗻᴖѸ˄12.2˗Coxˈ1992˅ᇍ⠛↉DNAⱘᮁ⚍DŽℸᡔᴃЁˈϔϾҎԧ㒚㚲㋏ 㹿㟈⅏ᗻⱘgammaᇘ㒓✻ᇘˈᶧ㡆ԧDNAߚ៤⠛↉DŽ✊ৢ䆹㒚㚲㋏ϢϔϾҧ哴㒚㚲㋏㵡ড়㗠㹿 ᬥˈᑊ㛑㐕ⅪҷDŽ䖭ᳳ䯈ˈҎ㉏㒚㚲ҧ哴㒚㚲ⱘᴖড়ԧ䱣ᴎ϶༅݊Ҏ㉏ᶧ㡆ԧ⠛↉DŽ 䖭ḋϔⱒϾⱘᴖড়㒚㚲㋏ܟ䱚ԧЁˈ↣ϔϾ䛑᳝ϡৠ᭄䞣ⱘᶧ㡆ԧ⠛↉ˈㄯ䗝⫳䭓 ৢˈህৃҹᔶ៤ϔ༫ᴖড়㒘ˈկϟᴹⱘࠊᅲ偠⫼њDŽ བᵰ㽕ϔϾᬒᇘᗻᴖѸ㒘ЁᇍϔϾSTSˈ䙷ህ㽕ᇚ↣⾡ᴖѸ㒘㒚㚲㋏ЁⱘDNA䖯㸠STSⱘ PCR᪡DŽ㒚㚲㋏Ёབᵰ᳝䆹STSⱘᶧ㡆ԧ⠛↉ˈ䙷Мህ㛑ᕫࠄϔϾℷⱘPCRֵোDŽ㒘 ЁⳌ䚏ᕜ䖥ⱘSTS᳝ⳌԐⱘԡᓣ˄retention pattern˅ˈЎᬒᇘᗻᓩ䍋ⱘᮁ⚍㨑ᅗ ӀЁ䯈ⱘ⥛ᕜᇣDŽⳌ䚏䕗䖰ⱘSTSԡᓣⳌԐᗻ䰡ԢˈⳌ䚏ᕜ䖰ⱘSTSⱘԡᓣᇚӮ ✊ϡৠDŽϢ䈅᠔⫼ᮍ⊩㉏Ԑˈㅫ⊩㉏ⱘ䕃ӊг㛑ߎSTSᬒᇘᗻᴖѸϞⱘⳌᇍ乎 ᑣˈᑊ䗮䖛ᮁ⚍㨑݊Ё䯈ⱘৃ㛑ᗻˈ⫼ᶤϔ䎱⾏㋏㒳䅵ㅫⳌ䚏ᷛ䆄⠽П䯈ⱘ䎱⾏DŽᬒᇘᗻ ᴖѸ䖬㛑ᦤկϔϾᷛ䆄⠽ԡѢᶤϔϾ⡍⅞ԡ⚍ⱘৃ㛑ؐ˄Ӭᇍ᭄ؐ˅DŽϔϾᬒᇘᗻᴖѸ ⱘߚ䕼⥛ձ䌪ѢᴖѸԧ⠛ᮁⱘᇣˈ㗠䖭জձ䌪ѢҎԧ㒚㚲㋏᠔ফⱘ䕤ᇘ䞣DŽϔ㠀ᇍ 㒘ᇣⱘ㒚㚲㋏ߚ䕼⥛Ў̚1MDŽ 䰸STS䞣ᬒᇘᗻᴖѸ䖬᳝Ͼᮍ⊩ৃ⫼ѢࠊҎ㉏⠽⧚䈅DŽܟ䱚䈅Փ⫼ϢSTS 䞣ϡৠⱘᡔᴃᴹއᅮܟ䱚ԧⱘ䖥ᑺDŽ՟བˈCEPH YAC䈅⊩˄Chumakov et al., 1995˅㓐ড়߽⫼ᣛ㒍⊩˄fingerprinting˅ǃ䯈ˉAluѻ⠽ᴖѸ⊩˄inter-Alu product hybridization˅STS䞣⊩ᴹࠊϔᓴ䞡ⱘYACܟ䱚ԧ䈅DŽ㔎༅ԧ㒚㚲ᴖѸձ䌪 Ѣൟ㒘䞡㒘˄ৃҹҎᎹᓩ䖯⬅ᅲ偠ᴀ䑿ᓩ䍋˅ˈҢ㗠ᇚᷛ䆄⠽ᬒ⬅ᶧ㡆ԧᮁ⚍᠔ 䰤ᅮⱘbin?Ё˄Vollrath et al., 1992˅DŽFISH䈅˄Licher et al., 1990˅Փ⫼ϔϾ㤻 ܝֵোᴹ⌟ܟ䱚ԧⱘ䯈ᳳDNAᠽᬷᯊⱘᴖѸᚙމˈҢ㗠ҹ㒚㚲䘫ӴᄺЁϔᴵᏺⱘԡ㕂ᅮߎ ܟ䱚ԧⱘԡ㕂DŽ ⷨお㗙ᤩᤝ㟈⮙ᯊᇍ䕀ᔩᑣ߫䈅᳝⡍߿ⱘ݈䍷DŽ䖭ѯᑣ߫ᰃ⬅Ꮖ㸼䖒ᑣ߫ˈ䙷ѯҢ Ꮖ䕀࣪៤STSᑊ㕂ѢӴ㒳⠽⧚䈅ⱘᏆⶹ㸡⫳㗠ᴹⱘDŽ䖥ᴹϔѯࠊ䞣EST˄Adams et al., 1991; Houlgatte et al., 1995; Hillier et al., 1996˅ⱘᎹᏆ㒣Փࠊᅲ偠ᅸ㛑 ᕫࠄ᭄ҹϛ䅵ⱘऩϔ㸼䖒ᑣ߫DŽϔᮺϔϾ㟈⮙ԡ⚍㹿䡈ᅮߎᴹৢˈ䖭ѯ䕀ᔩᑣ߫䈅ህ㛑 ᯢᰒࡴᖿᇍⳂᷛⱘⷨお䗳ᑺDŽ YACᑧৃ⫼ѢSTSⱘᥦᑣˈԚ݊ܟ䱚ԧЁⱘ催ጠড়⥛催ߴ䰸⥛ՓᅗӀϡ㛑⫼ѢDNA⌟ᑣDŽএᑈ 催ߚ䕼⥛ǃৃ⫼Ѣ⌟ᑣⱘ䋼㉦BAC䈅߭থሩᕜᖿDŽЎᅗӀ᠔䳔ⱘܟ䱚Ꮉ㡎∈ᑇᕜԢDŽ䰸 њϾ⡍՟ˈབᶧ㡆ԧ19ⱘLawrence Livemoreᅲ偠ᅸ䋼㉦ˈ݊ᅗ䈅䛑䖬া໘߱㑻䰊 ↉DŽ ൟ݀⫼᭄ᑧЁⱘ㒘㣗ೈ䈅 Ҏ㉏㒘⠽⧚䈅ֵᙃⱘЏ㽕ᴹ⑤ᰃ⬅NCBI˄National Center for Biotechnology Informationᆊ⫳⠽ᡔᴃֵᙃЁᖗ˅GDB˄Genome Data Base㒘᭄ഄˈ㾕⊼䞞˅ ᦤկⱘൟ݀⫼᭄ᑧDŽ䖭ѯ᭄ᑧᦤկ⾡䈅ⱘᴹ⑤ˈՓⷨお㗙㛑⫼ϔϾ⫼᠋⬠䴶 ѸѦ㋏㒳䈅Ё䖯㸠↨䕗DŽϔᅮᑺϟˈ䖭ѯ᭄ᑧ䖬㛑䖯㸠䈅ⱘ㓐ড়ঞߚᵤDŽNCBI EntrezGDBᇚᴀ㡖ҟ㒡DŽ⬅ϾԧЁᖗ㓈ᣕⱘ᭄ᑧৃᦤկЎ䆺ሑⱘֵᙃˈᑊᇚϟϔ㡖 ĀҢϾԧᴹ⑤ⱘ㒘㣗ೈⱘ䈅āЁҟ㒡DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ2/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
二章鼠类和人类公用物理图谱数据库的使用 页码,3/1 B| Entrez中染色体图谱的使用 Entrez的基因组部分是最容易获得物理图谱信息的来源之一。此服务由NCBl所提供。 Entrez 试图以一种可理解的方式将几种遗传学图谱和物理图谱、DNA和蛋白序列信息、以及一个目录 型引用数据库和三维晶体结构信息融合起来。因为它的内部连接多,而且界面简单, Entrez 可作为搜索图谱的一个起始点。 Entrez信息补救系统在第5章详细介绍 任何支持网络浏览器,如 Netscape、 Mosai c或 Mi crosoft Internet Expl orer的计算机系统都 可以使用 Entrez。与 Internet的连接应支持TCP/P,通过一个 Internet服务提供器就会形成 个有用的网络连接或是一个拨号连接。因为图谱信息中图形很多,所以应能连接28800p或 更多信息。 首先,将浏览器连到 Entrez的主页所在的URL( UNI FORM RESOURCE L0CAT0R统一资源定位 器),这样就会下载一页,包含一系列与 Entrez中核酸、蛋白质、目录、基因组和三维结构 数据库的链接,以及一些文档和帮助。选择标有“搜索基因组数据库”的链接,这样就会弹 出来一个窗口,提供搜索的范围(如图12.3)和在其它范围中一系列生物种类的名称。每 个生物体名称旁边都有一个数字,说明在数据库中其图谱的数目。得到人类图谱列表最简单 的办法就是点击标有“ Homo Sapi ens"的链接,这样就会得到一个含25个染色体图的列表 (染色体Ⅰ至Ⅹ再加上线粒体染色体组的两个词条,Y型图谱现仍没有)。 现在再在感兴趣的染色体下选择标有“图示”( Graphi cal View)的链接。这就会得到与图 12.4中所示相似的一个图谱。它是由几个图组成的一张复合图。这类图对于各个染色体来说 并不同,但至少它们都含有 Gene thon和CHLc( Cooperati ve Human Li nkage Center合作性人 类链接中心)基因图谱( Murray et al.,1994: Dib et al.,1996)、 Whi tehead I nsti tute 放射性杂交图谱和STS含量图( Hudson et al.1995)、斯坦福大学放射性杂交图谱、细胞遗 传学图、和一个序列图。序列图基本上是一个定位器,即将已制成图的片段定位。对于这些 片段,序列分析中心希望能在十年内将其制造出来。存在于多个图谱中的标记物用绿线连接 了起来,好让读者能够互相比较并在从一个图谱转向另一个时保持正确的方位。出于比较和 图示的目的,每一个图谱均由一个公用坐标系统校正,该系统以物理距离(DNA碱基对)的值 为基础。稍一检査就会发现它们只是笼统地排成一条线,如在标记物的顺序上就有很多矛 盾,在图上表现为绿线有交叉点。 这些图可以用鼠标浏览,一对标有" Action”和“Zoom”的选项按钮( radi o button)能控 制图的大小。要想对图的一部分作更详细的观察,可选择Zoom按钮,并点中需放大的区域 如果选Zoom后直接点击图上的区域,一般默认为放大10%。另外也可以用图形上方的pop-u (复选框)菜单来改变放大率的值。在高放大率下,诸如单个标记物的名称、图示基因、YAC 序列群和图示克隆等特征都可以很容易地分辨。进而也可以选择“左、右、校正”(Left Ri ght、Aign)等按钮来调整图象至合适的尺寸(左右按钮在点击Zoom一次后将会出现), Overvi ew(全览)命令将显示图象返回其初始大小。 为得到一个具体标记的图中元素的信息,可选择标有″ Action"的选项按钮,然后再点击该 元素。注意该按钮非要使用一次Zoom才会出现,例如,单击一个STS的名称将会显示其在 Genebank中的词条,而此词条又包含着与其它部分,如 Entrez词条、核酸、蛋白质和三维结 构数据库等的链接 Entrez网同时也提供了一条简单的在图上定位一个特定标记物的途径。在标有 Search ene(基因査询)的两个小框中选一个,输入标记物的名称或 Gen Bank中的通道号,然后按旁 边的按钮。这样就会产生另外一张图,其中标记物以黄色着重标记。如果输入两个名称,则 它们之间的区域将会着重显示。在此功能中,除了名称,物理图谱上很少有元素对应着实际 的基因,大多数标记物都只是重名的序列或是基因多样性中简单的序列重复(在STS中有很多 例子)。 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
NCBI EntrezЁᶧ㡆ԧ䈅ⱘՓ⫼ Entrezⱘ㒘䚼ߚᰃ᳔ᆍᯧ㦋ᕫ⠽⧚䈅ֵᙃⱘᴹ⑤ПϔDŽℸ᳡ࡵ⬅NCBI᠔ᦤկDŽEntrez 䆩ҹϔ⾡ৃ⧚㾷ⱘᮍᓣᇚ辵䘫Ӵᄺ䈅⠽⧚䈅ǃDNA㲟ⱑᑣֵ߫ᙃǃҹঞϔϾⳂᔩ ൟᓩ⫼᭄ᑧϝ㓈ԧ㒧ᵘֵᙃ㵡ড়䍋ᴹDŽЎᅗⱘݙ䚼䖲ˈ㗠Ϩ⬠䴶ㅔऩˈEntrez ৃЎ᧰㋶䈅ⱘϔϾ䍋ྟ⚍DŽEntrezֵᙃ㸹ᬥ㋏㒳ゴ䆺㒚ҟ㒡DŽ ӏԩᬃᣕ㔥㒰⌣㾜఼ˈབNetscapeǃMosaicMicrosoft Internet Explorerⱘ䅵ㅫᴎ㋏㒳䛑 ৃҹՓ⫼EntrezDŽϢInternetⱘ䖲ᑨᬃᣕTCP/IPˈ䗮䖛ϔϾInternet᳡ࡵᦤկ఼ህӮᔶ៤ ϔϾ᳝⫼ⱘ㔥㒰䖲ᰃϔϾᢼো䖲DŽЎ䈅ֵᙃЁᔶᕜˈ᠔ҹᑨ㛑䖲28800bp ֵᙃDŽ 佪ܜˈᇚ⌣㾜఼䖲ࠄEntrezⱘЏ义᠔ⱘURL˄UNIFORM RESOURCE LOCATOR㒳ϔ䌘⑤ᅮԡ ఼˅ˈ䖭ḋህӮϟ䕑ϔ义ˈࣙϔ㋏߫ϢEntrezЁḌ䝌ǃ㲟ⱑ䋼ǃⳂᔩǃ㒘ϝ㓈㒧ᵘ ᭄ᑧⱘ䫒ˈҹঞϔѯ᭛ḷᐂࡽDŽ䗝ᢽ᳝ᷛĀ᧰㋶㒘᭄ᑧāⱘ䫒ˈ䖭ḋህӮᔍ ߎᴹϔϾにষˈᦤկ᧰㋶ⱘ㣗ೈ˄བ12.3˅݊ᅗ㣗ೈЁϔ㋏߫⫳⠽⾡㉏ⱘৡ⿄DŽ↣ϔ Ͼ⫳⠽ԧৡ⿄ᮕ䖍䛑᳝ϔϾ᭄ᄫˈ䇈ᯢ᭄ᑧЁ݊䈅ⱘ᭄ⳂDŽᕫࠄҎ㉏䈅߫㸼᳔ㅔऩ ⱘࡲ⫣ህᰃ⚍ߏ”᳝ᷛHomo Sapiens”ⱘ䫒ˈ䖭ḋህӮᕫࠄϔϾ25Ͼᶧ㡆ԧⱘ߫㸼 ˄ᶧ㡆ԧĉ㟇ĒࡴݡϞ㒓㉦ԧᶧ㡆ԧ㒘ⱘϸϾ䆡ᴵˈ<ൟ䈅⦄ҡ≵᳝˅DŽ ⦄ݡ݈ᛳ䍷ⱘᶧ㡆ԧϟ䗝ᢽ᳝ᷛĀ⼎ā˄Graphical View˅ⱘ䫒DŽ䖭ህӮᕫࠄϢ 12.4Ё᠔⼎ⳌԐⱘϔϾ䈅DŽᅗᰃ⬅Ͼ㒘៤ⱘϔᓴড়DŽ䖭㉏ᇍѢϾᶧ㡆ԧᴹ䇈 ᑊϡৠˈԚ㟇ᇥᅗӀ䛑᳝GenethonCHLC˄Cooperative Human Linkage Center ড়ᗻҎ ㉏䫒Ёᖗ˅䈅˄Murray et al.,1994; Dib et al.,1996˅ǃWhitehead Institute ᬒᇘᗻᴖѸ䈅STS䞣˄Hudson et al.,1995˅ǃᮃഺ⽣ᄺᬒᇘᗻᴖѸ䈅ǃ㒚㚲䘫 ӴᄺǃϔϾᑣ߫DŽᑣ߫ᴀϞᰃϔϾᅮԡ఼ˈेᇚᏆࠊ៤ⱘ⠛↉ᅮԡDŽᇍѢ䖭ѯ ⠛↉ˈᑣ߫ߚᵤЁᖗᏠᳯ㛑कᑈݙᇚ݊ࠊ䗴ߎᴹDŽᄬѢϾ䈅Ёⱘᷛ䆄⠽⫼㓓㒓䖲 њ䍋ᴹˈད䅽䇏㗙㛑ѦⳌ↨䕗ᑊҢϔϾ䈅䕀ϔϾᯊֱᣕℷ⹂ⱘᮍԡDŽߎѢ↨䕗 ⼎ⱘⳂⱘˈ↣ϔϾ䈅ഛ⬅ϔϾ݀⫼തᷛ㋏㒳᷵ℷˈ䆹㋏㒳ҹ⠽⧚䎱⾏˄DNA⺅ᇍ˅ⱘؐ Ў⸔DŽϔẔᶹህӮথ⦄ᅗӀাᰃㄐ㒳ഄᥦ៤ϔᴵ㒓ˈབᷛ䆄⠽ⱘ乎ᑣϞህ᳝ᕜ ⳒˈϞ㸼⦄Ў㓓㒓᳝Ѹঝ⚍DŽ 䖭ѯৃҹ⫼哴ᷛ⌣㾜ˈϔᇍ᳝ᷛ“Action”“Zoom”ⱘ䗝乍ᣝ䪂˄radio button˅㛑 ࠊⱘᇣDŽ㽕ᛇᇍⱘϔ䚼ߚ䆺㒚ⱘ㾖ᆳˈৃ䗝ᢽZoomᣝ䪂ˈᑊ⚍Ё䳔ᬒⱘऎඳDŽ བᵰ䗝ZoomৢⳈ⚍ߏϞⱘऎඳˈϔ㠀咬䅸Ўᬒ10%DŽгৃҹ⫼ᔶϞᮍⱘpop-up ˄䗝Ḛ˅㦰ऩᴹᬍবᬒ⥛ⱘؐDŽ催ᬒ⥛ϟˈ䇌བऩϾᷛ䆄⠽ⱘৡ⿄ǃ⼎ǃYAC ᑣ߫㕸⼎ܟ䱚ㄝ⡍ᕕ䛑ৃҹᕜᆍᯧഄߚ䕼DŽ䖯㗠гৃҹ䗝ᢽĀᎺǃেǃ᷵ℷā˄Leftǃ RightǃAlign˅ㄝᣝ䪂ᴹ䇗ᭈ䈵㟇ড়䗖ⱘሎᇌ˄Ꮊেᣝ䪂⚍ߏZoomϔৢᇚӮߎˈ˅⦃ Overview˄ܼ㾜˅ੑҸᇚᰒ⼎䈵䖨ಲ݊߱ྟᇣDŽ ЎᕫࠄϔϾᷛԧ䆄ⱘЁܗ㋴ⱘֵᙃˈৃ䗝ᢽ᳝ᷛ“Action”ⱘ䗝乍ᣝ䪂ˈ✊ৢݡ⚍ߏ䆹 ܗ㋴DŽ⊼ᛣ䆹ᣝ䪂䴲㽕Փ⫼ϔZoomᠡӮߎˈ⦃՟བˈऩߏϔϾSTSⱘৡ⿄ᇚӮᰒ⼎݊ GenebankЁⱘ䆡ᴵˈ㗠ℸ䆡ᴵজࣙⴔϢ݊ᅗ䚼ߚˈབEntrez䆡ᴵǃḌ䝌ǃ㲟ⱑ䋼ϝ㓈㒧 ᵘ᭄ᑧㄝⱘ䫒DŽ Entrez㔥ৠᯊгᦤկњϔᴵㅔऩⱘϞᅮԡϔϾ⡍ᅮᷛ䆄⠽ⱘ䗨ᕘDŽ᳝ᷛSearch by gene˄ᶹ䆶˅ⱘϸϾᇣḚЁ䗝ϔϾˈ䕧ܹᷛ䆄⠽ⱘৡ⿄GenBankЁⱘ䗮䘧োˈ✊ৢᣝᮕ 䖍ⱘᣝ䪂DŽ䖭ḋህӮѻ⫳ϔᓴˈ݊Ёᷛ䆄⠽ҹ咘㡆ⴔ䞡ᷛ䆄DŽབᵰ䕧ܹϸϾৡ⿄ˈ߭ ᅗӀП䯈ⱘऎඳᇚӮⴔ䞡ᰒ⼎DŽℸࡳ㛑Ёˈ䰸њৡ⿄ˈ⠽⧚䈅Ϟᕜᇥ᳝ܗ㋴ᇍᑨⴔᅲ䰙 ⱘˈ᭄ᷛ䆄⠽䛑াᰃ䞡ৡⱘᑣ߫ᰃḋᗻЁㅔऩⱘᑣ߫䞡˄STSЁ᳝ᕜ ՟ᄤ˅DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ3/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,4/1 要想将一张 Entrez 图存在用户盘上,可单击鼠标右键(或 Machi toch上的 Shi ft-Cich 建),弹出窗口上方的 Cursor,然后会产生一个pop-up菜单,选择 Save I mage As(将图形存 为)并输入一个名称作为该图形文件的文件名。该图形以GF形式保存,可以在很多图形程序 中加以显示、打印和操作。这个过程在不同的网络浏览器中略有不同,有的要求在点击图片 前选择File(文件)菜单中标有 Save next li nk to di sk(将下一个链接存盘)一项。 除人类基因组, Entrez还提供关于鼠类、果蝇、C. elegans、酵母以及一些原生动物的图谱。 尽管可比较的(同线性)图仍不可获得,但它代表了现在最大和最完整的一套多生物体的图 谱信息 尽管以网络浏览 Entrez对一般的使用已经足够,此来源使用频率高的人还是想建立一个 Entrez网站,即NCB“站柜台”,以顾客一一服务员的形式使用软件。这种形式与网络版特 征一致,但从实质上可以更好地应用,而且界面美观。它适用于 Wi ndows、 Maci tosh和Unix 等系统,并可在 Entrez overvi ew(全览)页上下载 Entrez也有一定的限制。最严重的是由几种方法构建的图谱不得不使用同一坐标系统。这种 简化,满足了将所有表示同一区域的图形同时显示的需要,但有时也掩饰了其图谱信息模棱 两可和存在矛盾的特点,制造出并不存在的确定性的假象,特别是细胞遗传学图和物理图 片、基因图谱的整合关系并不紧密,必须小心使用。当然, Entrez也和一些实验室制作的网 页相连,它们提供图谱来源,这就使图谱能够保持实验室最常用的最新的形式。这些个体中 心的图谱将在后面作更详细的介绍。 在GDB中浏览染色体图 另一种常见的人类物理图谱数据的来源是GDB。尽管GDB是基于当时基因图谱的重要性才构建 起来的,但是最近几年来,GDB也已经进行了扩建重组,现在同样可以算是物理图谱数据的仓 库。不象NCBl,GDB只限于人类图谱数据。它不含序列数据,也没有其它种类生物的信息。 同NCBI一样,GDB可以由Ww上得到。GDB提供了一种全功能的对其数据库的查询式界面,这 点,尽管很有用,对新手来说可能还是会很头疼。限制性更强的査询界面,包括一种“按址 查图”的功能,能帮助你更直接进入GDB,特别是在1996年12月引入的GDB的视图一2程序 ( Mapi ew2 program),它利用新的Java微程序( applet)技术提供了一个与GDB中的基因 图谱和物理图谱相连的图形界面,并使网页能够合并“活性内容”( acti ve content) 1995)。一个能使用Java微程序的网络浏览器应服从以下规则:它们应含有 Mi crosoft Internet Explorer(3.0版本或更高)和№ escape Navi gator(2.0版本或更 高) 首先,要连上GDB,需连到GDB主页上的浏览器。从这个网址上,再找到并选择标有 Advanced Search(高级搜索)的链接,从而得到一个含有几种查询方式的页面 最简单的查询方式名为按址搜索( Search Maps by Location)。如图12.5,选择这一项后会 出现一个表。要使用这个表,得先选择要演示的染色体或亚染色体区域。如果要看整条染色 体,可从pop-up菜单中直接选择。而要看一个染色体区域的话,就要在输入栏From和To (从..到..)中输入两个细胞遗传学带或基因标记物的名称 搜索窗口下方的两个滚动式列表允许用户自己限制所搜索的图和标记物的种类。例如,可以 限制STSS(在GDB用语中为“扩增引物" ampl i mer)只用于放射性杂交图中的情况 让我们从标有 Submi t(提交)的按钮开始。在短时间等待后,将出现一个滚动列表,包括所 有符合要求的图谱。一般都会有基因型、细胞遗传型和物理型图谱 现在对感兴趣的图再按 Submi t。因为每个图都要花时间来获取和演示,所以除非使用速度很 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
㽕ᛇᇚϔᓴEntrez ᄬ⫼᠋ⲬϞˈৃऩߏ哴ᷛে䬂˄MachintochϞⱘShift-Click 䬂˅ˈᔍߎにষϞᮍⱘCursorˈ✊ৢӮѻ⫳ϔϾpop-up㦰ऩˈ䗝ᢽSave Image As˄ᇚᔶᄬ Ў˅ᑊ䕧ܹϔϾৡ⿄Ў䆹ᔶ᭛ӊⱘ᭛ӊৡDŽ䆹ᔶҹGIFᔶᓣֱᄬˈৃҹᕜᔶᑣ Ёࡴҹᰒ⼎ǃᠧॄ᪡DŽ䖭Ͼ䖛ϡৠⱘ㔥㒰⌣㾜఼Ё⬹᳝ϡৠˈ᳝ⱘ㽕∖⚍ߏ⠛ ࠡ䗝ᢽFile˄᭛ӊ˅㦰ऩЁ᳝ᷛSave next Link to Disk˄ᇚϟϔϾ䫒ᄬⲬ˅ϔ乍DŽ 䰸Ҏ㉏㒘ˈEntrez䖬ᦤկ݇Ѣ哴㉏ǃᵰ㴛ǃC.elegansǃ䝉↡ҹঞϔѯॳ⫳ࡼ⠽ⱘ䈅DŽ ሑㅵৃ↨䕗ⱘ˄ৠ㒓ᗻ˅ҡϡৃ㦋ᕫˈԚᅗҷ㸼њ⦄᳔᳔ᅠᭈⱘϔ༫⫳⠽ԧⱘ 䈅ֵᙃDŽ ሑㅵҹ㔥㒰⌣㾜Entrezᇍϔ㠀ⱘՓ⫼Ꮖ㒣䎇ˈℸᴹ⑤Փ⫼乥⥛催ⱘҎ䖬ᰃᛇᓎゟϔϾ Entrez㔥キˈेNCBI“キᶰৄāˈҹ乒ᅶˉˉ᳡ࡵਬⱘᔶᓣՓ⫼䕃ӊDŽ䖭⾡ᔶᓣϢ㔥㒰⠜⡍ ᕕϔ㟈ˈԚҢᅲ䋼Ϟৃҹདഄᑨ⫼ˈ㗠Ϩ⬠䴶㕢㾖DŽᅗ䗖⫼ѢWindowsǃMacintoshUnix ㄝ㋏㒳ˈᑊৃEntrez Overview˄ܼ㾜˅义Ϟϟ䕑DŽ Entrezг᳝ϔᅮⱘ䰤ࠊDŽ᳔Ϲ䞡ⱘᰃ⬅辵ᮍ⊩ᵘᓎⱘ䈅ϡᕫϡՓ⫼ৠϔതᷛ㋏㒳DŽ䖭⾡ ㅔ࣪ˈ⒵䎇њᇚ᠔᳝㸼⼎ৠϔऎඳⱘᔶৠᯊᰒ⼎ⱘ䳔㽕ˈԚ᳝ᯊг佄њ݊䈅ֵᙃễ ϸৃᄬⳒⱘ⡍⚍ˈࠊ䗴ߎᑊϡᄬⱘ⹂ᅮᗻⱘ؛䈵ˈ⡍߿ᰃ㒚㚲䘫Ӵᄺ⠽⧚ ⠛ǃ䈅ⱘᭈড়݇㋏ᑊϡ㋻ᆚˈᖙ乏ᇣᖗՓ⫼DŽᔧ✊ˈEntrezгϔѯᅲ偠ᅸࠊⱘ㔥 义Ⳍ䖲ˈᅗӀᦤկ䈅ᴹ⑤ˈ䖭ህՓ䈅㛑ֱᣕᅲ偠ᅸ᳔ᐌ⫼ⱘ᳔ᮄⱘᔶᓣDŽ䖭ѯϾԧЁ ᖗⱘ䈅ᇚৢ䴶䆺㒚ⱘҟ㒡DŽ GDBЁ⌣㾜ᶧ㡆ԧ ϔ⾡ᐌ㾕ⱘҎ㉏⠽⧚䈅᭄ⱘᴹ⑤ᰃGDBDŽሑㅵGDBᰃѢᔧᯊ䈅ⱘ䞡㽕ᗻᠡᵘᓎ 䍋ᴹⱘˈԚᰃ᳔䖥ᑈᴹˈGDBгᏆ㒣䖯㸠њᠽᓎ䞡㒘ˈ⦄ৠḋৃҹㅫᰃ⠽⧚䈅᭄ⱘҧ ᑧDŽϡ䈵NCBIˈGDBা䰤ѢҎ㉏䈅᭄DŽᅗϡᑣ᭄߫ˈг≵᳝݊ᅗ⾡㉏⫳⠽ⱘֵᙃDŽ ৠNCBIϔḋˈGDBৃҹ⬅WWWϞᕫࠄDŽGDBᦤկњϔ⾡ܼࡳ㛑ⱘᇍ᭄݊ᑧⱘᶹ䆶ᓣ⬠䴶ˈ䖭ϔ ⚍ˈሑㅵᕜ᳝⫼ˈᇍᮄᴹ䇈ৃ㛑䖬ᰃӮᕜ༈⮐DŽ䰤ࠊᗻᔎⱘᶹ䆶⬠䴶ˈࣙᣀϔ⾡Āᣝഔ ᶹāⱘࡳ㛑ˈ㛑ᐂࡽԴⳈ䖯ܹGDBˈ⡍߿ᰃ1996ᑈ12᳜ᓩܹⱘGDBⱘ㾚ˉᑣ ˄Mapview 2 program˅ˈᅗ߽⫼ᮄⱘJavaᖂᑣ˄applet˅ᡔᴃᦤկњϔϾϢGDBЁⱘ 䈅⠽⧚䈅Ⳍ䖲ⱘᔶ⬠䴶ˈᑊՓ㔥义㛑ড়ᑊĀ⌏ᗻݙᆍā˄active content˅ ˄Anuff, 1995˅DŽϔϾ㛑Փ⫼Javaᖂᑣⱘ㔥㒰⌣㾜఼ᑨ᳡Ңҹϟ㾘߭˖ᅗӀᑨ᳝ Microsoft Internet Explorer˄3.0⠜ᴀ催˅Netscape Navigator˄2.0⠜ᴀ 催˅DŽ 佪ܜˈ㽕䖲ϞGDBˈ䳔䖲ࠄGDBЏ义Ϟⱘ⌣㾜఼DŽҢ䖭Ͼ㔥ഔϞˈݡᡒࠄᑊ䗝ᢽ᳝ᷛAdvanced Search˄催㑻᧰㋶˅ⱘ䫒ˈҢ㗠ᕫࠄϔϾ᳝辵ᶹ䆶ᮍᓣⱘ义䴶DŽ ᳔ㅔऩⱘᶹ䆶ᮍᓣৡЎᣝഔ᧰㋶˄Search Maps by Location˅DŽབ12.5ˈ䗝ᢽ䖭ϔ乍ৢӮ ߎ⦃ϔϾ㸼DŽ㽕Փ⫼䖭Ͼ㸼ˈᕫܜ䗝ᢽ㽕ⓨ⼎ⱘᶧ㡆ԧѮᶧ㡆ԧऎඳDŽབᵰ㽕ⳟᭈᴵᶧ㡆 ԧˈৃҢpop-up㦰ऩЁⳈ䗝ᢽDŽ㗠㽕ⳟϔϾᶧ㡆ԧऎඳⱘ䆱ˈህ㽕䕧ܹᷣFromTo ˄Ң...ࠄ˅...Ё䕧ܹϸϾ㒚㚲䘫Ӵᄺᏺᷛ䆄⠽ⱘৡ⿄DŽ ᧰㋶にষϟᮍⱘϸϾ⒮ࡼᓣ߫㸼ܕ䆌⫼᠋㞾Ꮕ䰤ࠊ᠔᧰㋶ⱘᷛ䆄⠽ⱘ⾡㉏DŽ՟བˈৃҹ 䰤ࠊSTSs˄GDB⫼䇁ЁЎĀᠽᓩ⠽”amplimer˅া⫼ѢᬒᇘᗻᴖѸЁⱘᚙމDŽ 䅽៥ӀҢ᳝ᷛSubmit˄ᦤѸ˅ⱘᣝ䪂ᓔྟDŽⷁᯊ䯈ㄝᕙৢˈᇚߎ⦃ϔϾ⒮ࡼ߫㸼ˈࣙᣀ᠔ ᳝ヺড়㽕∖ⱘ䈅DŽϔ㠀䛑Ӯ᳝ൟǃ㒚㚲䘫Ӵൟ⠽⧚ൟ䈅DŽ ⦄ᇍᛳ݈䍷ⱘݡᣝSubmitDŽЎ↣Ͼ䛑㽕㢅ᯊ䯈ᴹ㦋পⓨ⼎ˈ᠔ҹ䰸䴲Փ⫼䗳ᑺᕜ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ4/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,5/1 快的网络连接,最好将同时浏览的图谱的数目限制在3个以内 图谱被整理后,将会打开一个新的窗口,以肩并肩的方式演示被选中的图(如图12.6),两 个或多个图中均用到的标记物用线相连,应注意有时也存在矛盾现象。 要得到演示图谱中一个标记物的其它信息,可双击它的名称。浏览器窗口将会返回前一页并 演示所选标记物在GDB中的词条。这个词条将会包括与GDB中其它信息的超链接( hyperl i nk) (如目录词条)和一些其它的生物数据库 要得到制图方法的信息或关于一张特定图的其它信息,双击其垂直的主干,得到一张网页 描述图谱并给出详尽的信息。(警告:不要关掉 Mapi ew,后的浏览器窗口,由于Java安全性的 一个特点,微程序只有当浏览器窗口开着时才能演示关于所选标记物的信息)。 Mapi ew(图片演示)中的演示可通过选择iew(演示)菜单中的 Marker Names(标记物名 称)或 Di spl ay Options(演示选项)来调整。这些选项可以让用户开或者关某些图的演 改变图谱的相对摆放顺序、并熟练选择标记物的名称。标记物被演示时默认为使用其基因座D 片断名。但有时候如果使用最初实验室里的命名,信息量将会更大,因为这会对标记物的 本质提供一些线索(例如,它是微卫星重复片断,还是一段表达序列) 要在图上搜索一个特定的标记物,应从Edit(编辑)菜单中选择Find(寻找)一项。输入 个或多个标记物的名称再按0K按钮。标记物的任何别名都能使用,也可用一个单*号,被选中 的标记物高亮度显示并滚动到视野内 来自个体来源的基因组范围图谱 尽管一级数据库,如Eηtrez和GDB是已发表的图谱的重要来源,但是它们还没有能替代原始数 据的东西。有能力制作自己的物理图谱的实验室一般都有自己的网址,连向它们的图谱数据 库。通过从这一渠道直接获取资料,我们可以看到制图实验室所使用的图的形式、下载原始 数据、并且了解实验室制图时的协议。另外,一些图在出现于Eηtrez和GDB前经常被丢掉。 Entrez和GDB数据库选择的表达方式,对那些希望将新的标记物定位于已知物理图谱上的研究 者来说,只提供了最小的帮助 基因组的基因图谱 尽管本章讨论的是物理图谱的来源,但若不涉及基因图谱,这些讨论就不能算全面,因为后 者是制作许多物理图谱时工作的基本骨架,也是许多制图项目的起点。有两种基因组范围的 基因图谱可供选择。 Genethon图( Dib et a.,19%6)含5264个多样性微卫星重复片断,间 隔1.6cM。完整的数据库文件,以及图谱的 PostScri pt方式图形表示,在 Gene thon的FTP站点 上均可获得,这些图通过GDB也可以获得 第二大基因图谱由 Cooperati ve Human Li nkage Center(公用人类链接中心)( Murray et a|.,1994)制造,CHLC图由10775个标记物组成,大多数为微卫星重复片断,间隔3.7cM。 人类基因组的转录物图 在1996年10月, Horno sapiens的一个全基因组转录物图由一个国际合作的研究实验室发表于 Science上( Schuler et a.,1996)。这个图由~15000个不同的表达序列组成,由放射性 杂交法定位,与 Genethon基因图谱衍生的框架相近。通过对酵母人工染色体作STS含量法又增 添了1000个表达序列。在这张图中,大约1/5的标记物有已知的或是假定的功能,而余下的代 表了未知功能的表达序列。制成图的序列一般由 Uni geneset衍生而来,它是一个由NCB管理 的公用重复ESTs数据库。 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
ᖿⱘ㔥㒰䖲ˈ᳔དᇚৠᯊ⌣㾜ⱘ䈅ⱘ᭄Ⳃ䰤ࠊϾҹݙDŽ 䈅㹿ᭈ⧚ৢˈᇚӮᠧᓔϔϾᮄⱘにষˈҹ㙽ᑊ㙽ⱘᮍᓣⓨ⼎㹿䗝Ёⱘ˄བ12.6˅ˈϸ ϾϾЁഛ⫼ࠄⱘᷛ䆄⠽⫼㒓Ⳍ䖲ˈᑨ⊼ᛣ᳝ᯊгᄬⳒ⦄䈵DŽ 㽕ᕫࠄⓨ⼎䈅ЁϔϾᷛ䆄⠽ⱘ݊ᅗֵᙃˈৃঠߏᅗⱘৡ⿄DŽ⌣㾜఼にষᇚӮ䖨ಲࠡϔ义ᑊ ⓨ⼎᠔䗝ᷛ䆄⠽GDBЁⱘ䆡ᴵDŽ䖭Ͼ䆡ᴵᇚӮࣙᣀϢGDBЁ݊ᅗֵᙃⱘ䍙䫒˄hyperlink˅ ˄བⳂᔩ䆡ᴵ˅ϔѯ݊ᅗⱘ⫳⠽᭄ᑧDŽ 㽕ᕫࠊࠄᮍ⊩ⱘֵᙃ݇Ѣϔᓴ⡍ᅮⱘ݊ᅗֵᙃˈঠߏൖ݊ⳈⱘЏᑆˈᕫࠄϔᓴ㔥义ˈ ᦣ䗄䈅ᑊ㒭ߎ䆺ሑⱘֵᙃDŽ˄䄺ਞ˖ϡ㽕݇ᥝMapviewৢⱘ⌣㾜఼にষˈ⬅ѢJavaᅝܼᗻⱘ ϔϾ⡍⚍ˈᖂᑣা᳝ᔧ⌣㾜఼にষᓔⴔᯊᠡ㛑ⓨ⼎݇Ѣ᠔䗝ᷛ䆄⠽ⱘֵᙃ˅DŽ Mapview˄⠛ⓨ⼎˅Ёⱘⓨ⼎ৃ䗮䖛䗝ᢽView˄ⓨ⼎˅㦰ऩЁⱘMarker Names˄ᷛ䆄⠽ৡ ⿄˅Display Options˄ⓨ⼎䗝乍˅ᴹ䇗ᭈDŽ䖭ѯ䗝乍ৃҹ䅽⫼᠋ᓔ㗙݇ᶤѯⱘⓨ⼎ǃ ᬍব䈅ⱘⳌᇍᨚᬒ乎ᑣǃᑊ❳㒗䗝ᢽᷛ䆄⠽ⱘৡ⿄DŽᷛ䆄⠽㹿ⓨ⼎ᯊ咬䅸ЎՓ⫼݊ᑻD ˉ⠛ᮁৡDŽԚ᳝ᯊབᵰՓ⫼᳔߱ᅲ偠ᅸ䞠ⱘੑৡˈֵᙃ䞣ᇚӮˈЎ䖭Ӯᇍᷛ䆄⠽ⱘ ᴀ䋼ᦤկϔѯ㒓㋶˄՟བˈᅗᰃᖂि᯳䞡⠛ᮁˈ䖬ᰃϔ↉㸼䖒ᑣ߫˅DŽ 㽕Ϟ᧰㋶ϔϾ⡍ᅮⱘᷛ䆄⠽ˈᑨҢEdit˄㓪䕥˅㦰ऩЁ䗝ᢽFind˄ᇏᡒ˅ϔ乍DŽ䕧ܹϔ ϾϾᷛ䆄⠽ⱘৡ⿄ݡᣝOKᣝ䪂DŽᷛ䆄⠽ⱘӏԩ߿ৡ䛑㛑Փ⫼ˈгৃ⫼ϔϾऩ োˈ㹿䗝Ё ⱘᷛ䆄⠽催҂ᑺᰒ⼎ᑊ⒮ࠄࡼ㾚䞢ݙDŽ ᴹ㞾Ͼԧᴹ⑤ⱘ㒘㣗ೈ䈅 ሑㅵϔ㑻᭄ᑧˈབEntrezGDBᰃᏆথ㸼ⱘ䈅ⱘ䞡㽕ᴹ⑤ˈԚᰃᅗӀ䖬≵᳝㛑᳓ҷॳྟ᭄ ⱘϰ㽓DŽ᳝㛑ࠊ㞾Ꮕⱘ⠽⧚䈅ⱘᅲ偠ᅸϔ㠀䛑᳝㞾Ꮕⱘ㔥ഔˈ䖲ᅗӀⱘ䈅᭄ ᑧDŽ䗮䖛Ң䖭ϔ⏴䘧Ⳉ㦋প䌘᭭ˈ៥Ӏৃҹⳟࠊࠄᅲ偠ᅸ᠔Փ⫼ⱘⱘᔶᓣǃϟ䕑ॳྟ ᭄ǃᑊϨњ㾷ᅲ偠ᅸࠊᯊⱘण䆂DŽˈϔѯߎ⦃ѢEntrezGDBࠡ㒣ᐌ㹿϶ᥝDŽ EntrezGDB᭄ᑧ䗝ᢽⱘ㸼䖒ᮍᓣˈᇍ䙷ѯᏠᳯᇚᮄⱘᷛ䆄⠽ᅮԡѢᏆⶹ⠽⧚䈅Ϟⱘⷨお 㗙ᴹ䇈ˈাᦤկњ᳔ᇣⱘᐂࡽDŽ 㒘ⱘ䈅 ሑㅵᴀゴ䅼䆎ⱘᰃ⠽⧚䈅ⱘᴹ⑤ˈԚ㢹ϡ⍝ঞ䈅ˈ䖭ѯ䅼䆎ህϡ㛑ㅫܼ䴶ˈЎৢ 㗙ᰃࠊ䆌⠽⧚䈅ᯊᎹⱘᴀ偼ᶊˈгᰃ䆌ࠊ乍Ⳃⱘ䍋⚍DŽ᳝ϸ⾡㒘㣗ೈⱘ 䈅ৃկ䗝ᢽDŽGenethon˄Dib et al., 1996˅5264Ͼḋᗻᖂि᯳䞡⠛ᮁˈ䯈 䱨1.6cMDŽᅠᭈⱘ᭄ᑧ᭛ӊˈҹঞ䈅ⱘPostScriptᮍᓣᔶ㸼⼎ˈGenethonⱘFTPキ⚍ Ϟഛৃ㦋ᕫˈ䖭ѯ䗮䖛GDBгৃҹ㦋ᕫDŽ Ѡ䈅⬅Cooperative Human Linkage Center˄݀⫼Ҏ㉏䫒Ёᖗ˅˄Murray et al., 1994˅ࠊ䗴ˈCHLC⬅10775Ͼᷛ䆄⠽㒘៤ˈ᭄Ўᖂि᯳䞡⠛ᮁˈ䯈䱨3.7cMDŽ Ҏ㉏㒘ⱘ䕀ᔩ⠽ 1996ᑈ10᳜ˈHorno sapiensⱘϔϾܼ㒘䕀ᔩ⠽⬅ϔϾ䰙ড়ⱘⷨおᅲ偠ᅸথ㸼Ѣ ScienceϞ˄Schuler et al., 1996˅DŽ䖭Ͼ⬅̚15000Ͼϡৠⱘ㸼䖒ᑣ߫㒘៤ˈ⬅ᬒᇘᗻ ᴖѸ⊩ᅮԡˈϢGenethon䈅㸡⫳ⱘḚᶊⳌ䖥DŽ䗮䖛ᇍ䝉↡ҎᎹᶧ㡆ԧSTS䞣⊩জ ⏏њ1000Ͼ㸼䖒ᑣ߫DŽ䖭ᓴЁˈ㑺1/5ⱘᷛ䆄⠽᳝Ꮖⶹⱘᰃ؛ᅮⱘࡳ㛑ˈ㗠ԭϟⱘҷ 㸼њⶹࡳ㛑ⱘ㸼䖒ᑣ߫DŽࠊ៤ⱘᑣ߫ϔ㠀⬅UniGeneset㸡⫳㗠ᴹˈᅗᰃϔϾ⬅NCBIㅵ⧚ ⱘ݀⫼䞡ESTs᭄ᑧDŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ5/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com