第十二章鼠类和人类公用物理图谱数据库的使用 页码,6/1 转录物图是通过将八家不同实验室的图谱数据综合而得到的。为协调制图方法的些微不同, 表达序列被放在由 Genethon基因图谱衍生的框架上。结果,该图的最大分辨率为~2CM。很多 情况下,可以从各个实验室的数据库里得到针对某一部分数据更好的制图信息,特别是the Whi tehead insti tute和 Stanford Uni versi ty的。 浏览NCB转录物图 转录物图可在两个网址上得到。数据的“亲本”站点为NCB。在那儿可以找到含有全基因组 转录物图的 Science文章的全文,以及彩色的图象,但一般都只有装饰性的墙面图案。另外, 也有搜索页可以让浏览者对特别感兴趣的基因进行查询,或是通过对功能未知,但其读码框 与某已知功能的蛋白质相近的表达序列图谱进行搜索 NCB网址的一个限制就是它不能在低分辨率标记物分布柱形图上提供转录物图的图形。但是 通过 Mapi ew微程序就可以得到其图形显示。从GDB的首页,沿着What'sNew的链接,可找到 全基因组转录物图(到本书出版时链接形式可能已有所不同)。同样,可以认为转录物图也 是 Entrez网将要制作的一部分 任何支持网络浏览器的计算机系统都可用来浏览NCB转录物图,要求是应连向 Internet并支 持TCP/P。通过 nternet服务器可能形成一个 dedi cated网络连接或是一个拨号连接。因为这 个网址图形不多,所以连接速度不要求很快 首先,点击 Science转录物图网页所在的浏览器,得到转录物图的主页,通过其鲜快的桃红背 景很容易认出它。现在,寻找并点击标有 Reasearch Tool s Page(研究工具页)的链接。 般这个链接很不起眼(它在该页的右方,图的下方),这个链接会引向一个有几种搜索方式 的窗口,你可以按址、按假定功能或只按序列进行搜索 要想搜索基因组的一个特定区域中特殊目的基因的图谱,可选择标有 Map Search(搜索图 谱)的链接,得到含有一列染色体的页面。选择感兴趣的染色体,得到与图12.7相似的页 面。现在,在标有 Interval(间隔)栏中,输入两个 Gene thon基因标记物来定义你感兴趣的 区域 Genethon图可从GDB得到,或直接在上面所给的URL上的 Gene thon中得到。例如,如图12.7所 示,要搜索位于染色体18的 Gene thon图上32cM和34cM中的表达序列,可输入D18S464 D18S153,再按 Select Markers(选择标记物)键开始搜索,得到列有目标区域中表达序列 的页面(图12.7),其中每个EST位于不同列,并有简短说明。附言“ Hi ghl y si mi l ar to 或“ Si mi l ar to”说明它不对应已知基因,但与 Swi ss-Prot中的某个基因相似 每个转录物的名称都是一个超文字链接。选择此链接会产生一个页面,对转录物进行详细说 明。在可获得信息中有重叠基因表、形成转录物群的ESTS、CDNA的准备原始材料,转录物的 克隆1D(在1.M.A.G. E Consorti um的网页可得到大多数ESTs的克隆号)、 Swiss-Prot相似性 搜索结果,以及 Entrez中关于其序列和词条信息的链接。 要想根据名称或假定功能搜索一个图中的转录物,应回到搜索页并选择 Text search(主题搜 索)。接着会弹出一页,上面有一个或多个搜索项。你可以搜索以下类型的内容, Gen Bank中 的一个通道号、一个标记物或地点名称、在转录物 Gen Bank词条的说明区内找到的一个说明性 词语、或是在 Swiss-Prot词条的说明区内找到的说明性词语,转录物与之很相似。你可以同 时限定很多搜索项,这样搜索系统会挑出含所有项的那些词条。 按 Search搜索键提交搜索,将会出现一列符合条件的转录物,其形式与前所述搜索的图谱相 似。例如搜索 krabi n(角蛋白)通常会得到17种 keratin和与 keratin相似的转录物,并指出 它们在图中的位置 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
䕀ᔩ⠽ᰃ䗮䖛ᇚܿᆊϡৠᅲ偠ᅸⱘ䈅᭄㓐ড়㗠ᕫࠄⱘDŽЎण䇗ࠊᮍ⊩ⱘѯᖂϡৠˈ 㸼䖒ᑣ߫㹿ᬒ⬅Genethon䈅㸡⫳ⱘḚᶊϞDŽ㒧ᵰˈ䆹ⱘ᳔ߚ䕼⥛Ў̚2cMDŽᕜ ᚙމϟˈৃҹҢϾᅲ偠ᅸⱘ᭄ᑧ䞠ᕫࠄ䩜ᇍᶤϔ䚼ߚ᭄དⱘࠊֵᙃˈ⡍߿ᰃthe Whitehead InstituteStanford UniversityⱘDŽ ⌣㾜NCBI䕀ᔩ⠽ 䕀ᔩ⠽ৃϸϾ㔥ഔϞᕫࠄDŽ᭄ⱘĀ҆ᴀāキ⚍ЎNCBIDŽ䙷ܓৃҹᡒࠄܼ᳝㒘 䕀ᔩ⠽ⱘScience᭛ゴⱘܼ᭛ˈҹঞᔽ㡆ⱘ䈵ˈԚϔ㠀䛑া᳝㺙佄ᗻⱘ䴶ḜDŽˈ г᳝᧰㋶义ৃҹ䅽⌣㾜㗙ᇍ⡍߿݈ᛳ䍷ⱘ䖯㸠ᶹ䆶ˈᰃ䗮䖛ᇍࡳ㛑ⶹˈԚ݊䇏ⷕḚ ϢᶤᏆⶹࡳ㛑ⱘ㲟ⱑ䋼Ⳍ䖥ⱘ㸼䖒ᑣ߫䈅䖯㸠᧰㋶DŽ NCBI㔥ഔⱘϔϾ䰤ࠊህᰃᅗϡ㛑Ԣߚ䕼⥛ᷛ䆄⠽ߚᏗ᷅ᔶϞᦤկ䕀ᔩ⠽ⱘᔶDŽԚᰃ 䗮䖛Mapviewᖂᑣህৃҹᕫࠄ݊ᔶᰒ⼎DŽҢGDBⱘ佪义ˈ⊓ⴔWhat’s Newⱘ䫒ˈৃᡒࠄ ܼ㒘䕀ᔩ⠽˄ࠄᴀкߎ⠜ᯊ䫒ᔶᓣৃ㛑Ꮖ᳝᠔ϡৠ˅DŽৠḋˈৃҹ䅸Ў䕀ᔩ⠽г ᰃEntrez㔥ᇚ㽕ࠊⱘϔ䚼ߚDŽ ӏԩᬃᣕ㔥㒰⌣㾜఼ⱘ䅵ㅫᴎ㋏㒳䛑ৃ⫼ᴹ⌣㾜NCBI䕀ᔩ⠽ˈ㽕∖ᰃᑨ䖲Internetᑊᬃ ᣕTCP/IPDŽ䗮䖛Internet᳡ࡵৃ఼㛑ᔶ៤ϔϾdedicated㔥㒰䖲ᰃϔϾᢼো䖲DŽЎ䖭 Ͼ㔥ഔᔶϡˈ᠔ҹ䖲䗳ᑺϡ㽕∖ᕜᖿDŽ 佪ܜ⚍ˈߏScience䕀ᔩ⠽㔥义᠔ⱘ⌣㾜఼ˈᕫࠄ䕀ᔩ⠽ⱘЏ义ˈ䗮䖛݊剰ᖿⱘḗ㑶㚠 ᱃ᕜᆍᯧ䅸ߎᅗDŽ⦄ˈᇏᡒᑊ⚍ߏ᳝ᷛReasearch Tools Page˄ⷨおᎹ义˅ⱘ䫒DŽϔ 㠀䖭Ͼ䫒ᕜϡ䍋ⴐ˄ᅗ䆹义ⱘেᮍˈⱘϟᮍ˅ˈ䖭Ͼ䫒ӮᓩϔϾ᳝᧰辵㋶ᮍᓣ ⱘにষˈԴৃҹᣝഔǃᣝ؛ᅮࡳ㛑াᣝᑣ߫䖯㸠᧰㋶DŽ 㽕ᛇ᧰㋶㒘ⱘϔϾ⡍ᅮऎඳЁ⡍⅞Ⳃⱘⱘ䈅ˈৃ䗝ᢽ᳝ᷛMap Search˄᧰㋶ 䈅˅ⱘ䫒ˈᕫࠄ᳝ϔ߫ᶧ㡆ԧⱘ义䴶DŽ䗝ᢽᛳ݈䍷ⱘᶧ㡆ԧˈᕫࠄϢ12.7ⳌԐⱘ义 䴶DŽ⦄ˈ᳝ᷛInterval˄䯈䱨˅ᷣЁˈ䕧ܹϸϾGenethonᷛ䆄⠽ᴹᅮНԴᛳ݈䍷ⱘ ऎඳDŽ GenethonৃҢGDBᕫࠄˈⳈϞ䴶᠔㒭ⱘURLϞⱘGenethonЁᕫࠄDŽ՟བˈབ12.7᠔ ⼎ˈ㽕᧰㋶ԡѢᶧ㡆ԧ18ⱘGenethonϞ32cM34cMЁⱘ㸼䖒ᑣ߫ˈৃ䕧ܹD18S464ˉ D18S1153ˈݡᣝSelect Markers˄䗝ᢽᷛ䆄⠽˅䬂ᓔྟ᧰㋶ˈᕫࠄ᳝߫ⳂᷛऎඳЁ㸼䖒ᑣ߫ ⱘ义䴶˄12.7˅ˈ݊Ё↣ϾESTԡѢϡৠ߫ˈᑊ᳝ㅔⷁ䇈ᯢDŽ䰘㿔“Highly similar to” “Similar to”䇈ᯢᅗϡᇍᑨᏆⶹˈԚϢSwiss-ProtЁⱘᶤϾⳌԐDŽ ↣Ͼ䕀ᔩ⠽ⱘৡ⿄䛑ᰃϔϾ䍙᭛ᄫ䫒DŽ䗝ᢽℸ䫒Ӯѻ⫳ϔϾ义䴶ˈᇍ䕀ᔩ⠽䖯㸠䆺㒚䇈 ᯢDŽৃ㦋ᕫֵᙃЁ᳝䞡㸼ǃᔶ៤䕀ᔩ⠽㕸ⱘESTsǃcDNAⱘޚྟॳᴤ᭭ˈ䕀ᔩ⠽ⱘ ܟ䱚ID˄I.M.A.G.E Consortiumⱘ㔥义ৃᕫࠄ᭄ESTsⱘܟ䱚ো˅ǃSwiss-ProtⳌԐᗻ ᧰㋶㒧ᵰˈҹঞEntrezЁ݇Ѣ݊ᑣ߫䆡ᴵֵᙃⱘ䫒DŽ 㽕ᛇḍৡ⿄؛ᅮࡳ㛑᧰㋶ϔϾЁⱘ䕀ᔩ⠽ˈᑨಲࠄ᧰㋶义ᑊ䗝ᢽText Search˄Џ乬᧰ ㋶˅DŽⴔӮᔍߎϔ义ˈϞ䴶᳝ϔϾϾ᧰㋶乍DŽԴৃҹ᧰㋶ҹϟ㉏ൟⱘݙᆍˈGenBankЁ ⱘϔϾ䗮䘧োǃϔϾᷛ䆄⠽ഄ⚍ৡ⿄ǃ䕀ᔩ⠽GenBank䆡ᴵⱘ䇈ᯢऎݙᡒࠄⱘϔϾ䇈ᯢᗻ 䆡䇁ǃᰃSwiss-Prot䆡ᴵⱘ䇈ᯢऎݙᡒࠄⱘ䇈ᯢᗻ䆡䇁ˈ䕀ᔩ⠽ϢПᕜⳌԐDŽԴৃҹৠ ᯊ䰤ᅮᕜ᧰㋶乍ˈ䖭ḋ᧰㋶㋏㒳Ӯᣥߎ᠔᳝乍ⱘ䙷ѯ䆡ᴵDŽ ᣝSearch᧰㋶䬂ᦤѸ᧰㋶ˈᇚӮߎ⦃ϔ߫ヺড়ᴵӊⱘ䕀ᔩ⠽ˈ݊ᔶᓣϢࠡ᠔䗄᧰㋶ⱘ䈅Ⳍ ԐDŽ՟བ᧰㋶kerabin˄㾦㲟ⱑ˅䗮ᐌӮᕫࠄ17⾡keratinϢkeratinⳌԐⱘ䕀ᔩ⠽ˈᑊᣛߎ ᅗӀЁⱘԡ㕂DŽ कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ6/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第十二章鼠类和人类公用物理图谱数据库的使用 页码,7/1 搜索的最终类型取决于 BLAST相似性,如要搜索与一段DNA序列相似的转录物图,在搜索页上 选择“序列搜索”,弹出一个很大的输入区。用 FASTA模式将目的序列剪切后粘贴在输入区 先在>后加上序列名称(任意标记物均可),再加入该序列,如下 > bl undergo obi n3′end CTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCCTGTGCAGCATTCCATAAT GTGAATATATAACACTTTATTCAAAATTTGGGGAAATAGTACCTTGTACATACA TAATTTCACATGTTTGCCAGTGTGTGTTTTAGATACATGCCTGGA 如该序列在 Gen Bank中已有一词条,那么只要输入其通道号就可以了。按下 Submi t Query(提 交要求)键。在被查询序列对照转录物序列进行一次 BLAST搜索后,NCB|服务器将会给出一页 结果,总结所有相似转录物的身份和图中位置 Whi te head i nsti tute提供的人类物理图谱 The Whi tehead i nti tute/Mi t center for genome research是两张基因组范围物理图谱的最 初来源。其中一张是STS含量图,内含指定为YAC的10000多个标记物,以及一张含12000个左 右标记物的放射性杂交图。 Whi tohead所用的G4杂交板( Genebri dge4 radi ati on hybri d pane)分辨率为~1Mbp,而以YAC为基础作的图分辨率大约为200kbp。这些图已经和 Genethon基因图相结合,产生了一张合图,在平均150kb范围内有20000个STSs。 Whi tohead图 上大约有一半的标记物是表达序列,它们在人类转录物图上也会出现。 Wl( Whi tehead insti tute)图可通过网络从 Whi tehead center for genome research的主页 上得到。沿着“人类物理图项目”( Human Physi cal Mappi ng Project)的链接就可以得到 感兴趣的图,这些图可通过几种方法浏览。选择一系列pop-up菜单可以产生所选染色体的 图,选择选项按钮可以综合放射性杂交图、STS含量图和基因图。与Eηtrez一样,这些图不是 固定不变的。点击一个STS或是重叠群,会弹出关于该图素详细信息的页面。图形式图谱在网 址上可按GlF或 Maci tosh最初模式(PCT)下载。最近引入的一个多图浏览器,有一个望文 生义的名称 Mul ti map(多图)可以为Java型浏览器(如图12.8)提供这些图详尽的信息。这 些图的后转录形式在 Whi tohead ftp站点上也可得到。但应注意,这些后转录图是一些长几英 尺,与墙壁差不多尺寸的怪物。这就需要一个有足够内存(至少8M)的激光打印机或标绘器 才能进行硬拷贝。 Whi tohead网址上还提供了对图谱数据库进行査询的搜索页。这些搜索数据的链接可按名称 Gen Bank通道号、STS型号、染色体分配进行搜索。另外, Whi behead网页也可根据功能关键字 搜索制图转录序列,并提供与NCB|中的主转录物图的链接 Whi behead也为那些希望建立他们自己的STS的研究者提供服务,并将之放在一个或多个图 上,这些服务包括 一个在线的引物选择程序,引物3 将一个STS放在 STS/YAC含量图上的服务 将一个STS放在放射性杂交图上的服务 Whi tohead图远未完善,对合图进行监督性测试就能显示出在基因图、放射性杂交图和 STS/YAC图上的STSs位置间存在矛盾。这些矛盾表现在合图上仍存在交叉线。解释这些图的 个关键点在于理解这些图在可靠性与分辨率水平不一。基因图骨架在数十兆时能可靠地连接 file://E:\wcb\生物信息学(中译本)\第十二章鼠类和人类公用物理图谱 2005-1-18
᧰㋶ⱘ᳔㒜㉏ൟপއѢBLASTⳌԐᗻˈབ㽕᧰㋶Ϣϔ↉DNAᑣ߫ⳌԐⱘ䕀ᔩ⠽ˈ᧰㋶义Ϟ 䗝ᢽĀᑣ߫᧰㋶āˈᔍߎϔϾᕜⱘ䕧ܹऎDŽ⫼FASTAᓣᇚⳂⱘᑣ߫ߛ࠾ৢ㉬䌈䕧ܹऎ˗ ܜৢ!ࡴϞᑣ߫ৡ⿄˄ӏᛣᷛ䆄⠽ഛৃ˅ˈࡴݡܹ䆹ᑣ߫ˈབϟ˖ >blunderglobin 3’end CTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCCTGTGCAGCATTCCATAAT GTGAATATATAACACTTTATTCAAAATTTGGGGAAATAGTACCTTGTACATACA TAATTTCACATGTTTGCCAGTGTGTGTTTTAGATACATGCCTGGA བ䆹ᑣ߫GenBankЁᏆ᳝ϔ䆡ᴵˈ䙷Мা㽕䕧ܹ݊䗮䘧োህৃҹњDŽᣝϟSubmit Query˄ᦤ Ѹ㽕∖˅䬂DŽ㹿ᶹ䆶ᑣ߫ᇍ✻䕀ᔩ⠽ᑣ߫䖯㸠ϔBLAST᧰㋶ৢˈNCBI᳡ࡵ఼ᇚӮ㒭ߎϔ义 㒧ᵰˈᘏ㒧᠔᳝ⳌԐ䕀ᔩ⠽ⱘ䑿ӑЁԡ㕂DŽ White head InstituteᦤկⱘҎ㉏⠽⧚䈅 The Whitehead Intitute/MIT Center for Genome Researchᰃϸᓴ㒘㣗ೈ⠽⧚䈅ⱘ᳔ ߱ᴹ⑤DŽ݊ЁϔᓴᰃSTS䞣ˈݙᣛᅮЎYACⱘ10000Ͼᷛ䆄⠽ˈҹঞϔᓴ12000ϾᎺ েᷛ䆄⠽ⱘᬒᇘᗻᴖѸDŽWhitehead᠔⫼ⱘG4ᴖѸᵓ˄Genebridge 4 radiation hybrid panel˅ߚ䕼⥛Ў̚1Mbpˈ㗠ҹYACЎ⸔ⱘߚ䕼⥛㑺Ў200kbpDŽ䖭ѯᏆ㒣 GenethonⳌ㒧ড়ˈѻ⫳њϔᓴড়ˈᑇഛ150kb㣗ೈݙ᳝20000ϾSTSsDŽWhitehead Ϟ㑺᳝ϔञⱘᷛ䆄⠽ᰃ㸼䖒ᑣ߫ˈᅗӀҎ㉏䕀ᔩ⠽ϞгӮߎ⦃DŽ WI˄Whitehead Institute˅ৃ䗮䖛㔥㒰ҢWhitehead Center for Genome ResearchⱘЏ义 ϞᕫࠄDŽ⊓ⴔĀҎ㉏⠽⧚乍Ⳃā˄Human Physical Mapping Project˅ⱘ䫒ህৃҹᕫࠄ ᛳ݈䍷ⱘˈ䖭ѯৃ䗮䖛辵ᮍ⊩⌣㾜DŽ䗝ᢽϔ㋏߫pop-up㦰ऩৃҹѻ⫳᠔䗝ᶧ㡆ԧⱘ ˈ䗝ᢽ䗝乍ᣝ䪂ৃҹ㓐ড়ᬒᇘᗻᴖѸǃSTS䞣DŽϢEntrezϔḋˈ䖭ѯϡᰃ ᅮϡবⱘDŽ⚍ߏϔϾSTSᰃ䞡㕸ˈӮᔍߎ݇Ѣ䆹㋴䆺㒚ֵᙃⱘ义䴶DŽᔶᓣ䈅㔥 ഔϞৃᣝGIFMacintosh᳔߱ᓣ˄PICT˅ϟ䕑DŽ᳔䖥ᓩܹⱘϔϾ⌣㾜఼ˈ᳝ϔϾᳯ᭛ ⫳Нⱘৡ⿄Multimap˄˅ৃҹЎJavaൟ⌣㾜఼˄བ12.8˅ᦤկ䖭ѯ䆺ሑⱘֵᙃDŽ䖭 ѯⱘৢ䕀ᔩᔶᓣWhitehead FTPキ⚍ϞгৃᕫࠄDŽԚᑨ⊼ᛣˈ䖭ѯৢ䕀ᔩᰃϔѯ䭓㣅 ሎˈϢຕᏂϡሎᇌⱘᗾ⠽DŽ䖭ህ䳔㽕ϔϾ᳝䎇ݙᄬ˄㟇ᇥ8M˅ⱘ▔ܝᠧॄᴎᷛ㒬఼ ᠡ㛑䖯㸠⹀ᣋ䋱DŽ Whitehead㔥ഔϞ䖬ᦤկњᇍ䈅᭄ᑧ䖯㸠ᶹ䆶ⱘ᧰㋶义DŽ䖭ѯ᧰㋶᭄ⱘ䫒ৃᣝৡ⿄ǃ GenBank䗮䘧োǃSTSൟোǃᶧ㡆ԧߚ䜡䖯㸠᧰㋶DŽˈWhitehead㔥义гৃḍࡳ㛑݇䬂ᄫ ᧰㋶ࠊ䕀ᔩᑣ߫ˈᑊᦤկϢNCBIЁⱘЏ䕀ᔩ⠽ⱘ䫒DŽ WhiteheadгЎ䙷ѯᏠᳯᓎゟҪӀ㞾ᏅⱘSTS ⱘⷨお㗙ᦤկ᳡ࡵˈᑊᇚПᬒϔϾϾ Ϟˈ䖭ѯ᳡ࣙࡵᣀ˖ ϔϾ㒓ⱘᓩ⠽䗝ᢽᑣˈᓩ⠽3 ᇚϔϾSTSᬒSTS/YAC䞣Ϟⱘ᳡ࡵ ᇚϔϾSTSᬒᬒᇘᗻᴖѸϞⱘ᳡ࡵ Whitehead䖰ᅠˈᇍড়䖯㸠ⲥⴷᗻ⌟䆩ህ㛑ᰒ⼎ߎǃᬒᇘᗻᴖѸ STS/YACϞⱘSTSsԡ㕂䯈ᄬⳒDŽ䖭ѯⳒ㸼⦄ড়ϞҡᄬѸঝ㒓DŽ㾷䞞䖭ѯⱘϔ Ͼ݇䬂⚍Ѣ⧚㾷䖭ѯৃ䴴ᗻϢߚ䕼⥛∈ᑇϡϔDŽ偼ᶊ᭄कܚᯊ㛑ৃ䴴ഄ䖲 कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅᭄ᑧⱘՓ⫼ 义ⷕˈ7/18 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कѠゴ哴㉏Ҏ㉏݀⫼⠽⧚䈅... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com