第一章化学信息学与 Internet 大学开设了计算机化学类课程推动了我国计算机辅助化学教学的研究活动;中 国科技大学张懋森教授开展计算分析和专家系统领域的研究工作,并成为1984 年我国的第一本计算机化学期刊《计算机与应用化学》的主编;中国科学院上海 冶金研究所陈念贻教授将化学模式识别和计算机模拟方法应用于材料研究;中 国科学院北京化工冶金研究所许志宏教授提出建立化学化工数据库。国内还有 许多学者在计算机化学和计算化学的重要领域中作出了贡献:中国科学院上海 有机化学研究所郑崇直教授、湖南大学俞汝勤教授、中国科学院长春应用化学研 究所许禄教授、中国科学院药物研究所嵇汝运教授、中国药科大学安登魁教授、 清华大学胡鑫尧教授北京化工大学麻德贤教授南开大学林少凡教授等。 第二节因特网( Interne)概述 Internet是由异型计算机、异型系统、异型网络系统协议所组成的联系世界 150多个国家和地区各种大大小小计算机网络的互连体,正像其英文名称所表 现的: Internet= Interconnect+ Networks 20多年前,计算机只能在高规格的实验室看到, Internet还只是美国很少的 几台大型计算机连成的网络,使用者只限于个别国家的小部分研究人员。在那 个年代,“个人计算机”这个概念都显得很荒谬,更不用说把无数台计算机连成一 个全球网络了。科学发展史表明,任何一种成功的新技术对社会的贡献都在于 它可以扩大人类的潜能。 今天的信息高速公路 Internet具有在瞬间跨越万水千山交流信息的能力, 使得人与人之间的距离缩短了,世界变小了。一进入 Internet即可领略到其信 息海洋之浩瀚:在 Internet上可以轻而易举地到达世界各国的站点,到达许多公 司、机构、大学的计算机,浏览或索取他们公开的软件或信息;可以参加各种各样 的新闻组或电子论坛;可以发布自己的消息;可以查寻几乎所有的信息;可通过 主题、特定的关键词和词组或描述性语言来检索 Internet站点上提供的数据库 信息。 Internet已成为一种全球性的文化现象,成为并列于电视、电话的第三大通 信系统。 Internet中的各个子网络由不同的国家管理,但又不受国界的限制,它 们在网上维系着各自不同的风格和习俗而又协调地交叉在一起。现代信息社会 把信息作为最重要的资源和产业,它和材料、能源一起并列成为社会物质和精神 活动的三大重要资源。据估算,有效地利用信息、合理地提取其中的有用成分能 产生数倍的附加经济效益。目前只是处于 Internet时代的黎明,它的发展将对 社会进步、科技发展、经济增长等起越来越重要的作用。信息技术已成为世界各 国在科技战线上争夺的战略制高点。 PDF文件使用" pdfFactory Pro"试用版本创建ww. fineprint.cn
PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
第二章化学化工网站与网上数据库 化学信息的需求是多方面的除了大量的化学专业信息以外,还会涉及物 理、数学、天文、地质、环境、计算机技术、工业技术、市场投资、金融、法律、教育。 我们应根据不同需要掌握一定的检索技巧,灵活运用各种检索策略,学习在In ternet上快速准确、全面地获取信息的方法。 Internet上的www( World Wide Web)环球网是一个可以检索 Internet上 几乎所有信息资源的信息查询系统,它利用超级文本的格式将相关联的信息文 件有机地组织在一起。WwW中的超文本( Hypertext)像 Windows中的帮助文 件,其中每个关键词都被用高亮度的色彩显示,但它的功能又远远超过帮助文 件。WWW的超文本文档形式不仅限于文本,而且是图文并茂、色彩丰富并可 带有声音、动画等影视信息的超媒体,具有超出常规描述的多种传播媒体所具有 的功能。这些文档往往带有超级链接(超级链接就是用醒目色彩的文字或图片 链接着与它们有关的背景材料和参考文章或图片等,简称超链接),使得浏览者 只需轻轻地点击它就可以非常方便地进入被链接处,可以从一篇文章转移到相 关内容的另一篇文章、从一台主机转到另一台主机浏览下去。 nternet的发展十分迅速,一方面信息非常广泛而且很多信息在定期或不 定期更新,另一方面信息资料的混乱度也在增加,信息的平均质量严重下降,系 统化整理成本越来越高。人们不得不花大量宝贵时间去阅读价值不大的资料。 因此,信息质量的重要性远胜过数量,信息挖掘的深度胜过广度。 Internet信息 检索工具尤其是第二代检索工具可以帮助用户系统地浏览所要检索的目标,筛 选和提高信息检索的速度和质量。 Internet上的化学资源非常丰富,除了有提供通用信息检索的网站以外,还 出现了针对化学领域的综合性信息服务和各种化学化工专业的站点。它们有些 提供文献和化学化工信息检索,有些提供各种化学数据库,有些是化学论坛,还 有些是为化学品化学仪器、化学软件采购提供帮助。 化学数据库包括化学文献数据库、化学结构数据库和化学物质的物性数据 库。数据库不仅提供原始数据,也是进行信息再加工的数据源,在科学研究和工 程技术领域有着非常重要的作用。功能强大内容丰高的大型数据库应用范围 广,而小型实用的专业数据库价格便宜使用方便。随着 Internet的普及与发 展许多数据库提供网上查询服务。化学文献数据库在其他章节中介绍,本章中 的数据库主要是指结构数据库、反应数据库和物性数据库 PDF文件使用" pdffactory Pro"试用版本创建ww. fineprint.cn
PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
第二章化学化工网站与网上数据库 第一节通用信息检索引擎 Internet检索工具一般具备以下功能:首先有一个简单易用、功能强大的前 端界面,使得查询方式容易设定;检索方式比较完备,可以按用户所需的方式进 行查询;检索结果具有较好的准确性和可读性,且检索速度较快。网络检索工具 大都采用 Server/ Client结构和交互式的 windows前端界面,检索途径多,可使 用“书签簿保留检索历史,在检索窗口中按一定规则输人检索式,发出检索命令 后即可得到检索结果。检索结果通常包括题目内容简介、URL地址等,由此可 进行更进一步的检索,获得更详细的内容。由于检索引擎能够帮助用户在比较 少的时间里方便地找到所需要的信息资料,因而成为用户上网的基本辅助工具。 wwW是 Internet上最先进的网络信息检索系统,它把超文本技术、网络技 术和多媒体技术融为一体,并把 Internet上的信息按一定的规则组织起来,以提 供进一步的查询。从1994年Yaho问世以来,已经开发出许多WwW检索引 擎,有记录可查的检索引擎数量就达到2500个左右。其中既有大型综合型的 通用信息检索引擎,也有在特定领域里发挥作用的专业检索引擎。检索引擎的 功能也有不少发展,第一代检索引擎是根据关键词在主页中的位置和出现频率 来计分和排序,而第二代检索引擎以用户访问该网站时所花费的时间来确定它 的人气指数或者根据该网站被其他网站链接数量来确定它的等级,并向用户返 送这些信息。 I.Yahoo(http://www.yahoocom Yahoo主页见图2-1。Yaho提供按主题词分类的索引,并且有功能完备 的检索方式,非常有效,但也异常拥挤,每天有上千万人次访问该节点。它已经 开发了很长时间,由很多编辑人员维护,所以质量非常高。Yaho是目前最常用 的检索工具,当不知去哪里时,在 Yahoo上检索是找到好站点的最好方法,初学 者也可以从那里找到较专门的站点。 使用 Yahoo检索非常简单,输人主题词后点击“ Search”按钮,或者点击 dvanced Search"(高级检索)即可。它将返回三种信息 (1)满足检索条件的Yaho的目录(用户可以利用这些目录进行交叉引 用); (2)满足检索条件的WWW网站; (3)含有网页索引的Yaho目录。 Yaho提供了全面的分类体系,它将WwW服务的节点按主题词建立分类 索引。我们还可以按这个分类来检索检索的方法是先选出分类的超链接,在 PDF文件使用" pdfFactory Pro"试用版本创建w. fineprint.cn
PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
第·节j用信总粒索引擎 F回因 File Ecit:iew o Beolnerk01 n3 Directory里re1p三 巴」則蝴鹧」 °aton:「 htp /yahoo com that'sRex?nats Cool?] Destinations et eura Psoclelse wate @-@ YAHOO! 69-8- Yason: Aurore stant stock Alerts as Yahoo! Mat 3:出:出 Yaheal ShoutingDnd eme, wmm geass, mts hewn 32e aNEi takata s.ran 型·E的如( Nts< Humanities News Meria i DhMt-byy um, dd Business E tono i sport PM4 25Is1 al: Connect: Host wry yahe co contacted Talting for reF a ctxx浏览器目图《小内容为Yahx主页) Yahx查洵结果面中具有下划线的均为Y:hx)分类的超链接,如¨ Busines A 上ckmy(商务与经济)、“Kgad(地).“ Education(教育).“ SeIenc(和 学)等等。在选择分类的超链接后,从 Yahe)饿会得到个查询界面,此时 按其查询要求进行进一步查询 Ythx还提供一些简单的高级查诲,不用通过分类索引直接检索关键词 利用这种方法用户可以省去很多分类檢索的步骤,但是注意便用的关键词的含 义要相对窄一些。例如.对" chemistry的检索,会使你面对数万条检索结果 去了检索的意义 对输入的关键词.Yah∞x提供↓种检索方式和2种檢索范围它们昰 Intelligent default¨(默认的智能方式).“^ n exact phrase match'(精确词组t 方式),“ Matches on all! word"(AN).单词之阃是“与”关系).“ Matches (ar: an word”(OR,单词之间是“或”关系):"Yhx( a:Gorie s”(在Yaho的分类网页泡 围内检索)、" Web sites”(在Yhwx提供链接的WWW站点上检索)\aiκκ还 提供在 Usce!:检索,其中“ intellige t default”是将输入的词作为个于出 例如输入"meth”,那么Ylkx∞将检索 methyl(甲基)、 methamphetamine(脫氧庥 该碱)和mehd(h法)等。点击“ Advanced Search“超链接,可以进行检索为式 和检索范的选择设置。 PDF文件使用" pdffactory Pro"试用版本创建ww. fineprint.cn
PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
第二章化学化工网站与网上数据库 例2-1检索关于Cu与吡啶( pyridine)的反应的信息。 (1)点击" Advanced Search"; (2)输人关键词“ Cu pyridine”或“ Copper pyridine"; (3)将检素方式设为 Matches on all words(AND)”; (4)点击“ Search”可以检索到数千条有关信息。 在本例中,如果选择关键词“ Copper pyridine reaction",缩小检索范围,检索结果 的词条还可以少一些。对检索一些不能分开的词组如“ Organic Chemistry",Ya hoo规定该词组用双引号“"标记即输入“ Organic Chemistry" Yahoo在高级查询上有些缺陷,如没提供“NEAR”等。但是Yaho在其主 页的末尾提供了到其他检索引擎如 altavista、 Lycos等的超链接,如果用户在 Yahoo上查不到所需资料,可以通过链接到这些地方去检索,从面起到一定的补 充作用。 2.其他检索引華 第二代检索引章:网站的质量反映在它内容的丰富性准确性以及满足用户 需求的程度上。第二代检索引鍪以被其他网站链接和以大多数用户访问的情况 认定一个网站的质量,它们的代表有 http://www.googlecom http://www.links2go.com(linkToGo http://www.Directhit 精选网站捡索引章:它们提供高质量的网站,对所挑选网站的质量以星的多 少来表示。一个网站的星越多,则其内容越好。 http://www.Aboutcom(about让各行各业的专家推荐他们所在行业的最 佳网站) http://www.eblAst.com(britannica不列颠百科全书精选网址); http://www.Refdesk.com/index.htmlReferenceDesk参考文献检索 擎)。 大型检索引華AlTheWeb(htp://www.AllTheWeb.com,htp://www. ussc alltheweb. com); AllTheWeb是目前 Internet上收录网页最多的检索引擎 (约有2亿个),他们计划收录10亿个网页。同时他们认为 AllThe Web的检索 速度最快,敢于标明用户每次检索所用的时间。 待色检索引鼙 http://www.Meta-list.net(MetaList收录有20多万个邮件列表); http://www.Findwhat.com提供产品与服务信息); http://www.Infojump.com收录近4000种报刊的500万篇文章)。 PDF文件使用" pdfFactory Pro"试用版本创建ww. fineprint.cn
PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn