搜索引擎 搜索引擎( Search Engine)是 Internet上 具有查询功能的网页的统称,目前已多 达数百种,包括 Web Search Engine(万维 网搜索引擎)、 Usenet Search Engine(新闻 论坛搜索引擎)、 YellowPage Search Engine(黄页搜索引擎)、 WhitePage Search Engine(白页搜索引擎)、Meta Search Engine(元搜索引擎)等类型。本章 将依次介绍这些搜索引擎
搜索引擎 • 搜索引擎(Search Engine)是Internet上 具有查询功能的网页的统称,目前已多 达数百种,包括Web Search Engine(万维 网搜索引擎)、Usenet Search Engine(新闻 论坛搜索引擎)、YellowPage Search Engine(黄页搜索引擎)、WhitePage Search Engine(白页搜索引擎)、 MetaSearch Engine(元搜索引擎)等类型。本章 将依次介绍这些搜索引擎
在具体介绍搜索引擎之前,先将表述搜索引擎功能和性能的几个术语含义阐述如下 ·(1)简单搜索( Simple search):指输入一个单词(关键词),提交搜索引擎查询,这是最基 本的搜索方式。 ·(2)词组搜索( Phrase search):指输入两个单词以上的词组(短语),提交搜索引擎查询, 也叫短语搜索,现有搜索引擎一般都约定把词组或短语放在引号“”内表示 方式也叫任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不念,这种 ·(4)目录搜索( Catalog search):指按搜索引擎提供的分类目录逐级査询,用户一般不需 要输入査询词,而是按照査询系统所给的几种分类项目,选择类别进行搜索,也叫分 类搜索( Classified Search)。 ·(5)高级搜索( Advanced search):指用布尔逻辑组配方式查询,也叫定制搜索。常用的 逻辑运算为AND(和)、OR(或)、NOT(非),对A、B两词而言, aand B是指取A和B 的公共部分(交集),AORB是指取A和B的全部(并集), AAND NOT B是指取A中排除B 后的部分,其中NOT只作用于一个词,故称为一元操作符,其余作用于二个词,故称 作二元操作符。A、B本身为多词时,可以用括号O分别括起来作为一个逻辑单位。此 外,还有NEAR(邻近)算符, A neaR B表示A词与B词之间相隔不超过n词,n的具体 值各引擎要求不一, WebCrawler则直接要求用NEAR/n形式指明 上述前三种搜索方式可以合称为语词搜索( Word Search),与高级搜索和目录搜索 道构成三类常见搜索方式 在所有搜索方式中,还可使用通配符,就象DOS文件系统用*作为通配符一样,通 配符用于指代一串字符,不过每个搜索引擎所用的通配符不完全相同,大多用*或? 少数用$。 不少搜索引擎还支持加(+)、减(-)词操作。具体特性将在介绍具体搜索引擎时叙述。 下面就分别介绍各类 Search engine
• 在具体介绍搜索引擎之前,先将表述搜索引擎功能和性能的几个术语含义阐述如下: • (1)简单搜索(Simple Search):指输入一个单词(关键词),提交搜索引擎查询,这是最基 本的搜索方式。 • (2)词组搜索(Phrase Search):指输入两个单词以上的词组(短语),提交搜索引擎查询, 也叫短语搜索,现有搜索引擎一般都约定把词组或短语放在引号“”内表示。 • (3)语句搜索(Sentence Search):指输入一个多词的任意语句,提交搜索引擎查询,这种 方式也叫任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。 • (4)目录搜索(Catalog Search):指按搜索引擎提供的分类目录逐级查询,用户一般不需 要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,也叫分 类搜索(Classified Search)。 • (5)高级搜索(Advanced Search):指用布尔逻辑组配方式查询,也叫定制搜索。常用的 逻辑运算为AND(和)、OR(或)、NOT(非), 对A、B两词而言, A AND B是指取A和B 的公共部分(交集),A OR B是指取A和B的全部(并集),A AND NOT B是指取A中排除B 后的部分,其中NOT只作用于一个词,故称为一元操作符,其余作用于二个词,故称 作二元操作符。A、B本身为多词时,可以用括号()分别括起来作为一个逻辑单位。此 外,还有NEAR(邻近)算符,A NEAR B表示A词与B词之间相隔不超过n 词,n 的具体 值各引擎要求不一,WebCrawler则直接要求用NEAR/n形式指明。 • 上述前三种搜索方式可以合称为语词搜索(Word Search),与高级搜索和目录搜索 一道构成三类常见搜索方式。 • 在所有搜索方式中,还可使用通配符,就象DOS文件系统用*作为通配符一样,通 配符用于指代一串字符,不过每个搜索引擎所用的通配符不完全相同,大多用*或?, 少数用$。 • 不少搜索引擎还支持加(+)、减(-)词操作。具体特性将在介绍具体搜索引擎时叙述。 下面就分别介绍各类Search Engine
3.1 Web Search Engine(万维网搜索引擎) 这里主要介绍功能较完善、性能较 优良、较有实用价值的八大万维网搜索 引擎:AltaⅤista、 Excite、 Hotbot、 Infoseek、 Lycos、 RESearch、 Web Crawler和 Yahoo
3.1 Web Search Engine(万维网搜索引擎) • 这里主要介绍功能较完善、性能较 优良、较有实用价值的八大万维网搜索 引擎:AltaVista、Excite、HotBot、 Infoseek、Lycos、NLSearch、 WebCrawler和Yahoo
3.1.1AltaVista(http://www.altavista.com/ Alta vista是DEC公司1995年12月推出的万维网搜索引擎,其主 页如图3.1所示。至1997年底,AItaⅤista标引的URL近6000万。 altavista: Main Page-翼etee 口区 File Edi t yiew Go Communi cator Help Back Forward Reload Home Search Guide Print Security Bookmarksocation:http://ww.altavista.digital.com/ 是 Instant Message回 Internet C Lookup C New&cool 1o oohot barth s alavi Stars! Pamela ArB。 okstore DIGITAL Internet Service Polo Ae, cA-USA DemiMool amazon com Looking for the Most Reliable Vegas Odds &r Analysis? [Search TRanslations l(Free eMaill Business Search ( People Search (Browse by Subject Search the Web for documents in any language the web Usenet earch refine Help. Preferences. New Search. Advanced Search a few search terms and click on the search butt 目回
3.1.1 AltaVista(http://www.altavista.com/) • AltaVista是DEC公司1995年12月推出的万维网搜索引擎,其主 页如图3.1所示。至1997年底,AltaVista标引的URL近6000万
AtaⅤista主页上栏是 Alta vista标志和热点信息,中栏是经常 变化的广告信息, Search后是査询选择及输入框,在输入框中输 入査询词,再点击 isearch按钮就能进行查询。AltaⅤista的搜索功 能包括:(1)支持语词搜索,性能一般;(2)支持高级搜索,性能 优良;(③3)不支持目录搜索。搜索类型可以选择 :the Web(万维网页) 或 Usenet(新闻论坛) 其特色和优势是:信息范围广泛,査全性能较好,提供多语 种信息查询支持 缺点:误检率高;虽有 Usenet搜索能力,但性能较差。 AtaⅤista使用*作为通配符;支持+、-词操作,允许包含或者 排除关键词;在高级搜索功能中提供了大量的选项,包括布尔运 算符、嵌套、近似搜索和有日期限制的搜索等。 无论是语词搜索还是高级搜索,都允许将搜索限制到页面元 素,例如标题(页名)或URL,或者甚至可以限制到某个域(系统名) 或Web网点 AtaⅤisa对大小写字母敏感,当输入的查询词是大写字母时, AtaⅤista只查大写字母;而当输入的查询词是小写字母时, AtaⅤista同时查大小写字母。 下面是进入 Altavista系统后的具体查询实例
• AltaVista主页上栏是AltaVista标志和热点信息,中栏是经常 变化的广告信息,Search后是查询选择及输入框,在输入框中输 入查询词,再点击search按钮就能进行查询。AltaVista的搜索功 能包括:(1)支持语词搜索,性能一般;(2) 支持高级搜索,性能 优良;(3)不支持目录搜索。搜索类型可以选择the Web(万维网页) 或Usenet(新闻论坛)。 • 其特色和优势是:信息范围广泛,查全性能较好,提供多语 种信息查询支持。 • 缺点:误检率高;虽有Usenet搜索能力,但性能较差。 • AltaVista使用*作为通配符;支持+、-词操作,允许包含或者 排除关键词;在高级搜索功能中提供了大量的选项,包括布尔运 算符、嵌套、近似搜索和有日期限制的搜索等。 • 无论是语词搜索还是高级搜索,都允许将搜索限制到页面元 素,例如标题(页名)或URL,或者甚至可以限制到某个域(系统名) 或Web网点。 • AltaVista对大小写字母敏感,当输入的查询词是大写字母时, AltaVista只查大写字母;而当输入的查询词是小写字母时, AltaVista同时查大小写字母。 • 下面是进入Altavista系统后的具体查询实例