(1)基于蜘蛛程序的机器人搜索引擎 这种搜索引擎由一个称为蜘蛛(5 pider)的机 器人程序自动访问网站,提取站点上的网页, 并根据网页中的链接进一步提取其他网页,或 转移到其他站点上。由索引器为搜集到的信息 建立索引,并根据用户的查询输入检索索引庠, 然后将查询结果返回给用户。 该类搜索引擎的优点是信息量大、更新及肘 不需人工干预,缺点是返回信息过多,有很多 无养信息,用户必须从结果中进行筛选
(1) 基于蜘蛛程序的机器人搜索引擎 • 这种搜索引擎由一个称为蜘蛛(Spider)的机 器人程序自动访问网站,提取站点上的网页, 并根据网页中的链接进一步提取其他网页,或 转移到其他站点上。由索引器为搜集到的信息 建立索引,并根据用户的查询输入检索索引库, 然后将查询结果返回给用户。 • 该类搜索引擎的优点是信息量大、更新及时、 不需人工干预,缺点是返回信息过多,有很多 无关信息,用户必须从结果中进行筛选
(2)目录式搜索引擎 以人工方式或半自动方式搜集信息,由编辑人员 看信息之后,人工形成信息摘要,并将信息置于 先确定的分类框架中。 信息大多面向网站,提供目录浏览服务和直接检索 服务。该类搜索引擎因为加入了人的智能,所以信 息准确、导航质量高,缺点是需要人工介入、维护 量大、信息量少、信息更新不及时。 目录的用户界面基本上都是分级结构,首页提供了 最基本的几个大类的入口,用户可以一级一级地向 下访问,直至找到自己感兴趣的类别,另外,用户 也可以利用目录提供的搜索功能直接查找一个关键 词,不过,由于目录只在保存的对站点的描述中进 槓搜索,因此站点本身的动态变化不会反映到搜索 Q、请中朱,这也是目录与基于机器人的搜素引擎之 的一大区别
(2)目录式搜索引擎 • 以人工方式或半自动方式搜集信息,由编辑人员查 看信息之后,人工形成信息摘要,并将信息置于事 先确定的分类框架中。 • 信息大多面向网站,提供目录浏览服务和直接检索 服务。该类搜索引擎因为加入了人的智能,所以信 息准确、导航质量高,缺点是需要人工介入、维护 量大、信息量少、信息更新不及时。 • 目录的用户界面基本上都是分级结构,首页提供了 最基本的几个大类的入口,用户可以一级一级地向 下访问,直至找到自己感兴趣的类别,另外,用户 也可以利用目录提供的搜索功能直接查找一个关键 词,不过,由于目录只在保存的对站点的描述中进 行搜索,因此站点本身的动态变化不会反映到搜索 结果中来,这也是目录与基于机器人的搜索引擎之 间的一大区别
(3)元搜索引擎 元搜索引擎的特点是本身并没有存放网页信息 的数据库,当用户查询一个关键词时,它把用 户的查询请求转换成其他搜索引擎能够接受的 命令格式,并访问教个搜索引擎来查询这个关 键词,并把这些搜索引擎返回的结果经过处理 后再返回给用户。对于返回的结果糸统会进行 重复排除、重新排序等处理。服务方式为面向 网页的全文检索。这类搜索引擎的优点是返回 结果的信息量更大、更全,缺点是用户需要做 更多的筛选
(3)元搜索引擎 • 元搜索引擎的特点是本身并没有存放网页信息 的数据库,当用户查询一个关键词时,它把用 户的查询请求转换成其他搜索引擎能够接受的 命令格式,并访问数个搜索引擎来查询这个关 键词,并把这些搜索引擎返回的结果经过处理 后再返回给用户。对于返回的结果系统会进行 重复排除、重新排序等处理。服务方式为面向 网页的全文检索。这类搜索引擎的优点是返回 结果的信息量更大、更全,缺点是用户需要做 更多的筛选