搜索引擎的类别 分类依据 信息搜集方法 服务提供方式 类别 目录式搜索引擎 机器人搜索引擎 元搜索引擎
16 搜索引擎的类别 ▪ 分类依据 –信息搜集方法 –服务提供方式 ▪ 类别 –目录式搜索引擎 –机器人搜索引擎 –元搜索引擎
目录式搜索引擎 搜集信息 人工方式或半自动方式 信息处理 由编辑员查看信息之后,人工形成信息摘要 并将信息置于事先确定的分类框架中 服务方式 提供目录浏览服务 提供直接检索服务 优点 讨论 缺点 讨论 代表 YAHOO、 Looksmart、Dmoz等
17 目录式搜索引擎 ▪ 搜集信息 –人工方式或半自动方式 ▪ 信息处理 –由编辑员查看信息之后,人工形成信息摘要 –并将信息置于事先确定的分类框架中 ▪ 服务方式 –提供目录浏览服务 –提供直接检索服务 ▪ 优点 – 讨论 ▪ 缺点 – 讨论 ▪ 代表 – YAHOO 、LookSmart、Dmoz等
机器人搜索引擎 搜集信息 蜘蛛( Spider)的机器人程序 以某种策略自动地在互联网中搜集信息 信息处理 建立索引库 服务方式 面向网页的全文检索服务 优点 讨论 缺点 讨论 代表 Google、天网等
18 机器人搜索引擎 ▪ 搜集信息 –蜘蛛(Spider)的机器人程序 –以某种策略自动地在互联网中搜集信息 ▪ 信息处理 –建立索引库 ▪ 服务方式 –面向网页的全文检索服务 ▪ 优点 – 讨论 ▪ 缺点 – 讨论 ▪ 代表 – Google 、天网等
元搜索引擎 技术方法 将用户的查询请求同时向多个搜索引擎递交 将返回的结果进行重复排除、重新排序等处理 作为自己的结果返回给用户 服务方式 面向网页的全文检索 本质特点 没有自己的数据 优点 讨论 缺点 讨论 代表 WebCrawler、 InfoMarket等
19 元搜索引擎 ▪ 技术方法 –将用户的查询请求同时向多个搜索引擎递交 –将返回的结果进行重复排除、重新排序等处理 –作为自己的结果返回给用户 ▪ 服务方式 –面向网页的全文检索 ▪ 本质特点 –没有自己的数据 ▪ 优点 – 讨论 ▪ 缺点 – 讨论 ▪ 代表 – WebCrawler、InfoMarket等
搜索引擎系统结构 搜索器 索引器 检索器 用户接口
20 搜索引擎系统结构 ▪ 搜索器 ▪ 索引器 ▪ 检索器 ▪ 用户接口