当前位置：和泉文库 > 计算机 > 浏览文档

复旦大学硕士学位论文：基于 RSS 的企业 Web 搜索引擎研究与设计

文件格式：DOC，文件大小：618.5KB，售价：14.75元

文档详细内容（约53页）

基于 RSS 的企业 Web 搜索引擎研究与设计目录目录第一章绪论 ··························· 1 1.1 选题的意义························· 1 1.2 国内外搜索引擎技术发展现状················· 1 1.2.1 国外技术发展现状 ··················· 2 1.2.2 国内技术发展现状 ··················· 2 1.2.3 企业搜索引擎的研究现状················ 2 1.3 搜索引擎设计模型 ····················· 4 1.4 本文的研究内容······················· 4 1.4.1 问题的提出······················ 4 1.4.2 研究的思路······················ 5 1.4.3 论文的组织······················ 6 第二章 RRS 技术·························· 7 2.1 RSS 的概念························· 7 2.2 RSS 版本和技术标准研究 ·················· 7 2.2.1 RSS 版本区别····················· 7 2.2.2 RSS 1.0 与 RSS 0.9x/2.0 的比较研究 ·········· 8 2.2.3 技术标准之争····················· 9 2.3 RSS 元素定义及用法 ····················10 2.4 RSS feed ·························11 2.5 RSS 技术的国内外发展现状··················12 2.6 本模型采用 RSS 的技术原因 ·················14 第三章数据自动采集设计······················15 3.1 RSS Feed 的自动搜集 ····················15 3.1.1 RSS Feed 的自动发现算法 ···············15 3.1.2 基于元搜索的 RSS Feed 自动搜集 ············16 3.1.3 RSS Feed 的特征分析 ·················16 3.1.4 RSS Feed 自动搜集设计 ················17 3.2 网页纯文本的提取 ·····················18 3.2.1 提取文本·······················18 3.2.2 特殊字符的转换 ····················19 3.3 RSS 信息的解析·······················20 第四章中文分词与索引设计·····················22 4.1 中文自动分词技术 ·····················22

基于 RSS 的企业 Web 搜索引擎研究与设计目录 4.1.1 汉语分词技术研究···················22 4.1.2 汉语自动分词的难点··················23 4.1.3 自动分词设计 ·····················24 4.2 索引技术··························27 4.2.1 全文检索技术 ·····················28 4.2.2 索引项的选择 ·····················28 4.2.3 索引的组织结构 ····················28 4.2.4 索引的设计和实现···················29 第五章数据检索设计························31 5.1 检索模型的比较研究 ····················31 5.1.1 布尔逻辑模型·····················31 5.1.2 模糊逻辑模型·····················32 5.1.3 向量空间模型·····················32 5.1.4 概率检索模型·····················33 5.2 提高检索效率和质量的相关技术················34 5.2.1 相关度排序技术 ····················34 5.2.2 用户接口技术 ·····················35 5.3 数据检索的实现·······················36 第六章基于 RSS 的企业 Web 搜索引擎的实现··············38 6.1 基于 RSS 的企业 Web 搜索引擎整体工作流程···········38 6.2 系统模块划分························39 6.3 主要数据结构························42 6.4 系统测试··························43 第七章结论与展望·························44 7.1 结论····························44 7.2 展望····························44 参考文献 ·····························46 致谢 ·······························47

点击进入文档下载页（DOC格式）

共53页，可试读18页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（DOC）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录