当前位置：和泉文库 > 计算机 > 浏览文档

《高级Web技术》参考资料：2-Web上的数据标准-XML_XML基础—概述与语法

文件格式：PDF，文件大小：880.34KB，售价：17.46元

文档详细内容（约64页）

HTML的局限性 ■搜索引擎简介分类目录式搜索引擎:早期的 Yahoo ■全文搜索引擎: Google及百度等第二代商用搜索引擎元搜索引擎: Web Crawler 文件)牺①)查看C)收震工具⑦)帮助cD ⊙回☆收来创,国,回题图B不 M囝转 WebCrawler ageswhite Featured searche Otner Resources a gs tormes o Add webcrawler to Your Site o when to plant a how to videos e WebCrawler Toolbar

HTML的局限性搜索引擎简介分类目录式搜索引擎：早期的Yahoo 全文搜索引擎：Google及百度等第二代商用搜索引擎元搜索引擎：WebCrawler

HTML的局限性 ■搜索引擎简介搜索引擎的体系结构下载系统:网络蜘蛛( Spider),广度,深度优先分析系统:分词, PageRank 索引系统:正排索引;倒排索引查询系统:检索模型下载系统分析系统网页库索引系统提交查询查询系统索引库返回查询结果 Client

HTML的局限性搜索引擎简介搜索引擎的体系结构下载系统：网络蜘蛛(p ) S ider)，广度，深度优先分析系统：分词，PageRank 索引系统：正排索引；倒排索引查询系统：检索模型

HTML的局限性搜索引擎简介分词基于字符串匹配基于理解基于统计 PageRank PR(A)=(1-d)+d(Pr(t1)C(t1)+.+ PR (Tn)/C(Tn)) aPR(A):网页A的 PageRank值; nT1,T2,…,Tn:网页A的链入网页; aPR(Ti):网页Ti的 PageRank值(i1,2,…n); ac(Ti):网页Ti的链出网页的数量(i=1,2,…n) d:一个衰减因子,0<d<1,通常取值为0.85

HTML的局限性搜索引擎简介分词基于字符串匹配基于理解基于统计 PageRank PR (A ) = (1- d) + d (PR (T1)/C (T1) + ڮڮ +PR (Tn)/C (Tn) ) PR (A ) ：网页A 的PageRank 值； T1, , T2 ڮ ,Tn ：网页A 的链入网页； PR (T i) ：网页T i 的PageRank 值( i= 1, 2, ڮn) ； C (T i) ：网页T i 的链出网页的数量( i= 1, 2, ڮn) ； d ：一个衰减因子, 0< d< 1, 通常取值为0. 85

HTML的局限性 ■搜索引擎简介哪索引系统 hithithit hit-. its hit hithit- ts hithithit hit 正排索引 cel0[ dIDn hite hit下tht“ ordID n hits: hit hithit hit Plain Hite: Positi∞n12 Fancy Hits: Type: 4Position:B Anchor)Hits: Cap :4[脚:4Pit∞4 倒排索引倒排福索引 wordID n docID docID n hits hithit hits sordID n doc ID docID n hit hit hit hit hit sordID n doc l0 dociD n hits hit hit… deeD n hits hithithit hit

HTML的局限性搜索引擎简介索引系统正排索引倒排索引

HTML的局限性 ■搜索引擎简介用户输入查询系统倒排表检索交档列表求交向量化 ■搜索引擎的评价标准向量相似度查全率(Reca) 排序输出查准率( Precision) recall-number of retrieved relevant documents total number of relevant documents number of retrieved relevant documents precision= total number of retrieved documents

HTML的局限性搜索引擎简介查询系统搜索引擎的评价标准查全率（Recall）查准率（Precision）

点击进入文档下载页（PDF格式）

共64页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

《高级Web技术》参考资料：2-soap&wsdl&uddi_4-Service web_WSDL
《高级Web技术》参考资料：2-soap&wsdl&uddi_4-Service web_UDDI
《高级Web技术》参考资料：2-soap&wsdl&uddi_4-Service web_Tomcat与SOAP&AXIS集成
《高级Web技术》参考资料：2-soap&wsdl&uddi_4-Service web_SOAP
《高级Web技术》参考资料：1-webapp outline_雅蛙网站的使用体验及对WEB2.0的认识
《高级Web技术》参考资料：1-webapp outline_离线Web技术在医疗业务应用的设想与尝试
《高级Web技术》参考资料：1-webapp outline_拥抱Web3.0
《高级Web技术》参考资料：1-webapp outline_what is web2.0
《高级Web技术》参考资料：1-webapp outline_web app outline Web 技术概述
《高级Web技术》参考资料：1-webapp outline_web app outline Web 技术概述
《高级Web技术》参考资料：1-webapp outline_Planetary-Scale Views on a Large Instant-Messaging Network
《高级Web技术》参考资料：1-SOA和WS概述_4-Service web_Web Service概述及其应用
《高级Web技术》参考资料：3-WS与工作流_4-Service web_BPELOverview
《高级Web技术》参考资料：3-应用web_4-EJB_EJB基础-2-体系结构
《高级Web技术》参考资料：3-应用web_4-EJB_EJB基础-3-主要接口设计原则
《高级Web技术》参考资料：3-应用web_4-EJB_EJB开发-4-创建Session EJB
《高级Web技术》参考资料：3-应用web_4-EJB_EJB开发-5-编写Entity Bean
《高级Web技术》参考资料：3-应用web_4-EJB_EJB开发-6-创建客户程序
《高级Web技术》参考资料：3-应用web_4-EJB_EJB开发-7-部署EJB应用
《高级Web技术》参考资料：3-应用web_4-EJB_EJB高级-10-安全性控制.
《高级Web技术》参考资料：3-应用web_4-EJB_EJB高级-11-EJB3.
《高级Web技术》参考资料：3-应用web_4-EJB_EJB高级-8-资源管理与EJB环境
《高级Web技术》参考资料：3-应用web_4-EJB_EJB高级-9-事务处理
《高级Web技术》参考资料：应用web - EJB 3RD EDITION - Richard Monson-Haefel

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录

《高级Web技术》参考资料：2-Web上的数据标准-XML_XML基础—概述与语法