白东理子太军 SHANDONG UNIVERSITY OF TECINOLOGY 信息检索的重要性 2 3 2020 visions 19502nnn orthe first issueof the new decade,Noture asked a selection of leading researchers and policy-makers Search ter Nervig' 2010年的第一期《自然》杂志评选出未来10年内 最重要的技术:互联网搜索技术排在第一位 。在英国皇家学会成立350周年时,评选近几百年 来开创性成果:基于语义的信息检索被列为其中 之一 2025年4月3日 6
2025年4月3日 6 信息检索的重要性 • 2010年的第一期《自然》杂志评选出未来10年内 最重要的技术:互联网搜索技术排在第一位 • 在英国皇家学会成立350周年时,评选近几百年 来开创性成果:基于语义的信息检索被列为其中 之一
归东程子末军 HANDONG UNIVERSITY OF TECINOLOGY 搜索示例:同济大学 3杀 2月济大学Goot接家Windows intemet Bplo阳 世年A-EA0C85aES47 ESADXAme·4XP西蛋 身fo的】同济大字G00ge孩家 登·日·3m·PageSafety,1oe 网质图片蓝出出贵走可荟丰中,更, 装史安魔业过 G00ge同济大号 Go0g%提宝型 转所有网历白中文网顺台局体中文两西 同领出打升百宇箱 固奇大堂 网页排序结果 一似工为王,理工结台,经、需.文、法 拉有机妆会作通目激您如人 据机构财大生荒,结更大利到空司 兔贵堆川物师提要组轨直专家全程支油 医多金留 植的论 性士武业 同不载了 上者9 图中 的动生 人才超 ton某的官其它 问题:搜索引擎怎么知道哪个网页排在前面 大学研究生院 哪个排在后面呢?即如何衡量网页的重要性? 同请大学2010年招收攻请博士学 业学位讲究生款有网种:MB 9on0auCa/dc值度W4出 上市 厨济大学网铭发育学悦回济大学继铁套州学院国济大学理代远橙鞋育网V20。 融2,淡宝宝维坐程 同清大学调结教有学用,继快软字烷。附教育。远程黎而、学历取商,地结黎育。成人歌有。高 等和商,我代近程敏布、路大学,网上大学,同上教育,学习。上 托票大邵大思售裤级让精干能2勇 付费 上语布n。 Goog白蓝讯:回济大坐 控的商专科本科进格证 广告 公的表科相资格证网上可立询国家 信两用T/15276292 专业自零5月出到坊大学置询现场,不少家长皇题擦租机忙看拍排唇镇位上的招生童传海 地m△兰的热上三4丝00江直±士值撞接白上土 2025年4月3日 7
2025年4月3日 7 搜索示例:同济大学 问题:搜索引擎怎么知道哪个网页排在前面, 哪个排在后面呢?即如何衡量网页的重要性? 网页排序结果 付费 广告
归求程上太军 SHANDONG UNIVERSITY OF TECINOLOGY 网页排名算法:PageRank ●网页排名是网络搜索引擎的核心 ·PageRank是著名网络搜索引擎Google用于评 测一个网页“重要性”或“影响力”的一种 方法 PageRank 2025年4月3日
2025年4月3日 8 网页排名算法:PageRank ⚫ 网页排名是网络搜索引擎的核心 ⚫ PageRank 是著名网络搜索引擎 Google 用于评 测一个网页 “重要性” 或 “影响力” 的一种 方法
归东露子太军 SHANDONG UNIVERSITY OF TECHNOLOGY 有向图的知识 ◆有向图 ◆顶点的出度(Out-degree) ◆J顶点的入度(In-degree) 例:右图为一个有向图,记为D 顶点组成的集合:V(D)={u,V,w} 弧组成的集合: A(D)={(u,w),(w,u),(u,v)} 顶点u的出度: od (u)=2 如何表示这个图,以便 顶点u的入度 id(u)=1 更好计算PageRank值呢? 2025年4月3日 9
2025年4月3日 9 例:右图为一个有向图,记为 D 顶点组成的集合:V(D)={u,v,w} 弧组成的集合: A(D)={(u,w),(w,u),(u,v)} 有向图的知识 ◆ 有向图 ◆ 顶点的出度(Out-degree) ◆ 顶点的入度(In-degree) 顶点 u 的出度: 顶点 u 的入度: od(u)=2 id(u)=1 如何表示这个图,以便 更好计算PageRank值呢?
山东程子太军 邻接矩阵 SHANDONG UNIVERSITY OF TECINOLOGY 器会会空会的空3会空是 口为研究需要,我们定义邻接矩阵 6=侧小共中%={及 如果存在从到i的孤 otherwise 对于下例中的有向图,其邻接矩阵为 12345678 0000001 0] 1 10110000 2 10000000 3 01000000 4 G 00110010 00011001 6 00001001 7 0 0001110 8 2025年4月3日 10
2025年4月3日 10 ❑ 为研究需要,我们定义邻接矩阵 对于下例 中的有向图,其邻接矩阵为 邻接矩阵 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8