NC&IS 信息检索 The CCF Advanced Disciplines Lectures 彭波 pb@net.pku.edu.cn 北京大学信息科学技术学院 6/27/2010
信息检索 The CCF Advanced Disciplines Lectures 彭波 pb@net.pku.edu.cn 北京大学信息科学技术学院 6/27/2010
Search Engine Bal爸百度 Google 网扯之家 ⑤0S0援摄 常a新浪期 7禁cn 《东制凉 ⊙隳裙网 米tom.com搜索 iTcm.cn 无忧考网 china.com ToploOcn oug Why are SE so important? Sog0搜狗 YAHOO 有道youdao 必应ong 热語 2理巴巴 多器 114 感 淘宝网 Taobao.com 188财离能 a.com China惑en 9 126件您 黑 搜
Search Engine Why are SE so important?
Era of Information 2009年上半年中国互联网用户,从年初算起的半年间增 长了13.4%,约4000万人,达到了3亿3千800万人 (CNNIC2009年6月数据),通过手机连接到互联网也迅 速增加了32.1%。但从另一方面看,普及率仅为25.5%比 发达国家低(日本:73.8%),因此目前预计仍然能保持 这个速度增长
Era of Information 2009年上半年中国互联网用户,从年初算起的半年间增 长了13.4%,约4000万人,达到了3亿3千800万人 (CNNIC2009年6月数据),通 过手机连接到互联网也迅 速增加了32.1%。但从另一方面看,普及率仅为25.5%比 发达国家低(日本:73.8%),因此目前预计仍然能保持 这个速度增长
Web增长 178000000 一Hostnames 160200000 -Active 142400000 124600000 Exponential 106800000 Growth 89000000 71200000 53400000 35600000 17800000 0 图客雪含含醫宝居舍是餐筹影器器落器是昌美器气气黑 豆墨三量鱼量豆量豆量豆®豆型豆型豆國豆型豆型豆型豆翼 网站数目变化趋势
Web增长 网站数目变化趋势
Web的支撑技术 ■ 用超文本技术(HTML) 实现信息与信 息的连接 用统一资源定位技术(URI) 实现全球 信息的精确定位 ■ 用新的应用层协议(HTTP) 实现分布 式的信息共享。 ■ 这三个特点无一不与信息的分发、获 取和利用有关。Tim Berners-Lee说: "Web是一个抽象的(假想的)信息空 间。"也就是说,.作为Internet.上的一 种应用架构,Web的首要任务就是向 人们提供信息和信息服务
Web的支撑技术 ◼ 用超文本技术(HTML)实现信息与信 息的连接 ◼ 用统一资源定位技术(URI)实现全球 信息的精确定位 ◼ 用新的应用层协议(HTTP)实现分布 式的信息共享。 ◼ 这三个特点无一不与信息的分发、获 取和利用有关。Tim Berners-Lee说: "Web是一个抽象的(假想的)信息空 间。 "也就是说,作为Internet上的一 种应用架构,Web的首要任务就是向 人们提供信息和信息服务