信息检索与数据挖掘 2019/2/26 26 1.1.1信息过载与大数据 信息过载, 如何解决?
信息检索与数据挖掘 2019/2/26 26 信息过载, 如何解决? 1.1.1 信息过载与大数据
信息检索与数据挖掘 2019/2/26 27 ·信息检索可以帮助人们从海量的数据中快速的找到 有用的信息 数据挖掘可以从大数据中提取出隐含的、先前未知 的并有潜在价值的信息 用户查询 000 8品品品品品 相关结果 IR系统
信息检索与数据挖掘 2019/2/26 27 用户查询 相关结果 IR系统 • 信息检索可以帮助人们从海量的数据中快速的找到 有用的信息 • 数据挖掘可以从大数据中提取出隐含的、先前未知 的并有潜在价值的信息
信息检索与数据挖掘 2019/2/26 28 1.1.2信息检索 。Information Retrieval这个术语产生于Calvin Mooers1948年在MTT的硕士论文。 ·Information Retrieval(IR):从大规模非结构化 数据(通常是文本)的集合(通常保存在计算机上) 中找出满足用户信息需求的资料(通常是文档)的 过程。 ·作为一门学科,是研究信息的获取 (acquisition)、表示(representation)、存储 (storage)、组织(organization).和访问(access) 的一门学问
信息检索与数据挖掘 2019/2/26 28 1.1.2 信息检索 • Information Retrieval这个术语产生于 Calvin Mooers 1948年在MIT的硕士论文。 • Information Retrieval(IR):从大规模非结构化 数据(通常是文本)的集合(通常保存在计算机上) 中找出满足用户信息需求的资料(通常是文档)的 过程。 • 作为一门学科,是研究信息的获取 (acquisition)、表示(representation)、存储 (storage)、组织(organization)和访问(access) 的一门学问
信息检索与数据挖掘 2019/2/26 29 1.1.2信息检索 ·信息检索可以看成计算机科学(Computer Science). 和图书情报学(Library&Info.Science)的交叉学 科。 ·以计算机为手段,处理信息对象和其他学科也融合: 语言学、认知科学 ·检索来自英文单词Retrieval,有些人把它翻译成获 取。其本义是“获得与输入要求相匹配的输出”。 注意:和我们平时所理解的搜索意义上的检索不一 样。(这里提醒一下:与Search的区别)
信息检索与数据挖掘 2019/2/26 29 • 信息检索可以看成计算机科学(Computer Science) 和图书情报学(Library & Info. Science)的交叉学 科。 • 以计算机为手段,处理信息对象和其他学科也融合: 语言学、认知科学 • 检索来自英文单词Retrieval,有些人把它翻译成获 取。其本义是“获得与输入要求相匹配的输出”。 • 注意:和我们平时所理解的搜索意义上的检索不一 样。(这里提醒一下:与Search的区别) 1.1.2 信息检索
信息检索与数据挖掘 2019/2/26 30 1.1.2信息检索 ·IR不仅仅是搜索,R系统也不仅仅是搜索引擎。 。例1:返回与信息检索相关的网页>搜索引擎(Search Engine,SE) ·例2:曾哥是狮子座的吗?>问答系统(Question Answering,QA) ·例3:返回Ipad的各种型号、配置、价格等>信息抽取 Information Extraction,IE) ·例4:使用Google Reader订阅新闻,并获取推荐>信息过 滤(Information Filtering)、信息推荐(Information Recommending)
信息检索与数据挖掘 2019/2/26 30 • IR不仅仅是搜索,IR系统也不仅仅是搜索引擎。 • 例1:返回与信息检索相关的网页 ->搜索引擎(Search Engine,SE) • 例2:曾哥是狮子座的吗?->问答系统(Question Answering,QA) • 例3:返回Ipad的各种型号、配置、价格等 ->信息抽取 Information Extraction, IE) • 例4:使用Google Reader订阅新闻,并获取推荐->信息过 滤(Information Filtering)、信息推荐(Information Recommending) 1.1.2 信息检索