信息检索与数据挖掘 2019/5/15 1 5月21日12:00前,提交文献阅读相关素材 6月3日12:00前,提交实验报告及相关素材 信息检索与数据挖掘 图像分类的算法思想 5月15日,第13章多媒体信息检索 5月20日,复习 5月22日,同学们文献阅读报告 5月27日,同学们文献阅读报告 6月3日,期末考试【暂定】
信息检索与数据挖掘 2019/5/15 1 信息检索与数据挖掘 图像分类的算法思想 5月15日,第13章 多媒体信息检索 5月20日,复习 5月22日,同学们文献阅读报告 5月27日,同学们文献阅读报告 6月3日,期末考试【暂定】 5月21日12:00前,提交文献阅读相关素材 6月3日12:00前,提交实验报告及相关素材
信息检索与数据挖掘 2019/5/15 3 引言:多媒体检索示例 微软识花:精细物体识别是怎么做到的 “微软识花 “app的开发是微软亚洲研究院和 微软亚洲研究院 2016年9月28日 中国科学院植物研究所多年来学术合作的成果。 中科院植物所不仅提供了260 万张花卉的识别图片,还提供 了经过专家鉴定的中国常见花 列表。而微软亚洲研究院的研 究员们利用先进的技术开发出 识别花卉的算法,并把识别结 果挑选出来,经植物所专家鉴 定。经过了两三次迭代的过程 ,才得到了最终训练机器识别 的样本集合。 http://www.msra.cn/zh-cn/news/features/flower-recognition-20160928.aspx
信息检索与数据挖掘 2019/5/15 3 引言:多媒体检索示例 微软识花:精细物体识别是怎么做到的 http://www.msra.cn/zh-cn/news/features/flower-recognition-20160928.aspx 微软亚洲研究院 2016年9月28日 “微软识花 “app的开发是微软亚洲研究院和 中国科学院植物研究所多年来学术合作的成果。 中科院植物所不仅提供了260 万张花卉的识别图片,还提供 了经过专家鉴定的中国常见花 列表。而微软亚洲研究院的研 究员们利用先进的技术开发出 识别花卉的算法,并把识别结 果挑选出来,经植物所专家鉴 定。经过了两三次迭代的过程 ,才得到了最终训练机器识别 的样本集合
信息检索与数据挖掘 2019/5/15 4 引言:从文本检索→图像检索 。Term→Feature:图像的表示? 原始查询 查询表示 文档表示 原始文档 相关度计算 ·Bag of Words→Bag of Features Object Bag-of-words
信息检索与数据挖掘 2019/5/15 4 引言:从文本检索图像检索 • TermFeature: 图像的表示? • Bag of Words Bag of Features
信息检索与数据挖掘 2019/5/15 5 词袋(Bag of words)模型 ·不考虑词在文档中出现的顺序 John is quicker than Mary Mary is quicker than John are的表示结果一样 ·在某种意思上说,这种表示方法是一种“倒退”, 因为位置索引中能够区分上述两篇文档 研表究明,汉字的亭顺并不 然而,词袋模 定一能景影阅响读,tt如当你 型是有效的! 看完这句话后,才发这现里 的字全是3乱的
信息检索与数据挖掘 2019/5/15 5 词袋(Bag of words)模型 • 不考虑词在文档中出现的顺序 • John is quicker than Mary 及 Mary is quicker than John are 的表示结果一样 • 在某种意思上说,这种表示方法是一种“倒退”, 因为位置索引中能够区分上述两篇文档 然而,词袋模 型是有效的!
信息检索与数据挖掘 2019/5/15 6 引言: 感知鸿沟(Sensory Gap)/语义鸿沟(Sematic Gap) (1)感知鸿沟是指真实世界的物体和从该物体场景对应的图像 中提取的描述信息之间的鸿沟; (2)语义鸿沟是指人们从视觉数据中所能提取到的信息和某个 用户在特定情况下对相同数据的描述缺乏一致性。 元数 纹理 颜色 机器 学习 据 最重要的 形状 相关 事实上的 视觉特征 反 工业标准 感知鸿沟 语义鸿沟 Saliency and Similarity Detection for Image Scene Analysis 清华大学博士论文《图像内容的显著性与相似性研究》,程明明,2012 http://mmcheng.net/
信息检索与数据挖掘 2019/5/15 6 引言: 感知鸿沟(Sensory Gap) /语义鸿沟(Sematic Gap) Saliency and Similarity Detection for Image Scene Analysis 清华大学博士论文《图像内容的显著性与相似性研究》,程明明,2012 http://mmcheng.net/ (1) 感知鸿沟是指真实世界的物体和从该物体场景对应的图像 中提取的描述信息之间的鸿沟; (2) 语义鸿沟是指人们从视觉数据中所能提取到的信息和某个 用户在特定情况下对相同数据的描述缺乏一致性