本科:Web信息检索 §4.1文本聚类 (Text Clustering) 徐悦牲Yueshen Xu) ysxu@xidian.edu.cn/xuyueshen@163.com 知识与数据工程研究中心 历毛子代牧大粤 XIDIAN UNIVERSITY
§4.1 文本聚类 (Text Clustering) 徐悦甡(Yueshen Xu) ysxu@xidian.edu.cn / xuyueshen@163.com 知识与数据工程研究中心 本科:Web信息检索
整体课程安排 历些毛子秋枚大学 XIDIAN UNIVERSITY 信息检索引擎 Google 含sK景同 查询 bing Query YAHOO! C0u9ou胸 中国雅虎 为了用户 Bal芯百度 /数据 S0S0搜搜 Sog9Lu搜狗 索引 聚类 倒排 分类 G中拽 有道y9udao 查询 推荐 爬虫 过滤 分布式 评估 相似性 为了系统 建模 /智能 排序 (Modeling) 2017/4/25 Ranking 软件工程系
2017/4/25 软件工程系 整体课程安排 查询 (Query) 建模 (Modeling) 排序 (Ranking) 信息检索引擎 为了用户 /数据 为了系统 /智能 索引 倒排 查询 爬虫 分布式 … 聚类 分类 推荐 过滤 评估 相似性
后续课程安排 历些毛子种枝大等 XIDIAN UNIVERSITY →计划 ▣文本聚类 问题背景→通用方法→针对文本的方法 口文本分类 口推荐系统 ■基于协同过滤的推荐方法 Query-free Information ■基于内容的推荐方法 Retrieval ■基于网络的推荐方法 口信息归纳与过滤 ■话题建模 ■垃圾信息过滤 口检索结果评估 2017/14/25 软件工程系
2017/4/25 软件工程系 后续课程安排 计划 文本聚类 文本分类 推荐系统 基于协同过滤的推荐方法 基于内容的推荐方法 基于网络的推荐方法 信息归纳与过滤 话题建模 垃圾信息过滤 检索结果评估 4 问题背景 通用方法 针对文本的方法 Query-free Information Retrieval
推荐教材 历忠毛子代枚大学 XIDIAN UNIVERSITY 口英文教材 Christopher D.Manning search prabhakar Raghavan C.D.Manning,P.Raghavan and H.Schuit Retrieval,Cambridge University Press,2008 to B.Croft,D.Metzler,T.Strohman.Search E Search Engines ion Practice,Addison-Wesley Information Retrievala 口中文教材 in Practice ■以上两本书的译版 口资源(公开课等) CE CRO 0 Chengxiang Zhai(顶级R学者,有幸在电梯 https://www.coursera.org/learn/text-retrieval C.D.Manning顶级NLP学者): http://web.stanford.edu/class/cs276/course_schedule.html R.J.Mooney(顶级NLP学者):htps:www.cs.utexas.edu/users/mooney/ 2017/14/25 软件工程系
2017/4/25 软件工程系 英文教材 C. D. Manning, P. Raghavan and H. Schütze. Introduction to Information Retrieval, Cambridge University Press, 2008 B. Croft, D. Metzler, T. Strohman. Search Engines: Information Retrieval in Practice, Addison-Wesley 中文教材 以上两本书的译版 资源(公开课等) Chengxiang Zhai (顶级IR学者,有幸在电梯里碰到过): https://www.coursera.org/learn/text-retrieval C.D. Manning (顶级NLP学者): http://web.stanford.edu/class/cs276/course_schedule.html R. J. Mooney(顶级NLP学者):https://www.cs.utexas.edu/users/mooney/ 推荐教材 5
推荐教材(续) 历些毛子种枝大学 XIDIAN UNIVERSITY ▣周边学科教材(中文) ■自然语言理解 >宗成庆.统计自然语言处理(第2版),清华大学出版社,2013 ■机器学习 >周志华.机器学习,清华大学出版社,2016 >李航.统计学习方法,清华大学出版社,2012 >j 刘铁岩.排序学习,课件 ■推荐系统 >项亮.推荐系统实践,人民邮电出版社,2012 >我自己主页上的课件与讲义 2017/14/25 软件工程系
2017/4/25 软件工程系 推荐教材(续) 周边学科教材(中文) 自然语言理解 ➢ 宗成庆. 统计自然语言处理(第2版), 清华大学出版社, 2013 机器学习 ➢ 周志华. 机器学习, 清华大学出版社,2016 ➢ 李航. 统计学习方法,清华大学出版社,2012 ➢ 刘铁岩. 排序学习,课件 推荐系统 ➢ 项亮. 推荐系统实践,人民邮电出版社,2012 ➢ 我自己主页上的课件与讲义 6