南京大学:《信息与计算科学导论》课程教学资源(课件讲稿)集合与关系 Sets-and-Relations
文件格式: PDF大小: 5.16MB页数: 117
• Web采集 • 采集器 • 连接服务器 • 链接分析 • 锚文本 • 链接分析:Pagerank • 链接分析:HITS
文件格式: PDF大小: 2.15MB页数: 71
中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)数据挖掘经典算法概述
文件格式: PDF大小: 3.85MB页数: 120
•从文本分类图像分类 • 如何从图像中获取全局特征? • 颜色特征、纹理特征、形状特征 • 如何从图像中获取局部特征? • SIFT: Scale-invariant feature transform •图像分类的几个发展阶段 • Low-level Modelling • Semantic Modelling • Sparse Coding • Deep Learning
文件格式: PDF大小: 7.28MB页数: 85
• 聚类概述 • 什么是聚类?在IR中如何用聚类?聚类的几个术语 • K-均值聚类算法 • K-均值聚类中的基本准则 • K-均值算法中簇的个数 • 聚类评价 • purity、NMI(Normalized Mutual Information,)、RI(Rand Index)、F measure • 基于模型的聚类 • 层次聚类简介 • 层次聚类的簇相似度计算 • 四种HAC算法:单连接、全连接 、组平均、质心法
文件格式: PDF大小: 3.13MB页数: 77
• 什么是Graphical Model • 定义、示例 • Representation、Inference、Learning • 主题模型与分类 • LSA (Latent Semantic Analysis), 1990 • pLSA (probabilistic Latent Semantic Analysis), 1999 • LDA(Latent Dirichlet Allocation), 2003 • Hierarchical Bayesian model • 主题模型的R语言实现示例
文件格式: PDF大小: 3.65MB页数: 73
• 支持向量机 • 二元线性SVM • SVM用于非线性分类 • 机器学习方法 • 人工神经网络(Artificial Neural Network, ANN) • 深度学习(Deep Learning)现状 • 经典的深度学习模型/算法 • 卷积神经网络 Convolutional Neural Networks (CNN) • 多层反馈网络 Recurrent neural Network(RNN) • 自动编码器 AutoEncoder • 受限玻尔兹曼机 Restricted Boltzmann Machine, RBM • 深度置信网络 (Deep Belief Nets,DBN)
文件格式: PDF大小: 5.63MB页数: 100
中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第10章 文本分类(基于向量空间的文本分类)
文件格式: PDF大小: 1.94MB页数: 52
中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第10章 文本分类(文本分类及朴素贝叶斯方法)
文件格式: PDF大小: 3.26MB页数: 62