聚类算法 朱钦圣
聚类算法 朱钦圣
目录 1、聚类算法简介 2、K-means?算法 3、DBSCAN:算法 4、层次聚类算法
1、聚类算法简介 2、K-means算法 3、DBSCAN算法 4、层次聚类算法 目录
聚类算法简介 1 简单介绍聚类算法
聚类算法简介 1 简单介绍聚类算法
聚类算法简介 定义 定义(wiki) 聚类就是按照某个特定标准(如距离 Cluster analysis is the task of 准则)把一个数据集分割成不同的类 grouping a set of objects in such a 或簇,使得同一个簇内的数据对象 way that objects in the same 的相似性尽可能大,同时不在同一 group(called a cluster)are more 个簇中的数据对象的差异性也尽可 similar (in some sense)to each 能地大。 other than to those in other groups(clusters)
聚类算法简介 定义(wiki) Cluster analysis is the task of grouping a set of objects in such a way that objects in the same group (called a cluster) are more similar (in some sense) to each other than to those in other groups (clusters) 定义 聚类就是按照某个特定标准(如距离 准则)把一个数据集分割成不同的类 或簇,使得同一个簇内的数据对象 的相似性尽可能大,同时不在同一 个簇中的数据对象的差异性也尽可 能地大
聚类任务 聚类目标:将数据集中的样本划分为若干个通常不 相交的子集("簇”,cluster). 聚类既可以作为一个单独过程(用于找寻数据内在 的分布结构),也可作为分类等其他学习任务的前 驱过程
聚类任务 聚类目标:将数据集中的样本划分为若干个通常不 相交的子集(“簇” ,cluster). 聚类既可以作为一个单独过程(用于找寻数据内在 的分布结构),也可作为分类等其他学习任务的前 驱过程