(1)K均值系列算法:K-meansK-Means算法是计算样本点与类簇质心的距离聚类迭代过程与类簇质心相近的样本点划分为同一类簇。AAAAAA4家444BRA△4A4AAAAAAO吕D44VAAD对于给定的样本集,按A0A0A4ooA照样本之间的距离大小A00Ao+OO00Xao0Oo82%将样本集划分为K个簇o80福囍00...8..4g.5004让簇内的点尽量紧密的口aoa连在一起,而让簇间的距离尽量的大
(1)K均值系列算法:K-means • K-Means算法是计算样 本点与类簇质心的距离, 与类簇质心相近的样本 点划分为同一类簇。 • 对于给定的样本集,按 照样本之间的距离大小, 将样本集划分为K个簇。 让簇内的点尽量紧密的 连在一起,而让簇间的 距离尽量的大。 聚类迭代过程
步骤01020304选择若干个初始对剩余的每个样在所有样本点都划重复步骤(2)质心,初始质心随机本点计算它们到各个分完毕后,根据划分情和(3)直到质心不选择即可,每一个质质心的欧式距离,并况重新计算各个簇的质再发生变化。心为一个类。将其归入到相互间距心所在位置然后选代计算各个样本点到各簇离最小的质心所在的簇。计算各个新簇的质心的距离,对所有样质心。本点重新进行划分
步 骤 01 02 03 04 选择若干个初始 质心,初始质心随机 选择即可,每一个质 心为一个类。 对剩余的每个样 本点计算它们到各个 质心的欧式距离,并 将其归入到相互间距 离最小的质心所在的 簇。计算各个新簇的 质心。 在所有样本点都划 分完毕后,根据划分情 况重新计算各个簇的质 心所在位置,然后迭代 计算各个样本点到各簇 质心的距离,对所有样 本点重新进行划分。 重复步骤(2) 和(3)直到质心不 再发生变化