本讲主要内容聚类的经济学需求聚类算法与实现三聚类的金融案例
本讲主要内容 一 聚类的经济学需求 二 聚类算法与实现 三 聚类的金融案例
聚类的金融应用K-means01层次聚类02
聚类的金融应用 K-means 层次聚类 01 02
(1)K-means算法K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。目标函数为最小化:(,-c)J(C.C.....C.) =1(=I j=)
(1)K-means算法 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小, 将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离 尽量的大。 目标函数为最小化:
原理图a表达了初始的数据集(2维)。假设分组数k-2。在图b中,随机选择两个点,标记为红色“质心”和蓝色“质心”,然后分别求样本中所有点到这两个质心的距离,并标记每个样本的类别为和该样本距离最小的质心的类别,如图c所示:(a)(b)(c)
原理 图a表达了初始的数据集(2维)。假设分组数k=2。 在图b中,随机选择两个点,标记为红色“质心”和蓝色“质心” ,然后分 别求样本中所有点到这两个质心的距离,并标记每个样本的类别为和该样本 距离最小的质心的类别,如图c所示:
原理对我们红色和蓝色两组点分别求其新的质心,如图d所示。图e和图f不断迭代图c和图d的过程,即将所有点的类别标记为距离最近的质心的类别并求新的质心,直到分类不再改变。(d)(f)e
原理 对我们红色和蓝色两组点分别求其新的质心,如图d所示。 图e和图f不断迭代图c和图d的过程,即将所有点的类别标记为距离最近的质 心的类别并求新的质心,直到分类不再改变