聚类分析方法基于划分的聚类算法基于层次的聚类算法对散点进行聚类,挑选几个点作为初始中心平衡迭代削减聚类法:构建聚类特征树,利点,根据一定规则选代重置聚类中心点:适用树结构快速聚类用于小规模数据K-means:计算样本点与类簇质心的距离基于层次的聚类算法与类簇质心相近的样本点划分为同一类簇通过样本间的距离来衡量相似度该算法能够用于挖掘任意形状的簇,并且能有效过滤掉噪声样本对于聚类结果的影响。K质心选择原有样本中的样本点作为代表对象来代表这个簇,计算剩下的样本点与代表DBSCAN:将具有足够密度的区域划分为对象的距离将样本点划分到与其距离最近并在具有噪声的空间数据库中发现任意形状的代表对象所在的族中。的族,将族定义为密度相连的点的最大集合
聚类分析方法 基于划分的聚类算法 • 对散点进行聚类,挑选几个点作为初始中心 点,根据一定规则迭代重置聚类中心点;适 用于小规模数据。 • K-means:计算样本点与类簇质心的距离, 与类簇质心相近的样本点划分为同一类簇, 通过样本间的距离来衡量相似度。 • K质心:选择原有样本中的样本点作为代表对 象来代表这个簇,计算剩下的样本点与代表 对象的距离,将样本点划分到与其距离最近 的代表对象所在的簇中。 基于层次的聚类算法 • 平衡迭代削减聚类法:构建聚类特征树,利 用树结构快速聚类。 基于层次的聚类算法 • 该算法能够用于挖掘任意形状的簇,并且能 有效过滤掉噪声样本对于聚类结果的影响。 • DBSCAN:将具有足够密度的区域划分为簇, 并在具有噪声的空间数据库中发现任意形状 的簇,将簇定义为密度相连的点的最大集合
聚类分析方法商业领域面向客户确定客户群·描绘客户特征·定制化客户管理其他领域。动植物聚类、基因聚类,获取对种群固有结构的认识压缩图片、影像,修复文档
聚类分析方法 商业领域——面向客户 • 确定客户群 • 描绘客户特征 • 定制化客户管理 其他领域 • 动植物聚类、基因聚类,获取对种群固有结构的认识 • 压缩图片、影像,修复文档
聚类的金融应用场景股票投资策略分析金融机构资产配置精准营销策略制定股票内在价值V业务收益V客户基本特征√投资策略业务条线偏好V消费习惯投资风险等√平均期限等V风险偏好等
股票投资策略分析 ✓ 股票内在价值 ✓ 投资策略 ✓ 投资风险等 聚类的金融应用场景 金融机构资产配置 ✓ 业务收益 ✓ 业务条线偏好 ✓ 平均期限等 精准营销策略制定 ✓ 客户基本特征 ✓ 消费习惯 ✓ 风险偏好等
02聚类的原理与算法
02 聚类的原理与算法
聚类的原理与算法K均值系列算法K-means·K质心层次聚类算法平衡迭代削减聚类法95667平衡迭代削减聚类法69.77.2基于密度的聚类算法DBSCAN算法
聚类的原理与算法 K均值系列算法 • K-means • K质心 层次聚类算法 • 平衡迭代削减聚类法 • 平衡迭代削减聚类法 基于密度的聚类算法 • DBSCAN算法