聚类分析
聚类分析
什么是聚类分析? 聚类(簇):数据对象的集合 a在同一个聚类(簇)中的对象彼此相似 口不同簇中的对象则相异 聚类分析 a将物理或抽象对象的集合分组成为由类似的对象组成的多个 类的过程 聚类是一种无指导的学习:没有预定义的类编号 ■聚类分析的数据挖掘功能 ¤作为一个独立的工具来获得数据分布的情况 口作为其他算法(如:特征和分类)的预处理步骤
什么是聚类分析? ◼ 聚类(簇):数据对象的集合 ❑ 在同一个聚类(簇)中的对象彼此相似 ❑ 不同簇中的对象则相异 ◼ 聚类分析 ❑ 将物理或抽象对象的集合分组成为由类似的对象组成的多个 类的过程 ◼ 聚类是一种无指导的学习:没有预定义的类编号 ◼ 聚类分析的数据挖掘功能 ❑ 作为一个独立的工具来获得数据分布的情况 ❑ 作为其他算法(如:特征和分类)的预处理步骤
聚类分析的典型应用 模式识另 空间数据分析 a在G|S系统中,对相似区域进行聚类,产生主题地图 ¤检测空间聚类,并给出它们在空间数据挖掘中的解释 口图像处理 经济学(尤其是市场研究) 万维网 口对WEB上的文档进行分类 口劝WEB日志的数据进行聚类,以发现相同的用户访问模式
聚类分析的典型应用 ◼ 模式识别 ◼ 空间数据分析 ❑ 在GIS系统中,对相似区域进行聚类,产生主题地图 ❑ 检测空间聚类,并给出它们在空间数据挖掘中的解释 ❑ 图像处理 ◼ 经济学(尤其是市场研究) ◼ 万维网 ❑ 对WEB上的文档进行分类 ❑ 对WEB日志的数据进行聚类,以发现相同的用户访问模式
聚类分析应用实例 ■市场营销:帮市场分析人员从客户基本库中发现不同 的客户群,从而可以对不同的客户群采用不同的营销 策略 土地使用:在地球监测数据库中,发现相同的土地使 用区域 保险业:发现汽车保险中索赔率较髙的客户群 ■城市规划:根据房子的类型、价值和地理位置对其进 行分组 地震研究:将观测到的震中点沿板块断裂带进行聚类, 得出地震高危区
聚类分析应用实例 ◼ 市场营销:帮市场分析人员从客户基本库中发现不同 的客户群,从而可以对不同的客户群采用不同的营销 策略 ◼ 土地使用:在地球监测数据库中,发现相同的土地使 用区域 ◼ 保险业:发现汽车保险中索赔率较高的客户群 ◼ 城市规划:根据房子的类型、价值和地理位置对其进 行分组 ◼ 地震研究:将观测到的震中点沿板块断裂带进行聚类, 得出地震高危区
什么是好的聚类分析? 个好的聚类分析方法会产生高质量的聚类 a高类内相似度 a低类间相似度 作为统计学的一个分支,聚类分析的研究主要 是基于距离的聚类;一个高质量的聚类分析结 果,将取决于所使用的聚类方法 a聚类方法的所使用的相似性度量和方法的实施 ¤方法发现隐藏模式的能力
什么是好的聚类分析? ◼ 一个好的聚类分析方法会产生高质量的聚类 ❑ 高类内相似度 ❑ 低类间相似度 ◼ 作为统计学的一个分支,聚类分析的研究主要 是基于距离的聚类;一个高质量的聚类分析结 果,将取决于所使用的聚类方法 ❑ 聚类方法的所使用的相似性度量和方法的实施 ❑ 方法发现隐藏模式的能力