当前位置：和泉文库 > 计算机 > 浏览文档

《数据把掘概念与技术》第六章(6-3) 凝聚层次聚类

一、在层次聚类分析中,输入中不指定要分成的类的个数。系统的输入为(X,s),系统的输出是类的层次。二、大多数层次聚类过程不是基于最优的思想, 而是通过反复的分区直至收敛,找出一些近似的、未达最优标准的解决方案。三、层次聚类算法分为:分裂算法和凝聚算法。

文件格式：PPT，文件大小：168KB，售价：7.86元

文档详细内容（约27页）

6.3凝聚层次聚类在层次聚类分析中,输入中不指定要分成的类的个数。系统的输入为(,s),系统的输出是类的层次 >大多数层次聚类过程不是基于最优的思想而是通过反复的分区直至收敛,找出一些近似的、未达最优标准的解决方案。层次聚类算法分为:分裂算法和凝聚算法

6.3 凝聚层次聚类 ➢ 在层次聚类分析中，输入中不指定要分成的类的个数。系统的输入为(X,s)，系统的输出是类的层次。 ➢ 大多数层次聚类过程不是基于最优的思想，而是通过反复的分区直至收敛，找出一些近似的、未达最优标准的解决方案。 ➢ 层次聚类算法分为：分裂算法和凝聚算法

分区算法从整个样本集开始,将它分成几个子集,然后把每个子集分成更小的集合,依次下去,最终,生成—个由粗略到精细的分区序列。 >凝聚算法首先把每一个对象当作一个初始类, 然后将这些类合并一个更粗略的分区,反复合并直至得到比较精细的分区,其过程是自底向上的过程,分区从精细到粗糙。 >凝聚算法又分为单链接和全链接算法,两者不同之处仅在于它们描述一对类的相似度的方法

➢ 分区算法从整个样本集开始，将它分成几个子集，然后把每个子集分成更小的集合，依次下去，最终，生成一个由粗略到精细的分区序列。 ➢ 凝聚算法首先把每一个对象当作一个初始类，然后将这些类合并一个更粗略的分区，反复合并直至得到比较精细的分区，其过程是自底向上的过程，分区从精细到粗糙。 ➢ 凝聚算法又分为单链接和全链接算法，两者不同之处仅在于它们描述一对类的相似度的方法

>单链接算法基于两类之间的距离是从两个类中抽取的两对样本(一个取自第一类,另个取自第二个)的距离中最小值。 >全链接算法基于两类间的距离是每对样本的距离中的最大值。 >下图为两种算法的图解说明。 + 类类2 类1 a)单链接距离 b)全链接距离图6-5对于单链接和全链接聚类算法的距离

➢ 单链接算法基于两类之间的距离是从两个类中抽取的两对样本(一个取自第一类，另一个取自第二个)的距离中最小值。 ➢ 全链接算法基于两类间的距离是每对样本的距离中的最大值。 ➢ 下图为两种算法的图解说明

凝聚聚类算法的基本步骤 1把每一个样本作为一个类,为所有不同的无序样本对的类间距离构造一个序列,然后按升序对这个序列进行排序。 2通过已排序的距离序列,对于每一个不同的阈值d形成一个样本图,图中将距离比dk 更近的各对样本合并成一个新的类。如果所有的样本都是这个图的元素则停止,否则,重复该步骤。 3这个算法的输出是一个嵌套层次图,可以用希望的相似水平去截取,在相应的子图中生成一个由简单联合标识的分区(类聚)

➢ 凝聚聚类算法的基本步骤： 1.把每一个样本作为一个类，为所有不同的无序样本对的类间距离构造一个序列，然后按升序对这个序列进行排序。 2.通过已排序的距离序列，对于每一个不同的阈值dk形成一个样本图，图中将距离比dk 更近的各对样本合并成一个新的类。如果所有的样本都是这个图的元素则停止，否则，重复该步骤。 3.这个算法的输出是一个嵌套层次图，可以用希望的相似水平去截取，在相应的子图中生成一个由简单联合标识的分区(类聚)

>例如:二维样本集共5个点X1,×2X32×4X5} 1=(0,2),x2=(0,0),x3=(1.5,0)x4=(5.0),×5=(5,2) 其图形化表示如下图图6-6聚类分析的5个二维样本

➢ 例如：二维样本集共5个点{x1 ,x2 ,x3 ,x4 ,x5 } x1=(0,2),x2=(0,0),x3=(1.5,0),x4=(5.0),x5=(5,2) 其图形化表示如下图：

点击进入文档下载页（PPT格式）

共27页，可试读9页，点击继续阅读 ↓↓

您可能感兴趣的文档

《数据把掘概念与技术》第六章（6-1）聚类概念
《数据把掘概念与技术》第八章(8-6) 多维关联规则挖掘
《数据把掘概念与技术》第八章(8-6) 多维关联规则挖掘
《数据把掘概念与技术》第八章（8-1）购物篮分析
《数据把掘概念与技术》第五章（5-5）方差分析
《数据把掘概念与技术》第五章（5-1）统计推断
《数据把掘概念与技术》第二章数据准备
《数据把掘概念与技术》第三章数据归约
《数据把掘概念与技术》第七章决策树和决策规则
《数据把掘概念与技术》第七章（7-4）修剪决策树
《数据把掘概念与技术》第一章数据挖掘的概念
《数据把掘概念与技术》第九章根据内容检索
《数据把掘概念与技术》第四章从数据中学习
万博科技职业学院：《Visual Basic程序设计》第一章概论
万博科技职业学院：《Visual Basic程序设计》第三章 BASIC语言基础
万博科技职业学院：《Visual Basic程序设计》第五章选择结构设计
万博科技职业学院：《Visual Basic程序设计》第四章程序的输入和输出
万博科技职业学院：《Visual Basic程序设计》第十章菜单和工具栏
万博科技职业学院：《Visual Basic程序设计》第八章过程一子程序和函数
万博科技职业学院：《Visual Basic程序设计》第六章循环程序结构
万博科技职业学院：《Visual Basic程序设计》第九章对话框
万博科技职业学院：《Visual Basic程序设计》第七章数组
万博科技职业学院：《Visual Basic程序设计》第十二章文件处理
万博科技职业学院：《Visual Basic程序设计》第十一章图形与图象设计

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录