相似性的度量 1ATISTIG. (三 (变量相似系数的计算方法) ■在对变量进行分类时,度量变量之间的相似 性常用相似系数,测度方法有 夹角余弦 cos e x∑ ∑(x1-x)-y) Pearson相关系数 2x-x)(0-F 2008年月
12 - 18 统计学 STATISTICS (第三版) 2008年8月 ◼ 在对变量进行分类时,度量变量之间的相似 性常用相似系数,测度方法有 相似性的度量 (变量相似系数的计算方法) 夹角余弦 Pearson相关系数 = i i i i i i i xy x y x y 2 2 cos − − − − = i i i i i i i xy x x y y x x y y r 2 2 ( ) ( ) ( )( )
第12章聚类分析 122层次聚类 122.1层次聚类的两种方式 122.2类间距离的计算方法 122.3层次聚类的应用
12.2 层次聚类 12.2.1 层次聚类的两种方式 12.2.2 类间距离的计算方法 12.2.3 层次聚类的应用 第 12 章 聚类分析
12.2层次聚类 1221层次聚类的两种方式
12.2.1 层次聚类的两种方式 12.2 层次聚类
层次聚类 1ATISTIG. (三 (hierarchical cluster 层次聚类又称系统聚类 事先不确定要分多少类,而是先把每一个 对象作为一类,然后一层一层进行分类 根据运算的方向不同,层次聚类法又分为 合并法和分解法,两种方法的运算原理 样,只是方向相反 2008年月
12 - 21 统计学 STATISTICS (第三版) 2008年8月 ◼ 层次聚类又称系统聚类 ◼ 事先不确定要分多少类,而是先把每一个 对象作为一类,然后一层一层进行分类 ◼ 根据运算的方向不同,层次聚类法又分为 合并法和分解法,两种方法的运算原理一 样,只是方向相反 层次聚类 (hierarchical cluster)
层次聚类 1ATISTIG. (三 (合并法) ■将每一个样本作为一类,如果是k个样本就分k成类 按照某种方法度量样本之间的距离,并将距离最近 的两个样本合并为一个类别,从而形成了k-1个类别 ■再计算出新产生的类别与其他各类别之间的距离, 并将距离最近的两个类别合并为一类。这时,如果 类别的个数仍然大于1,则继续重复这一步,直到所 有的类别都合并成一类为止 总是先把离得最近的两个类进行合并 ●合并越晚的类,距离越远 °事先并不会指定最后要分成多少类,而是把所有可能的 分类都列出,再视具体情况选择一个合适的分类结果 2008年月
12 - 22 统计学 STATISTICS (第三版) 2008年8月 ◼ 将每一个样本作为一类,如果是k个样本就分k成类 ◼ 按照某种方法度量样本之间的距离,并将距离最近 的两个样本合并为一个类别,从而形成了k-1个类别 ◼ 再计算出新产生的类别与其他各类别之间的距离, 并将距离最近的两个类别合并为一类。这时,如果 类别的个数仍然大于1,则继续重复这一步,直到所 有的类别都合并成一类为止 ◼ 总是先把离得最近的两个类进行合并 ⚫ 合并越晚的类,距离越远 ⚫ 事先并不会指定最后要分成多少类,而是把所有可能的 分类都列出,再视具体情况选择一个合适的分类结果 层次聚类 (合并法)