◆一、间隔尺度变量的相似性度量 令1、距离 设有n个样本单位,每个样本测有p个指标 (变量),原始资料阵为 12 P 21 P 2021/2/22 16 cxt
2021/2/22 16 cxt ❖ 一、间隔尺度变量的相似性度量 ❖ 1、距离 设有n个样本单位,每个样本测有p个指标 (变量),原始资料阵为: = n n n p p p x x x x x x x x x X 1 2 2 1 2 2 2 1 1 1 2 1
口每个样本都可以看成p维空间中的一点,n个 样本就是p维空间中的n个点。 口第个样本与第个样本之间的距离记为d 口聚类过程中,相距较近的点归为一类,相距 较远的点归为不同的类。 2021/2/22 cxt
2021/2/22 17 cxt 每个样本都可以看成p维空间中的一点,n个 样本就是p维空间中的n个点。 第i个样本与第j个样本之间的距离记为 聚类过程中,相距较近的点归为一类,相距 较远的点归为不同的类。 dij
☆第个和第个样品之间的距离如下四个条件 d120对一切的和成立; d=0当且仅当=成立 d=dn对一切的成立 d≤dk+d对于一切的i和成立 2021/2/22 18 cxt
2021/2/22 18 cxt ❖ 第i个和第j个样品之间的距离 如下四个条件: 0 ; ij d i j 对一切的 和 成立 0 ; ij d i j = = 当且仅当 成立 ; ij ji d d i j = 对一切的 和 成立 . ij ik kj d d d i j + 对于一切的 和 成立 dij
◆常用距离: (1)、明考夫斯基距离( Minkowski distance) x, -xg kIik j 明氏距离有三种特殊飛式: (1a)、绝对距离( Block距离):当q=1时 ()=∑ 2021/2/22 19 cxt
2021/2/22 19 cxt ❖ 常用距离: (1)、明考夫斯基距离(Minkowski distance) 明氏距离有三种特殊形式: (1a)、绝对距离(Block距离):当q=1时 ( ) = = − p k ij ik jk d x x 1 1 g p k g ij ik jk d x x 1 1 ( | | ) = = −
(1b)欧氏距离( Euclidean distance)当 q=2时 k d1(2)=∑(xk-xk) k=1 (1c切比雪夫距离当时 d, (oo)=maxxi -Xk sk≤P 2021/2/22 20 cxt
2021/2/22 20 cxt (1b)欧氏距离(Euclidean distance):当 q=2时 (1c)切比雪夫距离:当 时 ( ) 2 1 1 2 2 ( ) = − = p k i j i k j k d x x i k j k k p i j d = x − x 1 ( ) max q =