第十九章 聚类分析 Clustering Analysis
Clustering Analysis 第十九章 聚 类 分 析
判别分析:已知分为若干类的前提下,判 定观察对象的归属。 聚类分析:不知道应分多少类的情况下, 进行探索性分析,对观察对象 依据某些数量特征适当分类。 1指标聚类(R型聚类) 2样品聚类(Q型聚类)
判别分析:已知分为若干类的前提下,判 定观察对象的归属。 聚类分析:不知道应分多少类的情况下, 进行探索性分析,对观察对象 依据某些数量特征适当分类。 1.指标聚类(R型聚类) 2.样品聚类(Q型聚类)
第一节相似条数 聚类分析的关键是如何定义类间的 相似性,如何把相似性数量化
第一节 相似系数 聚类分析的关键是如何定义类间的 相似性,如何把相似性数量化
相似糸数 1.指标聚类: 简单相关系数(定量) EX XiX:-X ∑ XiX.-X 列联系数(定性): C R×C表 Pearson2 X tn 0<C<1
相似系数 1.指标聚类: 简单相关系数(定量): 2 j j 2 i i j j i i ij X X X X X X X X r n C 2 2 列联系数(定性): R×C表Pearson2 0<C<1
相似糸数 2样品聚类: 将n例样品看成是m维空间的n个点,用两 点间距离定义相似系数。 (1)欧氏距离( Euclidean distance) d=E(x-x
2.样品聚类: 将n例样品看成是m维空间的n个点,用两 点间距离定义相似系数。 (1)欧氏距离(Euclidean distance) 2 dij Xi Xj 相似系数