5.3主成分分析 主成分分析(Principal Component Analysis.,PCA),亦称主元分析, 是一种旨在找出几个综合指标来代表原来众多特征,使这些综合指标尽可能地 反映原来变量的信息,而且彼此之间互不相关,从而达到简化目的的一种统计 分析方法,是一种有监督的分类技术。 其实质是一种利用成分变量进行“降维”的线性分析方法,旨在寻找最重要 的变量(对模式贡献最大的观测量)
5.3 主成分分析 主成分分析(Principal Component Analysis, PCA),亦称主元分析, 是一种旨在找出几个综合指标来代表原来众多特征,使这些综合指标尽可能地 反映原来变量的信息,而且彼此之间互不相关,从而达到简化目的的一种统计 分析方法,是一种有监督的分类技术。 其实质是一种利用成分变量进行“降维”的线性分析方法,旨在寻找最重要 的变量(对模式贡献最大的观测量)
5.3主成分分析 基本原理:假设是的数据矩阵,对应样本量,对应变量。对矩阵中的每个变 量进行标准化处理,分解成主成分子空间和残差子空间之和,如式(5.2)所 示 X=hp+tap+L +tpi+E=TP+E (5.2) T是主成分得分矩阵,14,上是主球分得分向量;P是成分载荷矩阵, P是协方差主成分特征向量,也称为载荷向量,提取变量间关联信息;TP称 为主成分空间(Principal Component Space,PCS),是X在主成分载荷向 量方向的投影;E为残差矩阵,也称为残差空间(Residual Space,RS),是 X在残差向量方向的投影,其提取随机噪声和模型误差信息
5.3 主成分分析 基本原理:假设是的数据矩阵,对应样本量,对应变量。对矩阵中的每个变 量进行标准化处理,分解成主成分子空间和残差子空间之和,如式(5.2)所 示: T是主成分得分矩阵, 是主成分得分向量;P是成分载荷矩阵, Pi是协方差主成分特征向量,也称为载荷向量,提取变量间关联信息;TPt称 为主成分空间(Principal Component Space, PCS),是X在主成分载荷向 量方向的投影;E为残差矩阵,也称为残差空间(Residual Space, RS),是 X在残差向量方向的投影,其提取随机噪声和模型误差信息。 1 2 1 2 , ,..., ( ... ) k k t t t t t t
5.3主成分分析 具体的PCA分析步骤如下: (1)第一步计算矩阵X的样本的协方差矩阵S; (2)第二步计算协方差矩阵S的特征向量e1,e2,e的特征值,i=1,2,N, 并组成特征向量空间: (3)第三步将样本投影数据到特征向量空间中,并判断出样本在特征空间的相 关属性
5.3 主成分分析 具体的 PCA 分析步骤如下 : (1) 第一步计算矩阵 X 的样本的协方差矩阵S ; (2) 第二步计算协方差矩阵S的特征向量e1 ,e2 ,…,ei的特征值, i = 1,2,…,N , 并组成特征向量空间; (3) 第三步将样本投影数据到特征向量空间中,并判断出样本在特征空间的相 关属性