2.1主成分分析(PCA)PCA是principalcomponentanalysis的缩写,即主成分分析。此方法目标是找到数据中最主要的元素和结构,去除噪音和几余,将原有的复杂数据降维,揭露出隐藏在复杂数据背后的简单结构。主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化。这些综合指标就称为主成分,也就是说,对高维变量空间进行降维处理。从线性代数角度来看,PCA目标是找到一组新正交基去重新描述得到的数据空间,这个维度就是主元
2.1主成分分析(PCA) PCA是principal component analysis的缩写,即主成分分析。此方法目标是找到数 据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭露出隐 藏在复杂数据背后的简单结构。 主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表 进行最佳综合简化。这些综合指标就称为主成分,也就是说,对高维变量空间进 行降维处理。 从线性代数角度来看,PCA目标是找到一组新正交基去重新描述得到的数据空间, 这个维度就是主元
向量的表示及基变换A (3, 2)( )C)-()r(1,0)T +y(0, 1)T1/V21/V24/V26/V2)2/V2123延迟符号1/V21230-1/V200
向量的表示及基变换 A(3,2) 延迟符号
例题去中心化现在问题来了如果我们必须使用一维来表示这些数据,又希望尽量保留原始的信息,你要如何选择?
例题 去中心化 如果我们必须使用一维来表示这些数据, 又希望尽量保留原始的信息,你要如何 选择? 现在问题来了
》》》下面是三维空间中的一组数据Tu1XX2那么如何通过数学计算找出主轴的方向呢?
下面是三维空间中的一组数据 那么如何通过数学计算找出主轴的方向呢?
推导过程[21,22.,2n]1.给定一组数据2.将其中心化后表示为:(xx2...,x=(2-i22-i..,2n-23.中心化后的数据在第一主轴u方向上分布散的最开,也就是说在u方向上的投影的绝对值之和最大(也可以说方差最大),计算投影的方法就是将x与u,做内积,由于只需要求u的方向,所以设u,是单位向量。·也就是最大化下式:.=也即最大化:两个向量做内积可以转化成矩阵乘法x,ui = x u1E-(xu)T (xTu)Eniulxixui所以目标函数可以表示为:-Eni(x[u)2ul(EnxixDui
推导过程 0 1.给定一组数据: 2.将其中心化后表示为: 3.中心化后的数据在第一主轴u1方向上分布散的最开,也就是说在u1方向上的投影的绝对值之和最大 (也可以说方差最大),计算投影的方法就是将x与u1做内积,由于只需要求u1的方向,所以设u1是单 位向量。 也即最大化: 两个向量做内积可以转化成矩阵乘法: 所以目标函数可以表示为: 也就是最大化下式: