00010例1.9020C001X:XX00+0P00XXT的特征根:=9,=4,,=1。X的奇异值:3,2,1X=UDVT001(0100其中U=D=diag(3,2,1)000006
6 , 0 0 0 9 0 0 4 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 9 0 0 4 0 0 1 0 0 0 , 0 0 0 0 0 0 0 3 0 0 2 0 0 1 0 0 X XX X X T , T 例1. XX 的特征根:1 9,2 4,3 1。X的奇异值: 3,2,1 T diag(3,2,1) 1 0 0 0 1 0 0 0 1 0 0 0 , 0 0 0 1 0 0 0 1 0 0 0 1 U V D X UDV 其中 , T T 1 v
XXT或XTX的最大特征根2,=9对应的特征向量.u,=(0,0,1,0)T:X的第3行最重要,(XXT)3,最大.V,=(0,00,1):X的第4列最重要,(XTX)44最大如下图,u,vT定位矩阵X的最重要的位置:(3,4)u类似地,第二大特征值4对应的u2=(0,1,0,0)T,V2=(0,0,1,0)Tu2Vz定位矩阵A的(2,3)位置,u,定位矩阵A的(1,2)
7 : (3 4) (0,0,0,1) 4 , ( ) (0,0,1,0) 3 ( ) 9 1 1 1 44 1 33 1 如下图, 定位矩阵 的最重要的位置 , : 的第 列最重要 最大 : 的第 行最重要, 最大 或 的最大特征根 对应的特征向量 X X X X X XX XX X X T T T T T T T u v v u T 1 v T v1 u1 定位矩阵 的( ,)位置, 定位矩阵 的(,) 类似地,第二大特征值 对应的 2 3 1 2 4 (0,1,0,0) , (0,0,1,0) , 2 2 3 3 2 2 A A T T T T u v u v u v
C0-000-1阶逼近:3u,vi000000002002阶逼近:3uvT+2uzv0030000001002:X3阶即为原数据:3uv,+2u,v+u,000500008
8 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 1 3 1 1 T 阶逼近: u v 0 0 0 0 0 0 0 3 0 0 2 0 0 0 0 0 2 3 1 1 2 2 2 T T 阶逼近: u v u v X 0 0 0 0 0 0 0 3 0 0 2 0 0 1 0 0 3 3 1 1 2 2 2 3 3 T T T 阶即为原数据: u v u v u v
矩阵分解和低秩逼近矩阵分解(matrixfactorization)将矩阵分解成两个或多个矩阵分解矩阵的乘积,在新的基下重新表示矩阵的行或列向量:X= CRT,C:列基,R:行基rank(X)≤knxpnxkkxpRTX二X矩阵分解有任意多种,我们可以构造如下:假设X=(x1,.,x),rank(X)≤k,假设c1,.,ck是c(X)的一组基(有穴余),C=(C1,,Ck),则存在t;ERk使得xi=Cti,X = (X1,..Xp) = (Ct,..,.Ctp) = C(t,..,tp) ≤ CRT其中RT=(t1,,tp)是k×p矩阵,R的列向量是X行空间的基。当k<rank(X)时,CRT是X的秩k逼近(lowrankapproximation)9
9 矩阵分解(matrix factorization)将矩阵分解成两个或多个 矩阵的乘积,在新的基下重新表示矩阵的行或列向量: 𝑋 = 𝐶 𝑅 ⊤ , 𝐶:列基, 𝑅:行基 矩阵分解和低秩逼近 𝑛 × 𝑝 𝑛 × 𝑘 𝑘 × 𝑝 𝑋 𝐶 𝑅 ⊤ = 矩阵分解 矩阵分解有任意多种,我们可以构造如下: 假设𝑋 = 𝐱1, . , 𝐱𝑝 , 𝑟𝑎𝑛𝑘(𝑋) ≤ 𝑘, 假设𝐜1, . , 𝐜𝑘是𝐶(𝑋)的一组 基(有冗余),C = (𝐜1, . , 𝐜𝑘), 则存在𝐭𝑖 ∈ 𝑅 𝑘使得𝐱𝑖 = 𝐶𝐭𝑖, 𝑋 = 𝐱1, . , 𝐱𝑝 = 𝐶𝐭1, . , 𝐶𝐭𝑝 = 𝐶 𝐭1, . ,𝐭𝑝 ≜ 𝐶𝑅 ⊤ 其中𝑅 ⊤ = 𝐭1, . ,𝐭𝑝 是𝑘 × 𝑝矩阵,𝑅的列向量是𝑋行空间的基。 𝑟𝑎𝑛𝑘(𝑋) ≤ 𝑘 当 𝑘 < rank(𝑋) 时, 𝐶𝑅 ⊤是𝑋的秩𝑘逼近(low rank approximation)
由上页讨论知,矩阵分解X=CRT将X的列向量表示成C的列基X=CRT列向量的组合,同理,X的行向量表示为R的行向量的线性行基组合,因此我们称C的列为列空间的基(虽然它们可能有穴余),R的列为行空间的基。例1(PCA)假设Xnxp已中心化,样本协方差矩阵S=XTX/(n一1)的谱分解S=VAVT,主成分矩阵Y=XV,则有矩阵分解(主成分变换的反变换):X =YVT注意到Y是列正交的,即YTY=VTXTXV=n-1)AD2,因此矩阵分解X三YVT的行基和列基都是正交基-这很难得,我们有理由相信该分解一定具有某些优良性质。令U=YD-1,则UTU=Ip, X = YVT = UDVT这正是中心化矩阵X的SVD,U或者Y=UD的列向量是列空间C(X)的正交基,V或者VD的列向量是行空间C(XT)的正交基。我们后面将看到SVD/PCA在LS意义上具有优良逼近性质。10
10 由上页讨论知,矩阵分解𝑋 = 𝐶 𝑅 ⊤将𝑋的列向量表示成𝐶的 列向量的组合,同理,𝑋的行向量表示为𝑅 ⊤的行向量的线性 组合,因此我们称𝐶的列为列空间的基(虽然它们可能有冗 余),𝑅的列为行空间的基。 列基 𝑋 = 𝐶 𝑅 ⊤ 行基 例1(PCA)假设𝑋𝑛×𝑝已中心化, 样本协方差矩阵 𝑆 = 𝑋 ⊤𝑋/(𝑛 − 1)的谱分解𝑆 = 𝑉Λ𝑉 ⊤ , 主成分矩阵𝑌 = 𝑋𝑉, 则有矩阵分解(主 成分变换的反变换): 𝑋 = 𝑌𝑉 ⊤ 注意到𝑌是列正交的,即 𝑌 ⊤𝑌 = 𝑉 ⊤ 𝑋 ⊤𝑋𝑉 = 𝑛 − 1 Λ ≜ 𝐷 2 , 因 此矩阵分解𝑋 = 𝑌𝑉 ⊤的行基和列基都是正交基 – 这很难得,我 们有理由相信该分解一定具有某些优良性质。 令𝑈 = 𝑌𝐷 −1 , 则 𝑈 ⊤𝑈 = 𝐼𝑝, ⇒ 𝑋 = 𝑌𝑉 ⊤ = 𝑈𝐷𝑉 ⊤, 这正是中心化矩阵𝑋的SVD, 𝑈或者𝑌 = 𝑈𝐷的列向量是列空间𝐶(𝑋) 的正交基,𝑉或者𝑉𝐷的列向量是行空间𝐶( 𝑋 ⊤)的正交基。 我们后面将看到SVD/PCA在LS意义上具有优良逼近性质