满足如下的条件: 1、每个主成分的系数平方和为1。即 2+12+…+tl2=1 2、主成分之间相互独立,即无重叠的信息。即 Cov(F,F)=0,i≠j,i,j=1,2,…,p 3、主成分的方差依次递减,重要性依次递减,即 ar(F≥Var(F2)≥…≥am(F) F1、F2.…Fp分别称为原变量的第一、第二…第p个主成分 2021/2/22
2021/2/22 11 cxt ❖ 满足如下的条件: 1、每个主成分的系数平方和为1。即 2、主成分之间相互独立,即无重叠的信息。即 3、主成分的方差依次递减,重要性依次递减,即 F1、F2….Fp分别称为原变量的第一、第二….第p个主成分。 1 2 2 2 2 u1i + u i ++ upi = Cov(Fi,Fj)= 0,i j,i,j =1, 2,,p ( ) ( ) Var(F1)Var F2 Var F p
5.2数学模型与几何解释-几何解释 令为了方便,我们在二维空间中讨论主成分的几 何意义 设有n个样品,每个样品有两个观测变量X和2 在由变量x和ⅹ2所确定的二维平面中,n个样本 点所散布的情况如榍圆状。由图可以看出这n个 样本点无论是沿着x轴方向或x2轴方向都具有 较大的离散性,其离散的程度可以分别用观测 变量X的方差和X2的方差定量地表示。显然 如果只考虑X和X2中的任何一个,那么包含在 原始数据中的经济信息将会有较大的损失。 2021/2/22 cxt
2021/2/22 12 cxt 5.2 数学模型与几何解释-几何解释 ❖ 为了方便,我们在二维空间中讨论主成分的几 何意义: 设有n个样品,每个样品有两个观测变量xl和x2, 在由变量xl和x2 所确定的二维平面中,n个样本 点所散布的情况如椭圆状。由图可以看出这n个 样本点无论是沿着xl 轴方向或x2轴方向都具有 较大的离散性,其离散的程度可以分别用观测 变量xl 的方差和x2 的方差定量地表示。显然, 如果只考虑xl和x2 中的任何一个,那么包含在 原始数据中的经济信息将会有较大的损失
◇如果我们将Ⅺ轴和x2轴先平移,再同时按逆 时针方向旋转0角度,得到新坐标轴F和F2。 F|和F2是两个新变量。 2021/2/22 13 cxt
2021/2/22 13 cxt ❖ 如果我们将xl 轴和x2轴先平移,再同时按逆 时针方向旋转角度,得到新坐标轴Fl和F2。 Fl和F2是两个新变量
平移、转坐标轴 F F 2021/2/22 cxt
2021/2/22 14 cxt 平移、旋转坐标轴 • 1 x F2 • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • F1 2 x
平移、转坐标轴 x F 4 2021/2/22 三15 cxt
2021/2/22 15 cxt • 2 x 1 x F1 F2 • • •• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • 平移、旋转坐标轴