GV万2v万:GpV 2V月 §74求出主因子解后的进一步分析 一、因子旋转 建立因子分析数学摸型的目的不仅要找出公共因子并对变量进行分组,史重婴的是要知 道每个公共因子的意义,以便对实际问题作出科学分析。不难理解,由(亿.3-3)出发解出的 因子负荷阵是不唯一的,事实上,用一个正交矩阵T右乘A: (ATXAT)=A(TT)A'=AA=R 即知A在正交变换T下也是因子负荷阵 为此,当A的结构不使对主因子进行解释时,我们根据因子负荷阵的不唯一性,可用 个正交阵右乘A(即对A实施一个正交变换)由线性代数的知识,对A施行一个正交变换,对 应坐标系就有一次施转。因此我们称这种变换A的方法为因子轴的旋转,我们的目的要使初 始因子负荷阵A经 一系列旋转后结构简化 即达到以下原则 1、每个公共因子只在少数几个测试变量上具有高负荷,其余负荷很小或至多中等大。 2、每个测试变量仅在一个公共因子上有较大负荷,而在其余公共因子上的负荷较小或 至名只中等大小, 可见,惊转的目的是使每一个测试矢量在新的华标轴上的射影尽可能向1和0两极分化 对因子负荷阵旋转的方法有多种,如正交旋转,斜交旋转等,这里只介绍常用的Kaiser提 出的方差极大正交旋转法(Varimax法),为说明该旋转法的原理 首先考虑P=2的情形。设因子负荷阵 A=an an 再按行计算公共度h=a1+a22i=l.,m 考虑到各个变量Z:的公度之间的差异所造成的不平衡,需对中元素作规格化处理,即 每行元素用每行的公共度除,为简便规格化后的A,仍记为A=(a,/h,)=(@) 取正交阵7-cos,-sinp 记B=(b,)=A7 sino,coso an coso+dizsino.-di sin+diz cosobb 则B= 。 a coso+a sin, -am sino+am2 cosob b2 为使B达到结构简化,就须使旋转后的因子负荷阵B的两列元素的平方值向0和1两极分化(即 两个公共因子对实测变量Z的贡献越分散越好,这实际上希望将变量乙,乙,.乙分成两组, 一组主要与第一主因子有关,另一组主要与第二主因子有关),因此要求
⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = m m pmp pp pp uu u uu u uu u A λλ λ λλ λ λλ λ o o o o o o o o o M MMMM M M 2211 122121 2 212111 1 §7.4 求出主因子解后的进一步分析 一、因子旋转 建立因子分析数学模型的目的不仅要找出公共因子并对变量进行分组,更重要的是要知 道每个公共因子的意义,以便对实际问题作出科学分析。不难理解,由(7.3-3)出发解出的 因子负荷阵是不唯一的,事实上,用一个正交矩阵 T 右乘 A: ′ = )())(( ′′ = ′ = RAAATTAATAT 即知 A 在正交变换 T 下也是因子负荷阵 为此,当 A 的结构不便对主因子进行解释时,我们根据因子负荷阵的不唯一性,可用一 个正交阵右乘 A(即对 A 实施一个正交变换)由线性代数的知识,对 A 施行一个正交变换,对 应坐标系就有一次施转。因此我们称这种变换 A 的方法为因子轴的旋转,我们的目的要使初 始因子负荷阵 A 经一系列旋转后结构简化,即达到以下原则: 1、每个公共因子只在少数几个测试变量上具有高负荷,其余负荷很小或至多中等大。 2、每个测试变量仅在一个公共因子上有较大负荷,而在其余公共因子上的负荷较小或 至多是中等大小。 可见,旋转的目的是使每一个测试矢量在新的坐标轴上的射影尽可能向 1和 0两极分化。 对因子负荷阵旋转的方法有多种,如正交旋转,斜交旋转等,这里只介绍常用的 Kaiser 提 出的方差极大正交旋转法(Varimax 法),为说明该旋转法的原理 首先考虑 P=2 的情形。设因子负荷阵 再按行计算公共度 ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = 2 22 12 1 21 11 amm a a a a a A LL iii ,1 miaah 2 2 2 1 2 =+= L 考虑到各个变量Zi的公度之间的差异所造成的不平衡,需对A中元素作规格化处理,即 每行元素用每行的公共度除,为简便规格化后的A,仍记为A= )()( ijiij = aha ′ Δ 取正交阵 记 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = ϕϕ ϕϕ cos,sin sin,cos T ij == ATbB Δ )( 则 ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ = ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ ′ + ′ − ′ + ′ ′ + ′ − ′ + ′ = Δ 1 2 11 12 1 2 1 2 11 12 11 12 cos ,sin sin cos cos sin,sin cos m m m m m bb m bb aa aa aa aa B M MMM ϕ ϕ ϕ ϕ ϕϕ ϕϕ 为使B达到结构简化,就须使旋转后的因子负荷阵B的两列元素的平方值向 0和 1两极分化(即 两个公共因子对实测变量Z的贡献越分散越好,这实际上希望将变量Z1,Z2,.Zm分成两组, 一组主要与第一主因子有关,另一组主要与第二主因子有关),因此要求
(6品,.b品,(6,.b品) 两组数据的(样本)方差和V,尽可能大,为此,正交旋转的角度p应满足使 +=V=max 即 r-立之r-(立1=mx (7.4-1) 由微积分求最值原理令小=0 do (:b,与p有关,故v与p有关) 可解出:g4p=。-a-bm d-2ablm 若记y,=(aa/h,)2-(a2/h)2 w,=2(aa/h,)(a2/h) =an-an =2anan 则a=立b=∑mc=2(-.d=22 根据g4p的表达式中分子、分母的符号确定口角的取值范围如下表: 分子符号 分母符号 40取值范用 p取值范围 + 0-8 2 84 π开 48 + -0 _π-0 8 一般地,如公共因子有P个,则需逐次对每两个公共因子进行上述旋转,实际上,当公共因 子P>2时,可以每次取两个,全部配对旋转,例如取F,,F两个主因子配对旋转时,正 交变换阵如教材P172.所示,这一旋转只是对规格化后的因子负荷阵A的第I列,g列两 列进行,其余的元素不变,此时,公式(7.4-1)中只须将b,换成b,b换成b,旋转角计算 式中出现a,a2之处政为a,a。即可,易理解,共需C=P+》次旋转,算是一轮
),(),( 2 2 2 12 2 1 2 11 L m Lbbbb m 两组数据的(样本)方差V1和V2尽可能大,为此,正交旋转的角度ϕ 应满足使 max 21 ==+ Δ VVV 即 max]) 1 ()( 1 [ 2 1 2 2 1 2 2 1 = − ∑∑∑ = == = m i ij m i ij j b m b m V (7.4-1) 由微积分求最值原理 令 = 0 dϕ dv (∵bij与ϕ 有关,故V与ϕ 有关) 可解出: mbac mabd tg )( 2 4 22 −− − ϕ = 若记 2 2 2 1 )()( = iii − hahav ii i = 1 2 hahaw iiii )()(2 2 2 2 1 aa ii = ′ − ′ 2 aa ii 21 = ′ ′ 则 ∑∑∑ ∑ = = = = == =−= m i i ii m i i m i i m i i wvdwvcwbva 1 2 1 2 1 1 2),(., 根据tg4ϕ 的表达式中分子、分母的符号确定ϕ 角的取值范围如下表: 分子符号 分母符号 4ϕ 取值范围 ϕ 取值范围 + + 2 ~0 π 8 ~0 π + — π π ~ 2 4 ~ 8 π π — — 2 ~ π π −− 8 ~ 4 π π −− — + 0~ 2 π − 0~ 8 π − 一般地,如公共因子有P个,则需逐次对每两个公共因子进行上述旋转,实际上,当公共因 子P>2 时,可以每次取两个,全部配对旋转,例如取 , 两个主因子配对旋转时,正 交变换阵如教材P172 所示,这一旋转只是对规格化后的因子负荷阵A的第 列,g列两 列进行,其余的元素不变,此时,公式(7.4-1)中只须将 换成b Fl Fg l g T l bil iz, bii换成big,旋转角计算 式中出现 ai1 , ai2之处改为 ail , aig 即可,易理解,共需 2 )1( 2 + = pp Cp 次旋转,算是一轮