第十一章因子分析 11.1主要功能 11.2实例操作 11.1主要功能 多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的 増加本来是为了使研究过程趋于完整,但反过来说,为使硏究结果清晰明了而一味增加观察 指标又让人陷入混乱不清。由于在实际工作中,指标间经常具备一定的相关性,故人们希望 用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分 析、对应分析、典型相关分析和因子分析等方法 调用 Data reduction菜单的 Factor过程命令项,可对多指标或多因素资料进行因子分 析。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关 比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因 为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子 反映原资料的大部分信息 返回目录返回主页 11.2实例操作 [例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为 Ⅺ1至Ⅺ7,请对该资料进行因子分析 3.76 3.66 0.54 28 3.74 4.78 9.84 12.66 1.79 9.03 7.08 2.59 11.76 4.54 6.22 5.51 3.98 6.92 2.40 3.27 0.62 0.44 3.36 7.63 4.76 8.39 8.74 7.00 3.31 11.68 3.53 1.12 9.64 9.49 1.03 13.57 13.13 2.35 9.87 9.17 7.12 9.72
第十一章 因子分析 11.1 主要功能 11.2 实例操作 11.1 主要功能 多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的 增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察 指标又让人陷入混乱不清。由于在实际工作中,指标间经常具备一定的相关性,故人们希望 用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分 析、对应分析、典型相关分析和因子分析等方法。 调用 Data Reduction 菜单的 Factor 过程命令项,可对多指标或多因素资料进行因子分 析。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关 比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因 为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子 反映原资料的大部分信息。 11.2 实例操作 [例 11-1]下表资料为 25 名健康人的 7 项生化检验结果,7 项生化检验指标依次命名为 X1 至 X7,请对该资料进行因子分析。 X1 X2 X3 X4 X5 X6 X7 3.76 8.59 6.22 7.57 9.03 5.51 3.27 8.74 9.64 9.73 8.59 7.12 3.66 4.99 6.14 7.28 7.08 3.98 0.62 7.00 9.49 1.33 2.98 5.49 0.54 1.34 4.52 7.07 2.59 1.30 0.44 3.31 1.03 1.00 1.17 3.68 5.28 10.02 9.84 12.66 11.76 6.92 3.36 11.68 13.57 9.87 9.17 9.72 9.77 7.50 2.17 1.79 4.54 5.33 7.63 3.53 13.13 9.87 7.85 2.64 13.74 10.16 2.73 2.10 6.22 7.30 4.76 18.52 11.06 9.91 3.43 3.55 4.78 2.13 1.09 0.82 1.28 2.40 8.39 1.12 2.35 3.70 2.62 1.19
5.98 2.76 5.51 1.34 1.2 5.81 4.57 2.09 1.66 1.61 1.57 2.80 1.78 7.50 3.72 5.90 5.76 1.55 8.84 5.40 12.67 1.97 9.84 9.27 1.51 13.60 9.02 5.24 8.39 4.92 10.05 3.96 9.06 1.43 6.68 16.18 9.4 7.3 12.00 11.58 2.42 9.55 4.25 11.74 2.77 2.10 1.05 4.94 4.52 4.50 8.07 1.79 4.66 1.29 8.21 3.08 2.42 9.10 3.75 3.10 1.72 9.41 6.44 5.11 12.50 2.45 0.91 11.2.1数据准备 激活数据管理窗口,定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入 相应数值,建立数据库,结果见图11.1。 图11.1原始数据的输入 11.2.2统计分析 激活 Statistics菜单选 Data reduction的 Factor.命令项,弹出 Factor Analysis 对话框(图11.2)在对话框左侧的变量列表中选变量X1至X7,点击>钮使之进入 Variables
4.69 5.51 1.66 5.90 9.84 8.39 4.94 7.23 9.46 9.55 4.94 8.21 9.41 3.01 1.34 1.61 5.76 9.27 4.92 4.38 2.30 7.31 5.35 4.52 3.08 6.44 2.17 1.27 1.57 1.55 1.51 2.54 1.03 1.77 1.04 4.25 4.50 2.42 5.11 5.98 5.81 2.80 8.84 13.60 10.05 6.68 7.79 12.00 11.74 8.07 9.10 12.50 2.76 4.57 1.78 5.40 9.02 3.96 6.49 4.39 11.58 2.77 1.79 3.75 2.45 5.38 2.09 7.50 12.67 5.24 9.06 5.37 16.18 3.51 2.10 4.66 3.10 2.01 3.43 3.72 1.97 1.75 1.43 2.81 2.27 2.42 1.05 1.29 1.72 0.91 11.2.1 数据准备 激活数据管理窗口,定义变量名:分别为 X1、X2、X3、X4、X5、X6、X7,按顺序输入 相应数值,建立数据库,结果见图 11.1。 图 11.1 原始数据的输入 11.2.2 统计分析 激活 Statistics 菜单选 Data Reduction 的 Factor...命令项,弹出 Factor Analysis 对话框(图11.2)。在对话框左侧的变量列表中选变量X1至X7,点击➢ 钮使之进入Variables 框
图11.2因子分析对话框 点击 Descriptives...钮,弹出 Factor Analysis: Descriptives对话框(图11.3) 在 Statistics中选 Univariate descriptives项要求输出各变量的均数与标准差,在 Correlation matrix栏内选 Coefficients项要求计算相关系数矩阵,并选 KMO and Bartlett' s test of sphericity项,要求对相关系数矩阵进行统计学检验。点击 Continue 钮返回 Factor Analysis对话框。 图11.3描述性指标选择对话框 点击 Extraction..钮,弹出 Factor Analysis: Extraction对话框(图11.4),系统 提供如下因子提取方法:
图 11.2 因子分析对话框 点击 Descriptives...钮,弹出 Factor Analysis:Descriptives 对话框(图 11.3), 在 Statistics 中选 Univariate descriptives 项要求输出各变量的均数与标准差,在 Correlation Matrix 栏内选 Coefficients 项要求计算相关系数矩阵,并选 KMO and Bartlett’s test of sphericity 项,要求对相关系数矩阵进行统计学检验。点击 Continue 钮返回 Factor Analysis 对话框。 图 11.3 描述性指标选择对话框 点击 Extraction...钮,弹出 Factor Analysis:Extraction 对话框(图 11.4),系统 提供如下因子提取方法:
图11.4因子提取方法选择对话框8ea5> Principal components:主成分分析法 Unweighted least squares:未加权最小平方法 Generalized least squares:综合最小平方法; Maximum likelihood:极大似然估计法 Principal axis factoring:主轴因子法; Alpha factoring:a因子法; factoring:多元回归法 本例选用 Principal components方法,之后点击 Continue钮返回 Factor Analysis 对话框 点击 Rotation.钮,弹出 Factor Analysis: Rotation对话框(图11.5),系统有5 种因子旋转方法可选: 图11.5因子旋转方法选择对话框 None:不作因子旋转; Varimax:正交旋转 Equamax:全体旋转,对变量和因子均作旋转; Quartimax:四分旋转,对变量作旋转 Direct oblimin:斜交旋转
图 11.4 因子提取方法选择对话框 8ea5 > Principal components:主成分分析法; Unweighted least squares:未加权最小平方法; Generalized least squares:综合最小平方法; Maximum likelihood:极大似然估计法; Principal axis factoring:主轴因子法; Alpha factoring:α因子法; Image factoring:多元回归法。 本例选用 Principal components 方法,之后点击 Continue 钮返回 Factor Analysis 对话框。 点击 Rotation...钮,弹出 Factor Analysis:Rotation 对话框(图 11.5),系统有 5 种因子旋转方法可选: 图 11.5 因子旋转方法选择对话框 None:不作因子旋转; Varimax:正交旋转; Equamax:全体旋转,对变量和因子均作旋转; Quartimax:四分旋转,对变量作旋转; Direct Oblimin:斜交旋转
旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击 Continue钮返回 Factor Analysis对话框。 点击 Scores.钮,弹出弹出 Factor Analysis: Scores对话框(图11.6),系统提供 3种估计因子得分系数的方法,本例选 Regression(回归因子得分),之后点击 Continue 钮返回 Factor Analysis对话框,再点击0K钮即完成分析 图11.6估计因子分方法对话框 112.3结果解释 在输出结果窗口中将看到如下统计数据: 系统首先输出各变量的均数(Mean)与标准差( Std dey),并显示共有25例观察单位 进入分析:接着输出相关系数矩阵( Correlation matrix),经 Bartlett检验表明: Bartlett 值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 Kaiser- Meyer- Olkin Measure of Sampling Adequacy是用于比较观测相关系数值与偏 相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。今KMO 值=0.32122,偏小,意味着因子分析的结果可能不能接受 Analysis number 1 Listwise deletion of cases with missing values Std dev Label 7.10000 2.32380 2.34880 1.66556 9.152403.01405 5.45840 3.27344 7.167204.55817 2.346001.6109 Number of cases Correlation matrix X5 1.00000
旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击 Continue 钮返回 Factor Analysis 对话框。 点击 Scores...钮,弹出弹出 Factor Analysis:Scores 对话框(图 11.6),系统提供 3 种估计因子得分系数的方法,本例选 Regression(回归因子得分),之后点击 Continue 钮返回 Factor Analysis 对话框,再点击 OK 钮即完成分析。 图 11.6 估计因子分方法对话框 11.2.3 结果解释 在输出结果窗口中将看到如下统计数据: 系统首先输出各变量的均数(Mean)与标准差(Std Dev),并显示共有 25 例观察单位 进入分析;接着输出相关系数矩阵(Correlation Matrix),经 Bartlett 检验表明:Bartlett 值 = 326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 Kaiser-Meyer-Olkin Measure of Sampling Adequacy 是用于比较观测相关系数值与偏 相关系数值的一个指标,其值愈逼近 1,表明对这些变量进行因子分析的效果愈好。今 KMO 值 = 0.32122,偏小,意味着因子分析的结果可能不能接受。 Analysis number 1 Listwise deletion of cases with missing values Mean Std Dev Label X1 7.10000 2.32380 X2 4.77320 2.41779 X3 2.34880 1.66556 X4 9.15240 3.01405 X5 5.45840 3.27344 X6 7.16720 4.55817 X7 2.34600 1.61091 Number of Cases = 25 Correlation Matrix: X1 X2 X3 X4 X5 X6 X7 X1 1.00000