最大似然估计的拟合函数F乘以(n-1),其中n代表样本规模,便能得到一个 自由度为[(12)(p+q)(p+q+1)一k]的卡方统计检验值,其自由度实际 上是数据点总数[(12)(p+q)(p+q+1)]与模型自由参数数目(k)之差。 广义最小二乘法程序需要使用一个权数矩阵,比如S1,即样本方差协方差 矩阵的逆矩阵。广义最小二乘法程序产生的估计与最大似然估计非常接近,也有 同样可取的统计性质。 使用最大似然法和广义最小二乘法进行模型估计,需要假设观测变量为连续 性的变量,且具有多元正态分布( multivariate normal distribution)。即使是在大 样本时,观測变量的偏态性( nonnormality),尤其是在很高峰度( kurtosis)的 情况下,会导致很差的估计及其不正确的标准误( standard error)和偏高的卡方 值 因此,偏态分布或过高的峰度会威胁最大似然估计和最小二乘法估计的统计 检验。对于这个问题,可以釆取以下几种弥补措施。第一,考虑对偏态分布的变 量进行转换,使其近似于多元正态分布,或者设法减小过高的峰度。第二,将那 些离异值( outliers)从数据中删除。第三,可以应用自助再抽样( bootstrap re sampling)来估计参数估计的方差以进行显著性检验。最后,还有一种办法是取 得一个能够允许偏态性( nonnormality)且渐近有效( asymptotically efficient)的 替换估计。加权最小二乘法( weighted least squares,标志为wLS)估计就是这 样一种方法。1984年布朗( Browne)研制了一种“渐近性分布无干扰”( asymp- totically distribution frec,记为ADF)的估计方法,它不要求观测变量有多元变化 正态性。类似于广义最小二乘法,这种方法是加权最小二乘法。然而,在加权最 小乘法中使用的权数矩阵W,是S的渐近方差协方差矩阵的一致性估计 (consistent estimate of the asymptotic variance/covariance matrix of the sample vari ance/ covariance matriⅸx,S)。只要加杈矩阵能够反映该相关矩阵的渐近方差协方 差,加权最小二乘法还可以用来分析样本的相关矩阵( correlation matrix):加权 最小二乘法的缺点是运算费时且需较大的样本规模。 五、模型评价 LⅠSRL程序的首要任务是用样本数据对所设定的模型参数进行估计,再根 据这些参数估计来重建( reproduce)方差协方差,然后尽可能地将重建的(或称 引申的)方差协方差矩阵(用∑或SGMA表示)与观察方差协方差矩阵S相 匹配,引申的方差协方差矩阵匹配观察方差协方差矩阵的程度决定了结构方程模
型拟合样本数据的程度。当模型重建的方差协方差矩阵非常接近于观测的方差协 方差矩阵时,残差矩阵各元素就接近于0,这样,就可以认为模型拟合数据了。 关于模型的总体拟合程度有许多测量标准。最常用的拟合指标是拟合优度的 卡方检验(x2 goodness-of-fit test)。这个卡方值可以从拟合函数值直接推导出来, 它是拟合函数值与样本规模减1的乘积,其公式为 x2=(n-1)F 其中F是拟合函数。如果数据按多元正态分布且设定模型正确的话,这个 乘积则按卡方分布。注意,它的检验正好与传统的统计检验相反。我们希望得到 的是不显著的卡方值。换句话说,卡方值应该对应其自由度相对很小。事实上 卡方检验在这里是“拟合劣度”( badness of fit的测量,因为很小的卡方值说明 拟合很好,而很大的卡方值却说明拟合不好(既引申的方差协方差矩阵与观察方 差协方差矩阵差别太大)。当卡方值为0时,即残差矩阵的所有元素都是0,标 志着模型对数据的完美拟合。这种情况只有在恰好识别模型( just identified mod el)中才会出现。 尽管卡方检验提供模型在统计上是否成功的信息,但卡方值与样本规模相关 联,因而,它常常不能很好地判定模型的拟合。由于卡方值是(n-1)乘以拟 合函数的最小值F的积①,因此样本越大,卡方值也就越大。所以,即使观测的 与模型引申的方差协方差矩阵之间的差别其实不大,拒绝一个模型的概率会随着 样本规模增加而增加。为减小样本规模对拟合检验的影响,有一个直接与卡方相 联系的粗略常规( rough rule of thumb),既如果卡方值与自由度之比小于2,则 可以认为模型拟合较好。 除了总体卡方检验以外,还有很多模型拟合检验的指标。文献中通常使用的 评价模型拟合的指标有拟合优度指数( goodness-of- fit index,标志为GFI)和调 整的拟合优度指数( adjusted goodness-of-fit index,标志为AGFI)②。拟合优度指 数定义为 GFI=1- F[S,Σ(0)] ① LISREL模型的最大似然函数=(-1/2)n[tr(S1)+hnE-lnlS|-(p+q)1,因为 该函数有一负号,因而极大化该函数等于极小化其中括号内的函数(通常以F表示)即可 e n Joreskog, K.G. and D Sorbom(1993 )LisreL 8: Structural Equation Modeling with the SIMPLiS Command Language. Chicago: Scientific Software 350
GFI测定观測变量的方差协方差矩阵S在多大程度上被模型引申的方差协 方差矩阵Σ所预测。如果∑=S,GFⅠ等于1,意谓模型完美拟合。 这个指数可以按模型中参数估计总数的多少进行调整。调整后的拟合指数的 计算公式为 AGFI=1 (p+q)(p+q+1)2 (1-GF1) 其中p+q是观测变量的数目,(p+q)(p+q+1)2是数据点的总数, d.f.是自由度。估计参数相对于数据点总数越少或df越大,AGF就越接近于 GFI。 这两个指数测量的是在样本方差屮估计方差占有的加权比例。它们并不是统 计量,因此就不能用来对模型拟合度进行正常的统计检验。但是,它们被作为模 型适当( model adequacy)的总体指标。这两个指数的值域都在0至1之间, 般大于0.9时,则认为模型拟合观测数据。 还有很多拟合指数被称作比较拟合指数( comparative fit indexes)。它们是从 设定模型( specified model)的拟合(或是用拟合函数,或是用卡方值)与独立 模型( independence model)的拟合之间的比较中取得的。独立模型指假设所有 变量之间没有相关关系,即模型中所有的通径系数和外生变量之间协方差都固定 为0,只估计其方差。比较拟合指数测量的是设定模型同独立模型相比在拟合上 的改善程度。 本特勒与波内特提出的规范拟合指数①( Bentler- bonet normed fit index,标 志为、FⅠ)通过对设定模型的卡方值与独立模型的卡方值比较来评价估计的模 型。其计算公式为 NFI-Xinde Xmodel 其中x如是独立模型的卡方值估计,x2d是设定模型的卡方值估计。NFl 测量独立模型与设定模型之间卡方值的缩小比例。我们可以将此视为设定模型比 独立模型在拟合上的改善“增量”。NFI的局限性在于:第一,它不能控制自由 度,因此卡方值可以通过增加参数来减小。第二,NFI的抽样分布平均值与样本 D Bentler, P. M. and D G. Bonctt(1980)Significance tests and goodness-of-fit in the analysis of covariance structures. Psychological Bulletin, 88: 588-606
规模n正相关。所以,NFI可能在小样本时低估模型的拟合度。① 波伦( bollen)③曾建议了一种NFI的修正方法,能减小该指数的平均值对 样本规模的依赖,并考虑设定模型的自由度的影响。这种改进指标标志为II, 其计算公式如下 IFI= Xindep-Xmydel 对NHFI的另外一种修正是不规范拟合指数( nonnormal fit index),标志为 NNFI。它也处理了模型自由度对拟合指数的影响。NFI的计算公式如下 Xinde Model xinde- dfi NNFI的一个问题是其估计值变化很大,有时能超出0至1的范围,而有时 在小样本时又太小。并且,有时其他指标显示模型拟合很好,而它却反映拟合不 好 本特勒( Bentler)提出的比较拟合指数( comparative fit index),标志为 FI,也是通过与独立模型相比较来评价拟合程度,但是它采取了不同的方式。 CFI运用了非中心的卡方分布( noncentral( hi-square distribution)与非中心性的 参数( noncentral parameters)τ;。τ;的值越大,模型设定的错误越大;τ=0表 示完全拟合。CFI即使是对小样本估计模型拟合时也能做得很好。(F定义公式 为 CFⅠ=1-nxt ①参见 Bearden,W.O., Sharma,S., and Teel,小,上.(1982) Sample size cffects on chi quare and other statistics used in evaluating causal models. Journal of Marketing Research, 19: 425 2 A Bollen, K.A.(1988)A new incremental fit index for general structural equation models. A paper presented at 1988 Southern Sociological Society Meetings. Nashville, Tennessee 3 t Anderson, J and D. w. Gcrbing (1984)The effects of sampling error on covergence improper Solutions, and goodness-of-fit indices for maximum likelihood confirmatory factor analysis Psychometrika, 49: 155-173 o Bentler, P. M. and C-P. Chou(1987) Practical issues in structural modeling. Sxio- ogical Methods and Research, Vol 16, No. 1: 78-117 352
其中,mp=x2yp- dfind,并且rms=x2d-dfm 与GFI和AGFI同样,所有的比较拟合指数的值域都应该在0至1之间, 0.90及其以上的取值表示模型拟合较好。 近年来,有一个对结构方程模型拟合评价的指标得到了越来越多的重视,它 就是近似误差的均方根( root mean square error of approximation,标志为RM SEA)①。它被定义为 RMSEA=√F0/df [F-(df/(n-1)),O 其中,F0是总体差异函数( population discrepancy function,标志为PDF) 的估计②c这个差异是拟合函数最小值f与[df/(n-1)]之间的差,当其为 正值时取其值,当其为其他值时取0值。要是 RMSEA取值为0.05或以下,而 且 RMSEA的90%置信区间上限在0.08及以下,表示较好的模型拟合。(RM SEA<0.05)的置信度检验也很重要。如果模型拟合较好,置信度检验的P值应 大于0).05;即不能拒绝( RMSEA<0.05)这一假设 最后,还有一种拟合评价的重要方法是比较使用同一数据的两个或更多的理 论模型。通常,模型比较要求两个模型之间有嵌套( nested)关系。所谓嵌套就是 指两个模型有同样的参数但其中一个模型的自由参数只是另一个模型自由参数 的一部分(子集)。于是,就可以应用似然比检验( likelihood ratio test),即通过两个 模型拟合优度的卡方检验值及其自由度计算其差异以取得卡方统计量及其自由 度。如果卡方值变化比其自由度变化更大,就说明模型中的变化的确是一种改善。 有时,要比较的两个模型并不嵌套,在这种情况下就需要特别的方法来进行模型比 较。 LISREI提供三种紧密相关的信息标准指数( information criteria indexes)可以 C Steiger, JH.(1990) Structural model evaluation and modification: An interval esti mation approach. Multivariate Behavioral Research, Vol. 25: 173-180 Browne, M. w. and R. Cudeck (1989) Single sample cross-validation indices for covariance structures. Multivariate Behavioral Research, 24: 445-455 Rigdon, Edward E.(1996)CFI versus RMSEA: A comparison of two fit indices for structural equation modeling. Structural Equation Modeling: A Multidisciplinary Journal, Vol. 3, No 369-379 e J McDonald, R. P.(1989) An index of goodness of fit based on non-centrality. Journ of Classification, Vol. 6: 97-103