(1)领独生子女证(i=1)与生了男孩(j=1)正相关。按照隐含的因果假 没,则说明生了男孩的人更倾向于领取独生子女证,即更有可能停止生育。 (2)未领证(=2)与生了女孩(j=2)正相关,说明生女孩会在平均水平 上减少领证频数。 而交互参数pAB1)=pAB2).为负值则分别显示出: (1)领证与生了女孩负相关。或者说,生了女孩的人更倾向于不领取独生子 女证,即更有可能通过继续生育得到儿子 (2)未领证与生男孩负相关。或者说,生男孩这一事件会在平均水平上减少 不领证的概率。 其实我们发现,这些交互效应说的是一个意思,只不过是正面说和反面说的 区别。所以,有了pAB(1实际上已经得到了所有交互效应的结论,因为其他交 互参数是依赖于它而定的,不会出现相矛盾的解释。但是,如果类别数大于2以 后,分析就会稍微复杂一点。我们将在讨论例2时介绍这一情形。 SPSS输出是否领证这一因素(TAKE)的参数是对应于第一类(领证)的 即κA(1)=-0.051。在第二类未领证的参数则等于0.051。参数说明,样本案例 中领证的夫妇较少,未领证的夫妇较多。 至于孩子性别这个因素SEX的第一类的参数pB(1)=0.046,则说明样本中 男孩比例较大一点,女孩比例较小一点 在例1模型中已经包括了所有可能的效应项,因此是饱和模型( aturated/ full model)饱和模型所得到的各项参数估计,提供了可以用来准确无误地复制 原交互表频数分布的全部信息。SPSS输出中可以提供各交互单元的观测频数和 估计频数以及两者之间的残差。但是,对于饱和模型这部分输出没有分析意义, 因为两者完全相同,残差等于0。 如果模型中没有包括所有可能的效应项,就是一个简略模型( reduced model)。简略模型的参数估计值会与饱和模型有所不同 关于模型中参数的使用及其意义,先暂且介绍到这里。然而,对于例1模型 研究而言,还有一部分十分重要的工作没有做。按照统计分析惯例,对于样本数 据往往并不是先看参数估计,而是先检验模型的无关或无差异假设,如果检验结 果显著,再具体检验毎一个参数估计的显著水平。只有在这些检验都显著的情况 下,我们才来具体分析和阐释各参数估计的实际意义。而本章的介绍为了先使读 者建立起关于对数线性模型的基本了解,先介绍了模型参数。现在,我们必须补 上关于统计检验的介绍
4.对数线性模型的统计检验 在对样本数据进行分析的时候,统计检验十分重要。这是因为,不经过统计 检验,研究人员就不能肯定所得到的参数估计是不是仅仅源于抽样误差,因而不 能肯定在总体中是否存在着同样的情况。比如,例1的参数估计说明,在样本中 领证的少于未领证的、男孩多于女孩、有男孩的夫妇比有女孩的夫妇更倾向于终 止生育。但是,没有经过统计检验,所有这些结论只能限于这个样本之内,不能 肯定再抽一个样本能否得到类似结果(起码参数估计的符号相同),或者说不能 肯定总体也是这样。 依据饱和模型的参数估计虽然能够完美地再现样本所有交互单元的观测频 数,但它对于总体的情况并无丝毫涉及。模型的拟合程度是通过估计频数与观测 频数的比较来反映的,如果考虑抽样误差的影响,还必须经过统计检验才能推断 总体情况。 对数线性模型的统计检验包括四种主要检验 (1)对于假设模型的整体检验; (2)分层效应的检验; (3)单项效应的检验 (4)单个参数估计的检验。 (1)对于假设模型的整体检验 传统的交互表分析采用皮尔逊卡方检验( Pearson chi-square test,标为x2), 而在对数线性模型中主要是采用似然比卡方检验( likelihood-ratio chi- square test,标为L2)。在样本规模较大时,这两个统计量的值十分接近。但是相比之 下,似然比卡方具有若干优越性:首先,在似然比卡方检验中期望频数是用似然 估计方法计算的,因此似然比卡方检验更为稳健( robust),即不会因较小变化 产生较大波动。第二,似然比卡方可以被分解成若干部分,即各项效应都有对应 的似然比卡方值,并且它们的似然比卡方值之和等于整个模型的似然比卡方值。 这一特性在比较不同简略模型时尤其重要。 SPSS的对数线性模型分析同时提供这两种检验的结果。下面是这两种卡方 检验的计算公式 L2=2∑∑n;ln,;x2= (nn-n2)2 其中,n为估计交互频数。 两种卡方检验的虚无假设是:检验模型的频数估计与观测频数无差异,也可 以理解为检验模型与饱和模型无差异。因为检验模型中简化掉的通常是交互效应
项,而它们所代表的是因素之间的关联,所以,如果不能拒绝虚无假设,就意味 着这些效应项没有显著作用,即这些因素之间没有显著相关。因此,对数线性模 型整体检验的虚无假设既可以理解为无差异假设,也可以理解为无关假设。 对数线性模型整体检验是通过模型参数对交互表各频数的估计与实际观测频 数的拟合程度来进行的。前面已经提到,饱和对数线性模型可以完美无缺地再现 观测频数,因此对于饱和模型根本不用再查验统计结果输出就可以知道它必定完 全拟合观测频数。比如,例1饱和模型的整体检验结果如表7-5。 表7-5 SPSS输出的例1模型的整体检验结果——饱和模型 Likelihood ratio chi square= .00000 DF=0 P=1.000 carson quare 00000 DF=0 P=1.000 上面的整体检验结果中两种卡方值都等于0,显著水平都等于1(即统计中 常用的a值,在SPSS输出中标注为Pob或P),说明饱和模型的估计频数完全 等于观测频数,没有任何差别。换句话说,饱和模型代表观测频数,可以用来作 为完全拟合的标准来检验其他模型。注意上面检验的自由度(DF)等于0,意味 着所检验的模型与饱和模型之间的效应项目没有差别,所以对饱和模型的检验是 以自已为标准检验自己。 在对数线性模型分析中,真正有意义的是检验非饱和模型(又称为简略模 型, reduced model),即在饱和模型中剔除某些效应项以后形成的模型。如果简 略模型仍然可以比较准确地拟合观测数据,或者说其拟合程度与饱和模型无显著 差别,说明剔除的效应对于拟合意义不大。于是,我们就得到了简约的对数线性 模型。简约性( parsimony)是科学方法论的基本原则之一。简约并不是仅指简 单,而是指简单而又充分有效。科学研究的本质并不是再现世界,而是探求主要 因素之间的本质联系。我们应用对数线性模型的主要目的不是为了简单地用一个 统计模型再现观测频数,而是通过在模型中加入和减少交互效应项的试验,以寻 找真正重要的因素。所以一旦我们选定了要研究的因素,总是从包括所有可能交 互效应的饱和模型开始,尝试剔除那些不重要的交互效应项,一直达到在拟合程 度受影响不大的前提下形成效应项最少的模型。 如果我们从例1模型中将交互效应项删除,只保留主效应,形成一个简略模 型。那么其整体检验结果如表7-6
表76 SPSS翰出的例1模型的整体检验结果——简略模型 Goodness-of-Fit test statistics Likelihood Ratio Chi Square 0.28400 P=.001 Pearson Chi square 10.25762DF=1 P=,001 由于例1简略模型是从饱和模型中去掉一个交互项形成的,便会使简略模型 整体检验的自由度变成1。正如前面已经分析过的,这一交互项的自由度等于1 (即只要其四个参数中已知一个,其他参数都可以计算出来)。并且,简化模型的 L2从0增加到10.284,显著水平a为0.001(在SPSS输出中标注为P)。这 检验结果说明简略模型与饱和模型之间存在十分显著的差别,或者说简略模型的 拟合程度太差。而其原因就在于简略模型简略掉的交互项对于估计频数的作用很 大,不考虑这一交互影响就会严重地损失拟合程度 在一个效应项很多的复杂饱和模型中有可能删减多个效应项来形成简略模 在实际研究中,当研究者删除一些预计为不重要的效应项时,实际上期望简 略模型的统计检验不显著(即α>0.05),因为删除这些项目以后的简略模型仍 然能够很好地解释实际观测情况,意味着简约性的取得。而当研究者在模型测试 中撤消的是其所感兴趣的效应项时,则期望整体统计检验显著(即α≤0.05), 标志着简化模型与饱和模型有显著差异,即精简的效应项有很重要的影响作用 但是,在精简多个效应项时整体检验显著只是说明撤消的效应项中起码有一项是 有显著作用的,并不能说明哪一项显著。所以,整体检验在实际对数线性模型分 析中,主要服务于整个检验模型的检验情况,而确定各项效应时则是通过单项效 应的检验。对于一个多阶多项效应的复杂模型,釆用整体检验方式精简模型,就 意味着逐项效应的删除测试,那分析过程的效率就太低了。这时,分层检验分析 更为高效。 (2)分层效应检验 例1模型是最简单的对数线性模型。但是,在实际研究中一般涉及的因素较 多,因此不仅主效应项会增加,并且交互项增加得更快。比如,一个涉及四个因 素的模型(如后面的例2)中,除了4个主效应外,还有二阶交互效应6项、 阶交互效应4项、四阶交互效应1项。从这么多的效应中通过一项一项检验筛选 出重要的项目来,就太繁琐了。并且,在一般情况下,高阶交互效应不太容易显 著。所以,在对数线性模型分析中釆用按阶次集体检验交互效应项的方法来精简 不重要的效应,是十分简捷有效的。 228