第九章对数线性模型 第一节 General过程 9.1.1主要功能 9.1.2实例操作 第二节Hi lerarchica 9.2.1主要功能 9.2.2实例操作 第三节 Logit过程 9.3,1主要功能 9.3.2实例操作 对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对 数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对 于列联表资料,通常作ⅹ2检验,但ⅹ2检验无法系统地评价变量间的联系,也无法估计变量 间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。 第一节 Gener a|过程 9.1.1主要功能 调用该过程可对一个或多个二维列联表资料进行非层次对数线性分析。它只能拟合全饱 和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。 回目录返回主页 9.1.2实例操作
第九章 对数线性模型 第一节 General 过程 9.1.1 主要功能 9.1.2 实例操作 第二节 Hierarchical 过程 9.2.1 主要功能 9.2.2 实例操作 第三节 Logit 过程 9.3.1 主要功能 9.3.2 实例操作 对数线性模型是用于离散型数据或整理成列联表格式的计数资料的统计分析工具。在对 数线性模型中,所有用作的分类的因素均为独立变量,列联表各单元中的例数为应变量。对 于列联表资料,通常作χ2 检验,但χ2 检验无法系统地评价变量间的联系,也无法估计变量 间相互作用的大小,而对数线性模型是处理这些问题的最佳方法。 第一节 General 过程 9.1.1 主要功能 调用该过程可对一个或多个二维列联表资料进行非层次对数线性分析。它只能拟合全饱 和模型,即分类变量各自效应及其相互间效应均包含在对数线性模型中。 9.1.2 实例操作
「例9-1]在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成 列联表后如下所示 对保健服务满意程度□ 受教育程度 满意 65(91.5) 272(93.8) 41(976) 不满意 6(8.5) 18(6.2) 1(2.4) 按一般情形作ⅹ检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无 差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想 了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,必须采用对数线性模型 加以分析 9.1.2.1数据准备 激活数据管理窗口,定义变量名:实际观察频数的变量名为freq,受教育程度和满意 程度作为行、列分类变量(即独立变量),变量名分别为educ、care。输入原始数据,结果 如图9.1所示。如同第四章 Crosstab过程中所述,为使列联表的频数有效,应选Data菜单 的 Weight Cases.项,弹出 Weight Cases对话框(图9.2),激活 Weight cases by项, 从变量列表中选freq点击≯钮使之进入 Frequency Variable框,点击OK钮即可。 图9.1原始数据的输入
[例 9-1]在住院病人中,研究其受教育程度与对保健服务满意程度的关系,资料整理成 列联表后如下所示。 对保健服务满意程度 (%) 受教育程度 高 中 低 满意 不满意 65 (91.5) 6 (8.5) 272 (93.8) 18 (6.2) 41 (97.6) 1 (2.4) 按一般情形作χ2 检验,结果显示不同受教育程度的住院病人其对保健服务满意程度无 差别。但从百分比分析中可见,随受教育程度的提高,满意程度有下降的趋势;且我们还想 了解受教育程度与满意程度有无交互作用和交互作用的大小。对此,必须采用对数线性模型 加以分析。 9.1.2.1 数据准备 激活数据管理窗口,定义变量名:实际观察频数的变量名为 freq,受教育程度和满意 程度作为行、列分类变量(即独立变量),变量名分别为 educ、care。输入原始数据,结果 如图 9.1 所示。如同第四章 Crosstab 过程中所述,为使列联表的频数有效,应选 Data 菜单 的 Weight Cases...项,弹出 Weight Cases 对话框(图 9.2),激活 Weight cases by 项, 从变量列表中选 freq 点击 ➢ 钮使之进入 Frequency Variable 框,点击 OK 钮即可。 图 9.1 原始数据的输入
图9.2频数的加权定义 9.1.2.2统计分析 激活 Statistics菜单选 Loglinear中的 General.项,弹出 General Loglinear Analysis对话 框(图93)。从对话框左侧的变量列表中选care,点击>钮使之进入 Factor(s)框,点击 Define Range.钮,弹出 General Loglinear Analysis: Define Range对话框,定义分类变量care的范围 本例为1、2,故可在 Minimum处键入1,在 Maximum处键入2,点击 Continue钮返回 General Loglinear Analysis对话框。同法将变量edvc选入 Factor(s)框,并定义其范围为1、3。本例 要求计算各分类变量主效应和交互作用的参数估计,故点击 Contrast.钮,弹出 General oglinear Analysis: Contrasts对话框,选择 Display parameter estimates项,点击 Continue钮返 回 General Loglinear Analysis对话框,最后点击OK钮即完成分析。 图9.3非层次对数线性模型分析对话框 9.1.2.3结果解释 在结果输出窗口中将看到如下统计数据 首先显示系统对403例资料进行分析,共有二个分类变量:CARE为2水平,EDUC为 3水平。分析的效应有三类:满意程度(CARE)教育程度(EDUC)和两者的交互作用(CARE BY EDUC)。系统经2次叠代后即达到相邻二次估计之差不大于规定的0001
图 9.2 频数的加权定义 9.1.2.2 统计分析 激活 Statistics 菜单选 Loglinear 中的 General...项,弹出 General Loglinear Analysis 对话 框(图 9.3)。从对话框左侧的变量列表中选 care,点击 ➢ 钮使之进入 Factor(s)框,点击 Define Range...钮,弹出 General Loglinear Analysis: Define Range 对话框,定义分类变量 care 的范围, 本例为 1、2,故可在 Minimum 处键入 1,在 Maximum 处键入 2,点击 Continue 钮返回 General Loglinear Analysis 对话框。同法将变量 educ 选入 Factor(s)框,并定义其范围为 1、3。本例 要求计算各分类变量主效应和交互作用的参数估计,故点击 Contrast...钮,弹出 General Loglinear Analysis:Contrasts 对话框,选择 Display parameter estimates 项,点击 Continue 钮返 回 General Loglinear Analysis 对话框,最后点击 OK 钮即完成分析。 图 9.3 非层次对数线性模型分析对话框 9.1.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 首先显示系统对 403 例资料进行分析,共有二个分类变量:CARE 为 2 水平,EDUC 为 3 水平。分析的效应有三类:满意程度(CARE)、教育程度(EDUC)和两者的交互作用(CARE BY EDUC)。系统经 2 次叠代后即达到相邻二次估计之差不大于规定的 0.001
DATA Information 6 unweighted cases accepted 0 cases rejected because of out-of-range factor values 403 weighted cases will be used in the analysis FACTOR Information Factor Level Labe CARE 2 EDUC DESIGN Information Correspondence Between Effects and Columns of Design/Model 1 Starting Ending Column Column Effect n CARE 2 3 EDUC 4 CARE BY EDUC Note: for saturated models 500 has been added to all observed cells This value may be changed by using the Criteria= DELta subcommand *** ML converged at iteration 2 Maximum difference between successive iterations=. 00000 由于本例对 Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数 ( EXP count)与实际例数( OBS. count)相同,进而残差( Residual)、标准化残差( Std Resid) 和校正残差( Adj. Resid)均为0 Observed, Expected Frequencies and Residuals Factor Code OBS. count PCT. EXP count PCT. Residual Std Resid. Adj. Resid CAR EDUC 6550(16.13) 6550(16.13) .0000 EDUC2272.50(67.12) 272.50(67.12) 0000 EDUC341.50(10.22) 41.50(10.22) 0000 CARE 2 EDUC 650(1.60) 6.50(1.60) 0000 0000 EDUC218.50(4.56) 18.50(4.56) EDUC31.50(.37) 1.50(.37) 0000 0000 0000
DATA Information 6 unweighted cases accepted. 0 cases rejected because of out-of-range factor values. 0 cases rejected because of missing data. 403 weighted cases will be used in the analysis. FACTOR Information Factor Level Label CARE 2 EDUC 3 DESIGN Information 1 Design/Model will be processed. Correspondence Between Effects and Columns of Design/Model 1 Starting Ending Column Column Effect Name 1 1 CARE 2 3 EDUC 4 5 CARE BY EDUC Note: for saturated models .500 has been added to all observed cells. This value may be changed by using the CRITERIA = DELTA subcommand. *** ML converged at iteration 2. Maximum difference between successive iterations = .00000 由于本例对 Model(模型)未作定义,故系统采用默认的全饱和模型,因而期望例数 (EXP.count)与实际例数(OBS. count)相同,进而残差(Residual)、标准化残差(Std.Resid) 和校正残差(Adj.Resid)均为 0。 Observed, Expected Frequencies and Residuals Factor Code OBS. count & PCT. EXP. count & PCT. Residual Std. Resid. Adj. Resid. CARE 1 EDUC 1 65.50 (16.13) 65.50 (16.13) .0000 .0000 .0000 EDUC 2 272.50 (67.12) 272.50 (67.12) .0000 .0000 .0000 EDUC 3 41.50 (10.22) 41.50 (10.22) .0000 .0000 .0000 CARE 2 EDUC 1 6.50 ( 1.60) 6.50 ( 1.60) .0000 .0000 .0000 EDUC 2 18.50 ( 4.56) 18.50 ( 4.56) .0000 .0000 .0000 EDUC 3 1.50 ( .37) 1.50 ( .37) .0000 .0000 .0000
最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平 参数之和为0,故根据下列结果可推得各参数为 λ满意=1.386724028 λ不满意=-1.386724028 λ高教育程度=-0.091477207 λ中教育程度=1.144301306 λ低教育程度=-1.052824099 λ满意高教育程度=-0.231600045 λ满意中高教育程度=-0.041790087 λ满意低教育程度=0.273390132 λ不满意高教育程度=0.231600045 λ不满意中教育程度=0.041790087 λ不满意低教育程度=-0273390132 λ值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:①对保健服 务的满意程度高于不满意程度;②中等教育程度者的满意程度>高等教育程度者的满意程 度>低等教育程度者的满意程度:③通过受教育程度与对保健服务满意程度的交互作用研 究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。 Estimates for Parameters CARE Parameter Coeff. Std Err. Z-Value Lower 95 Cl Upper 95 CI 35fdf 1.38672402815965 8.68589 1.07381 1.69964 EDUC Parameter Coeff. Std Err. Z-Value Lower 95 CI Upper 95 CI 2 091477207198954598048142 144301306174076.57393 80313 1.48547 CARE BY EDUC Parameter Std Err. Z-value Lower 95 CI Upper 95 CI 23160004519895 1.16410 62154 15834 5-.0417900871740724008 38296 29938
最后输出参数估计的结果。为了唯一地估计参数,系统强行限定同一分类变量的各水平 参数之和为 0,故根据下列结果可推得各参数为: λ满意 = 1.386724028 λ不满意 = -1.386724028 λ高教育程度 = -0.091477207 λ中教育程度 = 1.144301306 λ低教育程度 = -1.052824099 λ满意.高教育程度 = -0.231600045 λ满意.中高教育程度 = -0.041790087 λ满意.低教育程度 = 0.273390132 λ不满意.高教育程度 = 0.231600045 λ不满意.中教育程度 = 0.041790087 λ不满意.低教育程度 = -0.273390132 λ值为正,表示正效应;反之为负效应;零为无效应。分析提供的信息是:①对保健服 务的满意程度高于不满意程度;②中等教育程度者的满意程度>高等教育程度者的满意程 度>低等教育程度者的满意程度;③通过受教育程度与对保健服务满意程度的交互作用研 究,结果表明高、中等教育未能增加人们对现有保健服务状况的满意程度。 Estimates for Parameters CARE Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 35fdf ; 1 1.386724028 .15965 8.68589 1.07381 1.69964 EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 2 -.091477207 .19895 -.45980 -.48142 .29847 3 1.144301306 .17407 6.57393 .80313 1.48547 CARE BY EDUC Parameter Coeff. Std. Err. Z-Value Lower 95 CI Upper 95 CI 4 -.231600045 .19895 -1.16410 -.62154 .15834 5 -.041790087 .17407 -.24008 -.38296 .29938