节中加以讨论。 、关于例题 为了使读者在实际上机应用SPSS操作鉴别分析时减少输入原始数据的麻 烦,这里我们尽量使用第三章因子分析中表3-2所提供的原始数据。该数据有 全国30个省、市、自治区的案例,原有5个变量,分别为多孩率、综合节育率 初中及以上受教育程度的人口比例、人均国民收入、城镇人口比例。假设我们将 这些变量作为鉴别变量来对各地区进行鉴别分组,以便更好分类指导工作。那 么,现在还必须要有一个分组变量才能完成鉴别分析。假设有理由可以断定其中 的一些地区归为一类、二类和三类地区,但是同时还有一些地区则很难进行类型 归属,于是我们可以建立一个分组变量TYPE来反映每个案例的分组属性。如 果读者已经将因子分析一章中表3-2的原始数据建立了SPSS数据文件,那么 现在只需要再新加一个分组变量并按照下列变量TYPE的数据输入即可。在这 个分组变量中,编码1、2、3分别表示一类、二类和三类,“”表示缺失值,在 输人数据时将相应单元格跳过即可。数据输入工作完成后,可以将该工作数据文 件另存为一个文件。然后我们就可以根据已知分组类型的案例建立鉴别方程,计 算各种鉴别分析统计指标,并在此基础上完成未知分组属性的那些案例的鉴别分 组工作 本章例题只是为了示范鉴别分析的操作过程,并无实际研究的意义(见表 9-1)。 表91 本章例题的原始数据 X3 TYPE 0.94 64.5135 2.58 92.32 55.41 2981 68.65 13.46 38.20 45.12 1124 41.83 678 011 8.91 91.43 1383 2 90.78 47.3 1628 47.17
续前表 X2 X3 X4 X5 TYPE 91.47 62.36 4822 66.23 90.31 40.85 21.24 7.07 14.44 88.71 29.04 15,24 9.04 12.02 87.28 38.76 124828.91 l1.15 89.13 36.33 976 18.23 87.72 1845 36.77 31.07 15.10 1193 24.05 7890.57 31.26 03 14.72 32.31 87.60 7.70 65 11.18 41.01 13.80 938 81.56 31.30 1100 27.35 2,33 20.84 81.45 34.59 1024 1374 31.91 ID只是序号,于分析无用。各X数据取自第三章表3-2 注:本书所附数据磁盘中相应数据文件名为T9.1.SAV。 三、鉴别分析模型的各参数指标及统计检验 个鉴别分析不光要有基本模型,还需要多个不同指标来表示模型的不同方 有的用于表示数量关系,有的用于评价和比较。下面分别对鉴别模型中所涉 及的主要指标加以介绍。为了避免有的参数计算过程所必须涉及的矩阵代数形式 或其他复杂的数学公式,这里将不对每个参数的来龙去脉加以详细讨论。由于本
章在介绍鉴别分析时将与SPSs统计软件的应用相结合,读者用不着在估计过程 的细节上花费许多功夫,因为只要我们正确地输入数据和制定鉴别分析的程序命 令,计算机能够提供全部统计结果。所以,在夲节中我们将只讨论每个指标的意 义和用途。有关SPSS的操作步骤在第四节中介绍。 I.非标准化鉴别系数 鉴别系数又称函数系数( function coefficient),其中还进一步分为两种: 标准化的和标准化的。非标准化鉴别系数( unstandardized discrimina oefficient)也称粗系数( raw coefficients)。将原始变量值(即粗数据, raw dat优 直接输入模型,得到的系数估计即非标准化的“粗"”系数。得到非标准化的鉴之 系数就意味着我们得到了求解的鉴别分析基本模型(见式(1)。 相应的SPSS的鉴别分析统计输出格式如表9-2。 表9 Unstandardized canonical discriminant function coefficients 2777410 7069548 0311224 2314016 1.66830980E-03 1.32867710E-0 0145724 1436736 Constant) 65.6113916 556023 在上述输出中,SPSS告诉我们推导的鉴别函数有两个,分别为① y1)=65.61+0.28x1-0.71x2-0.23x3+0.00x4+0.01xs y2)=-1.56+0.05x1-0.03x2-0.09x3-0.00x4+0.14x5 非标准化系数是用来计算鉴别值( discriminant score)的。将案例的各鉴别 变量值代入上述两个鉴别函数就可以分别计算出两个鉴别值来,于是就决定了其 在二维空间中的位置。实际上,如果需要鉴别值,SPSS也可以直接提供。通过 不同鉴别函数计算的鉴别值可以用来作图表示在鉴别空间中各案例的点,并用来 分析具体案例点与组别之间的位置。 类似于回归分析中的非标准化系数,非标准化的鉴别系数的大小并不能反映 相应变量在鉴别作用上的大小。比如在第一函数和第二函数中x4系数都非常 ①下面式中个别系数值太小以至无法显示有效数字