是自变量为连续变量,因变量为二分名义变量,除可采用判别分析法,也可以采 用 Logistic回归分析,也就是说, Logistic回归分析中的自变量为等距或比率变 量,因变量则是二分类别变量。除此以外, Logistic回归分析与多元回归分析的 最大差异在于因变量性质的不同,使得两者在参数估计与假设上也有所差异。进 行复回归分析时,回归模型必须符合正态性假定,但是 Logistic回归分析的假定 是观察值样本在因变量上的概率分布呈S形分布,此分布气情形又称 Logistic分 布( Hosmer和 Lemeshow,2000)。此外,在参数估计方面,复回归通常通过 般最小平方法让残差值极小化,以得到自变量参数的最佳估计值,而 Logistic回 归分析则是通过极大似然估计使因变量观察次数的概率极大化,进而得到自变量 参数的最佳估计值(王保进,2004)。与最小平方法相比,极大似然估计法可以 用于线性模型,也可以用于更复杂的非线性模,由于 Logistic回归是非线性模型, 因此极大似然是其最常用的估计法(王济川、郭志刚,2004)。 由于 Logistic回归分析采用极大似然法求解回归参数,因此回归模型也是通 过似然值( likelihood)进行整体检验。概数的对数值是个负数,所以通常先取似 然值的自然对数后再乘以-2,以便进行统计量检验。似然值的统计量在SPSS 输出表格中以“一2对数概似”栏表示,此数值越小,表示回归方程式的似然值 越接近1,回归模型的适配度越佳;此数值越大,表示回归方程式的似然值越小 回归模型的适配度越差 Logistic回归分析广泛地应用于因变量为二分类别变量的回归模型,此二分 类别变量的编码不是0就是1,国内相关的多变量统计书籍有人将之译为逻吉斯 回归分析,又有人将之译为逻辑斯回归分析,其实两者所使用的统计分析是相同 的。逻辑斯回归分析的中心概念是logt(逻辑),它是胜算(ods)的自然对数。 若p表示事件发生的概率、1-p表示事件不发生的概率,则事件发生的概率与 不发生的概率与多项式关系如下 事件发生的概率与函数关系为p 1+e(x) 事件不发生的概率与函数关系为1-p=1+分 则胜算(ods)= P
- 16 - 是自变量为连续变量,因变量为二分名义变量,除可采用判别分析法,也可以采 用 Logistic 回归分析,也就是说,Logistic 回归分析中的自变量为等距或比率变 量,因变量则是二分类别变量。除此以外,Logistic 回归分析与多元回归分析的 最大差异在于因变量性质的不同,使得两者在参数估计与假设上也有所差异。进 行复回归分析时,回归模型必须符合正态性假定,但是 Logistic 回归分析的假定 是观察值样本在因变量上的概率分布呈 S 形分布,此分布气情形又称 Logistic 分 布(Hosmer 和 Lemeshow,2000)。此外,在参数估计方面,复回归通常通过一 般最小平方法让残差值极小化,以得到自变量参数的最佳估计值,而 Logistic 回 归分析则是通过极大似然估计使因变量观察次数的概率极大化,进而得到自变量 参数的最佳估计值(王保进,2004)。与最小平方法相比,极大似然估计法可以 用于线性模型,也可以用于更复杂的非线性模,由于 Logistic 回归是非线性模型, 因此极大似然是其最常用的估计法(王济川、郭志刚,2004)。 由于 Logistic 回归分析采用极大似然法求解回归参数,因此回归模型也是通 过似然值(likelihood)进行整体检验。概数的对数值是个负数,所以通常先取似 然值的自然对数后再乘以 2,以便进行统计量检验。似然值的统计量在 SPSS 输出表格中以“—2 对数概似”栏表示,此数值越小,表示回归方程式的似然值 越接近 1,回归模型的适配度越佳;此数值越大,表示回归方程式的似然值越小, 回归模型的适配度越差。 Logistic 回归分析广泛地应用于因变量为二分类别变量的回归模型,此二分 类别变量的编码不是 0 就是 1,国内相关的多变量统计书籍有人将之译为逻吉斯 回归分析,又有人将之译为逻辑斯回归分析,其实两者所使用的统计分析是相同 的。逻辑斯回归分析的中心概念是 logit(逻辑),它是胜算(odds)的自然对数。 若 p 表示事件发生的概率、 1 p 表示事件不发生的概率,则事件发生的概率与 不发生的概率与多项式关系如下: 1 1 1 1 f x f x f x f x e p e p e p odds e p 事件发生的概率与函数关系为 事件不发生的概率与函数关系为1- 则胜算
由于胜算不是线性模型,若对其取自然对数就可以转换为线性方程,即 mn=m[e]=/()=具+Bx,+Bx+…+Bx 若k=1,则胜算自然对数的转换式为简单线性模型 2m[e]=/(x)=B+Bx 若胜算1表示第一组案例中事件发生的次数与事件不发生次数之间的比值 (事件发生的概率);胜算2表示第二组案例中事件发生的次数与事件不发生次 数之间的比值,两组案例中胜算的比值称为胜算比( odds ratio;简称OR)。如 男生通过信息技能检验的胜算为0.800,女生通过信息技能检验的胜算为0.200, 男女通过信息技能检验胜算比值为0.800÷0.200=4,表示男生通过信息技能检验 的概率约为女生通过信息技能检验概率的4倍:相对的,胜算比值也可以表示为 0200÷0.800=0.25,表示女生通过信息技能检验的概率约为男生通过信息技能检 验概率的0.25倍。 Logistic回归模型的显著性检验包括整体模型检验及个别参数检验两个部分。 整体模型适配度( goodness of fit)的检验是比较每一个观察值的预测概率与实际 概率间的差异。整体模型适配度检验的方法有四个指标: Pearsony2值、离差值 ( Deviance;D统计量)、 Hosmer- Lemeshow检验法、讯息测量指标( information measure)(王济川、郭志刚,2004)。在SPSS统计软件中,会提供 Pearsony2值 Hosmer- Lemeshow检验法数据统计量,当 Pearson.2值达到显著,表示所投入的 自变量中至少有一个自变量能有效预测样本在因变量的概率; Hosmer- Lemeshow 检验法(统计量简称为HL)刚好相反,当其检验值未达显著水平时,表示整体 模型的适配度佳,若是HL统计量显著性概率值p<005,则表示回归模型的适配 度不理想 在逻辑斯回归分析中,最理想的回归模型是x2检验值统计量达到显著而HL 统计量末达到005显著水平,但在实际研究中有时会出现x2检验统计量与HL 统计量均达到0.05显著水平的情形,此种情形在样本数很大时越有可能出现, 此现象一方面呈现自变量对分组因变量有显著的解释与预测力,一方面又呈现回 归模型的适配度不佳的情形,若是使用者在逻辑斯回归分析中遇到此种情形,可
- 17 - 由于胜算不是线性模型,若对其取自然对数就可以转换为线性方程,即 0 1 1 2 2 ln ln 1 f x k k p e f x B B X B X B X p 若 k 1,则胜算自然对数的转换式为简单线性模型 0 1 1 ln ln 1 p f x e f x B B X p 若胜算 1 表示第一组案例中事件发生的次数与事件不发生次数之间的比值 (事件发生的概率);胜算 2 表示第二组案例中事件发生的次数与事件不发生次 数之间的比值,两组案例中胜算的比值称为胜算比(odds ratio;简称 OR)。如 男生通过信息技能检验的胜算为 0.800,女生通过信息技能检验的胜算为 0.200, 男女通过信息技能检验胜算比值为 0.800÷0.200=4,表示男生通过信息技能检验 的概率约为女生通过信息技能检验概率的 4 倍;相对的,胜算比值也可以表示为 0.200÷0.800=0.25,表示女生通过信息技能检验的概率约为男生通过信息技能检 验概率的 0.25 倍。 Logistic 回归模型的显著性检验包括整体模型检验及个别参数检验两个部分。 整体模型适配度(goodness of fit)的检验是比较每一个观察值的预测概率与实际 概率间的差异。整体模型适配度检验的方法有四个指标:Pearson 2 值、离差值 (Deviance;D 统计量)、Hosmer-Lemeshow 检验法、讯息测量指标(information measure)(王济川、郭志刚,2004)。在 SPSS 统计软件中,会提供 Pearson 2 值、 Hosmer-Lemeshow 检验法数据统计量,当 Pearson 2 值达到显著,表示所投入的 自变量中至少有一个自变量能有效预测样本在因变量的概率;Hosmer-Lemeshow 检验法(统计量简称为 HL)刚好相反,当其检验值未达显著水平时,表示整体 模型的适配度佳,若是 HL 统计量显著性概率值 p<0.05,则表示回归模型的适配 度不理想。 在逻辑斯回归分析中,最理想的回归模型是 2 检验值统计量达到显著而 HL 统计量末达到 0.05 显著水平,但在实际研究中有时会出现 2 检验统计量与 HL 统计量均达到 0.05 显著水平的情形,此种情形在样本数很大时越有可能出现, 此现象一方面呈现自变量对分组因变量有显著的解释与预测力,一方面又呈现回 归模型的适配度不佳的情形,若是使用者在逻辑斯回归分析中遇到此种情形,可