Survival Function 1.0 08 0.2 0.0 0.2 2 REMISSN 图12-1SPSS输出的生存函数图 事件历史分析模型 在这一节中,我们介绍事件史分析方法的一系列统计模型,其中我们侧重于 离散时间 logit模型和Cox比例风险模型,因为这两种模型是社会科学中使用最 泛的模型。 1.离散时间Loit模型 对于离散时间单位,我们经常估算离散时间 Logit模型,其思路如下: P(t)代表某人在时间t上发生某事的概率。我们可以运用 Logit模型方程拟合 观察数据,用P(t)代表一个案例在时间t发生的事件,然后以下列公式建立 logit模型拟合数据 n1-P(t)=a()+bx1+b2x2) (1) 式中P(t)的值域在0~1之间,x1是一个独立于时间的变量,而x2(t)是一个 随时间变化的变量。为了简明而又不失去代表性,我们在这里以及后面示范中只 采用两个协变量。h表示取自然对数。截距a(t)也是在不同时间上不断变化的 量。如果我们回到前面提过的结婚年龄的例子,在我们研究结婚概率时,x1可 395
以代表性别(不随时间变化),x2代表个人收入(随时间而变化)s我们还可以 让截距a(t)随时间改变,只要我们加上几个代表不同时期的虚拟变量。在后面 的示范中,我们将用这个模型来测量在70年代末到80年代中国政府实行鼓励晚 婚政策所带来的影响。 而我们是否应该运用时变变量( time-varying variable)实际上取决于不同的 研究情况。如果研究者对探索时变变量并无兴趣,或是并不希望知道时变变量随 时间变化的影响的话,那么在等式右边他可以简单地运用a和x2(与时间无 关),而不必运用a(t)和x2(t)。后面将用例子来说明如何运用这一离散时间 Igit模型。如同其他 logit模型,离散时间风险模型也是用最大似然法来进行估 计的。其主要原则是通过选择参数来使模型具有最大可能性拟合所得到的观察数 据 为了检验拟合优度,我们采用似然比卡方(x2),定义如下 x2={lkg(检测模型的似然值)}-{kg(常数模型的似然值)}(2) 这里常数模型指一个只有常数项而无其他办变量的模型。检验的自由度是协变量 的总数。只要一个模型是另外一个模型的特殊情况(即包含于另一模型之内) 我们就可以用这个统计量来进行检验。大多数统计软件包都提供检测模型似然值 的对数值和常数模型似然值的对数值,作为自己标准统计分析结果的一部分输 出,因此似然比卡方值很容易根据上述公式计算出来。 2Cox比例风险模型 连续时间模型有很多,在这一章中我们详细介绍的只是其中的一种,即(xx 比例风险模型。(αx比例风险模型是在事件史分析中使用最广的模型。在后面的 节中,我们将简要介绍一些其他的连续时间模型。 用h(t)来代表风险率,考克斯(ox)①提出可以估算下列比例风险模 Inh(t)=a(t)+br 这里a(t)是一个基准风险函数,可以以任何形式出现。由于a(t)并未规定 从这个意义而言,(αx模型是一种半参数( emI-parametric)模型。并且,由于 对任意两个案例氵和j,两者的风险之比是一个常数,只取决于个人特征而与时 间t无关。从这个意义上讲,Cox模型又是成比例的。这很容易用一个例子来说 D A Cox, David R. 1972. "Regression Models and Life Tables. "Journal of Roval Statistical 1334:187220
明。假定案例i有特征x1;和x2;,而案例j有特征x1;和x2,那么案例i和j的 风险率则分别为 h: (t)=expla(t)+61x1i +b2T2ij h;(t)=expl a(t)+bIr1+ b2x2j J 因此, h; (t) expl a(t)+biIl+ 62x2i h, (t) expla(t)+b1r1+ b2]; =exp[b1(x1;-x1;)+b2(x2-x2) 请注意的是最后的结果并不取决于时间t。 考克斯(Cox)的天才贡献并不在于他的模型是成比例的( proportional)。事 实上,一旦我们开始引进时间变量,这个模型就不再是成比例的了。考克斯的贡 献在于他对估算公式(3)模型提出了很好的方法。他的估算方法被称为部分似 然值法( partial likelihood,缩写为PL)。在艾力森( Allison)①或山口②的书中可 以找到对PL估算的具体技术细节的讨论 关于〔ακ模型的拟合优度检验,离散时间lgit模型拟合优度检验的程序和 逻辑同样适用在这里。然而,还有另外两种检验即分值检验( score test)和 Wad检验也可以使用。③有充分理由可以认为,似然比卡方检验是使用最广泛的 检验方法。并且,多数统计软件的标准输出中都提供检测模型的对数似然值和常 数模型的对数似然值,因此似然比卡方值可以仿照上述离散时间模型计算公式 (2)来计算。 3.其他一些连续时间模型 如前所述,比例风险模型是社会科学中事件史分析应用最多的一种模型。 Cox模型的一个主要优点是,我们根本用不着对事件的时间概率分布做任何假 设,可以专心致力于解释变量(即协变量)。但是在某些研究场合中,我们还需 要对事件的时间概率分析提出假设。例如,如果我们知道某一事件发生的概率随 时间单调增加或减少,我们可以建立一个模型来表现这一特征。下面我们介绍 O A Allison, Paul. 1984. Event History Analysis: Regression for Longitudinal Event Data. Beverly Hills, CA: Sage Publications Q 3L Yamaguchi. Kazuo. 1991. Event History Analysis Applied Social Science Methods Series Volume 28. Sage Publications, Inc @ g Yamaguchi, Kazuo. 1991. Event History Analysis. Sage Publications Inc 397