学时:4 目标和要求:掌握前瞻性队列研究的设计原理、用途、实施过程、人年计算,RR、AR、AR PAR%的概念和意义。熟悉队列研究的常见偏倚和控制,熟悉其优缺点 教学手段:多媒体、例证、提问等。 队列研究 探讨疾病的病因和危险因素是流行病学在医学研究中的重要应用之一,前 章讲述的现况研究是一种横断面研究,因与果是同时存在的,故其在病因研究 中的作用有限。在研究疾病与病因的关系时,分析性流行病学方法更为常用、且 更具效率,能够验证病因假设。队列研究以及下一章介绍的病例对照研究是分析 性流行病学最基本的两种形式。队列研究主要用来研究一种暴露及其不同的水平 与其后的发病危险或其他结果之间的关联性。本章主要介绍队列研究的概念、基 本类型与应用;队列硏究的实施步骤、结果的分析与解释;队列研究中常见的偏 倚及其控制;队列研究的优缺点等。 第一节概述 、基本概念 (一)定义及有关术语 队列研究( cohort study)又称为群组研究,是将特定的人群按其是否暴 露于某因素或按不同暴露水平分为n个群组或队列,追踪观察一定时间,比较两 组或各组的发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系 强度大小的一种观察性研究方法。队列研究由于被观察对象在疾病出现以前先分 组,然后随访一段时间观察再比较其结局,故有人称之为随访研究( follow-up study )o 调查方向 现在 将来 暴露 疾病数比较发生率 (a+b) 有 研究 人群 c/c+d)
1 学时:4 目标和要求:掌握前瞻性队列研究的设计原理、用途、实施过程、人年计算,RR、AR、AR%、 PAR%的概念和意义。熟悉队列研究的常见偏倚和控制,熟悉其优缺点。 教学手段:多媒体、例证、提问等。 队列研究 探讨疾病的病因和危险因素是流行病学在医学研究中的重要应用之一,前 一章讲述的现况研究是一种横断面研究,因与果是同时存在的,故其在病因研究 中的作用有限。在研究疾病与病因的关系时,分析性流行病学方法更为常用、且 更具效率,能够验证病因假设。队列研究以及下一章介绍的病例对照研究是分析 性流行病学最基本的两种形式。队列研究主要用来研究一种暴露及其不同的水平 与其后的发病危险或其他结果之间的关联性。本章主要介绍队列研究的概念、基 本类型与应用;队列研究的实施步骤、结果的分析与解释;队列研究中常见的偏 倚及其控制;队列研究的优缺点等。 第一节 概 述 一、基本概念 (一) 定义及有关术语 队列研究(cohort study)又称为群组研究,是将特定的人群按其是否暴 露于某因素或按不同暴露水平分为 n 个群组或队列,追踪观察一定时间,比较两 组或各组的发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系 强度大小的一种观察性研究方法。队列研究由于被观察对象在疾病出现以前先分 组,然后随访一段时间观察再比较其结局,故有人称之为随访研究(follow- up study)。 调查方向 现在 将来 暴露 疾病 人数 比较发生率 a a/(a+b) b c c/(c+d) 研究 人群 有 无 无 有 有 无
图1队列研究原理示意图 (耿贯一,1998,略加修改) 从上述定义可以看出,队列研究的基本思路是:如果某因素是某病的危险 因素,那么暴露于该因素的人群经过一定时间后,其发病的比例一定高于未暴露 人群,且暴露于该因素的机会越多则发病风险越髙。反之,如果该因素不是危险 因素,那么暴露与非暴露人群的发病率无差异或差异无统计意义。 这里的暴露是指研究对象接触过某种欲研究的因素或具有某种特征和行为, 比如工作场所具有某种有害毒物、吸烟、饮酒等。而队列则是指具有该暴露的 组人群,队列可以是固定的,即人群在相同时间进入队列并对其随访到观察期结 束;也可以是动态的,即研究开始后不断有人加入或退出。所谓危险因素泛指能 导致疾病的发生增加的研究因素。 (二)队列研究的特点 1.在时序上是由前向后的,属于前瞻性研究。队列研究在疾病发生前开始 进行,要往后随访一段时间才能发现病例。 2.属于观察性对比研究。暴露与否是客观、自然存在于研究人群的,而不 是人为确定的,这一点可以与实验性研究相区别 3.研究对象按暴露与否进行分组,而不是按是否发病进行分组的,这一点 与病例对照研究正好相反;也不是随机分组的,这与实验性研究不同 4.从病因链的角度来看,队列研究是从“因”到“果”的研究,在病因推 断上合乎逻辑推理的顺序,其结果的可靠性强。 (三)队列研究的类型 根据研究对象进入队列的时间及资料获取的方式不同,可以将队列研究分 为三种类型。 1.前瞻性队列研究( prospective cohort study)研究对象的确定与分组 是根据硏究开始时的实际情况,如是否暴露来确定,研究的结局需随访观察一段 时间才能得到,这种设计叫前瞻队列硏究。优点:可信度高、偏倚少。缺点:费 时、费人力、物力、财力。 2.历史性队列研究( historical cohort study)研究工作是现在开始的, 而研究对象是过去某个时间进入队列的。其特点是追溯到过去某时期,决定人群 对某因素的暴露史,然后追査至现在的发病或死亡情况。由于研究结局在硏究开 始时已经发生,然后追溯到过去某时期,其性质是回顾性的,故这种设计又叫回 顾性队列研究( retrospective cohort study)。优点:省时、省人力物力。缺
2 d 图 1 队列研究原理示意图 (耿贯一,1998,略加修改) 从上述定义可以看出,队列研究的基本思路是:如果某因素是某病的危险 因素,那么暴露于该因素的人群经过一定时间后,其发病的比例一定高于未暴露 人群,且暴露于该因素的机会越多则发病风险越高。反之,如果该因素不是危险 因素,那么暴露与非暴露人群的发病率无差异或差异无统计意义。 这里的暴露是指研究对象接触过某种欲研究的因素或具有某种特征和行为, 比如工作场所具有某种有害毒物、吸烟、饮酒等。而队列则是指具有该暴露的一 组人群,队列可以是固定的,即人群在相同时间进入队列并对其随访到观察期结 束;也可以是动态的,即研究开始后不断有人加入或退出。所谓危险因素泛指能 导致疾病的发生增加的研究因素。 (二) 队列研究的特点 1. 在时序上是由前向后的,属于前瞻性研究。队列研究在疾病发生前开始 进行,要往后随访一段时间才能发现病例。 2. 属于观察性对比研究。暴露与否是客观、自然存在于研究人群的,而不 是人为确定的,这一点可以与实验性研究相区别。 3. 研究对象按暴露与否进行分组,而不是按是否发病进行分组的,这一点 与病例对照研究正好相反;也不是随机分组的,这与实验性研究不同。 4. 从病因链的角度来看,队列研究是从“因”到“果”的研究,在病因推 断上合乎逻辑推理的顺序,其结果的可靠性强。 (三)队列研究的类型 根据研究对象进入队列的时间及资料获取的方式不同,可以将队列研究分 为三种类型。 1.前瞻性队列研究(prospective cohort study) 研究对象的确定与分组 是根据研究开始时的实际情况,如是否暴露来确定,研究的结局需随访观察一段 时间才能得到,这种设计叫前瞻队列研究。优点:可信度高、偏倚少。缺点:费 时、费人力、物力、财力。 2.历史性队列研究(historical cohort study)研究工作是现在开始的, 而研究对象是过去某个时间进入队列的。其特点是追溯到过去某时期,决定人群 对某因素的暴露史,然后追查至现在的发病或死亡情况。由于研究结局在研究开 始时已经发生,然后追溯到过去某时期,其性质是回顾性的,故这种设计又叫回 顾性队列研究(retrospective cohort study)。优点:省时、省人力物力。缺
点:历史档案不一定符合设计要求,故适用范围较窄。 3.双向性队列研究( ambispective cohort study)根据历史档案确定暴 露与否,根据将来的情况确定结局,故这种设计又叫混合性队列研究。该方法不 但具有历史性队列研究的优点,还弥补了其不足。 (四)队列研究的应用范围 1.验证病因假设确定某个暴露与疾病的因果联系及其联系强度,验证病 因假设。由于它是一种从“因”观“果”的研究方法,符合病因链的实际顺序 故在病因学研究上的价值髙于现况研究和病例对照研究,但由于其分组不是随机 的,故其效力不如实验性研究。 2.考核疾病的防治效果如考核疫苗预防效果,可以将接种过疫苗的人群 作为一组,未接种人群作为另一组,比较两组发病率差异。 3.观察暴露因素与多种疾病相关结局的关系队列硏究不但可以硏究暴露 因素与疾病发生与否的关系,还可以了解暴露因素对疾病的发展、转归、预后的 影响。 4.研究疾病的自然史及其长期变动疾病在人群中的发生、发展到结局的 全过程称为疾病的自然史。通过队列研究的随访可以观察到疾病的整个自然史, 可以弥补临床观察的不足。 第二节研究实例 二十世纪上半叶英国发现肺癌的死亡率与支气管炎、肺结核以及其他癌症 不同,呈迅速上升趋势,而且与烟草的消耗量有平行关系,这种分布状况使卫生 工作者考虑到肺癌与吸烟之间是否存在联系。所以,Doll与Hl在1948年开始 进行了病例对照研究,发现肺癌患者中吸烟的比例明显高于对照组,吸烟有可能 是肺癌的病因。在此基础上,他们从1951年开始,又进行了队列研究以证实此 病因假设。他们选择英国医生作为研究对象,发函调查了59600名医生的一般情 况与吸烟状况,来自40701名医生的调査表可供分析。按吸烟与否分成暴露组与 非暴露组,然后进行随访,详细记录发病与死亡情况,并对收集到的资料进行多 方核对。此研究持续了几十年,从1964年报告的资料(表1)表明,35岁及以上 年龄组,每年不吸烟者肺癌死亡率为0.07‰,而每日吸烟1-14支者肺癌死亡率 为0.57‰,为不吸烟者的8.1倍;15-24支者为1.39‰,为不吸烟者的19.9倍; 25支及以上者为227‰,为不吸烟者的324倍。可见吸烟者患肺癌的危险性远 远高于不吸烟者,且呈明显的剂量效应关系
3 点:历史档案不一定符合设计要求,故适用范围较窄。 3. 双向性队列研究(ambispective cohort study) 根据历史档案确定暴 露与否,根据将来的情况确定结局,故这种设计又叫混合性队列研究。该方法不 但具有历史性队列研究的优点,还弥补了其不足。 (四)队列研究的应用范围 1.验证病因假设 确定某个暴露与疾病的因果联系及其联系强度,验证病 因假设。由于它是一种从“因”观“果”的研究方法,符合病因链的实际顺序, 故在病因学研究上的价值高于现况研究和病例对照研究,但由于其分组不是随机 的,故其效力不如实验性研究。 2.考核疾病的防治效果 如考核疫苗预防效果,可以将接种过疫苗的人群 作为一组,未接种人群作为另一组,比较两组发病率差异。 3.观察暴露因素与多种疾病相关结局的关系 队列研究不但可以研究暴露 因素与疾病发生与否的关系,还可以了解暴露因素对疾病的发展、转归、预后的 影响。 4.研究疾病的自然史及其长期变动 疾病在人群中的发生、发展到结局的 全过程称为疾病的自然史。通过队列研究的随访可以观察到疾病的整个自然史, 可以弥补临床观察的不足。 第二节 研究实例 二十世纪上半叶英国发现肺癌的死亡率与支气管炎、肺结核以及其他癌症 不同,呈迅速上升趋势,而且与烟草的消耗量有平行关系,这种分布状况使卫生 工作者考虑到肺癌与吸烟之间是否存在联系。所以,Doll 与 Hill 在 1948 年开始 进行了病例对照研究,发现肺癌患者中吸烟的比例明显高于对照组,吸烟有可能 是肺癌的病因。在此基础上,他们从 1951 年开始,又进行了队列研究以证实此 病因假设。他们选择英国医生作为研究对象,发函调查了 59600 名医生的一般情 况与吸烟状况,来自 40701 名医生的调查表可供分析。按吸烟与否分成暴露组与 非暴露组,然后进行随访,详细记录发病与死亡情况,并对收集到的资料进行多 方核对。此研究持续了几十年,从 1964 年报告的资料(表 1)表明,35 岁及以上 年龄组,每年不吸烟者肺癌死亡率为 0.07‰,而每日吸烟 1~14 支者肺癌死亡率 为 0.57‰,为不吸烟者的 8.1 倍;15~24 支者为 1.39‰ ,为不吸烟者的 19.9 倍; 25 支及以上者为 2.27‰,为不吸烟者的 32.4 倍。可见吸烟者患肺癌的危险性远 远高于不吸烟者,且呈明显的剂量效应关系
表135岁以上人群每年每1000人口肺癌死亡率与吸烟量的关系 不吸烟者肺癌 吸烟者肺癌死亡率(‰) 年龄组 死亡率(‰) 1~14支/日 15-24支/日25支以上/日 35~44 0.05(1)* 007(1) 0.00 0.11(1) 0.62(9) 0.75(8) 55-64 0.00 048(3) 2.31(20) 3.88(26) 0.00 269(9) 5.16(17) 648(14) 75 1.11l(2) 268(6) 7.27(8) 6.33(8) 007(3) 0.57(22) 1.39(54)2.27(57) *注:括号内为肺癌死亡人数 (Do和Hi,1964) 这个研究还从多方面证明了吸烟与肺癌之间的病因关系。Doll与Hll应用 规范的分析性流行病学方法,在人类历史上第一次科学地证明了吸烟是肺癌的病 因,从而为预防肺癌提供了确切的依据。从这个研究,不仅可了解队列研究这种 现代分析性流行病学方法,而且可以感受到它在揭示慢性病病因方面的无比威 力 第三节选择队列研究方法的指征 由于队列研究有一定的规模,需要观察一个较长时期,实施较为复杂,故 选择队列研究之前要经过周密的考虑 (一)前瞻性队列研究 1要有明确的研究目的和检验假设; 2所研究疾病的发病率或死亡率一般不应低于5%; 3.要有把握获得观察人群的暴露资料; 4要有确定发病或死亡等结局的简便而可靠的手段; 5要有把握获得足够数量的观察人群,并且该人群能被长期随访观察而取得 完整可靠的资料 6要有足够的人力、物力和财力 (二)历史性队列研究 要有足够数量的完整可靠的记录或档案材料,是实施历史性队列研究最重 要的前提,因为历史性队列硏究完全依赖于有关暴露、疾病和生死状况的完整真 实的历史记录。其他的应用指征见前瞻性队列研究,但其人力、物力、财力和时 间的要求并不是很高
4 表 1 35 岁以上人群每年每 1000 人口肺癌死亡率与吸烟量的关系 年龄组 不吸烟者肺癌 死亡率(‰) 吸烟者肺癌死亡率(‰) 1~14 支/日 15~24 支/日 25 支以上/日 35~44 0.05(1)* 0.07(1) 0.00 0.11(1) 45~54 0.00 0.31(3) 0.62(9) 0.75(8) 55~64 0.00 0.48(3) 2.31(20) 3.88(26) 65~74 0.00 2.69(9) 5.16(17) 6.48(14) 75~ 1.11(2) 2.68(6) 7.27(8) 16.33(8) 0.07(3) 0.57(22) 1.39(54) 2.27(57) * 注:括号内为肺癌死亡人数 (Doll 和 Hill,1964) 这个研究还从多方面证明了吸烟与肺癌之间的病因关系。Doll 与 Hill 应用 规范的分析性流行病学方法,在人类历史上第一次科学地证明了吸烟是肺癌的病 因,从而为预防肺癌提供了确切的依据。从这个研究,不仅可了解队列研究这种 现代分析性流行病学方法,而且可以感受到它在揭示慢性病病因方面的无比威 力。 第三节 选择队列研究方法的指征 由于队列研究有一定的规模,需要观察一个较长时期,实施较为复杂,故 选择队列研究之前要经过周密的考虑。 (一) 前瞻性队列研究 1.要有明确的研究目的和检验假设; 2.所研究疾病的发病率或死亡率一般不应低于 5%; 3.要有把握获得观察人群的暴露资料; 4.要有确定发病或死亡等结局的简便而可靠的手段; 5.要有把握获得足够数量的观察人群,并且该人群能被长期随访观察而取得 完整可靠的资料; 6.要有足够的人力、物力和财力。 (二) 历史性队列研究 要有足够数量的完整可靠的记录或档案材料,是实施历史性队列研究最重 要的前提,因为历史性队列研究完全依赖于有关暴露、疾病和生死状况的完整真 实的历史记录。其他的应用指征见前瞻性队列研究,但其人力、物力、财力和时 间的要求并不是很高
第四节队列研究的实施 (一)确定研究目的 队列研究首先要确定本次研究的目的,即根据一些病因线索提出病因假设, 然后验证假设是否科学、正确。这直接关系到研究的成败,故一定要有足够的科 学依据,可以先通过现况研究或病例对照研究结果初步验证假设,然后在此基础 上提出队列研究的检验假设。 (二)确定研究因素及研究因素的定义 一般把导致疾病事件增加的暴露因素称为危险因素或致病因素,把导致疾病 事件降低的暴露因素称为保护因素。暴露既可以是致病因素或保护因素还可是另 一个暴露产生的后果,即另一种疾病。例如,高血压是冠心病的暴露因素,但它 可能是其它暴露因素产生的结果,这要视研究目的和研究者对暴露因素的认识水 平而定。 有了明确的硏究因素后,接下来就须给研究因素一个明确的定义,如果我们 确定的暴露因素为吸烟,那么就必须事先明确规定何为吸烟?常用的吸烟定义为 平均每天吸烟量达到1支或以上、时间持续1年以上者,也有人将1年内吸烟总 量达到180支以上者定义为吸烟。究竟如何定义暴露因素,可以通过査阅文献或 请教有关专家,同时结合自己的研究目的、才力和人力限度和对研究结果的精确 度要求等因素,综合考虑后对暴露因素进行定义 另外,要尽可能对暴露因素进行定量,并且要考虑到暴露的时间长短以及暴 露是否连续。 队列研究除了要确定主要暴露因素外,同时应收集其他次要暴露因素资料 以便更好地说明研究结果。但一次硏究中暴露因素的数量也不能太多,否则影响 研究的精确程度。 (三)选择研究对象 1.暴露人群的选择可供选择的暴露人群有 (1)特殊暴露人群或职业人群:这部分人群暴露史明确,发病率也髙,故 易得出结果。特殊暴露人群指对某因素有较髙的暴露水平的人群。如果暴露因素 与疾病有关,则高度暴露的人群中疾病的发病率或死亡率就可能髙于其他人群, 这将有利于探索暴露与疾病之间的联系。所以在硏究暴露与疾病的关联时,常常 首先选择特殊暴露人群。例如选择遭受过原子弹爆炸危害的人群或接受过放射线 治疗的人群来研究放射线辐射与白血病的关系。 某些职业中常存在特殊暴露因素,它可能与某些疾病有关,所以某些职业人 群也是特殊暴露人群。例如选择染料厂工人硏究联苯胺致膀脱癌的作用,选择石 棉作业工人研究石棉与肺癌的关系等。 (2)一般人群:这种人群的代表性最好,得到的结果外推性好,但这部分
5 第四节 队列研究的实施 (一)确定研究目的 队列研究首先要确定本次研究的目的,即根据一些病因线索提出病因假设, 然后验证假设是否科学、正确。这直接关系到研究的成败,故一定要有足够的科 学依据,可以先通过现况研究或病例对照研究结果初步验证假设,然后在此基础 上提出队列研究的检验假设。 (二)确定研究因素及研究因素的定义 一般把导致疾病事件增加的暴露因素称为危险因素或致病因素,把导致疾病 事件降低的暴露因素称为保护因素。暴露既可以是致病因素或保护因素还可是另 一个暴露产生的后果,即另一种疾病。例如,高血压是冠心病的暴露因素,但它 可能是其它暴露因素产生的结果,这要视研究目的和研究者对暴露因素的认识水 平而定。 有了明确的研究因素后,接下来就须给研究因素一个明确的定义,如果我们 确定的暴露因素为吸烟,那么就必须事先明确规定何为吸烟?常用的吸烟定义为 平均每天吸烟量达到 1 支或以上、时间持续 1 年以上者,也有人将 1 年内吸烟总 量达到 180 支以上者定义为吸烟。究竟如何定义暴露因素,可以通过查阅文献或 请教有关专家,同时结合自己的研究目的、才力和人力限度和对研究结果的精确 度要求等因素,综合考虑后对暴露因素进行定义。 另外,要尽可能对暴露因素进行定量,并且要考虑到暴露的时间长短以及暴 露是否连续。 队列研究除了要确定主要暴露因素外,同时应收集其他次要暴露因素资料, 以便更好地说明研究结果。但一次研究中暴露因素的数量也不能太多,否则影响 研究的精确程度。 (三)选择研究对象 1.暴露人群的选择 可供选择的暴露人群有 (1)特殊暴露人群或职业人群:这部分人群暴露史明确,发病率也高,故 易得出结果。特殊暴露人群指对某因素有较高的暴露水平的人群。如果暴露因素 与疾病有关,则高度暴露的人群中疾病的发病率或死亡率就可能高于其他人群, 这将有利于探索暴露与疾病之间的联系。所以在研究暴露与疾病的关联时,常常 首先选择特殊暴露人群。例如选择遭受过原子弹爆炸危害的人群或接受过放射线 治疗的人群来研究放射线辐射与白血病的关系。 某些职业中常存在特殊暴露因素,它可能与某些疾病有关,所以某些职业人 群也是特殊暴露人群。例如选择染料厂工人研究联苯胺致膀脱癌的作用,选择石 棉作业工人研究石棉与肺癌的关系等。 (2)一般人群:这种人群的代表性最好,得到的结果外推性好,但这部分