讲稿流行病学课程名称:课程编号:y100615授课学期:2012-2013秋季学期授课班级:08预防袁聚祥任课教师:学院河北联合大学公共卫生
讲 稿 课程名称: 流行病学 课程编号: y100615 授课学期:2012-2013 秋季学期 授课班级: 08 预防 任课教师: 袁聚祥 河北联合大学 公共卫生 学院
第3周,第1讲次课程名称:《流行病学》摘要第三章描述性研究第一节概述授课题目(章、节)第二节研究设计与实施第三节研究实例本讲目的要求及重点难点:【目的要求】通过本讲课程的学习,掌握现况研究的概念、目的与种类,普查与抽样调查的概念、目的及其优缺点;熟悉抽样调查的方法,估计样本大小的原则,现况研究中常见偏倚及其控制。了解抽样调查估计样本大小的公式。【重点】现况研究的目的及其方法:普查的概念、目的及优缺点;抽样调查的方法。[难 点】现况研究偏性的防止,现况研究的质量控制。内容【本讲课程的引入】描述性研究通过描述疾病或健康状况的三间分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。【本讲课程的内容】第一节现况研究概述一、基本概念强调现况研究描述性研究又称横断面研究,也称患病率研究。特点,不能确定研究特定时点或期间和特定范围内人群中的有关变量(因素)与疾病或健康状因果关系况的关系二、研究目的与应用范围1掌握目标群体中疾病或健康状况的分布2提供疾病病因研究的线索3确定高危人群4评价疾病监测、预防接种等防治措施效果三、研究特点与研究类型研究特点:1开始时一般不设对照组2现况研究的特定时间3在确定因果联系时受到限制4对不会发生改变的暴露因素,可以提示因果联系研究类型1普查:调查特定时点或时期、特定范围内的全部人群(总体)。普查时限:特定时间应该较短,甚至指某时点,一般为1~2天或1~2周,最长不宜超过2~3个月,特定范围可指某一地区或某种特征的人群。1
1 课程名称:《流行病学》 第 3 周,第 1 讲次 摘 要 授课题目(章、节) 第三章 描述性研究 第一节 概述 第二节 研究设计与实施 第三节 研究实例 本讲目的要求及重点难点: 【目的要求】通过本讲课程的学习,掌握现况研究的概念、目的与种类,普查与抽样调查的概 念、目的及其优缺点;熟悉抽样调查的方法,估计样本大小的原则,现况研究中常见偏倚及其控 制。了解抽样调查估计样本大小的公式。 【重 点】现况研究的目的及其方法;普查的概念、目的及优缺点;抽样调查的方法。 【难 点】现况研究偏性的防止,现况研究的质量控制。 内 容 【本讲课程的引入】描述性研究通过描述疾病或健康状况的三间分布情况,找 出某些因素与疾病或健康状况间的关系,提供病因线索。 它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。 【本讲课程的内容】 第一节 现况研究概述 一、基本概念 描述性研究又称横断面研究,也称患病率研究。 研究特定时点或期间和特定范围内人群中的有关变量(因素)与疾病或健康状 况的关系 二、研究目的与应用范围 1 掌握目标群体中疾病或健康状况的分布 2 提供疾病病因研究的线索 3 确定高危人群 4 评价疾病监测、预防接种等防治措施效果 三、研究特点与研究类型 研究特点: 1 开始时一般不设对照组 2 现况研究的特定时间 3 在确定因果联系时受到限制 4 对不会发生改变的暴露因素,可以提示因果联系 研究类型 1 普查:调查特定时点或时期、特定范围内的全部人群(总体)。 普查时限:特定时间应该较短,甚至指某时点,一般为 1~2 天或 1~2 周,最长不 宜超过 2~3 个月,特定范围可指某一地区或某种特征的人群。 强调现况研究 特点,不能确定 因果关系
普查分类:(1)以了解人群中某病的患病率或健康状况为目的:(2)以早期发现病人为目的(筛检)。普查目的与用途:(1)了解某人群中某种疾病或某危险因素的基本分布情况。(2)了解某人群的健康水平或生长发育情况。(3)建立生理指标或制定某项生物学检验标准。(4)早期发现病人,以便早期诊断、早期治疗,即便于普查普治,从而提高治愈率,减少病残或减少劳动能力。(5)在疾病爆发或流行时,可借助于普查来寻找全部病例,也可以了解疾病的全貌。普查适用于有下列特点的疾病:①患病率高;②有简便诊断方法;③有切实治疗方法;有足够人力、物力。普查的优缺点①优点:能提供疾病分布情况和流行因素或病因线索:能起到普及医学科学知识的作用:能发现人群中的全部病例,使其得到及时治疗。②缺点:工作量大,难免有遗漏:需大量人力、物力,成本高:不能获得发病率资料。普查应答率一般要求最好在85%以上。2抽样调查:随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本统计量估计总体参数所在范围。(1)优点:省时间、人力和物力,调查范围小,调查工作容易做得细致,适于调查发病率较高的疾病。(2)缺点:设计、实施与资料分析均比较复杂;重复、遗漏不易发现,且不适于变异过大的资料。第二节现况研究的设计与实施一、明确调查目的和类型1根据研究提出的问题,明确调查目的2根据具体研究目的确定是普查还是抽样调查二、确定研究对象根据研究目的规定对象的人群分布特征、地域范围以及时间点1某个区域内的全体居民或其中一部分2某一时点上的流动人员3某些特殊群体强调样本量的三、确定样本量和抽样方法确定样本量估算和抽样方1预期现患率(P)2允许误差(d)法3显著性水平(α)tapo数资料样本大小估计公式:n=dt:统计学上的t值d:容许误差P:某病现患率 Q=1-P当抽样误差d=0.1P时,则n=400g/p当抽样误差d=0.15P时,则n=178g/p例:欲调查我国的肺结核患病率,预定α=0.05,则t~2,从以往全国结核病流2
2 普查分类:(1)以了解人群中某病的患病率或健康状况为目的; (2) 以早期发现病人为目的(筛检)。 普查目的与用途: (1)了解某人群中某种疾病或某危险因素的基本分布情况。 (2)了解某人群的健康水平或生长发育情况。 (3)建立生理指标或制定某项生物学检验标准。 (4)早期发现病人,以便早期诊断、早期治疗,即便于普查普治,从而提高治愈 率,减少病残或减少劳动能力。 (5)在疾病爆发或流行时,可借助于普查来寻找全部病例,也可以了解疾病的全 貌。 普查适用于有下列特点的疾病: ①患病率高; ②有简便诊断方法;③有切实治疗方法; ④有足够人力、物力。 普查的优缺点 ①优点:能提供疾病分布情况和流行因素或病因线索;能起到普及医学科学知识 的作用;能发现人群中的全部病例,使其得到及时治疗。 ②缺点:工作量大,难免有遗漏;需大量人力、物力,成本高;不能获得发病率 资料。普查应答率一般要求最好在 85%以上。 2 抽样调查:随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本 统计量估计总体参数所在范围。 (1)优点: 省时间、人力和物力,调查范围小,调查工作容易做得细致,适于 调查发病率较高的疾病。 (2)缺点 : 设计、实施与资料分析均比较复杂;重复、遗漏不易发现,且不适 于变异过大的资料。 第二节 现况研究的设计与实施 一、明确调查目的和类型 1 根据研究提出的问题,明确调查目的 2 根据具体研究目的确定是普查还是抽样调查 二、确定研究对象 根据研究目的规定对象的人群分布特征、地域范围以及时间点 1 某个区域内的全体居民或其中一部分 2 某一时点上的流动人员 3 某些特殊群体 三、确定样本量和抽样方法 确定样本量 1 预期现患率 ( P ) 2 允许误差(d) 3 显著性水平(α) 数资料样本大小估计公式: t:统计学上的 t 值 d:容许误差 P:某病现患率 Q=1–P 当抽样误差 d=0.1P 时,则 n=400q/p 当抽样误差 d=0.15P 时,则 n=178q/p 例:欲调查我国的肺结核患病率,预定α=0.05,则 t≈2,从以往全国结核病流 强调样本量的 估算和抽样方 法 2 2 d t PQ n =
行病学调查的资料获知以往我国的结核病患病率为367/10万,若调查的容许误差定为50/10万,则所抽取的样本含量应为多大?根据题意,t=2,P=367/10万=0.00367,q=1-P=0.99633,d=50/10万=0.0005,则n为:tpqn=2=22×0.00367X0.99633/0.00052=58500(人)d?按不同预期阳性率和允许误差时的样本量允许误差预期现患率0.10P0.15P0.20P0. 057600190033820. 0754933210313280.10360016029000. 15226410095667124000.2016003000.2512005330.30930415233tas?抽样调查均数时样本量计算公式:n=d?n为样本数,ua为正态分布中自左向右的累积概率为a/2时的u值,u0.05=1.960,0为标准差,8为允许误差,一般取总体均数可信限的一半。当α取0.05时,S为样本的预期标准差,d为允许误差,则n=4S2/d2例:欲调查肝硬化患者的血色素含量,预定a=0.05,则t~2,从正常人群的资料查知一般人群的血色素标准差约为3.0g/100ml,调查的容许误差为0.2g/100ml,则所抽取的样本含量应为多大?根据题意,t2,S=3.0g/100ml,d=0.2g/100ml,则n为:n=ts/d=2×9/0.04=900(人)抽样方法:非随机抽样:随机抽样。1非随机抽样:选择样本时,加入人主观因素,使总体中每个个体被抽取的机会是不均等的。试验者根据试验调查的目的、要求和被调查对象的总体情况,有意识地选择那些具有代表性的对象进行试验。2随机抽样:遵循随机化原则,保证总体中每一个对象都有同等机会被选入作为研究对象。(1)单纯随机抽样(简单随机抽样):最简单、最基本的抽样方法。从总体N个对象中,利用抽签或其他随机方法抽取n个,总体中每个对象被抽到的概率相等,(2)系统抽样(机械抽样):按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。·将总体各个个体单位按某种标志排列、连续编号·根据总体数N和确定的样本数n,计算抽样距离(N/n)·用单纯随机方法在第一组中确定一个起始号3
3 行病学调查的资料获知以往我国的结核病患病率为 367/10 万,若调查的容许误差 定为 50/10 万,则所抽取的样本含量应为多大? 根据题意,t=2,P=367/10 万=0.00367,q=1-P=0.99633,d=50/10 万=0.0005, 则 n 为: =22×0.00367×0.99633/0.00052=58500(人) 按不同预期阳性率和允许误差时的样本量 允许误差 预期现患率 0.10P 0.15P 0.20P 0.05 7600 3382 1900 0.075 4933 2103 1328 0.10 3600 1602 900 0.15 2264 1009 566 0.20 1600 712 400 0.25 1200 533 300 0.30 930 415 233 抽样调查均数时样本量计算公式: n 为样本数, uα 为正态分布中自左向右的累积概率为α/2 时的 u 值, u 0.05=1.960, σ为标准差,δ为允许误差,一般取总体均数可信限的一半。 当α取 0.05 时,S 为样本的预期标准差,d 为允许误差,则:n=4S2/d2 例: 欲调查肝硬化患者的血色素含量,预定α=0.05,则 t≈2,从正常人群的 资料查知一般人群的血色素标准差约为 3.0g/100ml,调查的容许误差为 0.2 g/100ml,则所抽取的样本含量应为多大? 根据题意,t=2,S=3.0g/100ml,d=0.2 g/100ml,则 n 为:n= t 2 S 2 /d 2 =2 2 × 9/0.04=900(人) 抽样方法:非随机抽样;随机抽样。 1 非随机抽样:选择样本时,加入人主观因素,使总体中每个个体被抽取的机会是 不均等的。 试验者根据试验调查的目的、要求和被调查对象的总体情况,有意 识地选择那些具有代表性的对象进行试验。 2 随机抽样:遵循随机化原则,保证总体中每一个对象都有同等机会被选入作为研 究对象。 (1)单纯随机抽样(简单随机抽样):最简单、最基本的抽样方法。从总体 N 个对 象中,利用抽签或其他随机方法抽取 n 个,总体中每个对象被抽到的概率相等, (2)系统抽样(机械抽样):按照一定顺序,机械地每隔若干单位抽取一个单位的 抽样方法。 •将总体各个个体单位按某种标志排列、连续编号 •根据总体数 N 和确定的样本数 n,计算抽样距离(N/n) •用单纯随机方法在第一组中确定一个起始号 2 2 d t pq n = 2 2 2 d t s n =
·从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象抽样比=n/N,抽样间隔为抽样比的倒数。如抽样比为5%(1/20),则抽样间隔为20。例如:总体中有250000个单位,决定抽取1000个作为样本。其比例应为1000/250000=1/250,即每250个中抽1个,具体做法是:先从1~250号中随机抽取1个作为起点,之后每隔250个抽取1个。(3)整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。分类:①单纯整群抽样:被抽到的群组中的全部个体均作为调查对象②二阶段抽样:通过再次抽样后调查部分个体例:要调查20所小学约10000名小学生某疾病的现患率,现要求抽查2000人,如用单纯随机抽样抽到的对象分散在各所小学,对调查的实施不方便,但若随机抽取4所小学,抽到的学校全部学生均进行调查,则实施很方便,可节省人力、物力,也易于为调查对象接受。但由于整群抽样的误差较大,一般样本数应在原有基础上增加20%。即再增加4X20%=0.8(所),则实际样本量为5所学校。(4)分层抽样:将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类:①按比例分配分层随机抽样:各层内抽样比例相同。②最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大。例:某地15岁以上各年龄组的人口数如下表,欲抽取1万人调查高血压患病率。采取按比例分层抽样方法时,首先计算抽样比例:10000/177000×100%=5.65%。再计算各年龄组的抽样人数某地15岁以上人口数和按相等比例确定的抽样人数人数(2)年龄组(1)抽样人数(3)=5.65%×(2)15~25000141225~34000192135~38000214745~32000180955~28000158165~200001130合计17700010000每层内可按单纯随机抽样法或其它方法抽取所需人数。以上四种抽样方法的抽样误差由小到大依次:分层抽样<系统抽样<单纯随机抽样<整群抽样3多级抽样:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,在大型流行病学调查中常用。方法:(1)从总体中抽取范围较大的单元(一级抽样)(2)从一级单元中抽取范围较小的单元(二级抽样)(3)依此类推…四、资料的收集通过测定或检查的方法收集4
4 •从此起始点开始,每隔 K(K=N/n)个单位抽取一个作为研究对象 抽样比=n /N,抽样间隔为抽样比的倒数。如抽样比为 5%(1/20),则抽样间隔 为 20。 例如:总体中有 250000 个单位,决定抽取 1000 个作为样本。 其比例应为 1000/250000=1/250 ,即每 250 个中抽 1 个,具体做法是:先从 1~ 250 号中随机抽取 1 个作为起点,之后每隔 250 个抽取 1 个。 (3)整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。 分类: ①单纯整群抽样:被抽到的群组中的全部个体均作为调查对象 ②二阶段抽样:通过再次抽样后调查部分个体 例:要调查 20 所小学约 10000 名小学生某疾病的现患率,现要求抽查 2000 人, 如用单纯随机抽样抽到的对象分散在各所小学,对调查的实施不方便,但若随机抽 取 4 所小学,抽到的学校全部学生均进行调查,则实施很方便,可节省人力、物力, 也易于为调查对象接受。 但由于整群抽样的误差较大,一般样本数应在原有基础上增加 20%。即再增加 4×20%=0.8(所),则实际样本量为 5 所学校。 (4)分层抽样:将总体单位按某种特征分为若干次级(层),然后从每一层内单纯 随机抽样组成一个样本。分类: ①按比例分配分层随机抽样:各层内抽样比例相同。 ②最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内 部变异大的层抽样比例大。 例:某地 15 岁以上各年龄组的人口数如下表,欲抽取 1 万人调查高血压患病 率。采取按比例分层抽样方法时,首先计算抽样比例:10000/177000×100%=5.65%。 再计算各年龄组的抽样人数。 某地 15 岁以上人口数和按相等比例确定的抽样人数 年龄组(1) 人数(2) 抽样人数(3)=5.65% ×(2) 15~ 25000 1412 25~ 34000 1921 35~ 38000 2147 45~ 32000 1809 55~ 28000 1581 65~ 20000 1130 合计 177000 10000 每层内可按单纯随机抽样法或其它方法抽取所需人数。 以上四种抽样方法的抽样误差由小到大依次:分层抽样<系统抽样<单纯随机抽样< 整群抽样 3 多级抽样:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以 上抽样方法结合使用,在大型流行病学调查中常用。方法: (1)从总体中抽取范围较大的单元(一级抽样) (2)从一级单元中抽取范围较小的单元(二级抽样) (3)依此类推. 四、资料的收集 通过测定或检查的方法收集