2015/1/9 课程设置 ▣x▣ 添财:覆论漂:22学财 共习:10学对 ■ 展泰方式:预防医拳集卫生统计季教研堂 医学统计学 Tel.:2057153 (Medical Statistics) 须防医季条 大季措品课程网站→教季资娇+(Ppt、WmV) 医学统计学的概念: 精论的三大任务: ■医桑:其纯医桑、临度医桑、预防医举 ■预防医学:卫生学、流行病学、 医学统计学 为什么学 ■医学统计学:应用搬率论和数理统计学原理 2 学什么 7 怎么学 “如果不能合理地运用,删可能造成不应有 的缺陷或得出错误的结论。 至am. 盛统出107州,有说101创,者我*为 表山形心美与華纯西药疗数对比 技体二4 单纯而芳 40 42 计算重信E间(Confidence Interval) 要学医 101/107=94.39% 87.70-97.70) 复设检脸(Test of significance), 18/19=94.74% (71.89-99.72) 计算机P值。 举月统计思维 学月统计思维
2015/1/9 1 医学统计学 (Medical Statistics) 预防医学系 1 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 3 医学统计学的概念: 医 学:基础医学、临床医学、预防医学 预防医学:卫生学、流行病学、医学统计学 医学统计学:应用概率论和数理统计学原理 结合医学实际,解决医学科研中设计、资料 收集、整理、分析的科学。 “如果不能合理地运用,则可能造成不应有 的缺陷或得出错误的结论。” 3 4 绪论的三大任务: ? ? ? 为什么学 学什么 怎么学 4 5 京某医院某大夫使用“乌贝散” (乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱,共研细末过120目筛,冲服) 治疗胃溃疡病出血107例,有效101例,有效率为 94.4% 别的医院,其他大夫使用“乌贝散”来治疗胃 溃疡病出血,其有效率也一定是94.4%吗? 计算 置信区间(Confidence Interval) 101/107=94.39% (87.70-97.70) 18/19= 94.74% (71.89-99.72) 医 学 生 为 什 么 要 学 医 学 统 计 学 ? 学习统计思维 5 6 某医院有位老大夫,用“冠心灵”治疗冠心病, 对照组用西药,观察结果如下表: 表1-1 冠心灵与单纯西药疗效对比 显 效 有 效 无 效 合计 单纯西药 9 25 6 40 冠 心 灵 19 18 5 42 冠心灵是否比单纯西药有效? 假设检验 (Test of significance), 计算概率P值。 学习统计思维 医 学 生 为 什 么 要 学 医 学 统 计 学 ? 6
2015/1/9 医苏桑态中一着文津振平,眉茶种中单药海守 哈萨克族人群高血压与高血糖及高血关 就感,者放卓为7B%,平均疗短为1厕左右。 一元什 阿此药海疗沈感的喷者故马? 由于流人有然海的情况 原药, 自意。 医学统计学 此葛的78%卉故者精操计! 族不同体质指最人群中血压与血素乱、 血升高天 ■■ 侧读论文吸收新知识 皆论的三大任务: 了术进展。 为什么举 的用 翼写论文:报告自已观 学什么 桌或实验的所究结果。 怎么学 aes,M.d.尺.Heay 本书的主要内容 ■教值变量的统计描述 ■教值变量的统计推新 ■分类变量的统计描述 ■分类变量的统计推断 医学统计中的基本概念 ■非泉故绕计 Basic Concept in Medical Statistics) ■直线相关与直线回归 ■统计表和统计图
2015/1/9 2 7 某杂志中一篇文章报导,用某种中草药治疗 流感,有效率为78%,平均疗程为1周左右。 问此药治疗流感的确有效吗? 由于流感具有自然治愈的情况 ,一般不 服药,多喝水,到1周左右有些患者也会 自愈。 此药的78%疗效有待探讨 ! 医 学 生 为 什 么 要 学 医 学 统 计 学 ? 7 8 哈萨克族人群高血压与高血糖及高血脂关系 摘要:目的 探讨新疆哈萨克族不同体质指数人群高血压与高 血脂、高血糖的关系。方法 采用分层整群抽样的方法,对沙 湾地区18岁以上哈萨克族居民进行高血压调查和体质指数、血 清胆固醇、甘油三酯、血糖等指标检测。结果 高血压组与对 照组比较,高血糖检出率分别为16%,6.3%(x2 =24.35, P=0.00,高总胆固醇分别为18.7%,9.9%(x2 =15.63, P=0.00),高甘油三酯分别为20.9% ,15.1% (x2 = 5.28, P=0.02);高低密度脂蛋白分别为15.4%,7.2%(x2 = 16.70, P=0.00),低高密度脂蛋白分别为18.6%,6.2%(x2 = 25.41, P=0.00),并且随体质指数增大,血糖、血清总胆固醇、甘油 三酯、低密度脂蛋白胆固醇水平升高,高密度脂蛋白胆固醇水 平降低。且在高血压组和对照组异常率均升高(P<0.05)。结论 哈萨克族不同体质指数人群中高血压与血脂紊乱、血糖升高关 系密切。 8 9 “非常痛心地看到,因为数据分析的缺陷和错误, 那么多好的生物研究工作面临着被葬送的危险” 。 -- F. Yates,M.J.R. Healy 统计知识 在医学中 的运用 撰写论文:报告自己观 察或实验的研究结果。 阅读论文:吸收新知识, 了解学术进展。 医 学 生 为 什 么 要 学 医 学 统 计 学 ? 9 10 绪论的三大任务: ? ? ? 为什么学 学什么 怎么学 10 本书的主要内容 数值变量的统计描述 数值变量的统计推断 分类变量的统计描述 分类变量的统计推断 非参数统计 直线相关与直线回归 统计表和统计图 11 医学统计中的基本概念 ( Basic Concept in Medical Statistics) 12
2015/1/9 第二节医学貌计的内衣及资料真型 第二节医学姚计的内及资州夹型 二、资样的典型 ,研党最计(design). 计量養样(measurement data 计k養样(enumeration data) >差翼普样(orting data) 等复资并(ranked data) ,会斯普并(analys纯data) 资养的种换 第二节医学姚计的内衣及资料夹型 统计资料的类型 史量与晚计资始分真方 1.k值文nume variable)计量 史量成值史量 构成计量资机 2.元李分4吏t(unordered categorles varlable) 分真史量「无库分真史量的成计款资料 .计k囊鲜(enumeration data 3.有李分4史量(ordinal categories variable))k等 银资样(ranked data) 统计资料的典型 统计资料的类型 数值支量与计量资样 无序分真麦量与计戴资料 ).元◆◆4支量unordered cateorlesvarlable)):变量值是 者高(cm、体重kg、▲压pa、业高/者高。 长值史量值 :石与子市09 年7岁易孩贵高值 120.2dm,118.6cm,121.8am*+) 35B130AB:10 3」
2015/1/9 3 13 第二节 医学统计的内容及资料类型 一、医学统计学的基本步骤和内容 研究设计( design) 收集资料(collection data) 整理资料 (sorting data) 分析资料 (analysis data) 13 14 二、资料的类型 计量资料 (measurement data) 计数资料 (enumeration data ) 等级资料 (ranked data ) 资料的转换 第二节 医学统计的内容及资料类型 14 变量与统计资料的分类方法 1.数值变量(numerical variable)和计量资料 (measurement data) 2.无序分类变量(unordered categories variable ) 和计数资料 (enumeration data) 3.有序分类变量(ordinal categories variable)和等 级资料(ranked data) 第二节 医学统计的内容及资料类型 15 概述 数值变量……………………..构成计量资料 分类变量 无序分类变量…..构成计数资料 有序分类变量…..构成等级资料 变量 统计资料的类型 16 数值变量与计量资料 1) 数值变量(numerical variable) :变量值是定量 的,表现为数值 大小,一般有度量衡单位。如: 身高(cm)、体重(kg)、血压(pa)、 坐高/身高。 2) 计量资料(measurement data) :由一群个体的 数值变量值构成的资料,即一群变量值。 如:石河子市09年7岁男孩身高值 (120.2cm,118.6cm,121.8cm…) 统计资料的类型 17 无序分类变量与计数资料 1). 无序分类变量(unordered categories variable):变量值是 定性的,有类别。 特点:类别客观存在,各类无秩序,可任意排列;类与类 之间界限清楚,(理论上)不会错判。 如:性别:男、女。 血型:O、A、 B、AB。 2). 计数资料(enumeration data):一群个体按无序分类变量 的类别清点每类有多少个个体,即分类个体数。 如: 性别构成:男:6 女:7 某人群血型构成:O:20 A:35 B:30 AB:10 统计资料的类型 18
2015/1/9 ■ 统计资料的类型 统计资料的类型 有序分真文量与等板资料 刀者◆会春绕(ornrevarlabl间:支女值无龙做 4于1 么请反点:一士,+、什 2格装不好个本会文去利情 一中我食 +:茶地#人平B高康批排反A:1手5 12-16/a >16g/d0- 转化过程中信息不断衰减 ■ 医拳统计学中的几个基本概念 医学统计拳中的几个基本概念 。(-J观寒单位和支量(observation unit and variable) 资。 老可以是 研完的述观对春种粉 成上的业制,又命市无小真和者李分真, 无李争真(unranked categories典制间无a度上的 e文量值(value of variable)):史量的观奉地景 楼文童值是定量的运是定性的普史量分为款值支量和 分典史量。 医学统计学中的几个基本瓶念 医学统计学中的几个基本概念 。(三)善体与将本(popul on and sample) 。【=)周度与支弄(homogeneity and variation) 着体:旅桶研完司的确定的具者茶要兴同性质的 ·同项:性质湘同。创知:同平桥、同丝刮。 所者个体的茶种史量值的暴合。了分为者限慝 。童弄:研充对流中春现,嘉華位木体间随美弄 体小无展愿体。 创:同年静、用性利的一轮葛被,在真同的 ·平本:从愿体中威机精取的代表恶体的一邮分 情元下业长,局他们的责高、体童不完金和同, 个休豫为样本。 就计季北这种个体涧始是开称为变开。 能计述 总林 4
2015/1/9 4 有序分类变量与等级资料 1)有序分类变量(ordinal categories variable) :变量值是定性 的、分等级。 特点:等级是主观划分的,各级没有大小但有秩序,必须 从低到高或由高到低;级和级之间界限模糊,可能错判。 如: 疗效:无效、好转、显效、治愈。 血清反应:–、+、+、++ 2)等级资料(ranked data):一群个体按有序分类变量的级别清 点每级有多少个个体,即分级个体数。 如:某地某人群EB病毒抗体反应:–: 65 +: 2 +: 3 ++: 1 统计资料的类型 19 统计资料的类型 资料的转化:根据分析的需要,计量资料、等级资料、 计数资料可以单向转化。 例如血红蛋白原属于计量资料; 若按血红蛋白按量的多少分成五级属等级资料; <6(g/dl)——重度贫血 6~(g/dl)——中度贫血 9~ (g/dl)——轻度贫血 12~16(g/dl)——正常 >16(g/dl)——增多 若按血红蛋白正常与异常分两组得到各组人数是计数资料; 转化过程中信息不断衰减 20 医学统计学中的几个基本概念 (一)观察单位和变量(observation unit and variable) 观察单位(unit):研究中按研究目的确定的研究个体。 它可以是一个人、一个家庭、一个地区、一个样品。 变量(variable):按研究目的描述观察对象各种特 征的量。亦称作指标或因子。 变量值(value of variable) :变量的观察结果 按变量值是定量的还是定性的将变量分为数值变量和 分类变量。 21 数值变量(numerical variable) :其变量值是定量的, 表现为数值大小,一般有度量衡单位,亦称为计量 资料。 分类变量(categorical variable)其变量值是定性的, 表现为互不相容的类别和属性。根据类别间有无程 度上的差别,又分为无序分类和有序分类。 无序分类(unranked categories)类别间无程度上的 差异。 有序分类(ranked categories)类别间有程度上的差异。 医学统计学中的几个基本概念 22 (二)同质与变异(homogeneity and variation) 同质:性质相同。例如:同年龄、同性别。 变异:研究对象中各观察单位个体间的差异。 例如:同年龄、同性别的一批男孩,在类同的 情况下生长,而他们的身高、体重不完全相同, 统计学把这种个体间的差异称为变异。 变异是统计学存在的根本原因。 医学统计学中的几个基本概念 23 (三)总体与样本(population and sample) 总体:根据研究目的确定的具有某些共同性质的 所有个体的某种变量值的集合。可分为有限总 体和无限总体。 样本:从总体中随机抽取的代表总体的一部分 个体称为样本。 医学统计学中的几个基本概念 24 总体 样本 抽取部分观察单位 参 数 统计量 统计推断 X S 统计描述 x X S 24
2015/1/9 医学统计学中的几个基本概念 从慈体中精取料本,一定要是循科学原则。 。()享与统计量(arm) 一最来说,一个拆本盛具者: ●享款:表示落体糟征的指标。用希赠字◆表示。 "代表性”((representative) 创如慝体均藏巴,慝体标准差; “tk”(randomization) 心就计重:表示料本精征的指标。用拉丁李零 表示。例知样本均散X,料本标准差5; “可素性”(reliabllity) 医学统计学中的几个基本瓶念 医学统计学中的几个基本概念 ()差(error):量值与真值的是开 ●C亚)随格解满是(sampling error 口是(system error). 口tka差(randomized error) 已地人年母压10.0p,000人为年 ,藏k侧量s垂(random measurement error) 00人 100万人 医学统计学中的几个基本机念 医学统计学中的几个基本机念 ●抽坪溪是糟点: 口板平者古4机平与能计幅平七食, ·抽样裤差不可晚免,但有机摩可普。 口卧盘率年,气平为1 。杯未地大,代泰性地好,妆诉酒是地小) 口不写题率件,规来场0 ·样本地小,代表性地姜,精样满差地大 口小,P<0.05P<0.01 口常起P<0.05你为率物是利有能计净客义的票展, P<0.01保场是利害高能计季老义不限。 5
2015/1/9 5 25 从总体中抽取样本,一定要遵循科学原则。 一般来说,一个样本应具有: “代表性” (representative) “随机性” (randomization) “可靠性” (reliability) 25 (四)参数与统计量(parameter and statistic) 参数:表示总体特征的指标。用希腊字母表示。 例如总体均数μ,总体标准差σ; 统计量:表示样本特征的指标。用拉丁字母 表示。例如样本均数 x,样本标准差s ; 医学统计学中的几个基本概念 26 27 (五)误差(error):测量值与真实值的差异 系统误差(system error) 随机误差(randomized error ) 随机测量误差(random measurement error) 随机抽样误差 (sampling error) 医学统计学中的几个基本概念 27 (五)随机抽样误差(sampling error) 由抽样所引起的样本指标与总体指标及样本指标与 样本指标之间的差别。 已知某地人群舒张压值10.0kp,随机抽取1000人为样本 样本1 样本2 总体 1000人 1000人 100万人 73.9mmHg 74.6mmHg 75mmHg (9.85kp) (9.95kp) (10.0kp) 医学统计学中的几个基本概念 28 抽样误差特点: 抽样误差不可避免,但有规律可寻。 样本越大,代表性越好,抽样误差越小; 样本越小,代表性越差,抽样误差越大; 医学统计学中的几个基本概念 29 30 六、概率(probability) 概率有古典概率与统计概率之分, 医学上常用的是统计概率 f/N 必然事件,概率为 1 不可能事件,概率为 0 小概率事件,P≤0.05 或 P≤0.01 常把 P≤0.05 作为事物差别有统计学意义的界限 , P≤0.01 作为事物差别有高度统计学意义的界限。 医学统计学中的几个基本概念 30