以及如何在随机变量的样本值基础上推断概率分布和总体值。统 计推断中涉及的各种统计分析方法是本次授课的重点内容。 四、医学统计学在科研中的作用: 1、系统积暴和表达经验 临床经验的积累在于大量的临床实践。实际上这些经验都可以整 理和表达为统计信息,掌握了一定的统计学知识,就可以将积累的经 验,通过对资料的收集、整理和分析,转变为正规和系统的统计信息, 用以报告或发表,使人类医学知识宝库不断充实和发展。 2、鬼成科研工作 生物学是一门实验科学,不管你从事的是生物学的哪一个分支, 都不可能完全脱离实验,只进行逻辑推理.而实验所得到的结果几乎 无例外地都带有或多或少的不确定性,即实验误差.在这种情况下, 不用统计学要想得到正确的结论是不可能的,可以毫不夸张地说,作 为一个实验科学工作者,离开了统计学就寸步难行,希望通过这门课 程的学习,能够掌握常用的统计方法,尤其是它们的条件,适用范围、 优缺点等,从而能够应用它们去解决实践中遇到的问题。否则,他将 无法知道其研究结果是否具有科学意义上的可重复性。要一一回答这 些问题,要求研究者必须在整个研究过程中贯穿和运用统计学的理论 和方法。 3、提写研究报告和阅读书刊 医学研究中往往要涉及大量的数据,但在撰写研究报告和论文
以及如何在随机变量的样本值基础上推断概率分布和总体值。统 计推断中涉及的各种统计分析方法是本次授课的重点内容。 四、 医学统计学在科研中的作用: 1、系统积累和表达经验 临床经验的积累在于大量的临床实践。实际上这些经验都可以整 理和表达为统计信息,掌握了一定的统计学知识,就可以将积累的经 验,通过对资料的收集、整理和分析,转变为正规和系统的统计信息, 用以报告或发表,使人类医学知识宝库不断充实和发展。 2、完成科研工作 生物学是一门实验科学,不管你从事的是生物学的哪一个分支, 都不可能完全脱离实验,只进行逻辑推理.而实验所得到的结果几乎 无例外地都带有或多或少的不确定性,即实验误差.在这种情况下, 不用统计学要想得到正确的结论是不可能的,可以毫不夸张地说,作 为一个实验科学工作者,离开了统计学就寸步难行,希望通过这门课 程的学习,能够掌握常用的统计方法,尤其是它们的条件,适用范围、 优缺点等,从而能够应用它们去解决实践中遇到的问题。否则,他将 无法知道其研究结果是否具有科学意义上的可重复性。要一一回答这 些问题,要求研究者必须在整个研究过程中贯穿和运用统计学的理论 和方法。 3、撰写研究报告和阅读书刊 医学研究中往往要涉及大量的数据,但在撰写研究报告和论文
时,只能使用经过整理和归纳的统计指标,并且用规范的统计表和统 计图表达。此外,在阅读国外期刊时,如果不具备统计学的基础知识, 则不能判断别人研究结果的可信性和局限性,更谈不上吸收和借鉴。 五、《医学统计学》中几个重要的基本概念: ()总体(population)、样本(sample)、个体(observed unit) .总体:根据研究目的所确定的性质相同的所有个体的某种 变量值的集合。如:调查某地1999年正常成年男子的红细胞数,则 魂寨对象:该地1999年正常成年男子。 观素单::统计研究中的最基本单位,如:一个人、一个家庭、 一个地区等。 观豪佳(变量佳:每个人测得的红细胞数。 该地1999年正常成年男子的红细胞数就构成一个总体 同质基础:同一地区、同一年份、同为正常成人、同为男性 有限总体(finite population):有确定的时间、空间和有限个观 察单位,如上例。 无限总体(infinite population):没有确定的时间和空间限制,观 察单位数为无限。如研究用某药治疗缺铁性贫血的疗效,此时,总体 的同质基础是贫血患者,同时用某药治疗,该总体应包括用该药治疗 的所有贫血患者的治疗结果。 .样本:从总体中随机抽取部分个体所组成的集合。 (随机化原则:总体中每一个观察单位均有同等机会被抽取) (2)参数(parameter)、统计量(statistics)
时,只能使用经过整理和归纳的统计指标,并且用规范的统计表和统 计图表达。此外,在阅读国外期刊时,如果不具备统计学的基础知识, 则不能判断别人研究结果的可信性和局限性,更谈不上吸收和借鉴。 五、 《医学统计学》中几个重要的基本概念: (1) 总体(population)、样本(sample) 、个体(observed unit) a. 总体:根据研究目的所确定的性质相同的所有个体的某种 变量值的集合。如:调查某地 1999 年正常成年男子的红细胞数,则 观察对象:该地 1999 年正常成年男子。 观察单位:统计研究中的最基本单位,如:一个人、一个家庭、 一个地区等。 观察值(变量值):每个人测得的红细胞数。 该地 1999 年正常成年男子的红细胞数就构成一个总体。 同质基础:同一地区、同一年份、同为正常成人、同为男性 有限总体(finite population): 有确定的时间、空间和有限个观 察单位,如上例。 无限总体(infinite population):没有确定的时间和空间限制,观 察单位数为无限。如研究用某药治疗缺铁性贫血的疗效,此时,总体 的同质基础是贫血患者,同时用某药治疗,该总体应包括用该药治疗 的所有贫血患者的治疗结果。 b. 样本: 从总体中随机抽取部分个体所组成的集合。 (随机化原则:总体中每一个观察单位均有同等机会被抽取) (2)参数(parameter)、统计量(statistics)
统计学中把总体的指标称为参数,把所得样本的平均数称为统计量。 (3)误差(error): 抽样误差(sampling error)由于总体中的个体间往往存在着 变异,随机抽取的样本仅是总体中的一部分个体,因而样本测得的指 标(统计量)往往与总体指标(参数)存在着差异,这种由于随机抽 样而造成的样本的统计量与总体参数之间的差异,称为抽样误差,它 既不定量,也不定性。 系镜误差:由于设计不严,测量仪器不准确,测量者水平的偏 差而造成的,这种误差是定量的,可控的。 (4)统计资料 对每个观察单位的某项特征进行测量和观察,其特征称为变量, 对变量的测值称为变量值,亦称为资料。 计量资料(quantitative data) 统计资料类型 计数资料(qualitative data) 等级资料(ranked dat) ①、定量资料(quantitative data)又称为针量资料: 用专业仪器测量,具有计量单位的测量数据,表现为数值的大小, 如身高(cm)、体重(kg人、血压(kPa)等。 特点:每个观察单位的观察值间有量的区别 ②、定性资料(qualitative data):其观察值是定性的,表现为 互不相容的类别或属性(即将观察单位按某种属性或类别分组,所得 各组的观察单位数)
统计学中把总体的指标称为参数,把所得样本的平均数称为统计量。 (3)误差(error): 抽样误差(sampling error) 由于总体中的个体间往往存在着 变异,随机抽取的样本仅是总体中的一部分个体,因而样本测得的指 标(统计量)往往与总体指标(参数)存在着差异,这种由于随机抽 样而造成的样本的统计量与总体参数之间的差异,称为抽样误差,它 既不定量,也不定性。 系统误差: 由于设计不严,测量仪器不准确,测量者水平的偏 差而造成的,这种误差是定量的,可控的。 (4)统计资料 对每个观察单位的某项特征进行测量和观察,其特征称为变量, 对变量的测值称为变量值,亦称为资料。 计量资料(quantitative data) 统计资料类型 计数资料 (qualitative data) 等级资料 (ranked dat) ①、定量资料 (quantitative data) 又称为计量资料: 用专业仪器测量,具有计量单位的测量数据,表现为数值的大小, 如身高(cm)、体重(kg)、血压(kPa)等。 特点:每个观察单位的观察值间有量的区别 ②、定性资料 (qualitative data): 其观察值是定性的,表现为 互不相容的类别或属性(即将观察单位按某种属性或类别分组,所得 各组的观察单位数)
特点:每个观察单位的观察值间有质的区别 分两种情况: 1、无序分类(unordered categories)又称为计数资料 ā.二项分类检验结果可以是阳性或阴性、治疗结果可以是治 愈或未愈、性别属性等,表现为两类间互相对立。 b.多项分类某种观察结果为互不相容的多个类别,如血型、 职业等。 2有序分类(ordinal categories)又称为等级资料 介于定量测量和定性观察之间的半定量观察结果,如测定某人 群血清反应,以人为观察单位,结果分为一、士、+、+四级,又如 观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结 果分为治愈、显效、好转、无效四级,通常有两个以上等级: 等级资料与计数资料的区别在于,等级资料虽然是多分类资料, 但各个类别存在着大小和程度上的差别。 特点:各美之间有程度的差别 资料的转化和分析:根据分析问题的需要,各类变量可以互相转化。 如:观察某人群成年男子的血红蛋白量(gL),属数值变量: 若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计 量资料进行处理。 序号 正常人组 病人组 2 3 4
特点:每个观察单位的观察值间有质的区别 分两种情况: 1、无序分类(unordered categories)又称为计数资料 a.二项分类 检验结果可以是阳性或阴性、治疗结果可以是治 愈或未愈、性别属性等,表现为两类间互相对立。 b.多项分类 某种观察结果为互不相容的多个类别,如血型、 职业等。 2、有序分类 (ordinal categories) 又称为等级资料 介于定量测量和定性观察之间的半定量观察结果,如测定某人 群血清反应,以人为观察单位,结果分为—、±、+、++四级,又如 观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结 果分为治愈、显效、好转、无效四级,通常有两个以上等级。 等级资料与计数资料的区别在于,等级资料虽然是多分类资料, 但各个类别存在着大小和程度上的差别。 特点:各类之间有程度的差别 资料的转化和分析:根据分析问题的需要,各类变量可以互相转化。 如:观察某人群成年男子的血红蛋白量(g/L), 属数值变量; 若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计 量资料进行处理。 序号 正常人组 病人组 1 2 3 4 5
若按血红蛋白正常与偏低分为两类,可按二项分类资料处理: 正常人组 病人组 正常 偏低 合计 若按贫血的诊断标准将血红蛋白含量分为五个等级:重度贫血、 中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。 正常人组 病人组 重度贫血 中度贫血 轻度贫血 正常 血红蛋白增高 合计 (5)频率(frequency)、概率(probability) 医学研究的大多数现象是随机现象,例如用同一种治疗方法治 疗某病的一群患者,可以知道治疗的结果有四种,但对于一个病人其 治疗后的结果是不确定的,此时的每一种可能发生的结果都是一个随 机事件(偶然事件、事件)。 定义:在n次随机试验中,随机事件A发生了k次,记1)-奇 则称fk)为随机事件A在n次试验中出现的频率。 实践证明,大量的试验中随机事件会呈现出频率稳定性
6 7 8 9 若按血红蛋白正常与偏低分为两类,可按二项分类资料处理; 正常人组 病人组 正常 偏低 合计 若按贫血的诊断标准将血红蛋白含量分为五个等级:重度贫血、 中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。 正常人组 病人组 重度贫血 中度贫血 轻度贫血 正常 血红蛋白增高 合计 (5)频率(frequency)、概率(probability) 医学研究的大多数现象是随机现象,例如用同一种治疗方法治 疗某病的一群患者,可以知道治疗的结果有四种,但对于一个病人其 治疗后的结果是不确定的,此时的每一种可能发生的结果都是一个随 机事件(偶然事件、事件)。 定义:在 n 次随机试验中,随机事件 A 发生了 k 次,记 ( ) n k f k n = , 则称 f (k ) n 为随机事件 A 在 n 次试验中出现的频率。 实践证明,大量的试验中随机事件会呈现出频率稳定性