第1周,第2讲次课程名称:《卫生统计学A》摘要第二章定量资料的统计描述授课题目(章、节)第一节频数与频数分布第二节定量变量的特征数【目的要求】掌握描述集中趋势、离散趋势的常用指标及其意义、适用范围。熟悉集中趋势、计算,频数分布表的编制及用途,频数分布的类型。【重点】描述集中趋势、离散趋势的常用指标及其意义、适用范围【难点】各类指标的应用。内 容
课程名称:《卫生统计学 A》 第 1 周,第 2 讲次 摘 要 授课题目(章、节) 第二章 定量资料的统计描述 第一节 频数与频数分布 第二节 定量变量的特征数 【目的要求】掌握描述集中趋势、离散趋势的常用指标及其意义、适用范围。熟悉集中趋势、 计算,频数分布表的编制及用途,频数分布的类型。 【重 点】描述集中趋势、离散趋势的常用指标及其意义、适用范围 【难 点】各类指标的应用。 内 容
【本讲课程的引入】统计描述是统计分析的内容之一,也是对科研实际工作中收集的资料进行分析的常用方法,通过统计描述可以了解资料的数量特征及其分布规律。但是统计描述的指标和方法却因资料类型而异,这一章主要介绍的是定量资料的统计描述。【本讲课程的内容】第一节频数与频数分布频数:对一个随机变量做重复观察,其中某变量值出现的次数。频率(frequency):各组频数除以总例数n所得的比值。频数分布表(frequencydistributiontable):将各变量值及其相应的频数列成表格的形式。离散型定量变量的频数分布:例2-1,表2-1举例12卫生统计学表2-11998年某地96名妇女产前检查次数分布累计人数检查次数频数额率(%)累计频率(%)(1)(2)(3)(4)(5)4.24. 2 044177.31111.51122211.522.9351313. 5 36. 5 3>2627. 16163. 55238424. 087.512>512.596100. 0合计96100内容
【本讲课程的引入】统计描述是统计分析的内容之一,也是对科研实际工作中收集 的资料进行分析的常用方法,通过统计描述可以了解资料的数量特征及其分布规 律。但是统计描述的指标和方法却因资料类型而异,这一章主要介绍的是定量资料 的统计描述。 【本讲课程的内容】 第一节 频数与频数分布 频数:对一个随机变量做重复观察,其中某变量值出现的次数。 频率(frequency):各组频数除以总例数 n 所得的比值。 频数分布表(frequency distribution table):将各变量值及其相应的频数列 成表格的形式。 一、离散型定量变量的频数分布:例 2-1,表 2-1 举例 内 容
二、连续型定量变量的频数分布例2-2:120名健康成年男子血清铁含量资料1、频数表的编制讲授、举(1)求全距(极差)R=29.64-7.42=22.22(2)定组段数与组距:8~15个组段,组距i=全距/组段数例(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。下限:每个组段的起点最小值)。上限:每个组段的终点(近似最大值)最后一个组段应同时写出上限和下限。(4)归组划记:得出频数并可计算频率、累积频数、累积频率。表2-2120名正常成年男子血清铁含量(μumol/L)频数表频率数累计频数组段累计额率(1)(2)(3)(4)(5)6--30.830. 83-.8~42.503.3365.001o10 ~8, 3312 -86.67315, 002025.0014 ~10. 0016 ~16. 6741.6718 ~2722.50T64, 171950:B215.0079, 1789, 1710.0024~86.6711595. 8326~A3.3311999.1728~3010.83120100, 00120100合计2、频数表的用途(1)陈述资料。(2)揭示资料的分布类型:对称分布和偏态分布对称分布型:指集中位置在正中,左右两侧频数分布大体对称。偏态分布型:指集中位置偏向一侧,频数分布不对称。偏态分布型:正偏态分布-集中位置偏向数值小的一侧。负偏态分布:集中位置偏向数值大的一侧。皖A·中品15-10-.810121416182022242628血清铁(umol/L)2.5 4.5 6.5 8.5 10.5 12.514.5 16.5 18.5 20.5图2-2120例健康成年男子血清铁含量(μmol/L)发乘组中值(μmol/kg)图2-3某地居民238人发汞含量(μmol/kg)分布分布(频率密度=频率/组距)(3)揭示资料的分布特征集中趋势(centraltendency)离散趋势(dispersion)
二、连续型定量变量的频数分布 例 2-2:120 名健康成年男子血清铁含量资料 1、频数表的编制 (1)求全距(极差)R=29.64-7.42=22.22 (2)定组段数与组距 : 8~15 个组段,组距 i=全距/组段数 (3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。 下限:每个组段的起点(最小值) 。 上限:每个组段的终点(近似最大值)。 最后一个组段应同时写出上限和下限。 (4)归组划记:得出频数并可计算频率、累积频数、累积频率。 2、频数表的用途 ⑴陈述资料。 ⑵揭示资料的分布类型: 对称分布和偏态分布 对称分布型:指集中位置在正中,左右两侧频数分布大体对称。 偏态分布型:指集中位置偏向一侧,频数分布不对称。 偏态分布型:正偏态分布-集中位置偏向数值小的一侧。 负偏态分布:集中位置偏向数值大的一侧。 ⑶揭示资料的分布特征:集中趋势(central tendency)、离散趋势(dispersion) 集中趋势:血清铁含量向中央部分集中,即中等含量者居多,集中在 18 这个 讲授、举 例
内 容
内 容
组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布逐渐减少而且血清铁含量的值参差不齐,最低的接近6,最高的接近30,这种现象称为离散趋势。(4)便于进一步计算指标和统计处理;讲授(5)便于发现某些特大或特小的可疑值第二节定量变量的特征数总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同-年龄段、相同的性别与类似的健康状况,这些共同点使得观察单位的同一变量趋向同一数值,即集中趋势。另一方面,同一总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、营养、行为等各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致某地18-35岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的离散趋势。集中趋势与离散趋势是频数分布的两个特征,需进行定量的描述。一、描述集中趋势的统计指标描述集中趋势的统计指标:均数、几何均数、中位数1.算术均数(arithmeticmean):简称均数(mean)常用X表示样本均数u表示总体均数。均数用于反映一组同质观察值的平均水平,适用于正态或近似正态分布的数值变量资料。其计算方法有:直接法:x=2x++例 2-3n加权法:-x例2-4Ef应用-适用于描述对称分布特别是正态分布资料的平均水平或集中位置,因为这时均数位于分布的中心,最能反映资料的集中趋势
组段,这种现象为集中趋势。离散趋势:从中央部分到两侧的频数分布逐渐减少, 而且血清铁含量的值参差不齐,最低的接近 6,最高的接近 30,这种现象称为离散 趋势。 ⑷便于进一步计算指标和统计处理; ⑸便于发现某些特大或特小的可疑值 第二节 定量变量的特征数 总体中的某些个体总是具有某些同质性,同一地区、同一年度、同一民族、同 一年龄段、相同的性别与类似的健康状况,这些共同点使得观察单位的同一变量趋 向同一数值,即集中趋势。 另一方面,同一总体中的个体之间又普遍存在着各种差别,也就是说由于遗传、 营养、行为等各种因素在个体之间都不会完全相同,即个体间存在差异,因此导致 某地 18-35 岁健康男性居民血清铁含量不会完全相同,而是呈现或大或小的离散趋 势。 集中趋势与离散趋势是频数分布的两个特征,需进行定量的描述。 一、描述集中趋势的统计指标 描述集中趋势的统计指标:均数、几何均数、中位数 1.算术均数(arithmetic mean):简称均数(mean)常用 X 表示样本均数, 表示总体均数。均数用于反映一组同质观察值的平均水平,适用于正态或近似正 态分布的数值变量资料。其计算方法有: 直接法: 1 2 . n x x x x n + + = 例 2-3 加权法: 0 x f x f = 例 2-4 应用-适用于描述对称分布特别是正态分布资料的平均水平或集中位置,因为这时 均数位于分布的中心,最能反映资料的集中趋势。 讲授