第3章统计描述 第1节统计表 1.统计表的基本概念和格式 统计表是以表格的形式简明地表达事物间数量关系的一种方式。它不仅可以代替冗长的 文字叙述,而且便于阅读在进行统计分析和比较时也十分方便因此在医学研究中应用极为 广泛。 统计表由标题、横标目、纵标目线条数字等组成其基本格式如表1.3.1所示 表1.3.1标题何地何时、何事) 顶线 横标目的 总的纵标目(单位) 总标目 纵标目纵标目纵标目 隔线 横标目 数字区域 底线 在编制统计表时,首先町出统计表的基本格式,即三条横线然后,按统计表各部分的一般 要求进行编制。 (1)标题 是统计表的总名称。通常写在表的上方要求简明扼要、主题思想和目的性明确使人一 看标题就能了解列表的用意。一般应把时间、地点和内容表示出来 (2)内容 要简单明了,一个表最好表示一个中心内容,不要过于庞杂 (3)排列 统计表的纵栏和横行要按一定的、合理的次序排列,统计表的“主词”和“宾词”要安排恰 当,一个好的统计表所列的标月和数字可以读成…句话。同类的或要比较的事项,尽可能列在 起,便于分析研究或对比。 (4)标日 分为纵标目和横标日。总的纵标目写在表的上部,一般指统计指标,用来说明下面的现象 或情况;横标目(即第一分组标志)位于表的左侧,说明每一横行的内容;纵标目(即第二分组标 志)写在总的纵标目之下,说明每一列的内容 (5)数字和符号 统计表中的数字一律用阿拉伯数字填写,小数的位数应前后对准。暂缺或未记录用“…” 15
表示,无数字用“-”数字为零者填“0” (6)线条 要尽量少,表中不必要的横线都可取消,表中不能有左上角的斜线和竖线。这样既可减 少制表和排印上困难,又可使统计表的“主词”和“宾词”更加明显。为了使行数很多的表在取消 横线后不看错行,可将横行每隔几行分为一组,组间空一行隔开。 (7)表的备注栏 不是统计表的必要组成部分,需要特别说明时才写在表底线下方。 2常见统计表的格式 统计表根据分组变量的数目多少可分为简单表和复合表。只含一个分组变量的统计表为 简单表,如表1.3.2,此表仅按血糖含量分组。含两个或两个以上分组变量的统计表称为复合 表,如表1.3.3,此表分别按“蝈虫排出情况”与“娆虫排出情况”分组。在实际应用中统计表又 可分为以下几种类型 (1)频数分布表 为了用一种简捷的方式表达一组计量资料,采用表1.32的方式,称它为频数分布表。在 此表中,分组变量所代表的是真正的观测指标,而频数只是形式上的观测指标。 霍13.2某年某地185名40岁以上正常人空腹血糖频数分布 空腹血糖(mmol/1) 频数 空腹血塘(mmol/L) 频数 3.05~ 2 3.33~ 5.55~ 5.83~ ±.16~ 4,44~ 3755 6.66 合计 (2)列联表 当两个变量皆为定性指标时,常将资料整理成表格的形式,这种表被称为列联表,其观测 指标一般为频数和百分比(率)。若列联表中两个分组变量都只有两个水平常称为2×2表或 四格表,如表1.3.3;若列联表中一个分组变量只有两个水平,另一↑分组变量有k(k>2)个 水平,常称为2×k表或k×2表如表13.4;若列联表中两个分组变量的水平数都大于2,常 喪1.3.3用使君子治疗184例蝈虫蛲虫混合感染息者的排虫情况 患者例数 蛲虫排出情况 百分比(%) :排出未排出合计 排出未排出 合计 接出 100.00 未排出 56 76 100.00 合计211218439.13 100.00 代袭“虫排出情况”虫、蛲虫排出情况分别为两种分组标志 16一
称为R×C表(R为行数、C为列数),如第3篇第2章中的表3.2.1~3.2.8 丧1.3.4急性貨疸型肝炎息者与正常人的超声波波型的频数分布 组别 正常 可疑 较密、密 黄疸肝炎组 12 正常人组 11 289 243 614 (3)表达多组计量资料的统计表 有时人们收集的资料很多如果一-列出,势必要占用很大篇幅,常用的方法是只列出各 种条件下的均数()标准差(s)和样本含量(n)。请看表1.3.5。 丧13.5A,B两因素伴随H-丁dR撸人对K4细胞抑制情况 相对抑制值(x士s) A(药物 B(氧浓度,%): B1(3%),n=9 0,190÷0.078 0.272±0.025 AAAAA 0.427士0.050 0.618±0.149 0.193-0.075 0.628±0.174 0.589士0.106 1.030±0.366 0.529±0.125 0.868±0.147 0.513±0.124 0.990±0.352 0.307士0.137 0.918±0.201 、和n分别代表样本均数标准差和样本含量,A1~A2分别代表7种药物 第2节统计图 统计图的基本概念 统计图是用点线、面体来形象地表达数量资料的一种方式,常用的统计图有条图(棒 图)圆图(饼图)统计地图线图、直方图散布图等 2选用统计图的原则 (1)资料性质原则 统计图的种类很多,应根据资料的类型和目的选用合适的统计图。定性资料,可选用的统 计图有条图、圆图统计地图等。定量资料,可选用的统计图有直方图(或多边图)、普通线图、半 对数线图、散布图等 (2)困形衬征原则 不同的统计图以不同的方式或姿态来形象化地表达资料。因此,掌握各种统计图的特征, 有助于正确选用统计图 条图:用来表示各相互独立的统计指标的数量大小。通常纵轴表达数量,横轴表达分组 标志。用绝对数或相对数均可表达数量其数量大小用图中各长条的高度来反映。 圆图:用来表示事物内部的构成情况。必须用相对数且各项之和为100%图中各扇形面
积表示数量的大小,将360圆心角看成100%,把每一部分所占的百分数折算成圆心角的度 数,根据圆心角的度数就可画出代表各部分数量大小的扇形来 统计地图:用来表示事物的数量在地域上的分布情况。如:反映疾病的地区分布。 直方图:用来表示计量资料各组段上频数(或频率)的分布情况。图中各长条的面积表示 各组数量的大小。 多边图:依次连接直方图中各矩形最高处的中点所得的图形,适用场合和作用与直方图 相同,仅仅是形象不同面已。 线图:也称折线图,资料中包含两个数量指标,放在横轴上的数量指标通常是时间,放在 纵轴上的数量指标通常是某种率。它分为普通线图和半对数线图。 绘制普通线图时纵、横轴上的尺度律用算术尺度,将各点依次用折线连接起来。它适合 于表达-个或多个事物或现象随着时间的推移数量的增减幅度。 绘制半对数线图时纵轴上的尺度取对数尺度横轴上的尺度仍用算术尺度,将各点依次 用折线连接起来。它适合于表达两个或多个事物或现象随着时间的推移,速度的变化快慢 值得注意的是:虽然在“表达两个或多个事物或现象随着时间的推移数量的增减幅度” 时选用普通线图是正确的,但人的眼睛对这种图所作出的反应是哪条折线变化得快一些,这就 容易使读者产生错觉:有时,把实际上变化慢的误认为是变化快的(当它的变化幅度很大时), 而把实际上变化快的误认为是变化慢的(当它的变化幅度很小时)为了避免这种错觉的产生, 当需在同一个直角坐标系中表达两个或多个事物或现象随着时间的推移,数量的变化趋势时, 建议一律选用半对数线图。 散布图:资料中包含两个数量指标如果两变量之间有自变量与因变量之分时,通常把自 变量放在横轴上,把因变量放在纵轴上。将成对的数据(X,Y)在直角坐标系中用圆点表示出 来,就称为散布图或散点图。它可以形象地反映出在专业上有一定联系的两个连续变量之间的 变化趋势,可借助它帮助判断是否值得进行直线相关和回归分析或拟合何种类型的曲线方程。 3.应用实例 现在各种绘图的软件非常多稍花点时间学习软件的使用方法,用计算机绘出统计图是不 难实现的事。本书在第1篇第7章中扼要介绍了如何用SAS/ GRAPH模块实现绘图的方法, 其他绘图软件就不一一介绍了 然而,读者要想绘制出正确的统计图,完全依赖计算机是不行的,因为各自的资料究竟适 合绘什么样的统计图,目前的非智能化的绘图软件还无法回答这就要求使用者必须具备根据 资料的性质和绘图目的,正确选用统计图的本领。前面虽然讲了一些选用统计图的原则,但面 对实际资料每次都能胸有成竹地作出正确选择,并非是一件容易的事。下面先给出几组实际 资料,并以选择题的方式提出问题请读者作出选择,然后,看“分析与解答”,以资核对 (1)实例与问题 【例1.3.1】对于上节表1.3.2资料,希望用统计图来形象反映185名40岁以上正常人 空腹血糖频数分布。问应选择统计图合适? A.条图或圆图B.直方图C.普通线图D.散布图E.统计地图F,半对数线图 例1.3.2】对于上节表1.34资料,希望用统计图来同时反映急性黄疸型肝炎患者与 正常人的三种超声波波型的频数分布或内部构成情况,问 ①如果要求用绝对数来绘图,应选择统计图合适
②如果要求用相对数来绘图,应选择统计图合适? A.复式条图B.直方图C.复式圆图D.线图E.散布图F统计地图 【例1.3.3】某大学一年级12名女生的体重与肺活量数据如下: 编号:123456789101112 体重(kg):424246464650505052525 肺活量(L):2.62.22.82.42.82.83.43.13.52.93.53.0 希望用统计图来反映肺活量与体重之间的变化趋势,问应选择统计图合适? A.复式条图B.直方图C.复式圆图D.折线图E.散布图F.统计地图 【例1.3.4】下面是某地居民1950~1968年伤寒与结核病死亡率(1/10万)资料: 年份:1950~1952~1954~1956~1958~1960~1962~1964~1966~1968 伤寒:31.322.418.09.25.03.81.6 结核:174.5157.1142.0127.297.771.359246.0 对于这两组资料,希望用统计图来形象地反映两种疾病的死亡率随着时间推移的变化速 度。问应选择 统计图合适? A.条图或圆图B.直方图C.普通线图D.散布图E.统计地图F,半对数线图 (2)分析与解答 【例1.3.1】应选B。因为血糖值属于计量指标,而反映该指标(即连续型变量)在各组段 上的频数分布情况,根据选择图形的原则,选择直方图最合适,见图1.3.1 【例1.3.2】中的①应选A。因为两种人群是互相独立的分组标志,它们在横轴上的位置 可以是任意的,故根据选择图形的原则选择复式条图最合适,参见图1.3.2。 品, 4.99 Zimi 空夏血糖(mmo几L) 黄痘肝炎组 正常人组 图1.3.1185名40岁以上正常人血箱频数分 图1.32两组人群3种超声波波型的频数分布 布宜方图 的复式奈图 该例中②可以选A,但最好选C。因为两种人群是互相独立的分组标志,而且要求用相对 数绘图此时若用条图也是可以的,但不能很好地反映出各人群组中三种波型人数的内部构成 情况,仅仅反映了各自数值的大小;而选用圆图,则可达到前述的两种目的,参见图1.3.3。 【例13.3】应选E。因为体重与肺活量两项指标都是计量的,绘出散布图后便可将它们 之间的变化趋势呈现出来,参见图1.3.4