主编胡良平 现代统计学 AS应用 军事医学科学出版社
内容提要 本书较全面地介绍了现代统计学的理论、方法及其应用技巧。针对多元统计分析方法计算量 大和算法复杂的特点,以SAS软件包作为实现复杂统计计算的工具,本书着重介绍各种试验设计 方法、统计分析方法及其适用条件、结合具体问题正确选用统计方法的技术以及对计算结果的正 确解释和应用。在一切从实际出发的思想指导下,合理调整教材结构和编写形式,把处理同一类 问题的统计方法集中到一起讲解,使貌似复杂的统计问题化繁为简,实用方便。本书具有以下独 到之处:用计算器和计算机两种计算工具实现统计计算,便于读者选用;针对问题和资料闸述统计 方法,有利于读者提高处理实际问题的综合能力;介绍的试验设计类型多,讲解详细,具有很强的 可操作性;为读者成功地使用SAS软件提供了一条有效的捷径。 根据教学对象的层次和学时数适当取舍内容,本书可作为研究生、本科生、大中专生的统计学 教材,高等院校和科研机构的教师、学者、科技人员、生物医学工作者、管理工作者等学习和应用统 计方法的参考书;还可作为用SAS软件解决统计问题的实用手册。 图书在版编目(CIP)数据 ! 现代统计学与SAS应用/胡良平卡编:一北京:军事医学科学出版社,2000.8 ISBN7-80121-274-6 I.现…Ⅱ.胡…Ⅲ.系统分析-应用-统计分析N.C8 中国版本图书馆CIP数据核字(2000)第64744号 军事医学科学出版社出版 (北京太平路27号邮政编码:100850) 新华书店总店北京发行所发行 潮河印刷厂印刷 开本:787mm×1092mm印张:27.75字数:689千字 2000年8月第1版2000年8月第1次印刷 印数:1-3000册定价:40.00元 (购买本社图书,凡有缺、损、倒、脱页者,本社发行部负责调换)
前言 统计学是什么?统计学有何作用?统计学研究些什么内容?如何学好统计学?怎样正确 运用统计学?这些同题是刚刚涉猎统计学的人们必然要思考的,甚至有些已学过多遍统计学 的人,仍在苦苦地琢磨着这些问题,而且,大有百思不得其解之“困惑”。至于前三个问题,在本 书的第一章绪论中已作了详细的讲解,此处不便蒉述。在此,就后两个问题展开一些讨论,希 望能与读者沟通思想,交流感情,从而有利于作者与读者之间尽早达成一致共识,为传播统计 学知识、有效地发挥统计学的作用作出更大的贡献。 要想学好统计学,首先要对统计学所研究的内容有一个较为全面的了解。这种了解,不是 停留在表面上的,而是对各部分内容从原理、方法、适用条件、计算到结果解释等各方面都认真 思考和反复实践过。其次要从问题的原形入手去学统计学。统计学教科书一般都按“由浅入 深”、“分门别类”等思路去编写,但是,用统计学时却面对的是错综复杂的实际资料,常使人感 到无从下手。只有在学习的全过程中,都始终注意“从问题的原形入手去学统计学”,即弄清每 一种统计方法所能解决的问题在实际工作中是如何表现的,又是如何将其转化成“与特定统计 方法对应的统计学问题的”。例如:在选择统计分析方法之前,必须判定资料是定量的还是定 性的c这似乎是一个不值得一提的问题,居然在某名牌期刊上还出现了因误判资料类型,而错 误地选择了统计分析方法的实例;又例如:在分析定量资料时,必须先判定资料所取自的设计 类型和资料本身所具备的前提条件之后,方可正确地选择统计分析方法,但很多人却不加思索 地盲目套用t检验;再例如:在分析定性资料时,必须先判定列联表中定性变量的属性和分析 目的之后,方可正确地选择统计分析方法,但很多人却糊里糊涂地生搬硬套又检验。笔者主 编的《医学统计应用错误的诊断与释疑)一书(于1999年1月由军事医学科学出版社出版),将 有助于读者识别医学期刊论文中有关统计学的各种误用现象,同时,也有助于读者防止自已在 运用统计学中犯类似错误。 怎样才能正确运用统计学?要在较全面地掌握了统计学知识的基础上,逐渐扩大统计学 的应用范围。每用一种方法,都要做到“心中有数”即此时共有哪几种可能的统计分析方法, 其中最好的是哪一种;处理此问题时人们常犯的错误是什么。尤其是面对多因素多指标的资 料时,思路必须十分清楚,欲达到什么分析目的,应该选用什么统计分析方法,这种方法涉及到 的资料可以包括哪些类型的变量,这些资料是否满足拟选定的统计分析方法所要求的前提条 件,怎样巧妙地实现复杂的统计计算,等等。要想正确运用统计学,首先必须老老实实地学好 统计学。笔者编著的《医学统计学内容概要、考题精选与考题详解〉一书(于2000年1月由军 事医学科学出版社出版),将有助于读者突破“根据各种不同的实际资料,正确选用统计分析方 法”的难关。 下面将结合实例就定量资料统计分析中的一个难点一设计类型的辨析谈一点“如何 从问题原形入手学习和运用统计学”的体会,供广大读者参考 人们在处理实际资料前,常按习惯将实验资料按“组别”或“药物”等单个枟题来划分,从列 出的表格看,使人很容易将其视为“单因素多水乎设计”,因而,常错误地选用统计分析方法。 医学期刊中,误用统计学的现象十分严重,其中分析定量资料的错误中,绝大部分错误都出在 不能正确识别资料的设计类型上。下面举一个实例,说明如何“通过对资料原形的转换去辨析
其真正的设计类型”的方法。 【例】某人用t检验分析了如下的资料,这是很不妥当的!因为它不是多个单因素2水平 的设计。资料的原形可概述如下 为了研究“不同药物对小鼠迟发超敏反应的影响”,研究者在表中给出的分组标志是“药 物”和“剂量”两项,写在“药物剂量”两列之下的具仫内容分别是“对照一”、“补肾药5”、“补 肾药10”、“补肾药20¨、“Cy0.025”、¨(y+补肾药0.025+5”、“(y+补肾药0.025+10”、“Cy 十补肾药0.025+20”;观测的指标是“耳舯重量”;每组均为10只小鼠。 分析】原作者按“药物”和“剂量”两项并列的形式制表,使人不易看出实验设计的类型。 像单因素8水平设计问题,又像是两个单因素4水平设计问题或是某种多因素设计问题。这 是缺乏有关设计类型概念的人们习惯的列表方式,在选用统计分析方法时将起着严重的误导 作压。 仔细看看以“药物”和“剂量”为总称的这两列。似乎该实验涉及了“药物”和“剂量”两个因 素,事情是否果真如此?不妨试列出由它们组合成的表格,即把“药物种类”与“药物剂量”视为 两个实验因亲,分别放置在表的横行与纵列上。前者的2个水平分别为“衬肾药”与“Cy药”, 后者的5个水平分别为“00.025、5、10、20”(gkg),它们之间共有10种组合,其中只有一半反 映了原先的分组,另有两种组合是重复的(即原先的对照组),还有4神组合不包括在原先的设 计之中,而原先两药仝用的3个组却无法表达出来。这说明从原表中抽象出“药物”和“剂量 这样两个因亲是不够正确的转换方式。事实上,原表中所反映的是两种药具有各自的用药剂 量,故将“补肾药的剂量”和¨Cy药的剂量”视为两个实验因素,问题就迎刃而解了。此时,“补 肾药的剂量”有4个水平,即“0、5、10、20”(gkg);“Cy药的剂量”有2个水平,即“0,0.025”(g kg)。于是,将这两个因素分别放置在表的横行与纵列上,它们之间的8种水平组合正好就是 原作者的实验所代表的寞正含义。故其本质是分别具有2水平和4水平的两个因素的水平组 合,即两因素(或称4×2)析因设计,而不是单因素8水平设计,也不是两个单因素4水平设计 问题。 慨括地说,正确分析定量资料的关键是:明确观测指标;弄清因素、水平及其各因素之间的 水平组合;找出与资料原形所对应的真正的设计类型;考察资料所具备的前提条件;正确运用 统计分析软件实现统计计算;结合专业和统计学知识作出合理的解释。 关于统计学中其他具体的学术问题,请读者仔细闻读本书各篇内容,慢慢去领悟统计学的 真谛。下面让我们一同来看看本书与其他类似书籍相比,所具备的几个独到之处 其一,用计算器和计算机两种计算工具实现统计计算,便于读者选用; 其二,针对实际问懸和具体资料讲授统计方法,有利于读者提髙处理实际问题的综合能 力 其三,介绍的试验设计类型多,讲解详细,具有很强的可操作性; 其四,为读者方便、成功地学会使用SAS软件提供了一条有效的捷径 其五,与常用统计分析方沄对应的SAS引导程序比软齐全,并附有程序修改指导和输出 结果的解释; 其六,内容丰富、实用,使用方便。 这些特点是一般介绍SAS软件的书籍和以计算器为计算工具的统计学教科书所缺少的 正因如此,预计本书将产生可喜的社会效益
本书虽然是以DOS环境下的SAS软件为计算工具,但其中的全部SAS引导程序在WIN I〕wS版SAS系统中仍可不加僇改地被调用。所有用过 WINDOWS版SAS软件的用户都知 道:其中约非编程法能解决的统计计算问题所占的比例很小,绝大部分统计计算间题仍需要借 助编程法来实现,即仍需要SAS引导程序。不仅如此,根据笔者的经验,要想灵活、方便地对 付各种复杂的统计问题,非得采取编程法不可! 本书共分6篇,第1篇统计学基础知识与SAS软件应用技巧,介绍了统计学的基本概念 和学习方法、试验设计入门、统计描述、SAS软件应用入门、编写SAS实用程序的技巧、单变量 统计分析竿。第2篇试验设计与定量资料的统计分析,介绍了与τ检验、非参数检验、各种方 差分析有关的试验设计和数据处理方法。第3篇试验设计与定性资料的统计分析,介绍了处 理二维和高维列联表资料的各种统计分析方法,包括x2检验、Fskr的精确检验、 Ridit分析 秩和检验、定性资料的相关分析、线性趋势检验、Ka即pa检验、对数线性模型和 Logistic回归模 型等。第4篇试验设计与回归分析,介绍了回归分析的种类和选用方法、简单直线回归、多项 式回归、简单曲线回归、非线性曲线拟合、多元线性回归、协方差分析、直接试验设计及其资料 的回归分析等。第5篇生李分析,介绍了生存资料的特点、生存时间函数和生存分析方法的分 类等基本概念;生存资料的非参数分析方法、OOX模型和参数模型的回归分析方法与应用。 第6篇多元统计分析,介绍了主成分分析、因子分析、对应分析、聚类分析、判别分析、典型相关 分析 根裾教学对象的层次和学时数适当取舍内容,本书可作为研究生、本科生、大中专生的统 计学教村;可作为高等院校和科研机构的教师、学者、科技人员、生物医学工作者、管理工作者 等学习和应用统计方法的參考书;还可作为用SAS软件解决实际间题的实用手册 在本书即将出版之际,谨向参加编写的全体同仁表示夏心的感谢! 由于我们水平有限,峡点和错误在所难免,敬诗读者批评指正。 主编胡良平 15干北京