高等学校教材 SPSS统计分析基础教程 主编张文彤 闫洁 高等教育出版社
高等学校教材 SPSS统计分析基础教程 主 编 张文彤 闫 洁 高等教育出版社
序言I 序 知识经济时代,数据成为宝贵的经济资源。在国外,电信、医疗、银行、证券、保险、制造、商 业、科研、教育等行业已广泛采用先进的统计分析技术从数据中提取有价值的信息和知识。在国 内,随着市场的蓬勃发展,了解成熟的统计分析产品,借鉴成功的统计分析行业应用经验,运用科 学的统计分析方法,从数据中总结、归纳有用的知识,并将知识用于市场营销、运营决策和信用风 险管理等领域,帮助企、事业单位降低消耗、增加效益,从而提高整体运行效率,已成为各行业中 有远见的人士普遍关注的问题。 SPSs软件是全球专业统计分析软件的领导者,一直致力于帮助企事业单位提高科学运用统 分析方法的能力,20世纪80年代就已经被许多学者引入中国市场。它包含了丰富的统计分 析算法,而且在使用层面上更多地考虑了客户在整个统计分析过程中的应用感受,其简洁的界 面、完善的数据准备功能和杰出的图表输出能力使得SPSS软件在全球有超过25万家的机构用 户,并成为国内的主流统计分析软件。随着该产品在各行业应用的深入以及SPSS培训和认证的 广泛开展,目前国内已涌现出一大批应用SPSS的专家。近两年,国内统计分析市场如火如茶 SPSs在产品技术上也不断推陈出新,继SSS英文版在国内成功应用之后,SPSS公司在今年首 次推出了简体中文版,该产品更加符合中国人的使用习惯,一经推出便受到各行业人士的喜爱 为了让中国的SPS软件爱好者更好地使用软件,我们在经过两年的筹备后向市场推出 SPSS统计分析大型丛书。该丛书是一套全面了解、认识和应用 SPSS最新统计分析软件、掌握统 计分析方法的专业书籍,以统计分析在国内的应用现状为切入点,本着学以致用的原则,在介绍 统计理论及SPSS软件功能模块的同时,更侧重于统计分析在各项工作中的实际应用,引导读者 不仅掌握SPSS软件及技术原理,而且学会运用统计方法解决工作和学习中的实际问题。 该丛书由业内权威专家主笔编写,资料引用详实可靠,实例剖析切中肯綮,不仅融合了行业 专家在统计应用领域多年的研究成果,而且还融入了很多SPS软件新、老行业用户的实际应用 经验。丛书总结了SPS软件在各行业的实践应用状况,并综合SPS最新行业应用方案,使各行 业读者能通过学习提高SPSS软件的运用能力,解决工作中的实际问题。在丛书编写过程中, SPSS公司和博塔(中国)有限公司(SPSS中国地区分销商)的技术专家还及时提供了国际最新的 行业发展信息和SPSS最新产品和技术信息,并结合SPSS的全球应用状况提出了宝贵意见 丛书将分期分批出版相应的分册,其中首批面世的为通用教材PS统计分析基础教程》 PSS统计分析高级教程》,均由复旦大学张文彤老师主编,全国多所高校的统计教师和统计专 业人士参编。张文形老师长期以来一直致力于积极推进统计分析工具在国内的普及应用,他在 202年编著的前作巛PSS∏统计分析教程》基础篇和高级篇因内容翔实、风格独特,受到了广大 读者的热烈欢迎,并被多所高校列为本科生或研究生教材,其中基础篇一书已通过教育部评审 成为20032004年度教育部研究生工作办公室推荐的究生教学用书”。他不仅拥有丰富的 教学经验,而且熟谙统计分析产品,本次全新编写的这两册教材分别针对不同读者群,由浅入深
序 言 Ⅰ 序 言 知识经济时代,数据成为宝贵的经济 资源。在国外,电信、医疗、银行、证券、保险、制造、商 业、科研、教育等行业已广泛采用先进的统计分析技术从数据中提取有价值的信息和知识。在国 内,随着市场的蓬勃发展,了解成熟的统计分析产品,借鉴成功的统计分析行业应用经验,运用科 学的统计分析方法,从数据中总结、归纳有用的知识,并将知识用于市场营销、运营决策和信用风 险管理等领域,帮助企、事业单位降低消耗、增加效益,从而提高整体运行效率,已成为 各行业中 有远见的人士普遍关注的问题。 SPSS软件是全球专业统计分析软件的领导者,一直致力于帮助企事业单位提高科学运用统 计分析方法的能力,20世纪 80年代就已经被许多学者引入中国市场。它包 含了丰富的统计分 析算法,而且在使用层面上更多地考虑了 客户在整个统计 分析过程 中的应用感受,其简洁的界 面、完善的数据准备功能和杰出的图表输出能 力使得 SPSS软件在全球有超过 25万家 的机构用 户,并成为国内的主流统计分析软件。随着该产品在各行业应用的深入以及 SPSS培训和认证的 广泛开展,目前国内已涌 现出一大批应用 SPSS的 专家。近 两年,国 内统计分析市场如火如荼, SPSS在产品技术上也不断推陈出新,继 SPSS英文版在国内成 功应用之 后,SPSS公司在今年首 次推出了简体中文版,该产品更加符合中国人的使用习惯,一经推出便受到各行业人士的喜爱。 为了让中国的 SPSS软件爱好者更好 地使用软件,我们在经过 两年的筹 备后向市场推出了 SPSS统计分析大型丛书。该丛书是一套全面了解、认识和应用 SPSS最新统计 分析软件、掌握统 计分析方法的专业书籍,以统计分析在国内的应用现状为切入点,本着学以致用的原则,在介绍 统计理论及 SPSS软件功能模块的同时,更侧重于统计分析在各项工作中的实际应用,引导读者 不仅掌握 SPSS软件及技术原理,而且学会运用统计方法解决工作和学习中的实际问题。 该丛书由业内权威专家主笔编写,资料引用详实可靠,实例剖析切中肯綮,不仅融 合了行业 专家在统计应用领域多年的研究成果,而且还 融入了很多 SPSS软件新、老行业用户的 实际应用 经验。丛书总结了 SPSS软件在各行业的实践应用状况,并综合 SPSS最新行业应用方案,使各行 业读者能通过学习提高 SPSS软件的运用能 力,解决工 作中的实际问题。 在丛书编 写过程中, SPSS公司和博塔(中国)有限公司(SPSS中国地区分销商)的技术专家还及时提供了国际最新的 行业发展信息和 SPSS最新产品和技术信息,并结合 SPSS的全球应用状况提出了宝贵意见。 丛书将分期分批出版相应的分册,其中首批面世 的为通用教材《SPSS统 计分析基础教程 》、 《SPSS统计分析高级教程》,均由复旦大学张文彤老师主编,全国多所 高校的统计教师 和统计专 业人士参编。张文彤老师长期以来一直致力于积极推进统计分析工具在国内的普及应 用,他在 2002年编著的前作《SPSS11统计分析教程》基础篇和高级篇因内容翔实、风格独特,受到了广大 读者的热烈欢迎,并被多所高校列为本科生或研究生教材,其中基础篇一书已通过教育 部评审, 成为 2003—2004年度教育部研究生工作办公室推荐的“研究 生教学 用书”。他不仅拥 有丰富的 教学经验,而且熟谙统计分析产品,本次全新编写的这两册教材分别针对不同读者群,由浅入深
Ⅱ序言 结合实际应用全面介绍了SPS5产品和应用。全书实例引用突出,分析讲解透彻,读者可由本书 管窺全套丛书“应用为本”的特色。 显然,上述两本书还不能完全覆盖SPSS的所有应用领域,因此,本套书从现在还有数本分册 正在组织编写中,包括全新的行业应用分册。这里我们热忱邀请各行各业的SFSS资深用户,以 及各高校的统计教师加入到本套丛书的编写工作中来,以共同推动我国各行业统计应用水平的 迅速提高 希望本套丛书能够让读者更清晰地了解统计分析,从而进一步促进统计分析在国内的普及 为便于读者交流和使用本套丛书,这里特公布相关网址如下: SPSS最新版本的全模块试用版下载:ww.8 pssbi com 丛书相关案例数据下载:www.spssbjcom.cn、ww.Medstatstarcom 读者答疑、经验交流:www.spsschubcam、ww.Statstarcom 博塔(中国)有限公司SPS丛书编委会
Ⅱ 序 言 结合实际应用全面介绍了 SPSS产品和应用。全书实 例引用突出,分析讲解透彻,读者 可由本书 管窥全套丛书“应用为本”的特色。 显然,上述两本书还不能完全覆盖 SPSS的所有应用领域,因此,本套书从现在还有数本分册 正在组织编写中,包括全新的行业应用分册。这里我们热忱邀请各行各业的 SPSS资深 用户,以 及各高校的统计教师加入到本套丛书的编写工作中来,以共同推动我 国各行业统计应 用水平的 迅速提高。 希望本套丛书能够让读者更清晰地了解统计分析,从而进一步促进统计分析在国内的普及。 为便于读者交流和使用本套丛书,这里特公布相关网址如下: SPSS最新版本的全模块试用版下载:www.spssbj.com.cn 丛书相关案例数据下载:www.spssbj.com.cn、www.MedStatStar.com 读者答疑、经验交流:www.spssclub.com、www.StatStar.com 博塔(中国)有限公司 SPSS丛书编委会
序言I 前 笔者前作PSS11统计分析教程》(基础篇)和PSS11统计分析教程》(高级篇)自2002 年中面世以来,因其内容翔实、风格独特,受到了广大读者的热烈欢迎,这从读者用Bmal请教 问题的数量即可看出,还有数位读者详细指出了书中的用字错误,可见其阅读的详细程度,在此 笔者对读者深表谢意。同时,数所高校均将其作为本科生或者研究生教材,而基础篇一书已通过 教育部评审,成为20032004年度教育部研究生工作办公室推荐“究生教学用书”,这无疑都 是对前作质量的充分肯定 但是,再优秀的作品也有其生命周期,随着时间的推移,上述著作的不足之处也逐渐显现出 来。对于基础篇而言,突出表现为以下两点 L.由于在2002年国内尚无系统、完整介绍 SPSS统计功能及其操作界面的书籍,前作最终将 风格定位在操作字典上,使读者能够全面了解SPSS各方面的分析功能及界面操作方法,应当说前 作很好地完成了这一任务。但是现在随着SSS中文版的正式面市,软件的界面操作已不是主要问 题,再来编写这种新华字典式的教材已无必要。读者自然希望能够有一个更好的教材体系出现 2对于统计软件教材而言,其本质应当是统计教材,软件仅仅是实现工具。前作顺应当时 的需要,主要满足的是已学习过统计理论知识,但不了解如何使用统计软件来实现的读者群的需 求,因此书中并未详细阐述统计基础知识。对于统计初学者而言,需要有一本统计教材与之配 合。但是在几年的使用后,现在多所高校均希望直接采用基础篇进行本科生的统计教学,而不需 要和其他教材配合使用。在软件工具已经越来越易用的时候,教材的最终归宿应当是以统计知 识为主线,这无疑是我们重新投入编写工作的最大动力 综上,在充分考虑了读者们的意见后,笔者毅然决定推翻原有的框架,完全从头编写基础教 程。这本新的基础教程以SPSS12.0为准,定位为统计软件和统计学入门书籍。他针对统计初 学者和SPS初级用户的需求,以统计理论为主线,严格按照本科生统计学教材方式编写,内容共 分三大部分:第一部分的任务是SPS操作入门,讲解了软件使用和数据管理的操作知识:第二部 分以统计理论为主线,详细阐述了如何在SPS中完成数据的统计描述和参数估计,以及如何使 用统计图表来进行数据的完美呈现:第三部分则详细介绍了t检验、方差分析、秩和检验、x2检 验、相关回归等常用的基本统计分析方法,内容覆盖了目前国内大部分专业统计课程的教学范 围,并结合SPS的强大功能作了很好的扩展。书后的附录根据初学者的特点加以编制,各章后 均附有参考文献和思考练习题,第三部分的章节还专门提供了本章小结,更好地满足了本科生教 学的需要。另外,书中大部分表为设计表格时自动生成的。因此,大部分表及表题为英文。 除作为教材外,本书还适用于各行业中非统计专业需要使用统计方法的人员,以及希望从头 学习SPSs软件的人员。我们希望广大读者能一如既往地踊跃提出自己使用中的宝贵意见和建 议,使得本书再版的时候能够更上一层楼,更完美地满足大家的学习和工作需求 张文彤 2004年7月于复旦公共卫生学院
序 言 Ⅰ 前 言 笔者前作《SPSS11统计分析教程》(基础篇)和《SPSS11统计 分析教程》(高级篇)自 2002 年中面世以来,因其内容翔实、风格独特,受到了 广大读者的热烈 欢迎,这 从读者用 E-mail请教 问题的数量即可看出,还有数位读者详细指出了书中的用字错误,可见其阅读的详细程 度,在此 笔者对读者深表谢意。同时,数所高校均将其作为本科生或者研究生教材,而基础篇一书已通过 教育部评审,成为 2003—2004年度教育部研究生工作办公室推荐“研究生教 学用书”,这无疑都 是对前作质量的充分肯定。 但是,再优秀的作品也有其生命周期,随着时间的推移,上述著作 的不足之处也逐 渐显现出 来。对于基础篇而言,突出表现为以下两点: 1.由于在 2002年国内尚无系统、完整介绍 SPSS统计功能及其操作界面的书 籍,前作最终将 风格定位在操作字典上,使读者能够全面了解 SPSS各方面的分析功能及界面操作方法,应当说前 作很好地完成了这一任务。但是现在随着 SPSS中文版的正式面市,软件的界面操作已不是主要问 题,再来编写这种新华字典式的教材已无必要。读者自然希望能够有一个更好的教材体系出现。 2.对于统计软件教材而言,其本质应当是统计教材,软件仅仅是 实现工具。前作顺应当时 的需要,主要满足的是已学习过统计理论知识,但不了解如何使用统计软件来实现的读者群的需 求,因此书中并未详细阐述统计基础知识。对于统计初学 者而言,需要有一 本统计教材与之配 合。但是在几年的使用后,现在多所高校均希望直接采用基础篇进行本科生的统计教学,而不需 要和其他教材配合使用。在软件工具已经越来越易用的时候,教材的 最终归宿应当是 以统计知 识为主线,这无疑是我们重新投入编写工作的最大动力。 综上,在充分考虑了读者们的意见后,笔者毅然决定推翻原有的框架,完全从头编 写基础教 程。这本新的基础教程以 SPSS12.0为准,定位为统计 软件和统计学入门书籍。他针对统计初 学者和 SPSS初级用户的需求,以统计理论为主线,严格按照本科生统计学教材方式编写,内容共 分三大部分:第一部分的任务是 SPSS操作入门,讲解了软件使用和数据管理的操作知识;第二部 分以统计理论为主线,详细阐述了如何在 SPSS中完成数据的统计描述和参数估计,以 及如何使 用统计图表来进行数据的完美呈 现;第三 部分则详细介绍 了 t检 验、方差 分析、秩和检验、χ 2 检 验、相关回归等常用的基本统计分析方法,内容覆 盖了目前国内大 部分专业 统计课程的教学范 围,并结合 SPSS的强大功能作了很好的扩展。书后的附录根据初学者的特点加以编制,各章后 均附有参考文献和思考练习题,第三部分的章节还专门提供了本章小结,更好地满足了本科生教 学的需要。另外,书中大部分表为设计表格时自动生成的。因此,大部分表及表题为英文。 除作为教材外,本书还适用于各行业中非统计专业需要使用统计方法的人员,以及希望从头 学习 SPSS软件的人员。我们希望广大读者能一如既往地踊跃提出自 己使用中的宝贵 意见和建 议,使得本书再版的时候能够更上一层楼,更完美地满足大家的学习和工作需求。 张文彤 2004年 7月于复旦公共卫生学院
目录 第一部分数据管理与软件入门 第卫章数据分析概述与软件入门 232文本数据如何导入SPS中………36 233数据库格式数据如何导入 L.1SP⑤软件概述… SPS中… 1.1.1软件的基本特点 24数据的保存 1.1.2SPSS的 Clent/Seme结构…4 241存为SPSS格式 1.L.3SPSS的模块式结构 242存为其他数据格式 1.L.4SPSS的安装 思考与练习…… 734044 L.2SPS操作入门 参考文献…………… 1.21SPSS软件的启动与退出……18 1.22SPSS的5个窗口 第3章数据管理 1.23SPSS的4种运行方式 10 31变量级别的数据管理… 1.24SPSS的4种结果输出 1.25SPSs的帮助系统 3L.2对变量值进行分组合并… 2254 L.3数据分析概述 31.3连续变量的可视化分段 1.31数据分析方法论介绍… 3L.4将字符变量转换为数值变量 1.32SPSs系列产品对数据分析流程 3L.5变量的编秩… 的支持 31.6 Transfor菜单中的其他功能………51 1.33本书内容介绍…… 32文件级别的数据管理() 思考与练习 321记录排序 参考文献… 322记录拆分 第7章数据录入与数据获取 323记录筛选……… 324记录加权 21数据格式概述……………………………23 325数据汇总 21.1统计软件中数据的录入格式 33文件级别的数据管理() 21.2变量属性介绍 331数据字典的定义与应用 22数据的直接录入 332查找重复记录… 221操作界面说明 333数据文件的重新排列与转置 222开放题和简单单选题的录入………28 334多个数据文件的合并…… 223多选题的录入 思考与练习… 23外部数据的获取… 参考文献… 231电子表格数据如何导入SSs中…34
目 录 Ⅰ 目 录 第一部分 数据管理与软件入门 第 章 数据分析概述与软件入门 ……… 3 1.1 SPSS软件概述 ………………………… 3 1.1.1 软件的基本特点 …………………… 3 1.1.2 SPSS的 Client/Server结构 ………… 4 1.1.3 SPSS的模块式结构 ………………… 5 1.1.4 SPSS的安装 ………………………… 6 1.2 SPSS操作入门 ………………………… 8 1.2.1 SPSS软件的启动与退出 …………… 8 1.2.2 SPSS的 5个窗口 …………………… 8 1.2.3 SPSS的 4种运行方式 ……………… 10 1.2.4 SPSS的 4种结果输出 ……………… 13 1.2.5 SPSS的帮助系统…………………… 16 1.3 数据分析概述………………………… 20 1.3.1 数据分析方法论介绍 ……………… 20 1.3.2 SPSS系列产品对数据分析流程 的支持 ……………………………… 21 1.3.3 本书内容介绍 ……………………… 22 思考与练习…………………………………… 22 参考文献 ……………………………………… 22 第 章 数据录入与数据获取 …………… 23 2.1 数据格式概述………………………… 23 2.1.1 统计软件中数据的录入格式 ……… 23 2.1.2 变量属性介绍 ……………………… 23 2.2 数据的直接录入 …………………… 27 2.2.1 操作界面说明 ……………………… 27 2.2.2 开放题和简单单选题的录入 ……… 28 2.2.3 多选题的录入 ……………………… 31 2.3 外部数据的获取 …………………… 34 2.3.1 电子表格数据如何导入 SPSS中 … 34 2.3.2 文本数据如何导入 SPSS中 ……… 36 2.3.3 数据库格式数据如何导入 SPSS中……………………………… 37 2.4 数据的保存 …………………………… 39 2.4.1 存为 SPSS格式 …………………… 40 2.4.2 存为其他数据格式 ………………… 40 思考与练习 …………………………………… 41 参考文献 ……………………………………… 41 第 章 数据管理 …………………………… 42 3.1 变量级别的数据管理 ……………… 42 3.1.1 计算新变量 ………………………… 42 3.1.2 对变量值进行分组合并 …………… 45 3.1.3 连续变量的可视化分段 …………… 47 3.1.4 将字符变量转换为数值变量 ……… 49 3.1.5 变量的编秩 ………………………… 50 3.1.6 Transform菜单中的其他功能 ……… 51 3.2 文件级别的数据管理(一)………… 52 3.2.1 记录排序 …………………………… 52 3.2.2 记录拆分 …………………………… 53 3.2.3 记录筛选 …………………………… 54 3.2.4 记录加权 …………………………… 55 3.2.5 数据汇总 …………………………… 56 3.3 文件级别的数据管理(二)………… 57 3.3.1 数据字典的定义与应用 …………… 57 3.3.2 查找重复记录 ……………………… 60 3.3.3 数据文件的重新排列与转置 ……… 62 3.3.4 多个数据文件的合并 ……………… 68 思考与练习 …………………………………… 71 参考文献 ……………………………………… 71