1SPSs软件概述 第卫章数据分析概述与软件入门 1.1SPSS软件概述 SPSS公司总部位于美国芝加哥,创立于1975年,一直以经营统计软件产品开发为主业 1994198年间,SPSS公司得到了很大的发展,陆续购并了 SYSTAT公司、BMDP软件公司 Quantun公司、EL公司等,并将各公司的主打产品收纳SPS旗下,从而使SPSs公司由原来的单 统计产品开发与销售转向为企业、教育科研及政府机构提供全面信息统计决策支持服务,成为 最新的数据仓库”和数据挖掘”领域前沿的一家综合统计软件公司 SPSs软件是SPS公司赖以起家的产品,目前也仍然是该公司的主打产品之一,目前的最新 版本为120本书也均以120版本为准进行讲解。SPSS的英文名称原为 Statistcal Package br Social sciences意为社会科学统计软件包。后来随着SPSs产品服务领域的扩大和服务深度 增加,SPSS公司已于2002年将英文全称更改为 Statis tical Product and Service Solutions意为统计 产品与服务解决方案。在近30年的发展中,虽然竞争对手不断出现,但SFSS却始终以其鲜明的 特色鼎立于统计学软件之中,现在和SAS(一种统计分析软件)被并称为当今最权威的两大统 软件。 1.1.1软件的基本特点 SPSs得到用户广泛欢迎的原因在于SPS强大的统计分析与数据准备功能,方便的图表展 功能,以及广阔的兼容性、界面的友好性满足了广大用户的需求,深受广大应用统计分析人员 的喜爱。 L.功能强大 (1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全方位的统计学算法,为各 种研究提供了相应的统计学方法。如方差分析、回归分析、多元统计分析方法、生存分析方法等, 法体系覆盖全面。 (2)提供了各种数据准备与数据整理技术。如利用值标签来快捷地录入数据,从而为数据 审核与分析提供了便利条件。生成新的变量,对连续性变量进行离散性转换;将几个小类别合并 为一个大类别等。利用SFSS强大的数据整理技术,可使数据结构、内容更易于分析。 (3)包括自由灵活的表格功能。特别是在SPSs1.5版本中新增的自定义表格模块 tom table),使得制表变得更加简单和直接。 (4)提供了各种常用的统计学图形,如条图、线图、饼图、直方图、散点图等多种图形,并且可
1.1 SPSS软件概述 3 第 章 数据分析概述与软件入门 1.1 SPSS软件概述 SPSS公司总部位于美国芝 加哥,创立 于 1975年,一直以 经营统计 软件产品开 发为主业。 1994—1998年间,SPSS公 司得到了 很大的发展,陆续 购并 了 SYSTAT公司、BMDP软件公司、 Quantum公司、ISL公司等,并将各公司的主打产品收纳 SPSS旗下,从而使 SPSS公司由原来的单 一统计产品开发与销售转向为企业、教育科研及政府机构提供全面信息统计决策支持服务,成为 最新的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。 SPSS软件是 SPSS公司赖以起家的产品,目前也仍然是该公司的主打产品 之一,目前的最新 版本为 12.0本书也均以 12.0版本为准进行讲解。SPSS的英文名称原为 StatisticalPackagefor SocialSciences,意为社会科学统计软件包。后来随着 SPSS产品服 务领域的 扩大和服务深度的 增加,SPSS公司已于 2002年将英文全称更改为 StatisticalProductandServiceSolutions,意为统计 产品与服务解决方案。在近 30年的发展中,虽然竞争对手不断出现,但 SPSS却始终以其鲜明的 特色鼎立于统计学软件之中,现在和 SAS(另一种统计分析软 件)被并称为当今最权威 的两大统 计软件。 1.1.1 软件的基本特点 SPSS得到用户广泛欢迎的原因 在于 SPSS强大 的统计分析与数 据准备功能,方便的图表展 示功能,以及广阔的兼容性、界面的友好性满足了广大用户的需求,深 受广大应用统计 分析人员 的喜爱。 1.功能强大 (1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全方位的统计学算法,为各 种研究提供了相应的统计学方法。如方差分析、回归分析、多元统计分析方法、生存分析方法等, 方法体系覆盖全面。 (2)提供了各种数据准备与数据整理技术。如利用值标签来快捷地录入数据,从 而为数据 审核与分析提供了便利条件。生成新的变量,对连续性变量进行离散性转换;将几个小类别合并 为一个大类别等。利用 SPSS强大的数据整理技术,可使数据结构、内容更易于分析。 (3)包括自由灵活的表格功能。特 别是在 SPSS11.5版本中新增的自定义表格模块(Cus- tomTable),使得制表变得更加简单和直接。 (4)提供了各种常用的统计学图形,如条图、线图、饼图、直方图、散点图等多种图形,并且可
4第1章数据分析概述与软件入门 将表格图形直接拷贝到Wom文档、幻灯片中,直接进行结果的展现。 2兼容性好 (1)在数据方面,不仅可在SPS中作数据录入工作,还可将日常工作中常用的Exce表格 数据、文本格式数据导入SPSS中进行分析,不仅节省了相当大的工作量,并且避免了因拷贝粘贴 可能引起的错误 (2)在结果方面,SPSS的表格、图形结果可直接导出为Wo文本、网页、Exce格式等,也 可以将表格、交互式图形作为对象选择性粘贴到 Wor Powe pont等中,并在其中再利用SPSs对 它们进行编辑 3易用性强 SS之所以有广大的用户群,不仅因为它是一种权威的统计学工具,提供了强大的统计功 能,也因为它是一种非常简单易用的软件。人机界面的友好、操作的简单,使得各位统计分析人 员对它青睐不已。另外,SPS也向一些高级用户提供了编程功能,使分析工作变得更加节省时 间和精力 1.1.2SPSs的 C lien t/ erver结构 SPSs软件自10.0版本以来,已发展为 C lient/Server的结构体系。用户可以选择只购买单机 版,也可以选择购买服务器和单机版。对于大数据量客户,可以利用 SPSS Server来解决速度慢 网络阻塞等由于数据量大而引起的问题。 分析中使用 SPSS Server的好处在于: 1)更快的分析速度。由于服务器端往往与数据仓库的物理距离更近,而 SPSS Server也对 计算进行了优化,加之应用服务器的硬件配置也远高于单机端喀户端),因此对于进行大数据 量分析的客户, SPSS Serveri可以使速度提高很多 (2)缓解网络阻塞。由于数据不需要全部传送到单机端,所以网络上的数据传输量大大减 少,从而缓解了网络阻塞问题 在使用时调用 Server的具体做法是:在应用服务器端安装 SPSS Server在单机端安装相同版 本的 SPSS Client惨见图1.1)。在单机端打开 SPSS for W indows时,选择菜单 File- Sw itch Se rve r在如图L.2(a)所示的对话框中指定要连接的 SPSS Server所在服务器地址,如果是第 次使用,则单击“Add"按钮,出现如图1.2(b)所示对话框,输入服务器名或P地址、端口号,单 击“K”按钮,在服务器列表中出现相应的 Serve地址,然后输入用户名、密码、域名,单击“OK 按钮,即可登录到 SPSS Seve此时,在 SPSS forw nd ows下方的状态栏中,就会显示“ SPSS PrC cessor on服务器名’:端口号’ is ready”,表示连接已经建立 当然对于数据量不大的客户,只用 SPSS C lenti就可以了。现在国内绝大多数用户所说的 SPSs实际上就是指的单机版
4 第 1章 数据分析概述与软件入门 将表格图形直接拷贝到 Word文档、幻灯片中,直接进行结果的展现。 2.兼容性好 (1)在数据方面,不仅可在 SPSS中 作数据录入工作,还可将 日常工作中常用 的 Excel表格 数据、文本格式数据导入 SPSS中进行分析,不仅节省了相当大的工作量,并且避免了因拷贝粘贴 可能引起的错误。 (2)在结果方 面,SPSS的表格、图形结果可 直接导 出为 Word、文本、网页、Excel格式等,也 可以将表格、交互式图形作为对象选择性粘贴到 Word、PowerPoint等中,并在其中再利用 SPSS对 它们进行编辑。 3.易用性强 SPSS之所以有广大的用户群,不仅因为它是一种权威的统计学工具,提供了强大的统计功 能,也因为它是一种非常简单易用的软件。人机界面的友好、操作的简单,使得各位统 计分析人 员对它青睐不已。另外,SPSS也向一些高级用户提 供了编程功能,使分析工作变得更加节省时 间和精力。 1.1.2 SPSS的 Client/Server结构 SPSS软件自 10.0版本以来,已发展为 Client/Server的结构体系。用户可以选择只购买单机 版,也可以选择购买服务器和单机版。对于大数据量客户,可以利用 SPSSServer来解决速度慢、 网络阻塞等由于数据量大而引起的问题。 在分析中使用 SPSSServer的好处在于: (1)更快的分析速度。由于服务器端往往与数据仓库的物理距离更近,而 SPSSServer也对 计算进行了优化,加之应用服务 器的硬件配置也 远高于 单机端(客 户端),因 此对于进行大数据 量分析的客户,SPSSServer可以使速度提高很多。 (2)缓解网络阻塞。由于数据不需要全部传送到单机端,所以网 络上的数据传输 量大大减 少,从而缓解了网络阻塞问题。 在使用时调用 Server的具体做法是:在应用服务器端安装 SPSSServer,在单机端安装相同版 本的 SPSSClient(参 见 图 1.1)。在 单机端 打开 SPSSforWindows时,选择 菜单 File→ Switch Server,在如图 1.2(a)所示的对话框 中指定要 连接的 SPSSServer所 在服务器地址,如果是第一 次使用,则单击“Add”按钮,出现如图 1.2(b)所示对 话框,输 入服务器名或 IP地址、端口号,单 击“OK”按钮,在服务器列表中出现相应的 Server地址,然后输入用户名、密码、域名,单击“OK” 按钮,即可登录到 SPSSServer。此时,在 SPSSforWindows下方的状态栏中,就会显示“SPSSPro- cessoron‘服务器名’:‘'端口号’isready”,表示连接已经建立。 当然对于数据量不大的客户,只用 SPSSClient就可以了。现在国内 绝大多数 用户所说的 SPSS,实际上就是指的单机版
SPS软件概述5 Serve hardware Serv hardware SPSS for SPSS Sorver SPSS 图1.1Ss软件的 C lien t/Server体系 Chanel iadiewtei-atart'wg etneethas 厂1 er this I 图L.2 SPSS Clen调用 SPSS Ser的对话框设置 1.1.3SPss的模块式结构 无论是 SPSS C lien坯还是 SPSS Sever均是模块式结构,即它把自己的所有功能分放在多个 模块上。用户可以根据分析中可能用到的数据处理和统计分析方法,自己选择适当的模块进行 购买,而不必花更多的钱购买所有模块。 SPSs12共由11个模块构成,它们分别是: SPSS Base, SPSs A dvanced. SPSS Categories SPSS Camp lex Samp le SPSS Conjoint SPSS Exact Test SPSS Maps SPSS M issing Value Analysis SPSS R gression SPSS Tables和 SPSS Trends其中 SPSS Base是必需的,因为SPs软件的整个框架、基 本的数据获取、数据准备等基本功能都被集中在这个模块上,其他模块必须在 SPSS Base搭建的 平台上才能工作。其他模块的功能分别如表11所示 SPSs软件通过其 License来控制模块是否安装。一个模块安装上之后,在 SPSS for w indows 的菜单中就会出现相应的菜单项,所以不同客户的 SPSS for w ndows的菜单可能有所不同。如 果没有购买 SPSS Trends模块,软件中就不会有这样一个菜单: Analyz· Trends如果没有购买 SPSSM aps模块,软件中就不会有菜单: G raph→Maps
1.1 SPSS软件概述 5 图 1.1 SPSS软件的 Client/Server体系 (a) (b) 图 1.2 SPSSClient调用 SPSSServer的对话框设置 1.1.3 SPSS的模块式结构 无论是 SPSSClient还是 SPSSServer,均是模块 式结构,即它把 自己的所 有功能分放在多个 模块上。用户可以根据分析中可能用到的数据处理和统计分析方法,自己选择适当的 模块进行 购买,而不必花更多的钱购买所有模块。 SPSS12共由 11个模块构成,它们分别是:SPSSBase、SPSSAdvanced、SPSSCategories、SPSS ComplexSample、SPSSConjoint、SPSSExactTest、SPSSMaps、SPSSMissingValueAnalysis、SPSSRe- gression、SPSSTables和 SPSSTrends。其中 SPSSBase是必 需的,因 为 SPSS软件的整个框架、基 本的数据获取、数据准备等基本功能都被集中在这个模块上,其他模 块必须在 SPSSBase搭建的 平台上才能工作。其他模块的功能分别如表 1.1所示。 SPSS软件通过其 License来控制模块是否安装。一个模块安装上之后,在 SPSSforWindows 的菜单中就会出现相应的菜单项,所以不同客户的 SPSSforWindows的菜单 可能有所 不同。如 果没有购买 SPSSTrends模块,软件 中就不会 有这样一个菜单:Analyze→ Trends;如 果没有购买 SPSSMaps模块,软件中就不会有菜单:Graph→Maps
6第1章数据分析概述与软件入门 表1.1SPSS模块与功能对应表 SPSS附加模块 SPSS Advanced 一般线性模型、混合线性模型、对数线性模型、生存分析等 Categores 对应分析、感知图、Pros等 SPSS Camp bx Sam pb 多阶段复杂抽样技术等 SPSS Conio nt 正交设计、联合分析等,适用于市场研究 SPSS Exact Test 精确P值计算、随机抽样P值计算等 SPSS Maps 在地图上展示数据等 SPSS M issing Va he analysi 缺失数据的报告与填补等 SPSS Regress on Logis tc回归、非线性回归、Pob回归等 SPSS Tables 交互式创建各种表格如堆积表、嵌套表、分层表等) SPSS Trends Atha模型、指数平滑、自回归等 着版本的提升,SPS的各个模块在功能和性能上也会有一定的改进。例如, SPSS Base从 11.5版本开始,提供了将结果直接导入 w od exce文档的功能,而在12版本中,变量名也不再 有8字符的位数限制。又比如 SPSS Tables在1L.5版本时发生了重大变化,提供了所见即所得 的表格制作功能,详见本书第7章。 SPSS Cam pex Samp e模块则是120版本新增加的内容,详 见本丛书的PS与市场研究》中的相关内容。 最后有一点需要澄清:国内许多SPSS书籍因对SPSs的功能讲解不全,总是在前言中声明所 使用的是SPSS标准版。实际上SPSs软件,不存在所谓的标准版和专业版之分,即使安装全部的 11个模块,软件也仍然是标准版。这些书籍中所谓的“标准版”,其实质只是 SPSS Base模块的 相应功能而己 1.1.4SPSs的安装 SPSs的安装非常简单,跟随安装向导即可将SPSS轻松安装到自己的本机。下面分别简要 介绍一下 SPSS Server和 SPSS C lient的安装过程。 L. SPSS Server的安装 SPSS Server支持的操作平台有AⅨUN,HPUNⅨ Linu x w indows Nt等,根据不同的版 本,支持平台略有不同。具体安装步骤如下 1)将 SPSS Server安装光盘插入计算机光驱后,出现如图1.3(a)所示的界面。选中 stall SPSS Server即进入安装向导 (2)跟随向导,接受 License协议,并选择安装目录,出现图L.3(b)图所示界面 (3)键入SPSS公司提供的 Licen se.单击“Upda”按钮,即出现该 License允许安装的模块 击“Nex按钮
6 第 1章 数据分析概述与软件入门 表 1.1 SPSS模块与功能对应表 SPSS附加模块 功 能 SPSSAdvanced 一般线性模型、混合线性模型、对数线性模型、生存分析等 SPSSCategories 对应分析、感知图、Proxscal等 SPSSComplexSample 多阶段复杂抽样技术等 SPSSConjoint 正交设计、联合分析等,适用于市场研究 SPSSExactTest 精确 P值计算、随机抽样 P值计算等 SPSSMaps 在地图上展示数据等 SPSSMissingValueAnalysis 缺失数据的报告与填补等 SPSSRegression Logistic回归、非线性回归、Probit回归等 SPSSTables 交互式创建各种表格(如堆积表、嵌套表、分层表等) SPSSTrends Arima模型、指数平滑、自回归等 随着版本的提升,SPSS的各个模块在功能和性能上也会有一定的改 进。例如,SPSSBase从 11.5版本开始,提供了将结果直接导入 Word、Excel文档的功 能,而在 12版本中,变量 名也不再 有 8字符的位数限制。又比如 SPSSTables在 11.5版本时发 生了重大变化,提供了所 见即所得 的表格制作功能,详见本书第 7章。SPSSComplexSample模块则是 12.0版本新增加的 内容,详 见本丛书的《SPSS与市场研究》中的相关内容。 最后有一点需要澄清:国内许多 SPSS书籍因对 SPSS的功能讲解不全,总是在前言中声明所 使用的是 SPSS标准版。实际上 SPSS软件,不存在所谓的标准版和专业版之分,即使安装全部的 11个模块,软件也仍然是标准版。这些书籍中所谓 的“标准版”,其实质只是 SPSSBase模块的 相应功能而已。 1.1.4 SPSS的安装 SPSS的安装非常简单,跟随安装向导即 可将 SPSS轻松 安装到自己的本 机。下面分别简要 介绍一下 SPSSServer和 SPSSClient的安装过程。 1.SPSSServer的安装 SPSSServer支 持的操作平台有 AIXUNIX,HPUNIX,Linux,WindowsNT等,根据不同的版 本,支持平台略有不同。具体安装步骤如下: (1)将 SPSSServer安装光 盘插入计算机光 驱后,出现如图 1.3(a)所示的界面。选中“In- stallSPSSServer”即进入安装向导。 (2)跟随向导,接受 License协议,并选择安装目录,出现图 1.3(b)图所示界面。 (3)键入 SPSS公司提供的 License,单击“Update”按钮,即出现该 License允许安装的模块, 单击“Next”按钮
SPS软件概述 设定该应用服务器的P地址和应用端口,再单击“Nex按钮,即开始安装,最后单击 Finish”按钮结束安装 SPSS Server 12.0 的naa作的s数u wecD和oM 图13 SPSS Serve安装过程中的几个视图 2. SPSS C SPSS C lient支持的操作平台为 w indows nt40. w indow s95982000XP等。安装要求约 100MB~120MB硬盘舰其版本和模块而不同),内存要求为64MB以上。具体安装步骤如下 ①1)将 SPSS C lien安装光盘放入计算机光驱后,出现如图1.4(a所示的界面。选中 PSS即进入安装向导。 (2)跟随向导,首先接受 License协议”,并选择安装目录,在随后的界面中键入名称、公司 和SPSS公司提供的序列号。 (3)当要求输入 License时,如图.4(b),键入SPSS公司提供的 License单击“Upda”按 钮,即出现该 License允许安装的模块,单击“Ne按钮,即开始安装,最后单击“ Finish”按钮结 束安装 SPSS 12.0 Instal Smwmewer nsta Adobe Acrobat Readers D Ma9PssD和sPaC drowse he Co ROM 图L4 SPSS C lient安装过程中的几个视图
1.1 SPSS软件概述 7 (4)设定该应用服务器的 IP地址和应用端口,再单 击“Next”按钮,即开始安装,最后单击 “Finish”按钮结束安装。 (a) (b) 图 1.3 SPSSServer安装过程中的几个视图 2.SPSSClient的安装 SPSSClient支持的操作平台为 WindowsNT4.0,Windows95、98、2000、XP等。安装要求约 100MB~120MB硬盘(视其版本和模块而不同),内存要求为 64MB以上。具体安装步骤如下: (1)将 SPSSClient安装光盘放入计算机光驱后,出现如图 1.4(a)所示的界面。选中“Install SPSS”即进入安装向导。 (2)跟随向导,首先“接受 License协议”,并选择安装目录,在随后的界面 中键入名 称、公司 和 SPSS公司提供的序列号。 (3)当要求输入 License时,如图 1.4(b),键入 SPSS公司提供的 License,单击“Update”按 钮,即出现该 License允许安装的模块,单击“Next”按钮,即开始安装,最后单击“Finish”按钮结 束安装。 (a) (b) 图 1.4 SPSSClient安装过程中的几个视图