《实用统计分析方法与SPSS应用》初稿/张文璋 高低图(High-Low) I Graphs=>[High-Lowl 帕累托图( Pareto) Graphs]=>[Pareto] 工序控制图( Control) I Graphs=I] 箱线图( Boxplot Graphs]=>[Boxplot 误差条图( Error bar) Graphs]=>Error Bar] 散点图( Scatter) ∴:|( raphs=>[Scatter 直方图( Histogram) h Graphs→>[ Histogram PP正态概率图 ,[Graphs]=>[P-P] ( Normal P-P Q-Q正态概率图 Graphs=>[Q-Q1 时序图( Sequence Graphs]=>[Sequence 自相关图 [Graphs]=>[Time Series (Autocorrelations) →>[ Autocorrelations 互相关图 Graphs→[ Time series Cross-Correlations) 表2-5交互式统计图形 图形名称 菜单项选择 条形图(Bar) 点图(Dot) I Graphs]=>[Interactive]=>[Dot 线图Line) Graphs]=>[Interactive]=>[Line] 带状图( Ribbon) Graphs]=>[Interactive]=>[Ribbon 点线图( Drop-Line) [Graphs]=>[Interactive=>[Drop-Line] 面积图(Area) I Graphs=>lInteractive=>Area 饼图(Pe) I Graphs=>Interactive=>[Pie 箱线图( Boxplot) [Graphs=>[Interactive=>[Boxplot 误差条图( Error bar [Graphs=>[Interactive]>[Error Bar 直方图( Histogram) Graphs]=>[Interactive=>[ Histogram 散点图( Scatterplot Graphs]=>[Interactive]=>[Scatterplot 四、输出管理( Output Managemen 不管是统计分析还是图形分析,其结果都输出到新的窗口—— Viewer窗口或 Draft Viewer窗口,SPSS默认输出窗口为 Viewer窗口(如图2-24所示)。 Viewer窗口的左边是输 出大纲视图(如图2-25所示),可以单击统计过程名称左边的“+”和“-”展开或收缩输出 31
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 31 高低图(High-Low) [Graphs]=>[High-Low] 帕累托图(Pareto) [Graphs]=>[Pareto] 工序控制图(Control) [Graphs]=>[Control] 箱线图(Boxplot) [Graphs]=>[Boxplot] 误差条图(Error Bar) [Graphs]=>[Error Bar] 散点图(Scatter) [Graphs]=>[Scatter] 直方图(Histogram) [Graphs]=>[Histogram] P-P 正态概率图 (Normal P-P) [Graphs]=>[P-P] Q-Q 正态概率图 (Normal Q-Q) [Graphs]=>[Q-Q] 时序图(Sequence) [Graphs]=>[Sequence] 自相关图 (Autocorrelations) [Graphs]=>[Time Series] =>[Autocorrelations] 互相关图 (Cross-Correlations) [Graphs]=>[Time Series] =>[Cross-Correlations] 表 2-5 交互式统计图形 图形名称 菜单项选择 条形图(Bar) [Graphs]=>[Interactive]=>[Bar] 点图(Dot) [Graphs]=>[Interactive]=>[Dot] 线图(Line) [Graphs]= >[Interactive]=>[Line] 带状图(Ribbon) [Graphs]= >[Interactive]=>[Ribbon] 点线图(Drop-Line) [Graphs]= >[Interactive]=>[Drop-Line] 面积图(Area) [Graphs]= >[Interactive]=>[Area] 饼图(Pie) [Graphs]= >[Interactive]=>[Pie...] 箱线图(Boxplot) [Graphs]= >[Interactive]=>[Boxplot] 误差条图(Error Bar) [Graphs]= >[Interactive]=>[Error Bar] 直方图(Histogram) [Graphs]= >[Interactive]=>[Histogram] 散点图(Scatterplot) [Graphs]= >[Interactive]=>[Scatterplot] 四、输出管理(Output Management) 不管是统计分析还是图形分析,其结果都输出到新的窗口——Viewer 窗口或 Draft Viewer 窗口,SPSS 默认输出窗口为 Viewer 窗口(如图 2-24所示)。Viewer 窗口的左边是输 出大纲视图(如图 2-25所示),可以单击统计过程名称左边的“+”和“-”展开或收缩输出
《实用统计分析方法与SPSS应用》初稿/张文璋 大纲,也可以拖动输出内容项目改变项目的位置。 Viewer窗口的右边显示具体的输出内容 (如图2-26所示),一般通过文字、表格、图形显示统计计算结果。许多输出结果以数据透 视表( Pivot table)的表格形式显示,数据透视表功能强大,便于用户自行定义所需格式。如 果要查看数据透视表中某个统计术语的含义,双击该数据透视表,右击术语,在弹出的快捷 菜单中选择What'This,就可获得该术语的简单定义。用户可通过与操作 Windows应用程 序一致的方法使用 Viewer窗口,这里不详细介绍。 口 File Edit View Insert Format Analyze Graphs Utilities Window Help 回国则四回回则凹 →国 Output sPss for Windows Processor is ready 图2-24输出窗口 FE Output- sPSS Viewer File Edit View Insert Format Analyze Graphs Utilities 回回回回则到 囗回回 日+ Output □rt1e Descriptive L Descriptive Statistics urrent Salary Valid N Qistwi 图225输出大纲视图
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 32 大纲,也可以拖动输出内容项目改变项目的位置。Viewer 窗口的右边显示具体的输出内容 (如图 2-26所示),一般通过文字、表格、图形显示统计计算结果。许多输出结果以数据透 视表(Pivot Table)的表格形式显示,数据透视表功能强大,便于用户自行定义所需格式。如 果要查看数据透视表中某个统计术语的含义,双击该数据透视表,右击术语,在弹出的快捷 菜单中选择[What’s This],就可获得该术语的简单定义。用户可通过与操作 Windows 应用程 序一致的方法使用 Viewer 窗口,这里不详细介绍。 图 2-24 输出窗口 图 2-25 输出大纲视图
《实用统计分析方法与SPSS应用》初稿/张文璋 t1- SPSs Viewer □口区 Edit View Insert Format Analyze Graphs Utilities Window Help e回回回山 Descriptives Descriptive Statistics Current Salary 474 ISPSS Processor is ready 图2-26输出内容
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 33 图 2-26 输出内容
《实用统计分析方法与SPSS应用》初稿/张文璋 第三章统计数据的收集、整理与描述 第一节统计数据的来源 统计数据的来源渠道很多,不同的统计数据可通过不同渠道获得。在进行一项研究时 可以查阅报纸书刊、査阅统计年鉴、也可以通过 Internet查阅联机数据库。如果这些数据仍 不能满足研究的需要,还可以委托调査公司或者自己组织调查,以获得必要的统计数据。我 们把来源于直接的调査和科学实验的统计数据称为第一手统计数据:把来源于别人调查和科 学实验的数据称为第二手统计数据。第二手统计数据主要是公开出版的统计数据。当然,我 们有时也通过一些渠道设法使用一些尚未公开的数据。对于第二手统计数据,作为使用者来 说,我们要淸楚从哪里可以获得有关数据,并要了解这些数据的来源、指标口径和数据的质 一、统计数据的直接来源 统计数据的直接来源主要是通过专门组织的直接调查和科学试验这两个渠道获得的。 (一)来源于管理和研究需要而专门组织的调查 在进行管理决策和科学硏究时,如果能利用现成的数据当然是省时、省钱、省力的好办 法。但为了国民经济宏观管理的需要,就必须掌握最新的人口、农作物产量、国内生产总值、 主要工业产品产量和产值,以及人民生活的变化情况,这就需要经常组织专门的调查以获得 国民经济管理的基本数据。国家统计局系统和国务院各部、委、局的统计系统就承担首这些 调查任务 另一方面,在社会主义市场经济条件下,大量的市场调查和民意测验也都需要组织专门 的统计调查,以搜集特殊的数据,满足管理和研究的要求。例如家用电器质量调查,化妆品 品牌的调査,广播电视收视率调査,居民闲暇时间使用情况的调査,白领阶层调査等等。为 适应社会和市场的需求,现在国内大中城市的市场调查业正在兴起,越来越多的调查公司或 调查研究所承担起专门组织调査的任务,为特殊的管理和研究服务 (二)来源于科学试验的数据 在社会科学的研究和经济管理中,我们用调查的方法搜集必要的统计数据。在自然科学 和工程的各个研究领域,如物理、化学、生物、医学、农业和工业等领域是通过科学试验的 方法获得统计研究的数据。例如某化工厂生产某种化工产品,为了在不同的影响因素(原料 配方)的不同水平中选取最优的水平,就要通过试验的方法获得必要的数据,通过对数据的 统计分析来确定生产的最优方案;又例如农业科研中要通过试验的方法选取最优品种和最佳 的种植方式。在医学中通过临床试验的数据分析某种药物或治疗方案的疗效。 统计数据的间接来源 对于社会上绝大多数的研究工作者和实际工作者来说,亲自去做直接的调查往往是不可 能的。这时,可以通过各种渠道获取别人调査或科学试验的第二手数据。 (一)来源于公开出版物的数据 第二手统计数据主要是公开出版或公开报道的数据。在我国,公开出版物或报道的社会 经济统计数据主要来自国家和地方的统计部门以及各种报刊传媒。现在,随着计算机网络技 术的发展,各国的报刊、杂志、图书及各种音像制品都可以从 Internet上获得,这也为我们 获得各种统计数据提供了方便
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 34 第三章 统计数据的收集、整理与描述 第一节 统计数据的来源 统计数据的来源渠道很多,不同的统计数据可通过不同渠道获得。在进行一项研究时, 可以查阅报纸书刊、查阅统计年鉴、也可以通过 Internet 查阅联机数据库。如果这些数据仍 不能满足研究的需要,还可以委托调查公司或者自己组织调查,以获得必要的统计数据。我 们把来源于直接的调查和科学实验的统计数据称为第一手统计数据;把来源于别人调查和科 学实验的数据称为第二手统计数据。第二手统计数据主要是公开出版的统计数据。当然,我 们有时也通过一些渠道设法使用一些尚未公开的数据。对于第二手统计数据,作为使用者来 说,我们要清楚从哪里可以获得有关数据,并要了解这些数据的来源、指标口径和数据的质 量。 一、统计数据的直接来源 统计数据的直接来源主要是通过专门组织的直接调查和科学试验这两个渠道获得的。 (一)来源于管理和研究需要而专门组织的调查 在进行管理决策和科学研究时,如果能利用现成的数据当然是省时、省钱、省力的好办 法。但为了国民经济宏观管理的需要,就必须掌握最新的人口、农作物产量、国内生产总值、 主要工业产品产量和产值,以及人民生活的变化情况,这就需要经常组织专门的调查以获得 国民经济管理的基本数据。国家统计局系统和国务院各部、委、局的统计系统就承担首这些 调查任务。 另一方面,在社会主义市场经济条件下,大量的市场调查和民意测验也都需要组织专门 的统计调查,以搜集特殊的数据,满足管理和研究的要求。例如家用电器质量调查,化妆品 品牌的调查,广播电视收视率调查,居民闲暇时间使用情况的调查,白领阶层调查等等。为 适应社会和市场的需求,现在国内大中城市的市场调查业正在兴起,越来越多的调查公司或 调查研究所承担起专门组织调查的任务,为特殊的管理和研究服务。 (二)来源于科学试验的数据 在社会科学的研究和经济管理中,我们用调查的方法搜集必要的统计数据。在自然科学 和工程的各个研究领域,如物理、化学、生物、医学、农业和工业等领域是通过科学试验的 方法获得统计研究的数据。例如某化工厂生产某种化工产品,为了在不同的影响因素(原料 配方)的不同水平中选取最优的水平,就要通过试验的方法获得必要的数据,通过对数据的 统计分析来确定生产的最优方案;又例如农业科研中要通过试验的方法选取最优品种和最佳 的种植方式。在医学中通过临床试验的数据分析某种药物或治疗方案的疗效。 二、统计数据的间接来源 对于社会上绝大多数的研究工作者和实际工作者来说,亲自去做直接的调查往往是不可 能的。这时,可以通过各种渠道获取别人调查或科学试验的第二手数据。 (一)来源于公开出版物的数据 第二手统计数据主要是公开出版或公开报道的数据。在我国,公开出版物或报道的社会 经济统计数据主要来自国家和地方的统计部门以及各种报刊传媒。现在,随着计算机网络技 术的发展,各国的报刊、杂志、图书及各种音像制品都可以从 Internet 上获得,这也为我们 获得各种统计数据提供了方便
《实用统计分析方法与SPSS应用》初稿/张文璋 (二)来源于内部调查的数据 对于我们的科学研究和经济管理来说,除了利用已经公开发表的数据,还要充分利用己 搜集到的但未公开发表的数据。因为统计调查的大量信息,特别是调查的原始数据,或者是 由于公开发表篇幅的限制,或者由于数据保密的原因等未公开发表、也未充分利用。例如, 城市和农村居民家庭的收入支出调査搜集了大量的统计数据和信息,是我们进行经济管理等 大量研究的宝贵数据资源,应该充分挖掘和利用。当然,在使用这些内部数据时既要考虑数 据的保密问题,又要考虑与原调查单位的合作问题。因为只有在解决了内部数据的合使用问 题后,才能发挥这些数据的作用,才能最大限度地发挥第二手资料的作用 利用间接来源的统计数据对使用者来说既省时又省钱、省力。但使用时应注意统计数据 指标的含义、计算口径和计算方法,以避免误用或滥用。同时,在引用统计数据时,一定要 注明数据的来源。这样,既尊重别人的劳动成果,也便于读者查找核对 第二节统计数据的收集 统计数据的收集就是统计调查,它按研究的目的和要求,有组织地向调查对象收集相关 的各种资料。为了保证统计数据资料的完整性、准确性和及时性,必须熟悉各种收集方法及 各自的特点。 问卷调查 问卷是调査者向被调查者了解情况或征询意见时所运用的统一设计的调查表。绝大多数 旨在收集定量数据的调查都要采用某种形式的问卷。问卷的质量高低对调查成功与否起决定 作用,只有研究者设计出高水平、高质量的问卷,才会使调查得以顺利完成,并获得令人满 意的数据。 问卷按传递方式不同,可分为报刊问卷、邮政问卷、送发问卷和访问问卷。问卷还可以 按调查方式分类,如按问卷的填答者不同,可分为自填问卷和代填问卷 从问卷的基本结构来看,应包括封面信、指导语、调查内容及编码四个基本内容 第一,封面信。给调查者的一封短信,一般内容不宜过长,以二三百字为宜。在封面信 中写清单位地址、电话号码、邮政编码、联系人姓名等,并说明大致的调査内容和进行这项 调査的目的,调查对象的选取和调查结果保密的措施。在信的结尾处,要真诚的感谢调査者 的合作和支持。 第二,指导语。指导语是用来指导被调查者填写问卷的一组说明。指导语的形式有两种。 一种是写在封面信之后,另一种是分别放在某些较复杂的问题后,用括号括起来,其作用主 要是指导被调查者准确理解与填写该问题。比如:(可选择多个答案)、(请按重要顺序排列) 通常两种形式结合使用 第三,调査内容。调查内容是问卷的主体,调查项目的多少由调查目的和经费决定,每 个项目包括问题和答案两个部分。从形式上分,问题可归为开放式问题和封闭式问题;从内 容上分,可分为有关个人背景资料问题、行为问题和态度问题及知识问题等 开放式问题不为被调查者提供答案,而由回答者自由回答。比如 ●您喜欢什么品牌的啤酒? 回答者可不受限制,回答自己喜欢的啤酒。开放式问题的优点是,被调查者可以充分自由地 按自己的方式发表意见,因为所得资料比较生动、丰富。但开放式问题所花费的时间和敬礼 较多,编码工作复杂繁琐,且开放式问题难于进行定量分析处理。 封闭式问题是在提出问题的同时,给出若干个答案,要求被调查者选择一个或多个答案 作为回答。如 ●您喜欢哪种国产牌子的啤酒?
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 35 (二)来源于内部调查的数据 对于我们的科学研究和经济管理来说,除了利用已经公开发表的数据,还要充分利用已 搜集到的但未公开发表的数据。因为统计调查的大量信息,特别是调查的原始数据,或者是 由于公开发表篇幅的限制,或者由于数据保密的原因等未公开发表、也未充分利用。例如, 城市和农村居民家庭的收入支出调查搜集了大量的统计数据和信息,是我们进行经济管理等 大量研究的宝贵数据资源,应该充分挖掘和利用。当然,在使用这些内部数据时既要考虑数 据的保密问题,又要考虑与原调查单位的合作问题。因为只有在解决了内部数据的合使用问 题后,才能发挥这些数据的作用,才能最大限度地发挥第二手资料的作用。 利用间接来源的统计数据对使用者来说既省时又省钱、省力。但使用时应注意统计数据 指标的含义、计算口径和计算方法,以避免误用或滥用。同时,在引用统计数据时,一定要 注明数据的来源。这样,既尊重别人的劳动成果,也便于读者查找核对。 第二节 统计数据的收集 统计数据的收集就是统计调查,它按研究的目的和要求,有组织地向调查对象收集相关 的各种资料。为了保证统计数据资料的完整性、准确性和及时性,必须熟悉各种收集方法及 各自的特点。 一、问卷调查 问卷是调查者向被调查者了解情况或征询意见时所运用的统一设计的调查表。绝大多数 旨在收集定量数据的调查都要采用某种形式的问卷。问卷的质量高低对调查成功与否起决定 作用,只有研究者设计出高水平、高质量的问卷,才会使调查得以顺利完成,并获得令人满 意的数据。 问卷按传递方式不同,可分为报刊问卷、邮政问卷、送发问卷和访问问卷。问卷还可以 按调查方式分类,如按问卷的填答者不同,可分为自填问卷和代填问卷。 从问卷的基本结构来看,应包括封面信、指导语、调查内容及编码四个基本内容。 第一,封面信。给调查者的一封短信,一般内容不宜过长,以二三百字为宜。在封面信 中写清单位地址、电话号码、邮政编码、联系人姓名等,并说明大致的调查内容和进行这项 调查的目的,调查对象的选取和调查结果保密的措施。在信的结尾处,要真诚的感谢调查者 的合作和支持。 第二,指导语。指导语是用来指导被调查者填写问卷的一组说明。指导语的形式有两种。 一种是写在封面信之后,另一种是分别放在某些较复杂的问题后,用括号括起来,其作用主 要是指导被调查者准确理解与填写该问题。比如:(可选择多个答案)、(请按重要顺序排列) 等,通常两种形式结合使用。 第三,调查内容。调查内容是问卷的主体,调查项目的多少由调查目的和经费决定,每 个项目包括问题和答案两个部分。从形式上分,问题可归为开放式问题和封闭式问题;从内 容上分,可分为有关个人背景资料问题、行为问题和态度问题及知识问题等。 开放式问题不为被调查者提供答案,而由回答者自由回答。比如: ●您喜欢什么品牌的啤酒? 回答者可不受限制,回答自己喜欢的啤酒。开放式问题的优点是,被调查者可以充分自由地 按自己的方式发表意见,因为所得资料比较生动、丰富。但开放式问题所花费的时间和敬礼 较多,编码工作复杂繁琐,且开放式问题难于进行定量分析处理。 封闭式问题是在提出问题的同时,给出若干个答案,要求被调查者选择一个或多个答案 作为回答。如: ●您喜欢哪种国产牌子的啤酒?