多元统计分析实验指导
多元统计分析实验指导
目录第一章统计分析软件SPSS和R概述(3)第二章多元正态总体均值向量和协差阵的假设检验·(11)(11)2.1实验一多因素方差分析·2.2实验二协方差分析·(20)第三章聚类分析·(26).3.1实验一系统聚类分析.(26)3.2实验二K-均值型聚类法.(31)(35)第四章判别分析·4.1实验一、实验二费歇判别法和贝叶斯判别法…(35)(42)4.3实验三逐步判别法(50)第五章主成分分析第六章(54)因子分析·.第七章对应分析…. (60)第八章典型相关分析(68)第九章简介定性资料的统计分析·(71)参考文献(76)
目 录 第一章 统计分析软件 SPSS 和 R 概述.(3) 第二章 多元正态总体均值向量和协差阵的假设检验.(11) 2.1 实验一 多因素方差分析.(11) 2.2 实验二 协方差分析.(20) 第三章 聚类分析.(26) 3.1 实验一 系统聚类分析.(26) 3.2 实验二 K-均值型聚类法.(31) 第四章 判别分析.(35) 4.1 实验一、实验二 费歇判别法和贝叶斯判别法.(35) 4.3 实验三 逐步判别法.(42) 第五章 主成分分析.(50) 第六章 因子分析.(54) 第七章 对应分析.(60) 第八章 典型相关分析.(68) 第九章 简介定性资料的统计分析.(71) 参考文献 .(76)
第一章统计分析软件 SPSS和R概述1.1.SPSS软件使用基础1.1.1SPSS软件概况SPSS是世界上最早的统计分析软件之一,20世纪60年代末由美国斯坦福大学的三位研究生研制,同时成立了SPSS公司,1975年在芝加哥组建了SPSS总部。SPSs是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。SPSS采用类似EXCEL表格的方式输入数据与管理数据,并能方便地从其他数据库中读入数据。只要掌握基本的Windows操作技能,熟知统计分析原理,就可以使用该软件。统计过程包括了常用的、较为成熟的统计过程。SPSS具有语法生成窗口,用户在菜单中选好各个选项,然后用“粘贴”方式,就可以自动生成的SPSS程序。1.1.2SPSS13.0forWindows的启动与退出1.1.2.1SPSS13.0forWindows的启动开机启动Windows后,在屏幕左下方鼠标按下“程序”,再选择“SPSSforWindows”,最后选择“SPSS13.OforWindows”,开始运行SPSS13.0forWindows,同时显示版本提示画面。在提示画面之后出现的是SPSS文件对话框。1.1.2.2SPSS13.0forWindows的退出SPSS有五种退出方法:单击SPSSData Editor窗口最右上角的关闭按钮;选择SPSSDataEditor窗口主菜单的“File~Exit”命令;双击SPSSDataEditor窗口最左上角的窗口图标;单击SPSSDataEditor窗口最左上角的窗口图标,在显示出的菜单中单击关闭命令;直接按Alt+F4组合键。1.2SPSS数据文件创建和导入1.2.1数据文件的建立数据的输入分成两个步骤:一是录人数据之前应该定义每个变量类型;二是将每个具体的变量值录人数据库单元格内。下面以具体实例来介绍SPSS数据文件的建立过程。例1-1:将某班级10位学生的高等数学成绩建立为SPSS数据文件。1
1 第一章 统计分析软件 SPSS 和 R 概述 1.1 SPSS 软件使用基础 1.1.1 SPSS 软件概况 SPSS 是世界上最早的统计分析软件之一, 20 世纪 60 年代末由美国斯坦福 大学的三位研究生研制,同时成立了 SPSS 公司, 1975 年在芝加哥组建了 SPSS 总 部。SPSS 是软件英文名称的首字母缩写,原意为 Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着 SPSS 产品服务领域的 扩大和服务深度的增加,SPSS 公司已于 2000 年正式将英文全称改为 Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。 SPSS 采用类似 EXCEL 表格的方式输入数据与管理数据,并能方便地从其他数据 库中读入数据。只要掌握基本的 Windows 操作技能,熟知统计分析原理,就可以 使用该软件。统计过程包括了常用的、较为成熟的统计过程。SPSS 具有语法生 成窗口,用户在菜单中选好各个选项,然后用“粘贴”方式,就可以自动生成的 SPSS 程序。 1.1.2 SPSS13.0 for Windows 的启动与退出 1.1.2.1 SPSS13.0 for Windows 的启动 开机启动 Windows 后,在屏幕左下方鼠标按下 “程序”,再选择“ SPSS for Windows”,最后选择“SPSS13.0 for Windows”,开始运行 SPSS13.0 for Windows, 同时显示版本提示画面。在提示画面之后出现的是 SPSS 文件对话框。 1.1.2.2 SPSS13. 0 for Windows 的退出 SPSS 有五种退出方法:单击 SPSS Data Editor 窗口最右上角的关闭按钮; 选择 SPSS Data Editor 窗口主菜单的“File ~Exit”命令;双击 SPSS Data Editor 窗口最左上角的窗口图标;单击 SPSS Data Editor 窗口最左上角的窗口图标, 在显示出的菜单中单击关闭命令;直接按 Alt+F4 组合键。 1.2 SPSS 数据文件创建和导入 1.2.1 数据文件的建立 数据的输入分成两个步骤:一是录人数据之前应该定义每个变量类型;二是 将每个具体的变量值录人数据库单元格内。下面以具体实例来介绍 SPSS 数据文 件的建立过程。 例 1-1:将某班级 10 位学生的高等数学成绩建立为 SPSS 数据文件
表1-2-1某班10位学生的高等数学成绩学号性别高等数学成绩女1862男75男3734女885女956男65男7878女909男50女1078数据录人的具体步骤如下:1.进人SPSS的界面:当打开SPSS后,展现在我们面前的界面如图1-2-1所示。-通Untitled-SPSSDataEditorFle Edit View Data TransformAnalyze Graphs Uilities Window Help国1131DataViewKVariableView.二SPSsProcessorisready图1-2-1SPSS的数据编辑窗口该窗口顶部显示为“SPSSDataeditor”,这是一个Windows软件界面,有菜单栏、工具栏。工具栏下方是数据栏,数据栏下方是数据编辑窗口的主界面。主界面由若干行和列组成,每行对应一条记录,每列对应一个指标。当没有输入任何数据,行、列的标号都是灰色的,第一行第一列的单元格框为深色,表明该单元格为当前单元格。首次进入SPSS系统时会出现一个对话框,单击右下方的Cancel按钮,即进入上面的主界面。2
2 表 1-2-1 某班 10 位学生的高等数学成绩 学号 性别 高等数学成绩 1 女 86 2 男 75 3 男 73 4 女 88 5 女 95 6 男 65 7 男 87 8 女 90 9 男 50 10 女 78 数据录人的具体步骤如下: 1.进人 SPSS 的界面:当打开 SPSS 后,展现在我们面前的界面如图 1-2-1 所示。 图 1-2-1 SPSS 的数据编辑窗口 该窗口顶部显示为“ SPSS Data editor”,这是一个 Windows 软件界面,有 菜单栏、工具栏。工具栏下方是数据栏,数据栏下方是数据编辑窗口的主界面。 主界面由若干行和列组成,每行对应一条记录,每列对应一个指标。当没有输入任 何数据,行、列的标号都是灰色的,第一行第一列的单元格框为深色,表明该单元 格为当前单元格。首次进入 SPSS 系统时会出现一个对话框,单击右下方的 Cancel 按钮,即进入上面的主界面
2.定义变量打开SPSS运行界面后,界面为Datavariable,首先单击左下角的“Variableview”;即显示如图1-2-2所示的界面,此界面上可以定义变量名、变量的类型、变量的长度、小数位数、变量名标签、变量值标签、变量的格式(显示宽度、对齐方式、误差值标签)等。定义一个变量的步骤如下:第一步,定义变量名,单击“Name”所在列的第一行,输入要定义的第一个变量的名称。在Name列中的第一、二、三行分别输入变量名学号、性别、成绩,同时SPSS会在变量类型、变量长度及小数位数等列中自动填入默认值(系统默认值为数值型变量)。如图1-2-2所示:-口当Untitled-SPSSDataEditorFileEdit View DataTransform AnalyzeGraphsUilitiesWindowHelp国ONameTypeWidthDecimalsValuesMissingColumnsAlignMeasureLabel1学号NoneNoneRightScaleNumeric82Let2性别None8None0NominalString3成绩None8RightNumeric82NoneScale41013S1619Data View入VariableViewSPSSProcessorisready图1-2-2定义变量属性的界面第二步,定义变量类型。单击“Type”栏的第一行,出现省略号,单击省略号,出现定义变量类型的对话框。用户可以在此对话框中选择变量类型并且更改变量的长度和小数位数。学号、成绩属于数值型变量,性别属于字符型变量,如果用户需要更改变量长度及小数位数,既可在VariableType对话框中更改,也可直接在界面上的“Width”和“DecimalPlace”中定义。第三步,定义变量名标签。在绝大多数情况下,前面两步工作的完成,就可以基本满足分析的需要,但变量的完整定义并未完成。定义变量名标签,该标签会在结果中输出以方便阅读。以变量成绩为例,在Label一栏内输入“高等数学成绩”,如图1-2-3所示:3
3 2.定义变量 打开 SPSS 运行界面后,界面为 Data variable,首先单击左下角的 “Variable view”;即显示如图 1-2-2 所示的界面,此界面上可以定义变量名、 变量的类型、变量的长度、小数位数、变量名标签、变量值标签、变量的格式(显 示宽度、对齐方式、误差值标签) 等。 定义一个变量的步骤如下:第一步,定义变量名,单击“Name”所在列的第一行, 输入要定义的第一个变量的名称。在 Name 列中的第一、二、三行分别输入变量 名学号、性别、成绩,同时 SPSS 会在变量类型、变量长度及小数位数等列中自动 填入默认值(系统默认值为数值型变量)。如图 1-2-2 所示: 图 1-2-2 定义变量属性的界面 第二步, 定义变量类型。单击“Type”栏的第一行,出现省略号,单击省略号,出 现定义变量类型的对话框。用户可以在此对话框中选择变量类型并且更改变量的 长度和小数位数。学号、成绩属于数值型变量,性别属于字符型变量,如果用户 需要更改变量长度及小数位数,既可在 Variable Type 对话框中更改,也可直接 在界面上的“ Width”和“ Decimal Place”中定义。 第三步,定义变量名标签。在绝大多数情况下,前面两步工作的完成,就可以基本 满足分析的需要,但变量的完整定义并未完成。定义变量名标签,该标签会在结果 中输出以方便阅读。以变量成绩为例,在 Label 一栏内输入“高等数学成绩”, 如图 1-2-3 所示: