《实用统计分析方法与SPSS应用》初稿/张文璋 厂 Match case 图2-19查找数据对话框 (三)数据转换 在理想情况下,输入的原始数据完全适合要执行的统计分析类型,遗憾的是,这种情况 很罕见,经常需要通过数据转换来提示变量之间的真实关系。利用SPSS可进行从简单到复 杂的数据转换。例如 1、根据已存在的变量建立新变量 选择[ Transform]=[ Compute,打开如图2-20所示的 Compute Variable(计算变量)对话 框。在对话框中的[ Target variable(目标变量)]下框中输入符合变量命名规则的变量名 目标变量可以是现存变量或新变量。对话框中[ Numeric Expression(数值表达式)]下的文本 框用于输入计算目标变量值的表达式。表达式能够使用左下框列出的现存变量名、计算器板 列出的算术运算符和常数和 Functions(函数)]列表框显示的各种函数等。可以在文本框中 直接输入和编辑表达式,也可以使用变量列表、计算器板和函数列表将元素粘贴到文本框中 计算器板包括数字、算术运算符、关系运算符和逻辑运算符,可以象使用计算器一样使 用它们。计算器板上的算术运算符有+(加)、-(减)、*(乘)、/(除)、**(指数)、()(运 算符顺序):关系运算符有<(小于)、>(大于)、<=(小于等于)、>=(大于等于)、=(等 于)、~=(不等于)等;逻辑运算符有&(and,与运算,A、B两关系均为真时A&B才为 真)、|(or,或运算,A、B任一关系为真时AB即为真)、~(not,非与算,颠倒表达式的 真假结果,A为真则~A为假,A为假则~A为真)。 函数表70多个函数,包括算术函数、统计函数、分布函数、逻辑函数、日期和时间汇 总与提取函数、缺失值函数、字符串函数、随机变量函数等等,例如自然对数LNO、绝对 值对数ABSO、求和函数SUMO等。 计算器板下面有一个[F按钮,单击该按钮打开条件表达式对话框。在条件表达式对话 框中指定一个逻辑表达式,一个逻辑表达式对每一个观测(case)返回真、假或缺失值。如果 个逻辑表达式的结果是真,就把转换应用于那个观测:如果结果是假或缺失值,就不对那 个观测应用转换
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 26 图 2-19 查找数据对话框 (三)数据转换 在理想情况下,输入的原始数据完全适合要执行的统计分析类型,遗憾的是,这种情况 很罕见,经常需要通过数据转换来提示变量之间的真实关系。利用 SPSS 可进行从简单到复 杂的数据转换。例如: 1、根据已存在的变量建立新变量 选择[Transform]=>[Compute],打开如图 2-20所示的[Compute Variable (计算变量)]对话 框。在对话框中的[Target Variable (目标变量)]下框中输入符合变量命名规则的变量名, 目标变量可以是现存变量或新变量。对话框中[Numeric Expression(数值表达式)]下的文本 框用于输入计算目标变量值的表达式。表达式能够使用左下框列出的现存变量名、计算器板 列出的算术运算符和常数和[Functions(函数)]列表框显示的各种函数等。可以在文本框中 直接输入和编辑表达式,也可以使用变量列表、计算器板和函数列表将元素粘贴到文本框中。 计算器板包括数字、算术运算符、关系运算符和逻辑运算符,可以象使用计算器一样使 用它们。计算器板上的算术运算符有+(加)、-(减)、*(乘)、/(除)、**(指数)、()(运 算符顺序);关系运算符有<(小于)、>(大于)、<=(小于等于)、>=(大于等于)、=(等 于)、~=(不等于)等;逻辑运算符有&(and,与运算,A、B 两关系均为真时 A&B 才为 真)、|(or,或运算,A、B 任一关系为真时 A|B 即为真)、~(not,非与算,颠倒表达式的 真假结果,A 为真则~A 为假,A 为假则~A 为真)。 函数表 70 多个函数,包括算术函数、统计函数、分布函数、逻辑函数、日期和时间汇 总与提取函数、缺失值函数、字符串函数、随机变量函数等等,例如自然对数 LN()、绝对 值对数 ABS()、求和函数 SUM()等。 计算器板下面有一个[IF]按钮,单击该按钮打开条件表达式对话框。在条件表达式对话 框中指定一个逻辑表达式,一个逻辑表达式对每一个观测(case)返回真、假或缺失值。如果 一个逻辑表达式的结果是真,就把转换应用于那个观测;如果结果是假或缺失值,就不对那 个观测应用转换
《实用统计分析方法与SPSS应用》初稿/张文璋 Target Variable Numeric Expression 参 Employee CodeL K89 秒 Date of Birth[b] 秒 Educational Le 图m网 秒 Employment 参 Current Salary [a ARTAN(numexpr CDFNORM(zvalue Beg DFBERNOULLI(qp 秒 Months since H 参 Previous Experie 秒 Minority Classific Reset Cancel Help 图2-20计算变量对话框 2、对观测(case)记录进行排序 在数据文件中,可根据一个或多个排序变量的值重排观测的顺序。选择[ Data=Sort Cases,打开[ Sort Cases对话框,如图2-21所示。 葬>x1 第z3 Reset Sort Order C Ascending 图2-21观测排序对话框 3、观测或变量转置 SPSS中将行作为观测,列作为变量。对那些观测和变量的行列关系与此相反的数据文 件,可以选择[ Data]=→[ Transpose将行列互换,对话框如图2-2所示 Variable(s) Name Variabl 图2-22转置对话框 4、文件合并 可以将两个或更多个数据文件合并在一起,即可将具有相同变量但观测不同的文件合
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 27 图 2-20 计算变量对话框 2、对观测(case)记录进行排序 在数据文件中,可根据一个或多个排序变量的值重排观测的顺序。选择[Data]=>[Sort Cases],打开[Sort Cases]对话框,如图 2-21所示。 图 2-21 观测排序对话框 3、观测或变量转置 SPSS 中将行作为观测,列作为变量。对那些观测和变量的行列关系与此相反的数据文 件,可以选择[Data]=>[Transpose]将行列互换,对话框如图 2-22所示。 图 2-22 转置对话框 4、文件合并 可以将两个或更多个数据文件合并在一起,即可将具有相同变量但观测不同的文件合
《实用统计分析方法与SPSS应用》初稿/张文璋 并,也可将观测相同变量不同的文件相合并。选择[Data}>[ Merge Files]=={ Add cases]从第 二个文件即外部SPSS数据文件向当前工作数据文件追加观测。选择[Data=>[ Merge Files→[ Add variables合并含有相同观测但不同变量的两个SPSS外部文件 5、选取观测子集 可以选择[ Data]=>[Select Cases]根据包含变量和复杂的表达式的准则把统计分析限于某 一特定观测子集,也可选取一个随机观测样本。这样就可以同时对不同的观测子集作不同的 统计分析 6、其它转换 数据汇总,[Data=[ Aggregate] 数据加权,[Data=> Weight Cases 数值编码,[ Transform={ Recode]; 数据求秩,[ Transform]=[ Rank Cases] 产生时间序列,[ Transform]=( reate Time Series:等等。 (四)保存数据文件 在数据文件中所做的任何变化都仅在这个SPSS过程期间保留,除非明确地保存它们。 要保存对前面建立的数据文件进行的任何改变,选择[Fle=Save或按CurH+S快捷键即可 如果要把数据文件保存为一个新文件或将数据以不同格式保存,可选择[Fle={ Save As 打开如图223所示的对话框。主要的保存类型有: SPSS(*sav),SPSS10.0默认格式 SPSS70(*sav),SPSS70格式 SPSS/PC+(*sys),SPSS/PC+格式; Excel(*xkls), Microsoft excel格式 1-2-3Rel3.0(*wk3), Lotus 1-2-3V3.0电子表格文件;等等 Save Data As 保存在① a sps ACrobat Odbc 面 Anxiety.sav sCripts 圃 Breast cancer survi SEtup Cars.sav 文件名Q 保存() 保存类型c):|sFss(米,sav) Paste mt取消」 图2-23“另存为”对话框 五)打开已经存在的数据文件 选择[rFie}=(open或按快捷键Crl+O,显示[ Open file(打开文件)对话框。选择要打开 的文件的文件类型和文件名,单击打开] 二、统计分析( Statistical Analysis) 在SPSS中建立了数据文件或打开一个数据文件之后,选择正确的统计分析方法,是得
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 28 并,也可将观测相同变量不同的文件相合并。选择[Data]=> [Merge Files]=>[Add cases]从第 二个文件即外部 SPSS 数据文件向当前工作数据文件追加观测。选择[Data]=>[Merge Files]=>[Add Variables]合并含有相同观测但不同变量的两个 SPSS 外部文件。 5、选取观测子集 可以选择[Data]=>[Select Cases]根据包含变量和复杂的表达式的准则把统计分析限于某 一特定观测子集,也可选取一个随机观测样本。这样就可以同时对不同的观测子集作不同的 统计分析。 6、其它转换 数据汇总,[Data]=>[Aggregate]; 数据加权,[Data]=>[Weight Cases]; 数值编码,[Transform]=>[Recode]; 数据求秩,[Transform]=>[Rank Cases]; 产生时间序列,[Transform]=>[Create Time Series];等等。 (四)保存数据文件 在数据文件中所做的任何变化都仅在这个 SPSS 过程期间保留,除非明确地保存它们。 要保存对前面建立的数据文件进行的任何改变,选择[File]=>[Save]或按 Ctrl+S 快捷键即可。 如果要把数据文件保存为一个新文件或将数据以不同格式保存,可选择[File]=>[Save As], 打开如图 2-23所示的对话框。主要的保存类型有: SPSS(*.sav),SPSS 10.0 默认格式; SPSS7.0(*.sav),SPSS 7.0 格式; SPSS/PC+(*.sys),SPSS/PC+格式; Excel(*.xls),Microsoft Excel 格式; 1-2-3 Rel 3.0(*.wk3),Lotus 1-2-3 V3.0 电子表格文件;等等。 图 2-23 “另存为”对话框 (五)打开已经存在的数据文件 选择[File]=>[Open]或按快捷键 Ctrl+O,显示[Open file(打开文件)]对话框。选择要打开 的文件的文件类型和文件名,单击[打开]。 二、统计分析(Statistical Analysis) 在 SPSS 中建立了数据文件或打开一个数据文件之后,选择正确的统计分析方法,是得
《实用统计分析方法与SPSS应用》初稿/张文璋 到正确分析结果的关键步骤。统计分析过程在主菜单 Analyze(分析中的下拉菜单中,如 表2-3所示。本书介绍的统计分析方法的SPSS使用参见相关章节 表2-3统计分析过程 菜单项 菜单项包含的统计分析功能(子菜单项) Reports(Et)OLAP Cubes(OnLine Analytical Processing Cubes) Case summaries(观测概要) Report Summaries in Rows(行形式输出报告) Report Summaries in Columns(列形式输出报告) escriptive Frequencies(一维频数分布表) Statistics(描述统| Descriptive(描述统计量计算) Explore(数据探索) Crosstabs(多维频数列表,列联分析) Compare Means(均 Means(分组求均值) 值比较) One-Sample T Test(单样本T检验) Independent-Samples T Test(独立样本T检验) Paired- Samples T Test(配对/相关样本T检验) One-way ANOVA(一维方差分析) General Linear Univariate(单变量GLM) Model GLM Multivariate(多变量GLM) 般线性模型) Repeated Measures(重复测量设计的GLM) Variance Components(方差成分) Correlate(相关分 Bivariate(两个变量的相关分析) Partial(偏相关分析) Distances(距离分析) Regression(回归分 Linear(线性回归分析 析) Curve estimation(曲线估计 Binary Logistic(二值 Logistic回归分析) Multinomial Logistic(多项 Logistic回归分析) Ordinal(有序回归) Probit(Pobt回归分析) Nonlinear(非线性回归分析 Weight estimation(加权估计 2- Stage Least Squares(两阶段最小二乘法回归分析) Loglinear(对数线| General(一般对数线性模型分析) 性模型) Logt(Logt分析) Model selection(模型选择对数线性分析) Classify(分类) K-Means Cluster(K均值大样本聚类分析) Hierarchical Cluster(系统/层次聚类分析) Discriminant(判别分析) Data Reduction(数 Factor(因子分析,主成分分析) 据降维) Correspondence(对应分析) Scale(等级分析) Reliability Analysis(可靠性分析) ①在 SPSS V8.0或更低版本中,该菜单项的名称为 Statistics统计刀
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 29 到正确分析结果的关键步骤。统计分析过程在主菜单[Analyze(分析)]①中的下拉菜单中,如 表 2-3所示。本书介绍的统计分析方法的 SPSS 使用参见相关章节。 表 2-3 统计分析过程 菜单项 菜单项包含的统计分析功能(子菜单项) Reports(报告) OLAP Cubes(OnLine Analytical Processing Cubes) Case Summaries(观测概要) Report Summaries in Rows(行形式输出报告) Report Summaries in Columns(列形式输出报告) Descriptive Statistics(描述统 计) Frequencies(一维频数分布表) Descriptive(描述统计量计算) Explore(数据探索) Crosstabs(多维频数列表,列联分析) Compare Means(均 值比较) Means(分组求均值) One-Sample T Test(单样本 T 检验) Independent-Samples T Test(独立样本 T 检验) Paired-Samples T Test(配对/相关样本 T 检验) One-way ANOVA(一维方差分析) General Linear Model(GLM,一 般线性模型) Univariate(单变量 GLM) Multivariate(多变量 GLM) Repeated Measures (重复测量设计的 GLM) Variance Components(方差成分) Correlate(相关分 析) Bivariate(两个变量的相关分析) Partial(偏相关分析) Distances(距离分析) Regression(回归分 析) Linear(线性回归分析) Curve Estimation(曲线估计) Binary Logistic(二值 Logistic 回归分析) Multinomial Logistic(多项 Logistic 回归分析) Ordinal(有序回归) Probit(Probit 回归分析) Nonlinear(非线性回归分析) Weight Estimation(加权估计) 2-Stage Least Squares(两阶段最小二乘法回归分析) Loglinear(对数线 性模型) General(一般对数线性模型分析) Logit(Logit 分析) Model Selection(模型选择对数线性分析) Classify(分类) K-Means Cluster(K 均值大样本聚类分析) Hierarchical Cluster(系统/层次聚类分析) Discriminant(判别分析) Data Reduction(数 据降维) Factor(因子分析,主成分分析) Correspondence(对应分析) Scale(等级分析) Reliability Analysis(可靠性分析) ① 在 SPSS V8.0 或更低版本中,该菜单项的名称为[Statistics(统计)]
《实用统计分析方法与SPSS应用》初稿/张文璋 匚菜单项 菜单项包含的统计分析功能(子菜单项) Multidimensional Scaling(多维等级分析) Nonparametric Chi- Square(卡方检验) Tests(非参数检验) Binomial(二项检验) Runs(游程检验) leK-S(单样本KS检验) 2 Independent Samples(两个独立样本非参数检验) K Independent Samples(多个独立样本非参数检验) 2 Related Samples(两个相关样本非参数检验 K Related Samples(多个相关样本非参数检验) Time Series(时间| Exponential Smoothing(指数平滑) 序列) Autoregression(自回归) ARIMA(差分自回归滑动平均模型) XIl ARIMA (XIl ARIMA) Seasonal Decomposition(季节分解) urvival(生存分 Life Tables(生命表分析) 析) Kaplan-Meier(卡普兰梅尔分析) Regression(Cox回归分析) Multiple Response Define Sets(定义多重应答数据集合) (多重应答) Frequencies(多重应答频数) Crosstabs(多重应答交叉列表) Ing Value| Missing Value Analysis(缺失值分析) 三、图形分析( Graphical Analysis 统计图是用点的位置、线段的升降、直条的长短或面积的大小等方法来表达统计数据的 种形式,它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地 表现出来,以便于读者的阅读、比较和分析。统计图具有简明生动、形象具体和通俗易懂的 特点。SPSS的图形分析功能很强,许多高精度的统计图形可从[ Analyze]菜单的各种统计分 析过程产生,也可以直接从 Graphs菜单中所包含的各个选项完成。图形分析的一般过程为 建立或打开数据文件,若数据文件结构不符合分析需要,则必须转换数据文件结构:生成图 形;修饰生成的图形,保存结果。常用的统计图形有条形图、线图、面积图、圆饼图、散点 图、直方图、箱线图等等,见表2-4。其中统计图形有两种形式,一种为一般图形,另一种 为交互式图形,交互式图形提供了更多的选项,可绘制出更强大的图形。 表24一般统计图形 图形名称 示意图 菜单项选择 条形图(Bar) [Graphs]=[Line] 面积图(Area) [Graphs=>[Area] 饼图(Pie) DI[ Graphs]=>[Pie
《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 30 菜单项 菜单项包含的统计分析功能(子菜单项) Multidimensional Scaling(多维等级分析) Nonparametric Tests(非参数检验) Chi-Square(卡方检验) Binomial(二项检验) Runs(游程检验) 1-Sample K-S(单样本 K-S 检验) 2 Independent Samples(两个独立样本非参数检验) K Independent Samples(多个独立样本非参数检验) 2 Related Samples(两个相关样本非参数检验) K Related Samples(多个相关样本非参数检验) Time Series(时间 序列) Exponential Smoothing(指数平滑) Autoregression(自回归) ARIMA(差分自回归滑动平均模型) X11 ARIMA(X11 ARIMA) Seasonal Decomposition(季节分解) Survival (生存分 析) Life Tables(生命表分析) Kaplan-Meier(卡普兰-梅尔分析) Cox Regression(Cox 回归分析) Multiple Response (多重应答) Define Sets(定义多重应答数据集合) Frequencies(多重应答频数) Crosstabs(多重应答交叉列表) Missing Value Analysis Missing Value Analysis(缺失值分析) 三、图形分析(Graphical Analysis) 统计图是用点的位置、线段的升降、直条的长短或面积的大小等方法来表达统计数据的 一种形式,它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地 表现出来,以便于读者的阅读、比较和分析。统计图具有简明生动、形象具体和通俗易懂的 特点。SPSS 的图形分析功能很强,许多高精度的统计图形可从[Analyze]菜单的各种统计分 析过程产生,也可以直接从[Graphs]菜单中所包含的各个选项完成。图形分析的一般过程为: 建立或打开数据文件,若数据文件结构不符合分析需要,则必须转换数据文件结构;生成图 形;修饰生成的图形,保存结果。常用的统计图形有条形图、线图、面积图、圆饼图、散点 图、直方图、箱线图等等,见表 2-4。其中统计图形有两种形式,一种为一般图形,另一种 为交互式图形,交互式图形提供了更多的选项,可绘制出更强大的图形。 表 2-4 一般统计图形 图形名称 示意图 菜单项选择 条形图(Bar) [Graphs]=>[Bar] 线图(Line) [Graphs]=>[Line] 面积图(Area) [Graphs]=>[Area] 饼图(Pie) [Graphs]=>[Pie]