表2-1spss中的数据文件 SPSS( sav) SPSS数据文件(60~10.0版) SPSS/PC+(.sys) SPSS4.0版数据文件 syd格式的 Systat数据文件 ,sys格式的 Systat数据文件 SPSS portable(’por)SPsS便携格式的数据文件 EXCEL(. xls) EXCEL数据文件(从50版~2000版) Lotus数据文件 SYLK(.slk) SYLK数据文件 dBase(*.dbf) d Base系列数据文件(从 d Base il-lⅤ) Text(.txt) 纯文本格式的数据文件 data(dat) 纯文本格式的数据文件 (2)使用数据库查询打开 SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文 件,比如 FoxPro30以上版本的*dbf文件就不能直接打开。为此,SPSS还提供了另一个 适用范围更广、但使用上较为专业的数据接口——数据库查询。 SPSS在这里使用的是一种叫ODBC( Open Database Capture)的数据接口,该接口被大 多数数据库软件和办公软件(如 MS Office支持,通过它,应用程序可以直接访问以结构化 查询语言(SQL)做为数据访问标准的数据库管理系统。 由于SPSS100可以直接打开 EXCEL所有系列的数据文件,因此数据库查询接口的用 处不是很大。但是,在90及以前的版本中,该查询仍是直接打开 EXCEL95、97及2000 数据文件的唯一办法 ODBC数据引擎是独立于各种应用软件,直接安装到 Windows系统中的,因此你所用 的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。还好,大多数支 持该接口的软件都会在安装光盘上附送该引擎的安装文件(如 MS Office不过有一点要提 醒大家,许多机器的OBDC数据引擎安装有问题(尤其是盗版),在SPSS中使用它往往要 死机。 选择菜单“File”“ Open Database”→“ New Query”,系统会弹出数据库向导的第 个窗口,其中会列出你使用的机器上己安装的所有数据库驱动程序,选中所需的数据源 然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。 (3)使用文本导入向导读入文本文件 选择菜单“Fle”“ Read Text Data”,系统就会弹出 Open File对话框,和前面的情 况完全一样,只是文件类型自动跳到了Text(*tt。实际上,该功能在SPSS中已被整合 到了 Open File对话框中。之所以在菜单上保留该条目有两个原因: 读入纯文本的情况非常普遍,放在这里更加醒目。 为了和SPSS老版本的使用上保持兼容。 [例2-1]现有一数据文件以纯文本的形式存为“c:Ln21.txt”,且第一行为变量名,请 将其读入SPSS
表 2-1 spss 中的数据文件 SPSS(*.sav) SPSS 数据文件 6.0 10.0 版 SPSS/PC+(*.sys) SPSS 4.0 版数据文件 Systat(*.syd) *.syd 格式的 Systat 数据文件 Systat(*.sys) *.sys 格式的 Systat 数据文件 SPSS portable(*.por) SPSS 便携格式的数据文件 EXCEL(*.xls) EXCEL 数据文件 从 5.0 版 2000 版 Lotus(*.w*) Lotus 数据文件 SYLK(*.slk) SYLK 数据文件 dBase(*.dbf) dBase 系列数据文件 从 dBase II IV Text(*.txt) 纯文本格式的数据文件 data(*.dat) 纯文本格式的数据文件 (2) 使用数据库查询打开 SPSS 可以直接打开许多类型的数据文件 但这并不是说它可以打开所有类型的数据文 件 比如 FoxPro 3.0 以上版本的*.dbf 文件就不能直接打开 为此 SPSS 还提供了另一个 适用范围更广 但使用上较为专业的数据接口 数据库查询 SPSS 在这里使用的是一种叫 ODBC(Open Database Capture)的数据接口 该接口被大 多数数据库软件和办公软件(如 MS Office)支持 通过它 应用程序可以直接访问以结构化 查询语言(SQL)做为数据访问标准的数据库管理系统 由于 SPSS 10.0 可以直接打开 EXCEL 所有系列的数据文件 因此数据库查询接口的用 处不是很大 但是 在 9.0 及以前的版本中 该查询仍是直接打开 EXCEL 95 97 及 2000 数据文件的唯一办法 ODBC 数据引擎是独立于各种应用软件 直接安装到 Windows 系统中的 因此你所用 的系统中 ODBC 所支持的数据类型取决于所安装的 ODBC 引擎的情况 还好 大多数支 持该接口的软件都会在安装光盘上附送该引擎的安装文件(如 MS Office) 不过有一点要提 醒大家 许多机器的 OBDC 数据引擎安装有问题(尤其是盗版) 在 SPSS 中使用它往往要 死机 选择菜单 File Æ Open Database Æ New Query 系统会弹出数据库向导的第 一个窗口 其中会列出你使用的机器上已安装的所有数据库驱动程序 选中所需的数据源 然后单击下一步 向导会一步一步的提示你如何做 直至将数据读入 SPSS (3) 使用文本导入向导读入文本文件 选择菜单 File Æ Read Text Data 系统就会弹出 Open File 对话框 和前面的情 况完全一样 只是文件类型自动跳到了 Text (*.txt) 实际上 该功能在 SPSS 中已被整合 到了 Open File 对话框中 之所以在菜单上保留该条目有两个原因 z 读入纯文本的情况非常普遍 放在这里更加醒目 z 为了和 SPSS 老版本的使用上保持兼容 [例 2-1] 现有一数据文件以纯文本的形式存为 c:\Li2_1.txt 且第一行为变量名 请 将其读入 SPSS
在 Open File对话框里选中相应的文件名并单击“确定”,系统会自动启动文本导入向导 对话框,如图2-1所示。 This wizard will help you read dsts fr text file and Does your text file match s predefined format? 21030,304050 步[一步完成。」取消」帮助 图2-1SPSS第一步 在SPSS100中,该向导并没有重新设计,因此仍然有问题被截断无法显示完的情况出现。 可以看到该向导共分6步,这是第一步。中部为一对单选按钮,问题为“你的文本文 件和预定义格式相一致吗?”,下方为按预定义格式读入的数据文件的预览。显然,SPSS 的预定义格式并没有正确识别该文件。因此选择“No”并单击“下一步”,系统弹出向导 的下一个对话框,如图2-2所示 How are your variables arranged? Wari ables are delimited by a specific character CoFiE variable nanas included at the top of your file Text file ,1,,,,3,4, 区上一步下一步m 图2-2SPSS第二步
在 Open File 对话框里选中相应的文件名并单击“确定” 系统会自动启动文本导入向导 对话框 如图 2-1 所示 图 2-1 SPSS 第一步 在 SPSS 10.0 中 该向导并没有重新设计 因此仍然有问题被截断无法显示完的情况出现 可以看到该向导共分 6 步 这是第一步 中部为一对单选按钮 问题为 你的文本文 件和预定义格式相一致吗 下方为按预定义格式读入的数据文件的预览 显然 SPSS 的预定义格式并没有正确识别该文件 因此选择 No 并单击 下一步 系统弹出向导 的下一个对话框 如图 2-2 所示 图 2-2 SPSS 第二步
最上方的问题是“你的变量是如何排列的?”,下面的选项分别为 Delimiter(用某种字 符区分)和 Fixed Width(固定宽度),一般都是 Delimit,第二个问题是“变量名包括在文件 最前面了吗?”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框。 The first case of data begins on which caac= Iepr C Each line represents a How nany cases do you want to inport? Che红 ir1000 case C A randon percentage of the cases(arox山0彐 Data preview D334050 上一步)[一步Q习□完成取消」帮助 图2-3SPSS第三步 最上方的句子意为“第一条记录从第几行开始?”,右侧可以输入行数。由于我们所 用的数据第一行为变量名,因此这里输入2。下面的问题是“你的记录是怎样存储在文件 中的?”。可以是“每一行代表一条记录”,或者“每**个变量代表一条记录”,数据一 般都是第一种情况。下一个问题是“你想导入多少条记录?”,可以是“所有记录”、“前 *条”或“随机导入*%的记录”。一般也选前者。单击“下一步”,第四个对话框如图 2-4所示 厂 Semicolon 厂Qher Group 上一步①)下一步)。」取消」帮助 图2-4SPSS第四步
最上方的问题是 你的变量是如何排列的 下面的选项分别为 Delimite(用某种字 符区分)和 Fixed Width(固定宽度) 一般都是 Delimite 第二个问题是 变量名包括在文件 最前面了吗 我们当然选 Yes 单击 下一步 系统弹出第三个对话框 图 2-3 SPSS 第三步 最上方的句子意为 第一条记录从第几行开始 右侧可以输入行数 由于我们所 用的数据第一行为变量名 因此这里输入 2 下面的问题是 你的记录是怎样存储在文件 中的 可以是 每一行代表一条记录 或者 每**个变量代表一条记录 数据一 般都是第一种情况 下一个问题是 你想导入多少条记录 可以是 所有记录 前 **条 或 随机导入**%的记录 一般也选前者 单击 下一步 第四个对话框如图 2-4 所示 图 2-4 SPSS 第四步
我这里介绍得非常详细,但实际使用中你可以不管大多数问题,因为SPSS一般都能 自动正确设置 最上方的问题为“变量间用的是哪种分隔符?”,可选的有Tab键、空格、逗号、分 号或自行定义的其他符号。本数据采用的是空格,可见系统已经自动识别并选择了空格, 而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步”,第五个对话框如 图25所示。 Specificati variable() selected in the data previ group 上一步①)[一步元成」」职消」助」 图2-5SPSS的第五步 上方的提示为“定义在数据预览窗口中所选择的变量”。顾名思义,在这个对话框中 你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。当然,在这里我们不用 这样做,直接单击“下一步”,系统弹出文本导入向导的最后一个对话框,如图26所示。 You have successfully defined the forn at of Mould you like to save this file format for futur Aould you like to paste the syntax? C ass the Finish button to complete the 上一步⑩】匚亮感取消」帮助 图2-6SPSS第六步
我这里介绍得非常详细 但实际使用中你可以不管大多数问题 因为 SPSS 一般都能 自动正确设置 最上方的问题为 变量间用的是哪种分隔符 可选的有 Tab 键 空格 逗号 分 号或自行定义的其他符号 本数据采用的是空格 可见系统已经自动识别并选择了空格 而下方的数据预览窗口显示出了正确的数据读入情况 单击 下一步 第五个对话框如 图 2-5 所示 图 2-5 SPSS 的第五步 上方的提示为 定义在数据预览窗口中所选择的变量 顾名思义 在这个对话框中 你可以在数据预览窗口中选择某一列变量 然后更改其变量名和类型 当然 在这里我们不用 这样做 直接单击 下一步 系统弹出文本导入向导的最后一个对话框 如图 2-6 所示 图 2-6 SPSS 第六步
最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”,第二 个问题为“你是否愿意将以上操作粘贴为SPSS语句?”,一般这两个问题我们都可以不 管。单击“完成”,系统最终成功地读入了Li21txt 3.保存数据文件 在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单Fle=>Save, 如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Save as菜单时相同的 Save as对话框。里面可以保存的数据类型和可以打开的几乎一样多,选 择合适的类型,确定就是了。 Save命令的快捷键为“Ctr”+“S”,如果你曾经领教过 Windows死机的巨大潜力 那么你一定会理解习惯性地随手按“Cτr”十“S”,至少不能算是一个坏习惯。 如果你准备将数据存为SPSS以外的其他类型,要注意有些设置可能会丢失,如标签 和缺失值等。尤其是缺失值,如果想存的数据格式不支持缺失值,那你的数据可能会变的 面目全非。 4.Fle菜单中的其他条目 Disp Data Inf(” 该菜单项用于显示数据的基本信息。选择它后会弹出非常类似于打开文件的一个对话 框用于选择数据文件,选择好后按“OK”,系统就会在结果窗口中列出所选数据的基本情 况,如建立时间、标签设置、记录数、变量设置等。 Apply Data Dictionary” 即使用数据字典。该功能使你可以直接在新数据集中套用以前定义好的变量设置(格 式、标签等,但不包括数据类型)。举个例子吧:请打开Lil_l.sav文件,将变量x的长度 从8改为4,标签删掉,然后选择菜单“Fle”→“ Apply Data Dictionary”,在文件对话框 中选择Lil_sav并按“OK”(即将Lil1.sav的变量设置按相同变量名一一套用在现在的 数据集上),怎么样?一切都变回去了吧 “ Cache Data 建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远 程用SQL调用数据库,这会非常费时。现在使用 Cache Data,可以将数据全部读入暂存盘 建立活动数据的缓冲区。大大加快了处理速度。不过我特意试了一下,如果是处理本机数 据的话,该命令对速度的提升不是非常明显。 “ Print和 Print preview 这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中“Pint Preview,是新增加的,使用上和WPS2000的打印预览非常相似(其实它用的是同样的程序) 不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常浪费纸张,用不用你自己决 “ Stop Processor” 用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果你正在对一个大 型的数据执行统计命令,等了半天都没有结束,此时你的另一半约你逛街的时间又要到了, 可是你的结果还没有存,执行命令时又存不了,怎么办呢?试试这个命令吧
最上面的问题为 你愿意保存这次的文件(读入)格式设置以备下次使用吗 第二 个问题为 你是否愿意将以上操作粘贴为 SPSS 语句 一般这两个问题我们都可以不 管 单击 完成 系统最终成功地读入了 Li2_1.txt 3 保存数据文件 在对数据做了修改后 保存数据文件是必不可少的工作之一 选择菜单 File==>Save 如果数据文件曾经存储过 则系统会自动按原文件名保存数据 否则 就会弹出和选择 Save as 菜单时相同的 Save as 对话框 里面可以保存的数据类型和可以打开的几乎一样多 选 择合适的类型 确定就是了 Save 命令的快捷键为 Ctrl S 如果你曾经领教过 Windows 死机的巨大潜力 那么你一定会理解习惯性地随手按 Ctrl S 至少不能算是一个坏习惯 如果你准备将数据存为 SPSS 以外的其他类型 要注意有些设置可能会丢失 如标签 和缺失值等 尤其是缺失值 如果想存的数据格式不支持缺失值 那你的数据可能会变的 面目全非 4 File 菜单中的其他条目 Disp Data Info 该菜单项用于显示数据的基本信息 选择它后会弹出非常类似于打开文件的一个对话 框用于选择数据文件 选择好后按 OK 系统就会在结果窗口中列出所选数据的基本情 况 如建立时间 标签设置 记录数 变量设置等 Apply Data Dictionary 即使用数据字典 该功能使你可以直接在新数据集中套用以前定义好的变量设置(格 式 标签等 但不包括数据类型) 举个例子吧 请打开 Li1_1.sav 文件 将变量 x 的长度 从 8 改为 4 标签删掉 然后选择菜单 File Æ Apply Data Dictionary 在文件对话框 中选择 Li1_1.sav 并按 OK (即将 Li1_1.sav 的变量设置按相同变量名一一套用在现在的 数据集上) 怎么样 一切都变回去了吧 Cache Data 建立数据缓冲区 以前 SPSS 每执行一条命令都会重新读取所需的数据 如果是从远 程用 SQL 调用数据库 这会非常费时 现在使用 Cache Data 可以将数据全部读入暂存盘 建立活动数据的缓冲区 大大加快了处理速度 不过我特意试了一下 如果是处理本机数 据的话 该命令对速度的提升不是非常明显 Print 和 Print Preview 这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来 其中 Print Preview 是新增加的 使用上和 WPS2000 的打印预览非常相似(其实它用的是同样的程序) 不过和 SPSS 结果的打印程序一样 用 SPSS 直接打印数据非常浪费纸张 用不用你自己决 定吧 Stop Processor 用于停止执行当前的 SPSS 命令 由于 SPSS 处理速度非常的慢 如果你正在对一个大 型的数据执行统计命令 等了半天都没有结束 此时你的另一半约你逛街的时间又要到了 可是你的结果还没有存 执行命令时又存不了 怎么办呢 试试这个命令吧