图14缺失值定义对话框 、 No missing values:没有缺失值 2、 Discrete missing values:可定义1-3个。如测量身高(厘米)的资料,可定义999为缺 失值:性别的资料(男为1、女为2),可定义一1为缺失值: 3、 Range of missing values:可定义缺失值的范围。如脉搏资料,可定义0-9为缺失值 4, Range plus one discrete ng value:可定义缺失值的范围,同时定义另外1个不是 这一范围的缺失值。如定义0—9为脉搏的缺失值,同时定义999为身高的缺失值 21.5变量标签 在 Define variable对话框中点击 Labels..钮,弹出 Define labels对话框(图1.5),用户 可定义变量标签和特定变量值的标签。如定义变量hb的标签为“血红蛋白值”,同时定义12.36为“正 常”,则可在 Define labels对话框中的 Variable Label处输入变量标签名,在 Value labels框 中的 Value处指定变量值,在 alue label处输入变量值标签,点击Add钮表示加入这种标签定义 点击 Change表示更改原有标签,用户重新定义,点击 Remove钮表示取消原有标签 Define labels: Variable Label:血红蛋白值 Continue Value Labels Cancel 1236 Help Value Label:正常 Add C杂9e Remove 图1.5定义标签对话框 21.6数据管理器列宽定义 在 Define variable对话框中点击 Column Format..钮,弹出 Define column format对话框 (图1.6),用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字:同时用户还可指定数 值或文字在数据管理器单元格中的位置:Left表示靠左、 Center表示居中、 Right表示靠右(此为 默认方式) 16
16 图 1.4 缺失值定义对话框 1、No missing values:没有缺失值; 2、Discrete missing values:可定义 1-3 个。如测量身高(厘米)的资料,可定义 999 为缺 失值;性别的资料(男为 1、女为 2),可定义-1 为缺失值; 3、Range of missing values:可定义缺失值的范围。如脉搏资料,可定义 0—9 为缺失值; 4、Range plus one discrete missing value:可定义缺失值的范围,同时定义另外 1 个不是 这一范围的缺失值。如定义 0—9 为脉搏的缺失值,同时定义 999 为身高的缺失值。 2.1.5 变量标签 在 Define Variable 对话框中点击 Labels...钮,弹出 Define Labels 对话框(图 1.5),用户 可定义变量标签和特定变量值的标签。如定义变量 hb 的标签为“血红蛋白值”,同时定义 12.36 为“正 常”,则可在 Define Labels 对话框中的 Variable Label 处输入变量标签名,在 Value Labels 框 中的 Value 处指定变量值,在 Value Label 处输入变量值标签,点击 Add 钮表示加入这种标签定义, 点击 Change 表示更改原有标签,用户重新定义,点击 Remove 钮表示取消原有标签。 图 1.5 定义标签对话框 2.1.6 数据管理器列宽定义 在 Define Variable 对话框中点击 Column Format...钮,弹出 Define Column Format 对话框 (图 1.6),用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字;同时用户还可指定数 值或文字在数据管理器单元格中的位置:Left 表示靠左、Center 表示居中、Right 表示靠右(此为 默认方式)
Define Column Format: Column Width: 5 Continu Text Alignment Cancel ○ Left O Center O Right Help 图1.6列宽格式定义对话框 第二节数据的编辑 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统 提供了如下主要方法 221数据的增删 2.2.1.1增加一个新的变量列 例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第2列的任 单元格,然后选Data菜单的 Insert variable命令项,系统自动为用户在第2列前插入一个新的 变量列,原第2列自动向右移一列成为第3列。 2.2.1.2增加一个新的观察单位(即增加一个新的行) 例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的第6行下 移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的 Insert Case命令项,系统 自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。 2.2.1.3增加一个新的观察值 例如由于输入错误,造成第7个观察单位的第4个变量值漏输,结果第8个观察单位的第4个 变量值误为第7个观察单位的第4个变量值,这样的情形使得数据管理器中的第4个变量值从第7 行起全部上移,而合计例数少一个。于是希望在第7行的第4列处插入1个单元格,原有数据依次 下移恢复正常。可先将鼠标指向在第η行第4列交叉处的单元格,然后按住鼠标左键向下拖动鼠标 直至第4列从第7行起的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被 剪切入剪贴板,再激活第8行第4列交叉处的单元格,选Edit菜单的 Paste命令项,可将剪贴板中 的原第7行起的所有数据下移自第8行开始,并空出第7行第4列的单元格以便补入漏输的数值。 2.2.1.4删除一个行 例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头,这时整个 第9行被选中(呈黑底白字状),然后按 Delete键或选Edit菜单的 Clear命令项,该行即被删除 2.2.1.5删除一个变量列 17
17 图 1.6 列宽格式定义对话框 第二节 数据的编辑 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统 提供了如下主要方法。 2.2.1 数据的增删 2.2.1.1 增加一个新的变量列 例如要在第 2 列前增加一个新的列,使原来的第 2 列右移变成第 3 列,则可先激活第 2 列的任 一单元格,然后选 Data 菜单的 Insert Variable 命令项,系统自动为用户在第 2 列前插入一个新的 变量列,原第 2 列自动向右移一列成为第 3 列。 2.2.1.2 增加一个新的观察单位(即增加一个新的行) 例如要在第 6 个观察单位前增加一个观察单位(亦即在第 6 行前增加一行,使原来的第 6 行下 移成为第 7 行),则可先激活第 6 行的任一单元格,然后选 Data 菜单的 Insert Case 命令项,系统 自动为用户在第 6 行前插入一个新的行,原第 6 行列自动向下移一行成为第 7 行。 2.2.1.3 增加一个新的观察值 例如由于输入错误,造成第 7 个观察单位的第 4 个变量值漏输,结果第 8 个观察单位的第 4 个 变量值误为第 7 个观察单位的第 4 个变量值,这样的情形使得数据管理器中的第 4 个变量值从第 7 行起全部上移,而合计例数少一个。于是希望在第 7 行的第 4 列处插入 1 个单元格,原有数据依次 下移恢复正常。可先将鼠标指向在第 7 行第 4 列交叉处的单元格,然后按住鼠标左键向下拖动鼠标 直至第 4 列从第 7 行起的所有数据被选中(黑底白字),选 Edit 菜单的 Cut 命令项,选中的数据被 剪切入剪贴板,再激活第 8 行第 4 列交叉处的单元格,选 Edit 菜单的 Paste 命令项,可将剪贴板中 的原第 7 行起的所有数据下移自第 8 行开始,并空出第 7 行第 4 列的单元格以便补入漏输的数值。 2.2.1.4 删除一个行 例如要删除第 9 行(即删除这个观察单位的所有观察值),则可先点击第 9 行的行头,这时整个 第 9 行被选中(呈黑底白字状),然后按 Delete 键或选 Edit 菜单的 Clear 命令项,该行即被删除。 2.2.1.5 删除一个变量列
例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑底白字状) 然后按 Delete键或选Edit菜单的 Clear命令项,该列即被删除。 2.2.1.6删除一个观察值 例如由于输入错误,造成第6个观察单位的第2个变量值重复输入,结果第7个观察单位的第 2个变量值误为第6个观察单位的第2个变量值,第8个观察单位的第2个变量值误为第7个观察 单位的第2个变量值,……,这样的情形使得数据管理器中的第2个变量值从第7行起全部下移 而合计例数多一个。于是希望将第7行第2列的单元格删除,原有数据依次上移恢复正常。可先将 鼠标指向在第8行第2列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第2列从第8行起 的所有数据被选中(黑底白字),选Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活 第7行第2列交叉处的单元格,按Del键删除该单元格的数值,选Edit菜单的 Paste命令项,可将 剪贴板中的原第8行起的所有数据上移自第7行开始,既填补第7行第2列的单元格,又恢复原有 下移的数值。 222数据的整理 2.2.2.1数据的排序 用户可按要求对数据管理器的数据进行排序。选Data菜单的 Sort cases.命令项,弹出Sort Cases..对话框(图1.7),在变量名列框中选1个需要按其数值大小排序的变量(用户也可选多个 变量,系统将按变量选择的先后逐级依次排序),点击≯钮使之进入 Sort by框,然后在 Sort order 框中确定是按升序( Ascending,从小到大)或降序( Descending,从大到小),点击OK钮即可。 ○ Descending 图1.7排序对话框 2.2.2.2数据的行列互换 有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方向排列的 数据,这时可选Data菜单的 Transpose.命令项,弹出 Transpose.对话框(图1.8),在变量名 列框中选1个或多个需要转换的变量,点击钮使之进入 Variable(s)框,再点击OK钮即可。产 生的新数据会在第1列出现一个case_lbl新变量,用于放置原来数值的变量名。若要将数据再转换 回原来的排列方式,方法与上述过程相同。 Name variable
18 例如要删除第 4 个变量列,则可先点击第 4 列的列头,这时整个第 4 列被选中(呈黑底白字状), 然后按 Delete 键或选 Edit 菜单的 Clear 命令项,该列即被删除。 2.2.1.6 删除一个观察值 例如由于输入错误,造成第 6 个观察单位的第 2 个变量值重复输入,结果第 7 个观察单位的第 2 个变量值误为第 6 个观察单位的第 2 个变量值,第 8 个观察单位的第 2 个变量值误为第 7 个观察 单位的第 2 个变量值,……,这样的情形使得数据管理器中的第 2 个变量值从第 7 行起全部下移, 而合计例数多一个。于是希望将第 7 行第 2 列的单元格删除,原有数据依次上移恢复正常。可先将 鼠标指向在第 8 行第 2 列交叉处的单元格,然后按住鼠标左键向下拖动鼠标直至第 2 列从第 8 行起 的所有数据被选中(黑底白字),选 Edit 菜单的 Cut 命令项,选中的数据被剪切入剪贴板,再激活 第 7 行第 2 列交叉处的单元格,按 Del 键删除该单元格的数值,选 Edit 菜单的 Paste 命令项,可将 剪贴板中的原第 8 行起的所有数据上移自第 7 行开始,既填补第 7 行第 2 列的单元格,又恢复原有 下移的数值。 2.2.2 数据的整理 2.2.2.1 数据的排序 用户可按要求对数据管理器的数据进行排序。选 Data 菜单的 Sort Cases...命令项,弹出 Sort Cases...对话框(图 1.7),在变量名列框中选 1 个需要按其数值大小排序的变量(用户也可选多个 变量,系统将按变量选择的先后逐级依次排序),点击 ➢ 钮使之进入 Sort by 框,然后在 Sort Order 框中确定是按升序(Ascending,从小到大)或降序(Descending,从大到小),点击 OK 钮即可。 图 1.7 排序对话框 2.2.2.2 数据的行列互换 有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方向排列的 数据,这时可选 Data 菜单的 Transpose...命令项,弹出 Transpose...对话框(图 1.8),在变量名 列框中选 1 个或多个需要转换的变量,点击 ➢ 钮使之进入 Variable(s)框,再点击 OK 钮即可。产 生的新数据会在第 1 列出现一个 case_lbl 新变量,用于放置原来数值的变量名。若要将数据再转换 回原来的排列方式,方法与上述过程相同
图1.8行列互换框 2.2.2.3数据的分组汇总 用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十分多样。 例如,要对下列数据(图1.9)按变量 group的大小,把变量xl作平均值汇总、把变量x2作求和 汇总。选Data菜单的 Aggregate..命令项,弹出 Aggregate Data对话框(图1.10),在变量名列 框中选 group变量,点击>钮使之进入 Break variable(s)框,选x变量进入 Aggregate Variable(s) 框,因x1欲作平均值汇总,故点击 Function...钮弹出 Aggregate Data: Aggregate Function对 话框(图1.1)选 Mean of values项点击 Continue钮返回;选x2变量进入 Aggregate Variable(s) 框,因x2变量欲作求和汇总,故点击 Function...钮选 Sum of values项点击 Continue钮返回。 再点击OK钮即可。结果如图1.12所示 qroup 66 5.00 263 3325 图1.9欲作分组汇总的原始数据 group Name Labe.Unction. d Save number of cases in break group as variable O Create new data file e Replace working data file 图1.10分组汇总对话框 19
19 图 1.8 行列互换框 2.2.2.3 数据的分组汇总 用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十分多样。 例如,要对下列数据(图 1.9)按变量 group 的大小,把变量 x1 作平均值汇总、把变量 x2 作求和 汇总。选 Data 菜单的 Aggregate...命令项,弹出 Aggregate Data 对话框(图 1.10),在变量名列 框中选group变量,点击➢ 钮使之进入Break Variable(s)框,选x1变量进入Aggregate Variable(s) 框,因 x1 欲作平均值汇总,故点击 Function...钮弹出 Aggregate Data: Aggregate Function 对 话框(图 1.11)选 Mean of values 项点击 Continue 钮返回;选 x2 变量进入 Aggregate Variable(s) 框,因 x2 变量欲作求和汇总,故点击 Function...钮选 Sum of values 项点击 Continue 钮返回。 再点击 OK 钮即可。结果如图 1.12 所示。 图 1.9 欲作分组汇总的原始数据 图 1.10 分组汇总对话框
Summary Function for Selected Variable(s Continue O Mean of values ○ Stand ○ First valu O Minimum yalue Help Last value ○ Maximum yalu Nu O Sum of va 口 Missing口 Unweighted ○ Percentage below‖ O Percentage outside Fraction above ○ Fraction inside ○ Fraction below ○ Fraction outside 图1.11分组汇总的函数功能对话框 x21 图1.12分组汇总后的数据 分组汇总提供的函数形式有: 1、 Mean of values:求该组的平均值; 2、 Standard deviation:求该组的标准差 3、 First value:只保留该组的第1个数值 4、 Minimum value:只保留该组的最小值 5、 Last value:只保留该组的最后1个数值 6、 Maximum value:只保留该组的最大值 7、 Number of cases:合计该组的观察例数 8、 Sum of values:求该组所有观察值的和。 9、 Percentage above:先确定1个数值,求大于该数值的所有例数占总例数的百分比 (0-100%) 10、 Percentage below:先确定1个数值,求小于该数值的所有例数占总例数的百分比(0-100%); 11、 Fraction above:先确定1个数值,求大于该数值的所有例数占总例数的百分比(0-1) 12、 fraction below:先确定1个数值,求小于该数值的所有例数占总例数的百分比(0-1 13、 Percentage inside:先确定1个下限,再确定1个上限,求数值在该区间内的例数占总例 数的百分比(0-100%) 14、 Percentage outside:先确定1个下限,再确定1个上限,求数值在该区间外的例数占总 例数的百分比(0-100%) 20
20 图 1.11 分组汇总的函数功能对话框 图 1.12 分组汇总后的数据 分组汇总提供的函数形式有: 1、Mean of values:求该组的平均值; 2、Standard deviation:求该组的标准差; 3、First value:只保留该组的第 1 个数值; 4、Minimum value:只保留该组的最小值; 5、Last value:只保留该组的最后 1 个数值; 6、Maximum value:只保留该组的最大值; 7、Number of cases:合计该组的观察例数; 8、Sum of values :求该组所有观察值的和。 9、Percentage above :先确定 1 个数值,求大于该数值的所有例数占总例数的百分比 (0-100%); 10、Percentage below:先确定 1 个数值,求小于该数值的所有例数占总例数的百分比(0-100%); 11、Fraction above:先确定 1 个数值,求大于该数值的所有例数占总例数的百分比(0-1); 12、Fraction below:先确定 1 个数值,求小于该数值的所有例数占总例数的百分比(0-1); 13、Percentage inside:先确定 1 个下限,再确定 1 个上限,求数值在该区间内的例数占总例 数的百分比(0-100%); 14、Percentage outside:先确定 1 个下限,再确定 1 个上限,求数值在该区间外的例数占总 例数的百分比(0-100%);