6.97 图4.1输入血清总蛋白含量值 4.1.2.2统计分析 激活 Statistics菜单,选 Summarize中的 Frequencies,命令项,弹出 Frequencies对话框 (图4.2)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选x,点击钮 使之进入 Variable(s)框。同时可点击 Format...钮弹出 Frequencies: Format对话框,在 Order by 栏中有四个选项: Ascending values为根据数值大小按升序从小到大作频数分布; Descending values 为根据数值大小按降序从大到小作频数分布; Ascending counts为根据频数多少按升序从少到多作 频数分布; Descending counts为根据频数多少按降序从多到少作频数分布。在 Page Formal栏中 可定义结果输出的格式。本例选 Ascending values项后点击 Continue钮返回 Frequencies对话框。 Variable 图4.2频数表分析对话框 点击 Statistics...钮,弹出 Frequencies: Statistics对话框(图4.3),可点击相应项目,要 求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数 计算。本例要求计算四分位数( Quartiles)、均数(Mean)、中位数( Median)、众数(Mode)、总和(Sum) 标准差(Std. deviation)、方差( Variance)、全距( Range)、最小值( Minimum)、最大值( Maximum)、 标准误(S.E.mean)、偏度系数( Skewness)和峰度系数( Kurtosis),选好后点击 Continue钮返回 Frequencies对话框 36
36 图 4.1 输入血清总蛋白含量值 4.1.2.2 统计分析 激活 Statistics 菜单,选 Summarize 中的 Frequencies...命令项,弹出 Frequencies 对话框 (图 4.2)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选 x,点击钮 使之进入 Variable(s)框。同时可点击 Format...钮弹出 Frequencies:Format 对话框,在 Order by 栏中有四个选项:Ascending values 为根据数值大小按升序从小到大作频数分布;Descending values 为根据数值大小按降序从大到小作频数分布;Ascending counts 为根据频数多少按升序从少到多作 频数分布;Descending counts 为根据频数多少按降序从多到少作频数分布。在 Page Formal 栏中 可定义结果输出的格式。本例选Ascending values项后点击Continue钮返回Frequencies对话框。 图 4.2 频数表分析对话框 点击 Statistics...钮,弹出 Frequencies:Statistics 对话框(图 4.3),可点击相应项目,要 求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数 计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、 标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、 标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击 Continue 钮返回 Frequencies 对话框
区 Change 区 Skewness 区 Kurtosis 图4.3频数表分析的统计指标对话框 点击 Charts...钮,弹出 Frequencies: Charts对话框,用户可选两种图形,一是直条图(Bar chart),适用于非连续性的变量:另一是直方图( Histogram),适用于连续性的变量。本例要求对 变量x绘制直方图,故选择 Histogram项,并要求绘制正态曲线( With normal curve),点击 Continue 钮返回 Frequencies对话框,再点击OK钮即可。 4.1.2.3结果解释 在输出结果窗口中将看到如下统计数据 系统对变量ⅹ的原始数据作频数分布表, Value为原始值、 Frequency为频数、 Percent为各组 频数占总例数的百分比、 Valid percent为各组频数占总例数的有效百分比、 Cum Percent为各组频 数占总例数的累积百分比。 Value label Value Frequency Percent Percent Percent 6.43 1.0 6.50 2.0 6.72 1.0 1.0 6.73 21423317477 4.0 0 6.80 2.0 2.0 10.0 6.88 13. 6.97 17477 7477 00000 28.0 7.27 42.0 7.35 11.0 11.0 7.4 7.47 1817 8.0 61.0 1.062.0 7.56 1.0 5.0 76.0 37
37 图 4.3 频数表分析的统计指标对话框 点击 Charts...钮,弹出 Frequencies:Charts 对话框,用户可选两种图形,一是直条图(Bar chart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对 变量 x 绘制直方图,故选择 Histogram 项,并要求绘制正态曲线(With normal curve),点击 Continue 钮返回 Frequencies 对话框,再点击 OK 钮即可。 4.1.2.3 结果解释 在输出结果窗口中将看到如下统计数据: 系统对变量 x 的原始数据作频数分布表,Value 为原始值、Frequency 为频数、Percent 为各组 频数占总例数的百分比、Valid percent 为各组频数占总例数的有效百分比、Cum Percent 为各组频 数占总例数的累积百分比。 X Valid Cum Value Label Value Frequency Percent Percent Percent 6.43 1 1.0 1.0 1.0 6.50 2 2.0 2.0 3.0 6.72 1 1.0 1.0 4.0 6.73 4 4.0 4.0 8.0 6.80 2 2.0 2.0 10.0 6.88 3 3.0 3.0 13.0 6.97 3 3.0 3.0 16.0 7.03 1 1.0 1.0 17.0 7.04 7 7.0 7.0 24.0 7.12 4 4.0 4.0 28.0 7.20 7 7.0 7.0 35.0 7.27 7 7.0 7.0 42.0 7.35 11 11.0 11.0 53.0 7.43 8 8.0 8.0 61.0 7.47 1 1.0 1.0 62.0 7.50 7 7.0 7.0 69.0 7.54 1 1.0 1.0 70.0 7.56 1 1.0 1.0 71.0 7.58 5 5.0 5.0 76.0
7.72 7.76 1.0 1.0 7.88 33.03.090.0 7.95 3.0 3.0 93.0 8.03 1.0 2.0 2.0 96. 1.0 99.0 1.0100.0 Total 100 100.0100.0 接着输出各基本统计指标,其中均数为7.366,标准误为0.039,中位数为7.350,众数为7.350, 标准差为0.39,方差为0.155,峰度系数为0.034,峰度系数的标准误为0.478,偏度系数为0.06, 偏度系数的标准误为0.241,全距为2.000,最小值为6.430,最大值为8.430,25%位数为7.120, 50%位数为7.350,75%位数为7.580,共100个观察值,无缺失值。 Mean 7.366 Std err 039 Median 7.350 Mode 7.350 Std de arlance Kurtosis SE Kurt ewness 060 ESKew 241 Minimum 6.430 Maximum 8.430 Percentile Value Percentile Value Percentile value 25.00 7.120 50.00 7.350 75.00 7.580 Valid cases Missing cases 最后系统输出带有正态曲线的直方图(图4.4),由图中可见,数据基本呈现正态分布形状
38 7.65 7 7.0 7.0 83.0 7.72 2 2.0 2.0 85.0 7.76 1 1.0 1.0 86.0 7.80 1 1.0 1.0 87.0 7.88 3 3.0 3.0 90.0 7.95 3 3.0 3.0 93.0 8.03 1 1.0 1.0 94.0 8.05 2 2.0 2.0 96.0 8.12 1 1.0 1.0 97.0 8.16 2 2.0 2.0 99.0 8.43 1 1.0 1.0 100.0 ------ ------- ------- Total 100 100.0 100.0 接着输出各基本统计指标,其中均数为7.366, 标准误为0.039, 中位数为7.350, 众数为7.350, 标准差为0.394, 方差为0.155, 峰度系数为0.034, 峰度系数的标准误为0.478, 偏度系数为0.06, 偏度系数的标准误为 0.241, 全距为 2.000, 最小值为 6.430, 最大值为 8.430, 25%位数为 7.120, 50%位数为 7.350, 75%位数为 7.580,共 100 个观察值,无缺失值。 Mean 7.366 Std err .039 Median 7.350 Mode 7.350 Std dev .394 Variance .155 Kurtosis .034 S E Kurt .478 Skewness .060 S E Skew .241 Range 2.000 Minimum 6.430 Maximum 8.430 Percentile Value Percentile Value Percentile Value 25.00 7.120 50.00 7.350 75.00 7.580 Valid cases 100 Missing cases 0 最后系统输出带有正态曲线的直方图(图 4.4),由图中可见,数据基本呈现正态分布形状。 X 6.50 6.75 7.00 7.25 7.50 7.75 8.00 8.25 8.50 Histogram Frequency 30 20 10 0 Std. Dev = .39 Mean = 7.37 N = 100.00
图4.4频数分布的直方图 从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的, 这与日常需要的等距分组、且组数保持在8~15组的要求不符。为此,在调用 Frequencies过程命 令之前,可先对原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故 可要求分成10组,起点为6.4,组距为0.2。选 Transform菜单 Recode项的 Into Different Variable. 命令项,在弹出的 Recode into different variable对话框中选x点击钮使之进入 Numeric Variable→0 utput Variable框,在 Output Variable栏的Name处输入x1,点击 Change钮表示新 生成的变量名为x1。点击0 Id and New values钮弹出 Recode into different variable:0 Id and New Values对话框,在 old value栏内选 Range项,输入第一个分组的数值范围:6.4~6.599,在 New value 栏内输入新值:6.4,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击 Continue 钮返回 Recode into different variable对话框,再点击OK钮即完成。系统在原数据库中生成 新变量为x1,这时调用 Frequencies过程命令将输出等距分组且组数为10的频数分布表 Valid Cum Value label Value Frequency Percent Percent Percent 3.0 6.60 5 5.0 .0 6.80 8.0 16.0 7.00 1212.012.028.0 7.20 25.0 25.0 53.0 7.40 76 8.00 6.0 Total 100.0100.0 Valid cases 100 ssing cases 第二节 Descriptives过程 4.2.1主要功能 用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数 据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位, 高的为正值,低的为负值,相等的为零 39
39 图 4.4 频数分布的直方图 从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的, 这与日常需要的等距分组、且组数保持在 8~15 组的要求不符。为此,在调用 Frequencies 过程命 令之前,可先对原始数据进行算术处理:已知最小值为 6.430,最大值为 8.430,全距为 2.000,故 可要求分成10组,起点为6.4,组距为0.2。选Transform菜单Recode项的Into Different Variable... 命令项,在弹出的 Recode Into Different Variable 对话框中选 x 点击钮使之进入 Numeric Variable→Output Variable 框,在 Output Variable 栏的 Name 处输入 x1,点击 Change 钮表示新 生成的变量名为 x1。点击 Old and New Values 钮弹出 Recode Into Different Variable:Old and New Values 对话框,在 Old value 栏内选 Range 项,输入第一个分组的数值范围:6.4~6.599,在 New value 栏内输入新值:6.4,点击 Add 钮,依此将各组的范围及对应的新值逐一输入,最后点击 Continue 钮返回 Recode Into Different Variable 对话框,再点击 OK 钮即完成。系统在原数据库中生成一 新变量为 x1,这时调用 Frequencies 过程命令将输出等距分组且组数为 10 的频数分布表。 X1 Valid Cum Value Label Value Frequency Percent Percent Percent 6.40 3 3.0 3.0 3.0 6.60 5 5.0 5.0 8.0 6.80 8 8.0 8.0 16.0 7.00 12 12.0 12.0 28.0 7.20 25 25.0 25.0 53.0 7.40 23 23.0 23.0 76.0 7.60 10 10.0 10.0 86.0 7.80 7 7.0 7.0 93.0 8.00 6 6.0 6.0 99.0 8.40 1 1.0 1.0 100.0 ------- ------- ------- Total 100 100.0 100.0 Valid cases 100 Missing cases 0 第二节 Descriptives 过程 4.2.1 主要功能 调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数 据转换成标准 Z 分值并存入数据库,所谓 Z 分值是指某原始数值比其均值高或低多少个标准差单位, 高的为正值,低的为负值,相等的为零
4.2.2实例操作 [例4-2]调查20名男婴的出生体重(克)资料如下,试作描述性统计。 770291527952995286029703087312631254654 2272350334183921266942183707231025733881 4.2.2.1数据准备 激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据, 4.2.2.2统计分析 激活 Statistics菜单选 Summarize中的 Descriptives.命令项,弹出 Descriptives对话框 (图4.5)。现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选x,点击钮使之进 入 Variable(s)框;本例要求将原始数据转换成z分值,故选 Save standardized value as variables 项 Variable[s a Save standardized values as variables 口 Display index Upo 图4.5描述性统计对话框 点击ons.阻,弹出 Descriptives: Options对话框(图46)。框中各指标的意义请读者 参阅本章第一节。选好项目后点击 Continue|钮返回 Descriptives对话框,再点击K钮即可。 40
40 4.2.2 实例操作 [例 4-2]调查 20 名男婴的出生体重(克)资料如下,试作描述性统计。 2770 2915 2795 2995 2860 2970 3087 3126 3125 4654 2272 3503 3418 3921 2669 4218 3707 2310 2573 3881 4.2.2.1 数据准备 激活数据管理窗口,定义男婴出生体重的变量名为 X,然后输入男婴出生体重的原始数据。 4.2.2.2 统计分析 激活 Statistics 菜单选 Summarize 中的 Descriptives...命令项,弹出 Descriptives 对话框 (图 4.5)。现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选 x,点击钮使之进 入 Variable(s)框;本例要求将原始数据转换成 z 分值,故选 Save standardized value as variables 项。 图 4.5 描述性统计对话框 点击 Options...钮,弹出 Descriptives:Options 对话框(图 4.6)。框中各指标的意义请读者 参阅本章第一节。选好项目后点击 Continue 钮返回 Descriptives 对话框,再点击 OK 钮即可