第七章均数间的比较 Compare means菜单详解 (医学统计之星:张文彤) 知道吗?在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU 所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之, 另外80%的复杂指令只完成20%的不常用任务 好了,言归正传。现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用 中同样有效!仅以 Analyze菜单为例,其中最常用的子菜单为 Discriptive statistics General Linear model(第一项) Correlate Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用SPSS解决 80%的统计学难题。如果不满足,你在召开新闻发布会的时候还可以对以上指标 进行四舍五入:)。 此时课堂上有一美眉提问:老师,那我们是不是可以只学这几项功能就行 了? 我..我.气死我了.. 好,言归更正传。在以上五个菜单中, Compare Means是最简单的一个,但使用 频率却几乎最高!因此,他的重要性也就不用我多说了吧.(以下省略五十万 字)。 下面让我们大家一起踏上 Compare Means之旅。该菜单集中了几个用于计量资料 均数间比较的过程。具体有: Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比 较 One- Samples t test过程进行样本均数与已知总体均数的比较。 Independent- Samples t test过程进行两样本均数差别的比较,即通常 所说的两组资料的t检验
第七章 均数间的比较 --Compare Means 菜单详解 (医学统计之星:张文彤) 知道吗?在计算机领域中有个著名的 80/20 规则,也就是在奔腾及更早的 CPU 所采用的 CISC 指令集中,有 80%的任务是被 20%的最常用指令所完成的;换言之, 另外 80%的复杂指令只完成 20%的不常用任务。 好了,言归正传。现在我要非常高兴的向大家宣布:80/20 规则在 SPSS 的使用 中同样有效!仅以 Analyze 菜单为例,其中最常用的子菜单为: • Discriptive Statistics • Compare Means • General Linear Model(第一项) • Correlate • Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用 SPSS 解决 80%的统计学难题。如果不满足,你在召开新闻发布会的时候还可以对以上指标 进行四舍五入:)。 此时课堂上有一美眉提问:老师,那我们是不是可以只学这几项功能就行 了? 我...我...气死我了... 好,言归更正传。在以上五个菜单中,Compare Means 是最简单的一个,但使用 频率却几乎最高!因此,他的重要性也就不用我多说了吧...(以下省略五十万 字)。 下面让我们大家一起踏上 Compare Means 之旅。该菜单集中了几个用于计量资料 均数间比较的过程。具体有: • Means 过程 对准备比较的各组计算描述指标,进行预分析,也可直接比 较。 • One-Samples T Test 过程 进行样本均数与已知总体均数的比较。 • Independent-Samples T Test 过程 进行两样本均数差别的比较,即通常 所说的两组资料的 t 检验
Paired- Samples t test过程进行配对资料的显著性检验,即配对t检 验。 One- Way anova过程进行两组及多组样本均数的比较,即成组设计的方 差分析,还可进行随后的两两比较。 §7.1 Means过程 和上一章所讲述的几个专门的描述过程相比, Means过程的优势在于各组的描述 指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再 次调用其他过程。显然要方便的多。 7.1.1界面说明 【 Dependent list框】 用于选入需要分析的变量 【 Independent List框】 用于选入分组变量。 【 Options钮】 弹岀ω ptions对话框,选择需要计算的描述统计量和统计分析: o Statistics框可选的描述统计量。它们是: 1.sum, number of cases总和,记录数 2.mean, geometric mean, harmonic mean均数,几何均数,修正均数 3. standard deviation, variance, standard error of the mean F 准差,均数的标准误,方差 4. median, grouped median中位数,频数表资料中位数(比如30岁组 有5人,40岁组有6人,则在计算 grouped median时均按组中值35 和45进行计算)。 5. minimum, max range最小值,最大值,全距 6. kurtosis, standard error of kurtosis峰度系数,峰度系数的标 准误 7. skewness, standard error of skewness偏度系数,偏度系数的标 准误 8. percentage of total sum, percentage of total N总和的百分比, 样本例数的百分比 o Cell statistics框选入的描述统计量
• Paired-Samples T Test 过程 进行配对资料的显著性检验,即配对 t 检 验。 • One-Way ANOVA 过程 进行两组及多组样本均数的比较,即成组设计的方 差分析,还可进行随后的两两比较。 §7.1 Means 过程 和上一章所讲述的几个专门的描述过程相比,Means 过程的优势在于各组的描述 指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再 次调用其他过程。显然要方便的多。 7.1.1 界面说明 【Dependent List 框】 用于选入需要分析的变量。 【Independent List 框】 用于选入分组变量。 【Options 钮】 弹出 Options 对话框,选择需要计算的描述统计量和统计分析: o Statistics 框 可选的描述统计量。它们是: 1. sum,number of cases 总和,记录数 2. mean, geometric mean, harmonic mean 均数,几何均数,修正均数 3. standard deviation,variance,standard error of the mean 标 准差,均数的标准误, 方差 4. median, grouped median 中位数,频数表资料中位数(比如 30 岁组 有 5 人,40 岁组有 6 人,则在计算 grouped median 时均按组中值 35 和 45 进行计算)。 5. minimum,maximum,range 最小值,最大值,全距 6. kurtosis, standard error of kurtosis 峰度系数,峰度系数的标 准误 7. skewness, standard error of skewness 偏度系数,偏度系数的标 准误 8. percentage of total sum, percentage of total N 总和的百分比, 样本例数的百分比 o Cell Statistics 框 选入的描述统计量
o Statistics for First layer复选框组 1. Anova table and eta对分组变量进行单因素方差分析,并计算用于 度量变量相关程度的eta值。 2. Test for linearity检验线性相关性,实际上就是上面的单因素方 差分析 7.1.2结果解释 有了上一章的基础, Means过程的输出看起来就不太困难了。以第一章的数据为 例,输出如下: Means Case Processing Summary Included Excluded Tota 血萨值x分变量 1000% 1000% 上表还是缺失值报告。 Report 血萨值 分狠变量 Mean std deviation 15209 常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选 择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量 可以非常直观的进行各组间的比较。 ANOVA Tablea Sum of squares 血赣值x分组变量 Between Groups( Combined) 1.134 1.134 within Groups 3918 a, t Rwr ta tree g roape, earn meas res tr在弹值“分量 calotte compled
o Statistics for First layer 复选框组 1. Anova table and eta 对分组变量进行单因素方差分析,并计算用于 度量变量相关程度的 eta 值。 2. Test for linearity 检验线性相关性,实际上就是上面的单因素方 差分析。 7.1.2 结果解释 有了上一章的基础,Means 过程的输出看起来就不太困难了。以第一章的数据为 例,输出如下: Means 上表还是缺失值报告。 常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选 择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量 可以非常直观的进行各组间的比较
上表为单因素方差分析表。在选择了 Anova table and eta或 Test for linearity 复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将 在单因素方差分析一节中解释 Measures of Association Eta Eta squared 血恒x分狽变量 相关性度量指标,给出Eta值以及Eta值的平方根 §7.20ne- Samples t Test过程 One- Samples t test过程用于进行样本所在总体均数与已知总体均数的比较, 可以自行定义已知总体均数为任意值,该对话框的界面非常简单。 7.2.1界面说明 【 Test variables框】 用于选入需要分析的变量 【 Test value框】 在此处输入已知的总体均数,默认值为0。 【 Options钮】 弹出 Options对话框,用于定义相关的选项,有: o Confidence interval框输入需要计算的均数差值可信区间范围,默认 为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总体均 数的可信区间。 o Missing values单选框组定义分析中对缺失值的处理方法,可以是具体 分析用到的变量有缺失值才去除该记录( Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除 ( Excludes cases listwise)。默认为前者,以充分利用数据 7.2.2结果解释 One- Samples t test过程的输出也是比较简单的,由描述统计表和t检验表组 成,比如要检验数据lil_1.sav中血磷值的总体均数是否等于1,则输出如下
上表为单因素方差分析表。在选择了 Anova table and eta 或 Test for linearity 复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将 在单因素方差分析一节中解释。 相关性度量指标,给出 Eta 值以及 Eta 值的平方根。 §7.2 One-Samples T Test 过程 One-Samples T Test 过程用于进行样本所在总体均数与已知总体均数的比较, 可以自行定义已知总体均数为任意值,该对话框的界面非常简单。 7.2.1 界面说明 【Test Variables 框】 用于选入需要分析的变量。 【Test Value 框】 在此处输入已知的总体均数,默认值为 0。 【Options 钮】 弹出 Options 对话框,用于定义相关的选项,有: o Confidence Interval 框 输入需要计算的均数差值可信区间范围,默认 为 95%。如果是和总体均数为 0 相比,则此处计算的就是样本所在总体均 数的可信区间。 o Missing Values 单选框组 定义分析中对缺失值的处理方法,可以是具体 分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除 (Excludes cases listwise)。默认为前者,以充分利用数据。 7.2.2 结果解释 One-Samples T Test 过程的输出也是比较简单的,由描述统计表和 t 检验表组 成,比如要检验数据 li1_1.sav 中血磷值的总体均数是否等于 1,则输出如下:
T-Test One-Sample Statistics Std, Deviation Std, Error Mean 血破宜 1.2846 4687 g.567E02 所分析变量的基本情况描述,有样本量、均数、标准差和标准误。 One-Sample Test est value 1 95% Confidence Interval of the difference Sig (2-tailed) Mean Difference 血值 2976 8669E02 4825 上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左 到右依次为t值(t)、自由度(df)、P值(Sig.2- tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。由上表可知:t=2.975,P=0.007。因此可 以认为血磷值的总体均数不等于1。 §7.3 Independent- Samples t Test过程 Independent- Samples t test过程用于进行两样本均数的比较,即常用的两样 本t检验。该对话框的界面我们在第一章已经见过了,和上面的One- Samples t Test对话框非常相似 7.3.1界面说明 【 Test variables框】 用于选入需要分析的变量。 【 Grouping Variable框】 用于选入分组变量。注意选入变量后还要定义需比较的组别。 【 Define Groups框】 用于定义需要相互比较的两组的分组变量值
T-Test 所分析变量的基本情况描述,有样本量、均数、标准差和标准误。 上表为单样本 t 检验表,第一行注明了用于比较的已知总体均数为 1,下面从左 到右依次为 t 值(t)、自由度(df)、P 值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的 95%可信区间。由上表可知:t=2.975,P=0.007。因此可 以认为血磷值的总体均数不等于 1。 §7.3 Independent-Samples T Test 过程 Independent-Samples T Test 过程用于进行两样本均数的比较,即常用的两样 本 t 检验。该对话框的界面我们在第一章已经见过了,和上面的 One-Samples T Test 对话框非常相似。 7.3.1 界面说明 【Test Variables 框】 用于选入需要分析的变量。 【Grouping Variable 框】 用于选入分组变量。注意选入变量后还要定义需比较的组别。 【Define Groups 框】 用于定义需要相互比较的两组的分组变量值