第七章均数间的比较 Compare means菜单详解 (医学统计之星:张文彤) 知道吗?在计算机领域中有个著名的80/20规则,也就是在奔腾及更早的CPU 所采用的CISC指令集中,有80%的任务是被20%的最常用指令所完成的;换言之, 另外80%的复杂指令只完成20%的不常用任务。 好了,言归正传。现在我要非常高兴的向大家宣布:80/20规则在SPSS的使用 中同样有效!仅以 Analyze菜单为例,其中最常用的子菜单为 Discriptive statistics General Linear model(第一项) Correlate Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用SPSS解决 80%的统计学难题。如果不满足,你在召开新闻发布会的时候还可以对以上指标 进行四舍五入:)。 此时课堂上有一美眉提问:老师,那我们是不是可以只学这几项功能就行 了? 我..我.气死我了.. 好,言归更正传。在以上五个菜单中, Compare Means是最简单的一个,但使用 频率却几乎最高!因此,他的重要性也就不用我多说了吧.(以下省略五十万 字)。 下面让我们大家一起踏上 Compare Means之旅。该菜单集中了几个用于计量资料 均数间比较的过程。具体有: Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比 较 One- Samples t test过程进行样本均数与已知总体均数的比较。 Independent- Samples t test过程进行两样本均数差别的比较,即通常 所说的两组资料的t检验
第七章 均数间的比较 --Compare Means 菜单详解 (医学统计之星:张文彤) 知道吗?在计算机领域中有个著名的 80/20 规则,也就是在奔腾及更早的 CPU 所采用的 CISC 指令集中,有 80%的任务是被 20%的最常用指令所完成的;换言之, 另外 80%的复杂指令只完成 20%的不常用任务。 好了,言归正传。现在我要非常高兴的向大家宣布:80/20 规则在 SPSS 的使用 中同样有效!仅以 Analyze 菜单为例,其中最常用的子菜单为: • Discriptive Statistics • Compare Means • General Linear Model(第一项) • Correlate • Regression(前半截) 只要掌握了它们的使用秘籍,你就可以理直气壮的宣称你已经可以用 SPSS 解决 80%的统计学难题。如果不满足,你在召开新闻发布会的时候还可以对以上指标 进行四舍五入:)。 此时课堂上有一美眉提问:老师,那我们是不是可以只学这几项功能就行 了? 我...我...气死我了... 好,言归更正传。在以上五个菜单中,Compare Means 是最简单的一个,但使用 频率却几乎最高!因此,他的重要性也就不用我多说了吧...(以下省略五十万 字)。 下面让我们大家一起踏上 Compare Means 之旅。该菜单集中了几个用于计量资料 均数间比较的过程。具体有: • Means 过程 对准备比较的各组计算描述指标,进行预分析,也可直接比 较。 • One-Samples T Test 过程 进行样本均数与已知总体均数的比较。 • Independent-Samples T Test 过程 进行两样本均数差别的比较,即通常 所说的两组资料的 t 检验
Paired- Samples t test过程进行配对资料的显著性检验,即配对t检 验。 One- Way anova过程进行两组及多组样本均数的比较,即成组设计的方 差分析,还可进行随后的两两比较。 §7.1 Means过程 和上一章所讲述的几个专门的描述过程相比, Means过程的优势在于各组的描述 指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再 次调用其他过程。显然要方便的多。 7.1.1界面说明 【 Dependent list框】 用于选入需要分析的变量 【 Independent List框】 用于选入分组变量。 【 Options钮】 弹岀ω ptions对话框,选择需要计算的描述统计量和统计分析: o Statistics框可选的描述统计量。它们是: 1.sum, number of cases总和,记录数 2.mean, geometric mean, harmonic mean均数,几何均数,修正均数 3. standard deviation, variance, standard error of the mean F 准差,均数的标准误,方差 4. median, grouped median中位数,频数表资料中位数(比如30岁组 有5人,40岁组有6人,则在计算 grouped median时均按组中值35 和45进行计算)。 5. minl mum, max l mum, range最小值,最大值,全距 6. kurtosis, standard error of kurtosis峰度系数,峰度系数的标 准误 7. skewness, standard error of skewness偏度系数,偏度系数的标 准误 8. percentage of total sum, percentage of total N总和的百分比, 样本例数的百分比 o Cell statistics框选入的描述统计量
• Paired-Samples T Test 过程 进行配对资料的显著性检验,即配对 t 检 验。 • One-Way ANOVA 过程 进行两组及多组样本均数的比较,即成组设计的方 差分析,还可进行随后的两两比较。 §7.1 Means 过程 和上一章所讲述的几个专门的描述过程相比,Means 过程的优势在于各组的描述 指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再 次调用其他过程。显然要方便的多。 7.1.1 界面说明 【Dependent List 框】 用于选入需要分析的变量。 【Independent List 框】 用于选入分组变量。 【Options 钮】 弹出 Options 对话框,选择需要计算的描述统计量和统计分析: o Statistics 框 可选的描述统计量。它们是: 1. sum,number of cases 总和,记录数 2. mean, geometric mean, harmonic mean 均数,几何均数,修正均数 3. standard deviation,variance,standard error of the mean 标 准差,均数的标准误, 方差 4. median, grouped median 中位数,频数表资料中位数(比如 30 岁组 有 5 人,40 岁组有 6 人,则在计算 grouped median 时均按组中值 35 和 45 进行计算)。 5. minimum,maximum,range 最小值,最大值,全距 6. kurtosis, standard error of kurtosis 峰度系数,峰度系数的标 准误 7. skewness, standard error of skewness 偏度系数,偏度系数的标 准误 8. percentage of total sum, percentage of total N 总和的百分比, 样本例数的百分比 o Cell Statistics 框 选入的描述统计量
o Statistics for First layer复选框组 1. Anova table and eta对分组变量进行单因素方差分析,并计算用于 度量变量相关程度的eta值。 2. Test for linearity检验线性相关性,实际上就是上面的单因素方 差分析 7.1.2结果解释 有了上一章的基础, Means过程的输出看起来就不太困难了。以第一章的数据为 例,输出如下: Means Case Processing Summary Included Excluded Tota 血萨值x分变量 1000% 1000% 上表还是缺失值报告。 Report 血萨值 分狠变量 Mean std deviation 15209 常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选 择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量 可以非常直观的进行各组间的比较。 ANOVA Tablea Sum of squares 血赣值x分组变量 Between Groups( Combined) 1.134 1.134 within Groups 3918 a, t Rwr ta tree g roape, earn meas res tr在弹值“分量 calotte compled
o Statistics for First layer 复选框组 1. Anova table and eta 对分组变量进行单因素方差分析,并计算用于 度量变量相关程度的 eta 值。 2. Test for linearity 检验线性相关性,实际上就是上面的单因素方 差分析。 7.1.2 结果解释 有了上一章的基础,Means 过程的输出看起来就不太困难了。以第一章的数据为 例,输出如下: Means 上表还是缺失值报告。 常用统计描述量报表。这里按默认情况输出均数,样本量和标准差。由于我们选 择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量 可以非常直观的进行各组间的比较
上表为单因素方差分析表。在选择了 Anova table and eta或 Test for linearity 复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将 在单因素方差分析一节中解释 Measures of Association Eta Eta squared 血恒x分狽变量 相关性度量指标,给出Eta值以及Eta值的平方根 §7.20ne- Samples t Test过程 One- Samples t test过程用于进行样本所在总体均数与已知总体均数的比较, 可以自行定义已知总体均数为任意值,该对话框的界面非常简单。 7.2.1界面说明 【 Test variables框】 用于选入需要分析的变量 【 Test value框】 在此处输入已知的总体均数,默认值为0。 【 Options钮】 弹出 Options对话框,用于定义相关的选项,有: o Confidence interval框输入需要计算的均数差值可信区间范围,默认 为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总体均 数的可信区间。 o Missing values单选框组定义分析中对缺失值的处理方法,可以是具体 分析用到的变量有缺失值才去除该记录( Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除 ( Excludes cases listwise)。默认为前者,以充分利用数据 7.2.2结果解释 One- Samples t test过程的输出也是比较简单的,由描述统计表和t检验表组 成,比如要检验数据lil_1.sav中血磷值的总体均数是否等于1,则输出如下
上表为单因素方差分析表。在选择了 Anova table and eta 或 Test for linearity 复选框时出现。实际上就是在检验各组间均数有无差异。上面各项的具体含义将 在单因素方差分析一节中解释。 相关性度量指标,给出 Eta 值以及 Eta 值的平方根。 §7.2 One-Samples T Test 过程 One-Samples T Test 过程用于进行样本所在总体均数与已知总体均数的比较, 可以自行定义已知总体均数为任意值,该对话框的界面非常简单。 7.2.1 界面说明 【Test Variables 框】 用于选入需要分析的变量。 【Test Value 框】 在此处输入已知的总体均数,默认值为 0。 【Options 钮】 弹出 Options 对话框,用于定义相关的选项,有: o Confidence Interval 框 输入需要计算的均数差值可信区间范围,默认 为 95%。如果是和总体均数为 0 相比,则此处计算的就是样本所在总体均 数的可信区间。 o Missing Values 单选框组 定义分析中对缺失值的处理方法,可以是具体 分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除 (Excludes cases listwise)。默认为前者,以充分利用数据。 7.2.2 结果解释 One-Samples T Test 过程的输出也是比较简单的,由描述统计表和 t 检验表组 成,比如要检验数据 li1_1.sav 中血磷值的总体均数是否等于 1,则输出如下:
T-Test One-Sample Statistics Std, Deviation Std, Error Mean 血破宜 1.2846 4687 g.567E02 所分析变量的基本情况描述,有样本量、均数、标准差和标准误。 One-Sample Test est value 1 95% Confidence Interval of the difference Sig (2-tailed) Mean Difference 血值 2976 8669E02 4825 上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左 到右依次为t值(t)、自由度(df)、P值(Sig.2- tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。由上表可知:t=2.975,P=0.007。因此可 以认为血磷值的总体均数不等于1。 §7.3 Independent- Samples T Test过程 Independent- Samples t test过程用于进行两样本均数的比较,即常用的两样 本t检验。该对话框的界面我们在第一章已经见过了,和上面的One- Samples t Test对话框非常相似 7.3.1界面说明 【 Test variables框】 用于选入需要分析的变量。 【 Grouping Variable框】 用于选入分组变量。注意选入变量后还要定义需比较的组别。 【 Define Groups框】 用于定义需要相互比较的两组的分组变量值
T-Test 所分析变量的基本情况描述,有样本量、均数、标准差和标准误。 上表为单样本 t 检验表,第一行注明了用于比较的已知总体均数为 1,下面从左 到右依次为 t 值(t)、自由度(df)、P 值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的 95%可信区间。由上表可知:t=2.975,P=0.007。因此可 以认为血磷值的总体均数不等于 1。 §7.3 Independent-Samples T Test 过程 Independent-Samples T Test 过程用于进行两样本均数的比较,即常用的两样 本 t 检验。该对话框的界面我们在第一章已经见过了,和上面的 One-Samples T Test 对话框非常相似。 7.3.1 界面说明 【Test Variables 框】 用于选入需要分析的变量。 【Grouping Variable 框】 用于选入分组变量。注意选入变量后还要定义需比较的组别。 【Define Groups 框】 用于定义需要相互比较的两组的分组变量值