第十章统计分析方法 统计分析方法,作为一种科学的研究方法,在课题数据的收集、整理和分析等方面起着 重要的作用,正越来越为众多研究者所采用。鉴于统计分析思想较为复杂,具体的统计分析 方法名目繁多,难以概全,本章旨在删繁就简,着眼实用,介绍最基本的统计思想及统计方 法 第一节统计分析方法概述 、统计分析的内涵 统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与 技术 统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。凡资料是以 数据形式呈现,需要与数字打交道的,统计分析便必不可少。统计分析方法常与实验、观察、 测量、调查所得结果相联系,为研究作出正确的结论提供科学的途径和方法,是研究者从事 科学研究的必备工具之 、统计分析方法的特征 采用统计分析方法进行教育研究,是研究达到高水平的客观要求,应用统计分析方法进 行科学研究,有以下几个基本特征: 1.科学性 统计分析方法以数学为基础,具有严密的结构,需要遵循特定的程序和规范,从确立选 题、提出假设、进行抽样、具体实施,一直到分析解释数据,得出结论,都须符合一定的逻 辑和标准。 2.直观性 现实世界是复杂多样的,其本质和规律难以直接把握,统计分析方法从现实情境中收集 数据,通过分数、次序、频数等直观、浅显的量化数字及简明的图表表现出来,这些数据的 处理,将我们的研究与客观世界紧密相连,从而提示和洞悉现实世界的本质及其规律。 3.可重复性 可重复性是衡量研究质量与水平高低的一个客观尺度,用统计分析方法进行的研究皆是 可重复的。从课题的选取、抽样的设计,到数据的收集与处理,皆可在相同的条件下进行重 复,并能对研究所得的结果进行验证。 三、统计分析方法的局限 统计分析方法有其自身的优势与局限,正确认识其优势和局限,二者同样重要。统计分 析方法的局限,归结起来,主要有下列几点 1.现实生活极其复杂,诸多因素常常纠缠交错在一起,仅靠统计分析方法去控制和解 释这些因素及其相互关系,是不全面、不深刻的
1 第十章 统计分析方法 统计分析方法,作为一种科学的研究方法,在课题数据的收集、整理和分析等方面起着 重要的作用,正越来越为众多研究者所采用。鉴于统计分析思想较为复杂,具体的统计分析 方法名目繁多,难以概全,本章旨在删繁就简,着眼实用,介绍最基本的统计思想及统计方 法。 第一节 统计分析方法概述 一、统计分析的内涵 统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与 技术。 统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。凡资料是以 数据形式呈现,需要与数字打交道的,统计分析便必不可少。统计分析方法常与实验、观察、 测量、调查所得结果相联系,为研究作出正确的结论提供科学的途径和方法,是研究者从事 科学研究的必备工具之一。 二、统计分析方法的特征 采用统计分析方法进行教育研究,是研究达到高水平的客观要求,应用统计分析方法进 行科学研究,有以下几个基本特征: 1.科学性 统计分析方法以数学为基础,具有严密的结构,需要遵循特定的程序和规范,从确立选 题、提出假设、进行抽样、具体实施,一直到分析解释数据,得出结论,都须符合一定的逻 辑和标准。 2.直观性 现实世界是复杂多样的,其本质和规律难以直接把握,统计分析方法从现实情境中收集 数据,通过分数、次序、频数等直观、浅显的量化数字及简明的图表表现出来,这些数据的 处理,将我们的研究与客观世界紧密相连,从而提示和洞悉现实世界的本质及其规律。 3.可重复性 可重复性是衡量研究质量与水平高低的一个客观尺度,用统计分析方法进行的研究皆是 可重复的。从课题的选取、抽样的设计,到数据的收集与处理,皆可在相同的条件下进行重 复,并能对研究所得的结果进行验证。 三、统计分析方法的局限 统计分析方法有其自身的优势与局限,正确认识其优势和局限,二者同样重要。统计分 析方法的局限,归结起来,主要有下列几点: 1.现实生活极其复杂,诸多因素常常纠缠交错在一起,仅靠统计分析方法去控制和解 释这些因素及其相互关系,是不全面、不深刻的
2.统计分析方法的运用是有条件的,它依赖于数据资料本身的性质、统计方法的适用 程度和研究者对统计原理及统计技术的理解、掌握程度与应用水平。方法选择不当,往往易 得出错误的结论 3.统计决断以概率为基础,既然是概率,就存在误差,因而可以说,统计决断的结论 并非绝对正确。例如,从样本统计量推断总体参数的信息时,由于我们的推断建立在一定的 概率基础上,我们没有百分之百的把握认为推断是正确的;当我们在0.95概率基础上比较 两个总体平均数是否相等并认为它们之间存在或不存在显著差异时,从可靠度上看,我们决 断错误的可能性尚有5% 四、统计分析方法的主要内容 统计分析方法,按不同的分类标志,可划分为不同的类别,而常用的分类标准是功能标 准,依此标准进行划分,统计分析可分为描述统计和推断统计 1.描述统计 描述统计是将教育研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和 归纳数据的特征及变量之间的关系的一种最基本的统计方法。描述统计主要涉及数据的集中 趋势、离散程度和相关强度,最常用的指标有平均数(X)、标准差(σx)、相关系数(r)等 2.推断统计 推断统计指用概率形式来决断数据之间是否存在某种关系及用样本统计值来推测总体 特征的一种重要的统计方法。推断统计包括总体参数估计和假设检验,最常用的方法有Z 检验、t检验、x2检验等。 描述统计和推断统计二者彼此联系,相辅相成,描述统计是推断统计的基础,推断统计 是描述统计的升华。具体硏究中,是采用描述统计还是推断统计,应视具体的硏究目的而定, 如研究的目的是要描述数据的特征,则需描述统计:若还需对多组数据进行比较或需以样本 信息来推断总体的情况,则需用推断统计 例如,我们在某幼儿园大班开展一项识字教改实验,期末进行一次测试,并对测试所得 数据进行统计分析。如果我们只需了解该班儿童识字的成绩(平均数及标准差)及其分布,此 时,应采用描述统计方法;若我们还需进一步了解该实验班与另一对照班(未进行教改实验) 儿童的识字成绩有无差异,从而判断教改实验是否有效时,我们除了要对两个班的成绩进行 描述统计之外,还需采用推断统计方法。 五、统计分析的基本步骤 统计分析,大致可分为如下三个步骤 1.收集数据 收集数据是进行统计分析的前提和基础。收集数据的途径众多,可通过实验、观察、测 量、调査等获得直接资料,也可通过文献检索、阅读等来获得间接资料。收集数据的过程中 除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料:一是连续数 据,也叫计量资料,指通过实际测量得到的数据,如对儿童身高、体重测量所得的数值,或 在考试测验中所得的分数等:二是间断数据,也叫计数资料,指通过对事物类别、等级等属 性点计所得的数据,如儿童男女的人数,学习成绩在优、良、中、及格、不及格各个等级中 的人数等
2 2.统计分析方法的运用是有条件的,它依赖于数据资料本身的性质、统计方法的适用 程度和研究者对统计原理及统计技术的理解、掌握程度与应用水平。方法选择不当,往往易 得出错误的结论。 3.统计决断以概率为基础,既然是概率,就存在误差,因而可以说,统计决断的结论 并非绝对正确。例如,从样本统计量推断总体参数的信息时,由于我们的推断建立在一定的 概率基础上,我们没有百分之百的把握认为推断是正确的;当我们在 0.95 概率基础上比较 两个总体平均数是否相等并认为它们之间存在或不存在显著差异时,从可靠度上看,我们决 断错误的可能性尚有 5%。 四、统计分析方法的主要内容 统计分析方法,按不同的分类标志,可划分为不同的类别,而常用的分类标准是功能标 准,依此标准进行划分,统计分析可分为描述统计和推断统计。 1.描述统计 描述统计是将教育研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和 归纳数据的特征及变量之间的关系的一种最基本的统计方法。描述统计主要涉及数据的集中 趋势、离散程度和相关强度,最常用的指标有平均数( X )、标准差( X )、相关系数( r )等。 2.推断统计 推断统计指用概率形式来决断数据之间是否存在某种关系及用样本统计值来推测总体 特征的一种重要的统计方法。推断统计包括总体参数估计和假设检验,最常用的方法有 Z 检验、t 检验、 2 检验等。 描述统计和推断统计二者彼此联系,相辅相成,描述统计是推断统计的基础,推断统计 是描述统计的升华。具体研究中,是采用描述统计还是推断统计,应视具体的研究目的而定, 如研究的目的是要描述数据的特征,则需描述统计;若还需对多组数据进行比较或需以样本 信息来推断总体的情况,则需用推断统计。 例如,我们在某幼儿园大班开展一项识字教改实验,期末进行一次测试,并对测试所得 数据进行统计分析。如果我们只需了解该班儿童识字的成绩(平均数及标准差)及其分布,此 时,应采用描述统计方法;若我们还需进一步了解该实验班与另一对照班(未进行教改实验) 儿童的识字成绩有无差异,从而判断教改实验是否有效时,我们除了要对两个班的成绩进行 描述统计之外,还需采用推断统计方法。 五、统计分析的基本步骤 统计分析,大致可分为如下三个步骤: 1.收集数据 收集数据是进行统计分析的前提和基础。收集数据的途径众多,可通过实验、观察、测 量、调查等获得直接资料,也可通过文献检索、阅读等来获得间接资料。收集数据的过程中 除了要注意资料的真实性和可靠性外,还要特别注意区分两类不同性质的资料:一是连续数 据,也叫计量资料,指通过实际测量得到的数据,如对儿童身高、体重测量所得的数值,或 在考试测验中所得的分数等;二是间断数据,也叫计数资料,指通过对事物类别、等级等属 性点计所得的数据,如儿童男女的人数,学习成绩在优、良、中、及格、不及格各个等级中 的人数等
2.整理数据 整理数据就是按一定的标准对收集到的数据进行归类汇总的过程。由于收集到的数据大 多是无序的、零散的、不系统的,在进入统计运算之前,需要按照研究的目的和要求对数据 进行核实,剔除其中不真实的部分,再分组汇总或列表,从而使原始资料简单化、形象化 系统化,并能初步反映数据的分布特征。 3.分析数据 分析数据指在整理数据的基础上,通过统计运算,得出结论的过程,它是统计分析的核 心和关键。数据分析通常可分为两个层次:第一个层次是用描述统计的方法计算出反映数据 集中趋势、离散程度和相关强度的具有外在代表性的指标:第二个层次是在描述统计基础上 用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和 规律 第二节统计表与统计图 数据收集完成之后,就要进入数据整理阶段,此时常用统计表与统计图。 、统计表 与数据的类型(间断型与连续型)相对应,统计表包括频数表(或频数百分比表,频数累 积百分比表)和频数分布表(或累积频数分布表) 1.频数表 频数表(或频数百分比表,频数累积百分比表)指反映间断型变量各类型频数(或频数百分 比,频数累积百分比)的统计表。 例如,幼儿园某班有20名幼儿,其中男幼儿18名,女幼儿2名,则该班幼儿男女生情 况统计表为 表10-1幼儿园某班男女幼儿人数统计表 性别 人数(n) 百分比(%)累积百分比〔% 男 18 90.00 90.00 女 10.00 100.00 总计 2.频数分布表 频数分布表(或累积频数分布表)指反映连续型变量各组数据频数(或累积频数)分布的统 计表。其制作方法是先将数据从小至大顺序排列并按一定间距进行分组,然后分别计算各组 的频数(或累积频数)并列成表格。 例如,幼儿园某班幼儿30名,其中男幼儿12名,女幼儿18名,30名小朋友的智商分 别为 979098102104102105102100113l1511211312115 l14116114112l15118124123123125126128130132131 从上述数据可看出,该班小朋友的智商最低为90,最高为132,以10为间距将其分成
3 2.整理数据 整理数据就是按一定的标准对收集到的数据进行归类汇总的过程。由于收集到的数据大 多是无序的、零散的、不系统的,在进入统计运算之前,需要按照研究的目的和要求对数据 进行核实,剔除其中不真实的部分,再分组汇总或列表,从而使原始资料简单化、形象化、 系统化,并能初步反映数据的分布特征。 3.分析数据 分析数据指在整理数据的基础上,通过统计运算,得出结论的过程,它是统计分析的核 心和关键。数据分析通常可分为两个层次:第一个层次是用描述统计的方法计算出反映数据 集中趋势、离散程度和相关强度的具有外在代表性的指标;第二个层次是在描述统计基础上, 用推断统计的方法对数据进行处理,以样本信息推断总体情况,并分析和推测总体的特征和 规律。 第二节 统计表与统计图 数据收集完成之后,就要进入数据整理阶段,此时常用统计表与统计图。 一、统计表 与数据的类型(间断型与连续型)相对应,统计表包括频数表(或频数百分比表,频数累 积百分比表)和频数分布表(或累积频数分布表)。 1.频数表 频数表(或频数百分比表,频数累积百分比表)指反映间断型变量各类型频数(或频数百分 比,频数累积百分比)的统计表。 例如,幼儿园某班有 20 名幼儿,其中男幼儿 18 名,女幼儿 2 名,则该班幼儿男女生情 况统计表为: 表 10-1 幼儿园某班男女幼儿人数统计表 性别 人数(n) 百分比(%) 累积百分比(%) 男 女 18 2 90.00 10.00 90.00 100.00 总计 20 100.00 2.频数分布表 频数分布表(或累积频数分布表)指反映连续型变量各组数据频数(或累积频数)分布的统 计表。其制作方法是先将数据从小至大顺序排列并按—定间距进行分组,然后分别计算各组 的频数(或累积频数)并列成表格。 例如,幼儿园某班幼儿 30 名,其中男幼儿 12 名,女幼儿 18 名,30 名小朋友的智商分 别为: 97 90 98 102 104 102 105 102 100 113 115 112 113 112 115 114 116 114 112 115 118 124 123 123 125 126 128 130 132 131 从上述数据可看出,该班小朋友的智商最低为 90,最高为 132,以 10 为间距将其分成
5组,制定分布表为: 表10—2幼儿园某斑30名幼儿智商Q分布表 智商(IQ) 人数(f) 累积频数(cf) 90- 36263 总计 与间断型和连续型数据相对应,统计图主要包括直条图、直方图等 L直条图 直条图是用来描述间断变量频数的统计图。变量的频数用直条的长度来表示。对上例, 该班小朋友的性别用直条图表示如图10-1所示。 复印书中图9-1 2.直方图 直方图是用来描述连续变量频数分布的统计图。用直方图描述连续变量的频数分布,其 方法为先对变量取值进行分组,并计算各组的频数,然后用直方条的面积来表示各组的频数。 对上例,该班小朋友智商(Q分布用直方图表示为如图10-2所示
4 5 组,制定分布表为: 表 10—2 幼儿园某班 30 名幼儿智商(IQ)分布表 智商(IQ) 人数(f) 累积频数(cf) 90- 100- 110- 120- 130- 3 6 12 6 3 3 9 21 27 30 总计 30 二、统计图 与间断型和连续型数据相对应,统计图主要包括直条图、直方图等。 l.直条图 直条图是用来描述间断变量频数的统计图。变量的频数用直条的长度来表示。对上例, 该班小朋友的性别用直条图表示如图 10—1 所示。 复印书中图 9-1 2.直方图 直方图是用来描述连续变量频数分布的统计图。用直方图描述连续变量的频数分布,其 方法为先对变量取值进行分组,并计算各组的频数,然后用直方条的面积来表示各组的频数。 对上例,该班小朋友智商(IQ)分布用直方图表示为如图 10—2 所示
12 数 086420 6 120 130 智商 图10-2幼儿园某班30名幼儿智商分布直方图 第三节描述统计 在教育研究过程中,在收集了大量的观测数据后,首先应对数据的特征进行描述。描述 数据,常用的统计量有平均数、标准差、标准分数、相关系数等 -、平均数 平均数是用来描述数据分布集中趋势的一个统计量,常用符号X来表示,它是一组观 测值的总和除以该数目所得的商来计算,定义公式为 X 式中,X代表平均数 ∑表示累加求和 X表示具体的观察值 n表示观察值个数 例如:某幼儿园50名幼儿珠心算测试成绩总分为4010,则该班平均分应为 ∑X4010 80.20
5 3 6 12 6 3 0 2 4 6 8 10 12 14 90- 100- 110- 120- 130- 智商 人数 图 10—2 幼儿园某班 30 名幼儿智商分布直方图 第三节 描述统计 在教育研究过程中,在收集了大量的观测数据后,首先应对数据的特征进行描述。描述 数据,常用的统计量有平均数、标准差、标准分数、相关系数等。 一、平均数 平均数是用来描述数据分布集中趋势的一个统计量,常用符号 X 来表示,它是一组观 测值的总和除以该数目所得的商来计算,定义公式为: n X X = 式中, X 代表平均数 ∑表示累加求和 X 表示具体的观察值 n 表示观察值个数 例如:某幼儿园 50 名幼儿珠心算测试成绩总分为 4010,则该班平均分应为: 80.20 50 4010 = = = n X X