、方差和标准差 方差和标准差描述一组数据的差异情况和离散程度的统计量。方差或标准差越小,表明 数据的离散程度越小,数据分布越集中整齐:反之,方差或标准差越大,表明数据离散程度 越大,数据分布越参差不齐 方差指观测值与平均数差异平方和的算术平均数,常用符号σ2x来表示,其计算:公 式为: ∑(x-x)x ∑Ⅹ 式中,a2x代表方差 X代表平均数 ∑表示累加求和 X,X2分别表示原始数据及其平方 n表示观察值个数 标准差等于方差的算术平方根,常用符号ax来表示,其计算公式为: Lx-X n 式中,x代表标准差 如,数据80、90、50、60、70 其平均数F_80+90+50+60+70 方差a2(80-70)2+(90-70)2+(50-70)-+(60-70)+(70-70 5 标准差ax=√200=1414 标准差在计算数据时,我们常使用到计算机或计算器,现以计算器(型号为 CASIO fx-82MS,fx270MS,fx-83MS,fx-85Ms,fx-300MS,fx-350Ms,)为例说明平均数与标准 差的计算步骤: 1、清零(清除计算器里以往存贮的数据): Shift clr 1 2、设置“SD”统计模式(单变量统计模式) MODE 2 3、输入数据:[L80DT DDD 园oDDi 4凶國HE囗□(原始数据平方和∑X2)结果为∑X2=25500
6 二、方差和标准差 方差和标准差描述一组数据的差异情况和离散程度的统计量。方差或标准差越小,表明 数据的离散程度越小,数据分布越集中整齐;反之,方差或标准差越大,表明数据离散程度 越大,数据分布越参差不齐。 方差指观测值与平均数差异平方和的算术平均数,常用符号 X 2 来表示,其计算:公 式为: ( ) 2 2 2 2 − = − = n X n X n X X X 式中, X 2 代表方差 X 代表平均数 ∑表示累加求和 X,X2 分别表示原始数据及其平方 n 表示观察值个数 标准差等于方差的算术平方根,常用符号 X 来表示,其计算公式为: X = ( ) n X − X 2 式中, X 代表标准差 如,数据 80、90、50、60、70, 其平均数 70 5 80 90 50 60 70 = + + + + X = 方差 200 5 (80 70) (90 70) (50 70) (60 70) (70 70) 2 2 2 2 2 2 = − + − + − + − + − X = 标准差 X = 200 = 14.14。 标准差在计算数据时,我们常使用到计算机或计算器,现以计算器(型号为 CASIO fx-82MS, fx-270MS,fx-83MS,fx-85MS,fx-300MS,fx-350MS,)为例说明平均数与标准 差的计算步骤: 1、清零(清除计算器里以往存贮的数据):Shift CLR 1 = 2、设置“SD”统计模式(单变量统计模式) : MODE 2 3、输入数据: 80 DT 90 DT 50 DT 60 DT 70 DT 4、AC SHIFT S-SUM 1 = (原始数据平方和 2 X ) 结果为 = 25500 2 X
四四s□2□(原始数据之和∑X)结果为∑X=350 四dHS国[(容量n 结果为n=5 HF-A[(平均数x) 结果为X=70 國Fw□(标准差ax) 结果为ax=14.14 将标准差ax平方后(方差a2x 结果为a2x=200 三、标准分数 我们知道,对单组数据的大小进行比较,可直接比较观察值(原始分数)的大小:然而, 要比较两组(或多组)数据的大小,由于各自的平均数和标准差有所不同,仅从原始分数中 我们很难得出科学结论。如,已知某次期末考试全班数学和物理的平均分分别为65和80, 标准差分别为5和10,某生数学得了70分,物理得了75分,问这两个分数孰高孰低?从原 始分数角度看,数学70比物理75低,然而,由于两科考试的内容及难度不一,各自的平均 分及标准差有所不同,同一分数在不同的科目中所具有的价值及表示的意义也就不一样,数 学70在班级中属较高水平,而物理75在班级中的水平为中下,这说明该生数学成绩比物理 成绩要好。为解决不同数组的比较问题,我们引入另一分数一一标准分数。 标准分数又称Z分数,是以标准差为单位来表示原始分在一组数据中所处相对位置的 统计量。Z分数的大小由观测值与平均数之差除以标准差来表示,其计算公式为 式中,Z代表标准分数 X、σx分别代表平均数、标准差 例如:甲乙两幼儿在语言、常识、计算测试中的成绩见下表,试分析谁的总成绩较好。 表10-3甲乙两幼儿语言、常识、计算测试成绩比较表 科目 原始分X 平均分 标准差 X 标准分Z 语言 59 51 2.25 0.25 常识 75 74 10 0.10 0.50 计算 71 8 -0.50 0.50 193 平均分643367.00 0.6167 0.4167
7 AC SHIFT S-SUM 2 = (原始数据之和 X ) 结果为 X = 350 AC SHIFT S-SUM 3 = (容量 n) 结果为 n=5 AC SHIFT S-VAR 1 = (平均数 X ) 结果为 X = 70 AC SHIFT S-VAR 2 = (标准差 X ) 结果为 X =14.14 将标准差 X 平方后 (方差 X 2 ) 结果为 X 2 =200 三、标准分数 我们知道,对单组数据的大小进行比较,可直接比较观察值(原始分数)的大小;然而, 要比较两组(或多组)数据的大小,由于各自的平均数和标准差有所不同,仅从原始分数中 我们很难得出科学结论。如,已知某次期末考试全班数学和物理的平均分分别为 65 和 80, 标准差分别为 5 和 10,某生数学得了 70 分,物理得了 75 分,问这两个分数孰高孰低?从原 始分数角度看,数学 70 比物理 75 低,然而,由于两科考试的内容及难度不一,各自的平均 分及标准差有所不同,同一分数在不同的科目中所具有的价值及表示的意义也就不一样,数 学 70 在班级中属较高水平,而物理 75 在班级中的水平为中下,这说明该生数学成绩比物理 成绩要好。为解决不同数组的比较问题,我们引入另一分数——标准分数。 标准分数又称 Z 分数,是以标准差为单位来表示原始分在一组数据中所处相对位置的 统计量。Z 分数的大小由观测值与平均数之差除以标准差来表示,其计算公式为: x X X Z − = 式中,Z 代表标准分数 X 、 X 分别代表平均数、标准差 例如:甲乙两幼儿在语言、常识、计算测试中的成绩见下表,试分析谁的总成绩较好。 表 10—3 甲乙两幼儿语言、常识、计算测试成绩比较表 科目 原始分 X 平均分 X 标准差 X 标准分 x X X Z − = 甲 乙 甲 乙 语言 常识 计算 59 75 63 51 79 71 50 74 67 4 10 8 2.25 0.10 -0.50 0.25 0.50 0.50 总计 193 201 1.85 1.25 平均分 64.33 67.00 0.6167 0.4167
从上表可看出:虽然幼儿乙的原始分数高于幼儿甲,但是通过和样本比较,将不可比的 原始分数转换成标准分数,幼儿甲平均标准分是0.6167,幼儿乙平均标准分是04167,幼儿 甲三科成绩标准分之和比幼儿乙高,说明幼儿甲的总成绩比幼儿乙好 四、相关系数 相关指变量之间的相互关系和联系程度,其大小常用相关系数来表示。相关系数取值介 于-1.00~1.00之间,其值的正负及大小反映了变量之间变化的方向和关系的紧密程度 按相关系数的正负符号来分,相关分为正相关、负相关和零相关 正相关表示一变量发生变化时,另一变量也发生同方向的变化。如身高与体重的关系是 正相关,对幼儿来说,身高增加,体重也随之增加;又如练习量与效果的关系也是正相关, 幼儿跳绳、拍球的练习量増加了,在跳绳、拍球活动中的得分随之提高ε 负相关表示一个变量发生变化时,另一变量发生反方向的变化。如幼儿身体健康水平与 缺勤率的关系是负相关,身体越健康,缺勤率越低,反之,身体状况越差,缺勤率也就越髙 又如练习量与错误率的关系也是负相关,幼儿练习量越多,其错误率也就越低。 零相关表示变量之间线性关系上相互独立,彼此没有关系,一变量变化并不一定引起另 变量的相应变化。如身高与学业成绩的关系是零相关,幼儿身体越高,其学业成绩未必就 越好或越差;又如幼儿的性格与其胖瘦的关系也属零相关。外向的幼儿,可能较胖,也可能 较瘦,内向的幼儿,也可能胖,也可能瘦 相关系数绝对值的大小表示变量关系的密切程度,绝对值越接近1,表示两变量的关系 越密切:绝对值越接近于0,表示两变量的关系越疏远。按绝对值的大小,相关可分为高度 相关、中度相关和低度相关。绝对值在07及以上的,称为高度相关;在0.3~0.7之间的 称为中度相关:03以下的,称为低度相关。 计算相关系数的方法很多,对于不同的数据类型,应采用不同的相关计算方法。在教育 研究中,最常用的相关是积差相关 当两个变量是连续的、成对的且变量的总体接近正态分布时,变量的关系常用积差相关 来表示,其符号为r,计算公式为: ∑X-Cx)∑r)m x2-(x/n∑-∑/ 式中,r表示积差相关系数 ∑表示累加求和 XY表示X与Y的积 X和Y分别表示变量X和变量Y的平均数 O,和O分别表示变量X和变量Y的标准差 表示变量X和变量y的成对数目 例如,10名5岁幼儿在语言x和常识y上的得分如下表第2、3列所示,求两者的相关 程度
8 从上表可看出:虽然幼儿乙的原始分数高于幼儿甲,但是通过和样本比较,将不可比的 原始分数转换成标准分数,幼儿甲平均标准分是 0.6167,幼儿乙平均标准分是 0.4167,幼儿 甲三科成绩标准分之和比幼儿乙高,说明幼儿甲的总成绩比幼儿乙好。 四、相关系数 相关指变量之间的相互关系和联系程度,其大小常用相关系数来表示。相关系数取值介 于-1.00~1.00 之间,其值的正负及大小反映了变量之间变化的方向和关系的紧密程度。 按相关系数的正负符号来分,相关分为正相关、负相关和零相关。 正相关表示一变量发生变化时,另一变量也发生同方向的变化。如身高与体重的关系是 正相关,对幼儿来说,身高增加,体重也随之增加;又如练习量与效果的关系也是正相关, 幼儿跳绳、拍球的练习量增加了,在跳绳、拍球活动中的得分随之提高。 负相关表示—个变量发生变化时,另一变量发生反方向的变化。如幼儿身体健康水平与 缺勤率的关系是负相关,身体越健康,缺勤率越低,反之,身体状况越差,缺勤率也就越高; 又如练习量与错误率的关系也是负相关,幼儿练习量越多,其错误率也就越低。 零相关表示变量之间线性关系上相互独立,彼此没有关系,一变量变化并不一定引起另 一变量的相应变化。如身高与学业成绩的关系是零相关,幼儿身体越高,其学业成绩未必就 越好或越差;又如幼儿的性格与其胖瘦的关系也属零相关。外向的幼儿,可能较胖,也可能 较瘦,内向的幼儿,也可能胖,也可能瘦。 相关系数绝对值的大小表示变量关系的密切程度,绝对值越接近 l,表示两变量的关系 越密切;绝对值越接近于 0,表示两变量的关系越疏远。按绝对值的大小,相关可分为高度 相关、中度相关和低度相关。绝对值在 0.7 及以上的,称为高度相关;在 0.3~0.7 之间的, 称为中度相关;0.3 以下的,称为低度相关。 计算相关系数的方法很多,对于不同的数据类型,应采用不同的相关计算方法。在教育 研究中,最常用的相关是积差相关。 当两个变量是连续的、成对的且变量的总体接近正态分布时,变量的关系常用积差相关 来表示,其符号为 r,计算公式为: ( )( ) ( ) ( ) − − − = X X n Y Y n XY X Y n r 2 2 2 2 , 式中,r 表示积差相关系数 ∑表示累加求和 XY 表示 X 与 Y 的积 X 和 Y 分别表示变量 X 和变量 Y 的平均数 x 和 y 分别表示变量 X 和变量 Y 的标准差 n 表示变量 X 和变量 y 的成对数目 例如,10 名 5 岁幼儿在语言 x 和常识 y 上的得分如下表第 2、3 列所示,求两者的相关 程度