2015/1/9 回回 课程设置 恋石何于大学 瀑财:覆论瀑:22净对 共月绿:10学财 方差分析(ANOVA) 联方式:预防医季卫生晚 Tel:2057153 Analysis of variance Baidu账七:yfaC讨论.米民、作业) 预防医学 wmv) 大R网雀/ m=C=33-1) =3 2 ◆次比秋时,a=0.05,作完n次比秋,系新I真增 的瓶率汤a'=1-1-a)n。 105 本周a'=1-1-0.059=0.1426是0.05始2.90. 同周? 国此,对多个坪来珀款的比献检脸意香用? 1.春血时量值与共的款不有学的原国是什a2 2三氢始值春不湘周的原国是什么7 3.色香用粒业群本的t格脸暖仔能计分新? 务分新ANO1VA) 方差分斯基本愿想 林特转+外 派文开=威机史开+处复圆素吾威的支升 奢果用的能计分新者债为者基分新 (Analysisof Variance.ANOVA). F-MSa4 晚计量, 所以王 不 计春义?丁以道此F界值表作出晚计雄断
2015/1/9 1 方差分析(ANOVA) Analysis of variance 预防医学系 2 课程设臵 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 例 6.1 三组大鼠 GSH 值(mg/gprot) 甲 乙 丙 合计 79.81 87.58 60.29 80.60 70.73 62.63 … … … 104.28 80.36 46.56 72.29 56.40 55.23 全部数据 ni 12 12 12 36 Xi 83.15 75.63 52.27 70.35 Si 12.30 11.07 10.85 17.35 问题? 1.各组测量值与其均数不相等的原因是什么? 2.三组均值各不相同的原因是什么? 3.能否用独立样本的 t 检验进行统计分析? 3 3 2 3(3 1) 2 3 m C 每次比较时,α=0.05,作完n次比较,累积Ⅰ类错误 的概率为α' =1-(1-α)n 。 本题α'=1-(1- 0.05)3 =0.1426 是0.05的2.9倍. 因此,对多个样本均数的比较t检验能否用? 4 由英国统计学家R.A.Fisher首先提 出的一种统计方法,并以F命名方 差分析的统计量,所以方差分析又 称 F 检验。 将所研究的对象分为多个处理组,施加不同的干 预,施加的干预称为处理因素(factor),处理因 素至少有两个水平(level)。用这类资料的样本信 息来推断各处理组间多个总体均数是否存在差别, 常采用的统计分析方法为方差分析 (Analysis of Variance, ANOVA)。 方差分析 (ANOVA) 5 方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般不 会为1,而是接近1,但如果处理因素确有作用,则组间变 异会远大于组内均方, F值将明显大于1,大到多少才有统 计意义?可以通过F界值表作出统计推断。 6
2015/1/9 一、方差分折的基本思想 口乐=5两+巧有 0悬=0a闲十0a★ 总变异的分解 ■银设两样本来自网一慈体。 口H0:1=g2=g3 血内支异 F=MSan-T+E S维州 E 收k大.Fa >方差是描述变异的一种指标, 第一节方差分析的基本思想 差分析是一种假设检脸的方法。方 差分斯也此是对变开的分斯。 会,通比「检脸,来分斯莎南唇史升的春国素的 故虚反国素用的支互故应。 是对意变异进行分斯。看总吏异 )女差会斯财,一服圆素通多,恶史开此被分解得 是由哪些部分组成的,这些部分间 是如,领差部分此是小,从而高丁妆。 的美条如何。 ,根据史弄的来绿,接查部观套值焉的喜的是平 方差分新盛用条件: 1、各样本是相互教立的威机样本,从 函是外,其◆◆个都分的变开可南基垂特龙圆 盖春分布) ★的作用加以解醉。 一2、春杯本的愿体方差湘等,即方是齐性。 MS),骨期F会专张出能计推断,从而判断米 周兼对观森指标者无影喻。 2
2015/1/9 2 一、方差分析的基本思想 SS总=SS组间+SS组内 υ总= υ组间+υ组内 假设两样本来自同一总体。 H0:μ1= μ2 = μ3 H0成立则理论上F值=1 若处理起作用,则组间变异会增大,F值>1 7 E T E MS MS F 组内 组间 组间变异 总变异 组内变异 总变异的分解 8 方差是描述变异的一种指标,方 差分析是一种假设检验的方法。方 差分析也就是对变异的分析。 是对总变异进行分析。看总变异 是由哪些部分组成的,这些部分间 的关系如何。 9 第一节 方差分析的基本思想 根据研究目的和设计要求将总变异分解成几个部 分,通过F检验,来分析影响总变异的各因素的 效应及因素间的交互效应。 方差分析时,一般因素越多,总变异就被分解得 越细,误差部分就越小,从而提高了检验效率。 10 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分,除随机 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 通过比较不同来源变异的方差(也叫均方 MS),借助F分布做出统计推断,从而判断某 因素对观察指标有无影响。 11 方差分析应用条件: 1、各样本是相互独立的随机样本,均服从 正态分布; 2、各样本的总体方差相等,即方差齐性。 12
2015/1/9 >只研究一个固兼(可者多个水平,知k个 水平),故称单图素设计。它是将备个比 脸对兼随机地分配到k个水平组(处夏触) 完全随机设计的方差分析 中。 >k个处题鱼样本舍量录好湘等,但也可以 不暮。 ■ 组内支开(SS,) ■血内各个观到值X,与本 瓶内均值了之差的平力 不。反映丁鱼内(同一 水平下)样本的威机被 12.轴 11.07 10. 17.5 8=2x,- 玉服之两版都的文补 金非成海用的支开—>薄史养 血司支弄(SSRJ 善支开(SS) 。血内均值X,与善均值刀之差的平方和 金师同量值大小不 同,这种史平备秀 善支升,以春则量 值内恶啪款 处程园素春个水平鱼闲的 善界,网时心包合丁随机 S,=22x,- 甲乙 满是
2015/1/9 3 完全随机设计的方差分析 只研究一个因素(可有多个水平,如k个 水平) ,故称单因素设计。它是将每个试 验对象随机地分配到k个水平组(处理组) 中。 k个处理组样本含量最好相等,但也可以 不等。 14 例 6.1 三组大鼠 GSH 值(mg/gprot) 甲 乙 丙 合计 79.81 87.58 60.29 80.60 70.73 62.63 … … … 104.28 80.36 46.56 72.29 56.40 55.23 全部数据 ni 12 12 12 36 Xi 83.15 75.63 52.27 70.35 Si 12.30 11.07 10.85 17.35 三种变异: • 组内数据的变异 ——> 组内变异 • 三组之间数据的变异 ——> 组间变异 • 全部数据间的变异 ——> 总变异 15 组内变异(SSe) 组内各个观测值 与本 组内均值 之差的平方 和。反映了组内(同一 水平下)样本的随机波 动。 2 1 1 ( ) i k i n j SSe Xij X i Xij 30 40 50 60 70 80 90 100 110 甲 乙 丙 X甲 X乙 X丙 Xi Xij 16 组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 17 总变异(SST) 全部测量值大小不 同,这种变异称为 总变异,以各测量 值Xij与总均数 间的差异度量。 Xij k i n j T ij i SS X X 1 1 2 ( ) 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X 18
2015/1/9 方美分桥基本愿想 底麦异的分解 ,可以分解为: 感史开■鱼内史开。十血间史开 MSa 见豪值与血响教的差开: F=MSa 血均数与落物款的差异:无一下 :X)-=(g-)+(民- 计套义,可以通此F不值表作出能计推断。 1.总变异 2.组间变弄(SSTR) 墨高的业平九SS-2(x,-到 ■内的值,与卷值之差的平方不 =(m- n-2n化- 反映了: 处服同★春个水平血同的 巧=春测量值的恶期款了垂值的平方和 善异,同时也色台了威机 。 3.组内支异 三种“变异”之间的关集 瓢内嘉均业平克型 SSg=SS+SSa内 s22x,--2m-s Vg=Va网tVa内 =SS。SS 组问支异SS网:处理素+随机误差 组内变异SSa: 随机误 4
2015/1/9 4 方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般不 会为1,而是接近1,但如果处理因素确有作用,则组间变 异会远大于组内均方, F值将明显大于1,大到多少才有统 计意义?可以通过F界值表作出统计推断。 19 总变异的分解 每个观察值与总均数不同: 可以分解为: 观察值与组均数的差异: 组均数与总均数的差异: 即: x x ij xij xi xi x x x (x x ) (x x) ij ij i i 20 总离均差平方和 ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= 1. 总变异 X SS总反映:所有测量值之间总的变异程度 SS总=各测量值Xij与总均数 差值的平方和 全部观测值的方差 21 2.组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 22 组内离均差平方和 总 组 间 组 内 - = SS SS SS x x n S k i i i k i n j ij i i 1 2 1 1 2 ( ) ( 1) m i 3. 组内变异 在同一处理组内,虽然每个受试对象接受的处理相 同,但测量值仍各不相同,这种变异称为组内变异。 SS组内仅仅反映了随机误差的影响。也称SS误差 23 三种“变异”之间的关系 24 SS总=SS组间+SS组内 ν总 =ν组间 +ν组内 组间变异 SS组间:处理因素 + 随机误差 组内变异 SS组内: 随机误差
2015/1/9 地卖军为织小有关 均苏之比=Fvalue 变异 知果各组样本的总体均相等(H:==m=), 还与其自由度有关,由于各部分自由度不相等, 即各处组的样木来自相同总体,无处壅因素的作用,则 因此各部分高均差平方和不能直接比较,须将 可变异同组内变异一样,只反映前机谈差作用的大小。塑间 各部分离均差平方和除以相应自由度,其比值 均方与组内均方的比值常为F能计量 称为均方差,简称均方(mean square,MS)。组 F= MS组 间均方和组内均方的计算公式为: S组内 片=V组间,=Y组内 F值接近于,就没有速由拒始山:反之,F值越大, 的理由越充分,戴建统计的建论正喇,当出成立时,F V组同 V组内 统计量服从F分布。 平圆素打基分新的计第公式 F F分布 卷支5522-到2N-7 ■F分布有两个自由度,组调自由度和组内自 由度 ■F分布是一种偏态分布。 本空区1受路 有-N-女 共中:N-∑m,为处理组数 ■ Pn8-1 1换出检脸版设,项走检脸水准: 方差分析的检验步豫 史米除SS v MS F P 悉变异279.986129 处理91.2247245.61246.52<0.05 188.7614276.9912
2015/1/9 5 均方(mean square,MS) 变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为: SS MS 组间 组间 组间 SS MS 组内 组内 组内 25 均方之比=F value 如果各组样本的总体均数相等(H0: 1 2 … k ), 即各处理组的样本来自相同总体,无处理因素的作用,则组 间变异同组内变异一样,只反映随机误差作用的大小。组间 均方与组内均方的比值称为 F 统计量 MS F MS 组间 组内 1 组间 , 2 组内 F 值接近于 l,就没有理由拒绝 H0;反之,F 值越大,拒绝 H0 的理由越充分。数理统计的理论证明,当 H0 成立时,F 统计量服从 F 分布。 26 单因素方差分析的计算公式 变异来源 离均差平方和 SS 自由度 υ 均方 MS F 总变异 N-1 组间变异 k-1 组内变异 N-k ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= k i SS ni xi x 1 2 组 间 ( ) 组间 组间 SS 组内 组内 SS 组内 组间 MS MS 其中: N ni , k为处理组数 k i SS ni Si 1 2 组 内 ( 1) 27 F分布 F分布有两个自由度 ,组间自由度和组内自 由度 ; F分布是一种偏态分布。 28 方差分析的检验步骤 ⒈ 提出检验假设,确定检验水准。 H0 : μ1= μ2= μ3 ; H1 : μ1 ,μ2 ,μ3 不同或不全相同; α=0.05 ⒉ 根据公式计算SS、MS及F值 方差分析步骤 30 变异来源 SS ν MS F P 总变异 279.9861 29 处理组间 91.2247 2 45.6124 6.52 <0.05 误差 188.7614 27 6.9912 P71 8-1