章 第五章统计假设测验与参数的区间估计 课时 6 &5.1统计推断的意义和内容 &5.2统计假设测验概述 节 &5.3平均数的假设测验 &5.4百分数的假设测验 &5.5统计假设测验的两类错误 &5.6参数的区间估计 (1)了解统计假设测验的基本原理和步骤,以及一尾测验与两尾测验 教学 的区别:(2)了解t分布的定义、参数和性质:(3)掌握平均数、百分数假 目的 设测验的方法:(④)掌握统计假设测验两类错误的概念、概率及其降低措 施:(⑤)掌握参数区间估计的原理和方法。 1.统计假设测验概念 教学 2。小概率原理及统计假设测验两类错误 重点 3.假设检验的步骤 4.各类总体参数的假设测验 1.统计假设测验的原理与统计学两类错误含义 2.两尾测验与一尾测验的区别与联系 数学 突破方法: 难点 举通过通俗易懂的生活或作物、草业、植保等相关科研实例(如飞机 失事的机率立,蔬菜农药残余检疫等),帮助学生理解教学难点,起得很 好的效果。 相关素材(参考资料、指导学生阅读材料等): 列出主要参考文献 1. 《试验统计方法》,盖钧镒主编,中国农业出版社,2000。 2. 《试验设计与统计分析》,金益主编,中国农业出版社,2007。 3. 《SS统计分析教程》,唐燕琼主编,中国农业出版社,20O6。 4. 《试验统计引论》,韩汉鹏主编,中国林业出版社,2006。 5. 《热带作物的试验设计与统计分析》,林德光著,华南热带农业大学,1985 6. 《生物统计的数学原理》,林德光,辽宁人民出版社,1982。 7. 《试验设计与统计分析学习指导》,黄亚群主编,中国农业出版社,2008: 8. 《果树试验设计与统计》,刘权主编,中国农业出版社,1997。 9.《肥料试验及统计分析》,陶勤南主编,中国农业出版社,1997。 10.《食品试验设计与统计分析》,王钦德主编,中国农业出版社,2002 《试验设计与分析》,袁志发主编,高等教育出版社,2000
1 章 第五章 统计假设测验与参数的区间估计 课时 6 节 &5.1 统计推断的意义和内容 &5.2 统计假设测验概述 &5.3 平均数的假设测验 &5.4 百分数的假设测验 &5.5 统计假设测验的两类错误 &5.6 参数的区间估计 教学 目的 (1)了解统计假设测验的基本原理和步骤,以及一尾测验与两尾测验 的区别;(2)了解 t 分布的定义、参数和性质;(3)掌握平均数、百分数假 设测验的方法;(4)掌握统计假设测验两类错误的概念、概率及其降低措 施;(5)掌握参数区间估计的原理和方法。 教学 重点 1. 统计假设测验概念 2. 小概率原理及统计假设测验两类错误 3. 假设检验的步骤 4. 各类总体参数的假设测验 教学 难点 1. 统计假设测验的原理与统计学两类错误含义 2. 两尾测验与一尾测验的区别与联系 突破方法: 举通过通俗易懂的生活或作物、草业、植保等相关科研实例(如飞机 失事的机率立,蔬菜农药残余检疫等),帮助学生理解教学难点,起得很 好的效果。 相关素材(参考资料、指导学生阅读材料等): 列出主要参考文献 1. 《试验统计方法》,盖钧镒主编,中国农业出版社,2000。 2. 《试验设计与统计分析》,金益主编,中国农业出版社,2007。 3. 《SAS 统计分析教程》,唐燕琼主编,中国农业出版社,2006。 4. 《试验统计引论》,韩汉鹏主编,中国林业出版社,2006。 5. 《热带作物的试验设计与统计分析》,林德光著,华南热带农业大学,1985。 6. 《生物统计的数学原理》,林德光,辽宁人民出版社,1982。 7. 《试验设计与统计分析学习指导》,黄亚群主编,中国农业出版社,2008。 8. 《果树试验设计与统计》,刘权主编,中国农业出版社,1997。 9. 《肥料试验及统计分析》,陶勤南主编,中国农业出版社,1997。 10. 《食品试验设计与统计分析》,王钦德主编,中国农业出版社,2002。 《试验设计与分析》,袁志发主编,高等教育出版社,2000
教师授课思路、设问及讲解要点 一、引言 在科学研究中,往往首先要提出一个有关某总体参数的假设,然后通过调 查研究或试验研究获得的数据分析,由样本统计数推论总体参数的信息,这种 方法就是该章要讲的统计推断。 二、教学内容正文(含讲课内容、提问设计、课堂练习等) &5.1统计推断的意义和内容 1.统计推断:是根据样本和假定模型对总体作出的以概率形式表述的推断, 2,统计推断内容:包括假设检验(test of hypothesis)和参数估计 (parametric estimation)二个内容。而参数估计包括点估计与区间估计。 3.统计推断的前提条件:资料必须来自随机样本:统计数的分布规律必须 己知。 4.统计假设测验:是指据某种需要,对末知的或不完全清楚的总体提出 些假设(Hypothesis),由样本实际结果经过一定的概率测验,作出接受或否 ” 定假设的推论。 5.参数估计:是指由样本结果对总体参数作出点估计和区间估计。 6.点估计是以统计数估计相应参数。 7.区间估计是在一定的置信度下估计出参数的置信区间。 过 &5.2统计假设测验概述 程 统计假设检验又叫显著性检验(test of significance)。显著性检验的 方法很多,常用的有检验、F检验和检验等。尽管这些检验方法的用途及 使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著 性检验为例来阐明显著检验的原理,介绍几种t检验的方法,然后介绍总体 参数的区间估计(interval estimation)。 统计假设:在科学研究中,往往首先要提出一个有关某一总体参数的假设。 这种假设称为统计假设 原品种0=300kg,0=75kg 新品系n=25,下=330kg→4 μ≠4? 例如:两种药剂杀虫效果的比较,一种新品种与当地良种的比较等:检验 某产品是否达某项质量标准,或在某项有害物质指标上是否超标的试验。这类 试验数据均可采用统计假设检验来分析。 2
2 教 学 过 程 教师授课思路、设问及讲解要点 一、引言 在科学研究中,往往首先要提出一个有关某总体参数的假设,然后通过调 查研究或试验研究获得的数据分析,由样本统计数推论总体参数的信息,这种 方法就是该章要讲的统计推断。 二、教学内容正文(含讲课内容、提问设计、课堂练习等) &5.1 统计推断的意义和内容 1.统计推断:是根据样本和假定模型对总体作出的以概率形式表述的推断。 2.统计推断内容:包括假设检验(test of hypothesis)和参数估计 (parametric estimation)二个内容。而参数估计包括点估计与区间估计。 3.统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须 已知。 4.统计假设测验:是指据某种需要,对末知的或不完全清楚的总体提出一 些假设(Hypothesis),由样本实际结果经过一定的概率测验,作出接受或否 定假设的推论。 5.参数估计:是指由样本结果对总体参数作出点估计和区间估计。 6.点估计是以统计数估计相应参数。 7.区间估计是在一定的置信度下估计出参数的置信区间。 &5.2 统计假设测验概述 统计假设检验又叫显著性检验 (test of significance)。显著性检验的 方法很多,常用的有 t 检验、F 检验和 2检验等。尽管这些检验方法的用途及 使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著 性检验为例来阐明显著检验的原理, 介绍几种 t 检验的方法,然后介绍总体 参数的区间估计(interval estimation)。 统计假设:在科学研究中,往往首先要提出一个有关某一总体参数的假设。 这种假设称为统计假设 原品种 µ0 =300kg ,σ=75kg 新品系 n=25, x =330kg→µ µ≠µ0 ? 例如:两种药剂杀虫效果的比较,一种新品种与当地良种的比较等;检验 某产品是否达某项质量标准,或在某项有害物质指标上是否超标的试验。这类 试验数据均可采用统计假设检验来分析
数据结构 从服从正态分布N(“广300,0=75)的原品种总体中,随机抽取n个个体 构成样本,则样本观察值可表示为 (1,2,.,n 而从新品系总体中随机抽取的样本观察值,则为 x=μ+e1(=1,2,.,d 新品系与原品种的产量差异为 T=H-H。 将(4.3)代入(4.2)得 x=业0+r+eg (i1,2,.,n) 二、统计假设测验的基本思路—一小机率原理 小机率原理即概率很小的事件,在一次试验中是不至于发生的。 对一个样本的n个观察值xi求平均数 因x=μ。+T+et (i=l,2,.,n) 元=4o+T+E 学 (-4)=(-4)+E 过 上式说明,元与4。的表面差异(元-“)是由真实差异(u-4。)和试 验误差e,构成。 先假设真实差异不存在,表面差异全为试验误差。然后计算这一假设出现 的概率,根据小概率事件实际不可能性原理,判断假设是否正确。这是对样本 所属总体所做假设是否正确的统计证明,称为统计假设测验(statistica hypothesis test). 三、统计假设测验的基本步骤 例如,假设新品系的总体平均数4与原品种总体平均数4相等, (x-4。)=(u-4。)+e=e,即表面差异(x-4=30kg)全为试验误差,新品 系的产量与原品种没有差异。这个假设就叫无效假设(null hypothesis),记 为HO::h。与其对应的另一个统计假设叫备择假设(alternate hypothesis) 记为HA:≠4。 无效假设的形式是多种多样的,随研究的内容不同而不同,但必须遵循两 个原则: 无效假设是有意义的: 据之可计算出因抽样误差而获得样本结果的概率
3 教 学 过 程 一、数据结构 从服从正态分布 N(μ0=300,σ=75)的原品种总体中,随机抽取 n 个个体 构成样本,则样本观察值可表示为 xi = μ0 + εi (i=1,2 ,. ,n) 而从新品系总体中随机抽取的样本观察值,则为 xi = μ + εi (i=1,2 ,. ,n) 新品系与原品种的产量差异为 τ = μ - μ0 将(4.3)代入(4.2)得 xi = μ0 + τ + εi (i=1,2 ,. ,n) 二、统计假设测验的基本思路——小机率原理 小机率原理即概率很小的事件,在一次试验中是不至于发生的。 对一个样本的 n 个观察值 xi 求平均数 因 xi = μ0 + τ + εi (i=1,2 ,. ,n) − = − + = + + ( ) ( ) 0 0 0 x xi i 上式说明, x 与 μ0 的表面差异( x -μ0)是由真实差异(μ- μ0 )和试 验误差εi构成。 先假设真实差异不存在,表面差异全为试验误差。然后计算这一假设出现 的概率,根据小概率事件实际不可能性原理,判断假设是否正确。这是对样本 所属总体所做假设是否正确的统计证明,称为统计假设测验(statistical hypothesis test)。 三、统计假设测验的基本步骤 例如,假设新品系的总体平均数 µ 与原品种总体平均数 µ0 相等, ( x -μ0)=(μ-μ0 )+εi=εi 即表面差异( x -µ0=30 ㎏)全为试验误差,新品 系的产量与原品种没有差异。这个假设就叫无效假设(null hypothesis),记 为 H0:µ= µ0。与其对应的另一个统计假设叫备择假设(alternate hypothesis), 记为 HA:µ≠µ0。 无效假设的形式是多种多样的,随研究的内容不同而不同,但必须遵循两 个原则: 无效假设是有意义的; 据之可计算出因抽样误差而获得样本结果的概率
例5.1设某地区的单地小麦品种一般亩产300KG,多年种植结果获得标准 差为75KG。现有某新品种=25,平均数330,问新品种样本所属总体与当地品 种这个总体是否差异显著。 第一步统计假设H0:4= 第二步计算统计量4=-弘 330-30-2 σ1Wn751√25 查附表2,即得u值对应的概率p<0.05。表明30Kg差异属于试验误差的 概率小于5%。 根据小概率事件实际不可能性原理,这个假设应被否定,即表面差异不全 为试验误差,新品系与原品种之间存在真实差异。 判定是否属小概率事件的概率值叫显著水平(significant level), 般以a表示。农业上常取0.05和0.01。凡计算出的概率p小于a的事件即为 小概率事件。 统计上,当1%<p≤5%称所测差异显著,p≤1%称差异极显著,p>5%称 差异不显著,所以,统计假设测验又叫差异显著性测验(difference significance test) 显著水平的选择应根据试验要求和试验结论的重要性而定。 第三步统计推断 过 若|u|≤1.96,故p>5%,接受假设H0,差异不显著 若2.58>|u|>1.96,故1%<p≤5%,拒绝假设H0,差异达显著。 若|u|>2.58,故p≤1%,拒绝假设H0,差异达极显著。 第四步依题意写结论 上例u=2>1.96,新品种产量显著高于当地品种。 四、统计假设测验的几何意义 a=0.01时,由附表3得u=1.96,则0:=0的接受区域为 (4-1.96oX(04+o) 图5.15%显著水平假设测验图示(表示接受区域和否定区域)
4 255 270 285 300 315 330 345 0.00 0.01 0.02 0.03 fN (y) y 270.6 329.4 否定区 域 2.5% 否定区 域 2.5% 接 受 区 域 平均数取值 教 学 过 程 例 5.1 设某地区的单地小麦品种一般亩产 300KG,多年种植结果获得标准 差为 75KG。现有某新品种 n=25,平均数 330,问新品种样本所属总体与当地品 种这个总体是否差异显著。 第一步 统计假设 H0: = 0 第二步 计算统计量 2 75/ 25 330 300 / 0 = − = − = n x u u 查附表 2,即得 u 值对应的概率 p<0.05。表明 30Kg 差异属于试验误差的 概率小于 5%。 根据小概率事件实际不可能性原理,这个假设应被否定,即表面差异不全 为试验误差,新品系与原品种之间存在真实差异。 判定是否属小概率事件的概率值叫显著水平(significant level), 一 般以α表示。农业上常取 0.05 和 0.01。凡计算出的概率 p 小于α的事件即为 小概率事件。 统计上,当 1%<p ≤5%称所测差异显著,p ≤1%称差异极显著,p>5%称 差 异 不 显 著 , 所以 , 统 计 假 设测 验 又 叫 差异 显 著 性 测验 (difference significance test) 显著水平的选择应根据试验要求和试验结论的重要性而定。 第三步 统计推断 若│u│≤ 1.96,故 p>5% ,接受假设 H0,差异不显著。 若 2.58>│u│> 1.96,故 1%<p ≤5%,拒绝假设 H0,差异达显著。 若│u│> 2.58,故 p ≤1%,拒绝假设 H0,差异达极显著。 第四步 依题意写结论 上例 u=2>1.96,新品种产量显著高于当地品种。 四、统计假设测验的几何意义 α =0.01 时 ,由 附表 3 得 u=1.96 , 则 H0 : µ= µ0 的 接受 区域 为 ( ) ( ) x x 0 −1.96 x 0 + 图 5.1 5%显著水平假设测验图示(表示接受区域和否定区域)
否定区域为: 小麦品种例,0=300,a:=15,故H0:=40的95%接受区域为 (300-1.96×15Xx(300+1.96×15 即270.6((329.4 新品系试种的25个小区样本平均数x=330kg,落入接受区外,H0被否 定,与u测验结果一致。 有95%的把握认为新品系与原品种亩产量存在真实差异。(图5.1) 五、两尾测验和一尾测验 两尾检验H:4=山 H:μ≠4,它实际上包含了>0,μ<0两种情况,否定域为两尾,考 虑的概率为左右两尾概率之和。故叫两尾检验。 其目的在于判断μ与μ。有无差异,而不考虑谁大谁小。 学 当HO:u≤0,HA:>0,则否定区在x分布的右尾。 当HO:≥O,HA:μ<O,则否定区在x分布的左尾。 过 象这种在假设测验中所考虑的概率只用一尾概率的测验称为一尾测验 (one-tailed test)(图5.2)。 选用一尾测验还是两尾测验,应根据专业知识而定。 一般,若事先不知道谁大,为了检验μ与。是否有差异,则用两尾: 如据专业知识和经验,推测μ不会小于μ。或大小μ。时,应用一尾检验
5 教 学 过 程 否定区域为: 小麦品种例,µ0=300, x =15,故 H0: µ= µ0 的 95%接 受区域为 (300 −1.9615)x(300 +1.9615) 即 270.6 x329.4 新品系试种的 25 个小区样本平均数 x =330 ㎏,落入接受区外, H0 被否 定,与 u 测验结果一致。 有 95%的把握认为新品系与原品种亩产量存在真实差异。(图 5.1) 五、两尾测验和一尾测验 两尾检验 H0: = 0 HA: 0 ,它实际上包含了 µ>µ0, µ<µ0 两种情况,否定域为两尾,考 虑的概率为左右两尾概率之和。故叫两尾检验。 其目的在于判断μ与μ0有无差异,而不考虑谁大谁小。 当 H0: µ≤µ0, HA: µ>µ0,则否定区在 x 分布的右尾。 当 H0: µ≥µ0, HA: µ<µ0,则否定区在 x 分布的左尾。 象这种在假设测验中所考虑的概率只用一尾概率的测验称为一尾测验 (one-tailed test)(图 5.2)。 选用一尾测验还是两尾测验,应根据专业知识而定。 一般,若事先不知道 谁大,为了检验μ与μ0是否有差异,则用两尾; 如据专业知识和经验,推测μ不会小于μ0 或大小μ0时,应用一尾检验