(2)确定检验统计量 1有了两个假设,就要根据数据来对它们进行判断 选择适当的统计量,并在原假设H成立的条件下确 定该统计量的分布 (3)确定显著性水平a ◇根据样本所得的数据来拒绝零假设的概率应小于 005,当然也可能是0.01,0.005,0.001等 等 ◇根据统计量的分布查表,确定对应于α的临界值. 2021/2/22 6 cxt
2021/2/22 6 cxt (2)确定检验统计量 1 有了两个假设,就要根据数据来对它们进行判断: 选择适当的统计量,并在原假设H0成立的条件下确 定该统计量的分布。 (3)确定显著性水平α ❖ 根据样本所得的数据来拒绝零假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 , 0.001 等 等。 ❖ 根据统计量的分布查表,确定对应于α的临界值
今显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error) ◆有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type I error)。 2021/2/22 cxt
2021/2/22 7 cxt ❖ 显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error )。 ❖ 有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type II error )
(4)计算检验统计量的值并进行判断 ◆根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H作出判断 值)和根据这个实现值计算冷令(t值或F 根据数据计算检验统计量的实现亻 如果口-值小于或等于a,就拒绝零假设,这 时犯错误的概率最多为a;如果p-值大于a, 就不拒绝零假设,因为证据不足。 2021/2/22 8 cxt
2021/2/22 8 cxt (4)计算检验统计量的值并进行判断 ❖ 根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H0作出判断. ❖ 根据数据计算检验统计量的实现值( t 值或F 值)和根据这个实现值计算 p值 ❖ 如果p - 值小于或等于α,就拒绝零假设,这 时犯错误的概率最多为α;如果p - 值大于α, 就不拒绝零假设,因为证据不足
令实际上,多数计算机软件仅仅给出卩-值,而不给 出a。这有很多方便之处。比如a=0.05,而假 定所得到的p-值等于0001。这时如果采用p 值作为新的显著性水平,即新的a=0.001;于是 就可以说,在显著性水平为0.001时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 而不是旧的a所表明的百分之五。 令在这个意义上,卩-值又称为观测的显著性水平 observed significant level 1)。在统计软件输 significant的缩写“Sig”ae”,有的用 出尸-值的位置,有的用 2021/2/22 cxt
2021/2/22 9 cxt ❖ 实际上,多数计算机软件仅仅给出 p - 值,而不给 出 α 。这有很多方便之处。比如 α= 0.05 ,而假 定所得到的 p - 值等于 0.001 。这时如果采用 p - 值作为新的显著性水平,即新的 α= 0.001 ;于是 就可以说,在显著性水平为 0.001 时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 一而不是旧的 α 所表明的百分之五。 ❖ 在这个意义上, p - 值又称为观测的显著性水平 ( observed significant level )。在统计软件输 出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的缩写 “Sig
◇3.关于“临界值”的问题: ◆过去的统计教科书中,使用临界值的概念进行假设 检验,不计算卩-值。只比较统计量的取值和临界 值的大小。使用临界值而不是ρ-值来判断拒绝与 否是前计算机时代的产物。当时计算尸-值不易 只采用临界值的概念。 ◇现在计算机软件一般都不给出和口临界值,但都给 出口-值和统计量的实现值,让用户自己决定显著 性水平是多少。 2021/2/22 10 cxt
2021/2/22 10 cxt ❖ 3 .关于 “ 临界值 ” 的问题: ❖ 过去的统计教科书中,使用临界值的概念进行假设 检验,不计算p - 值。只比较统计量的取值和临界 值的大小。使用临界值而不是p - 值来判断拒绝与 否是前计算机时代的产物。当时计算p - 值不易, 只采用临界值的概念。 ❖ 现在计算机软件一般都不给出α和临界值,但都给 出p - 值和统计量的实现值,让用户自己决定显著 性水平是多少