第三章统计推断 §3.1统计学的基本概念。 前面两章中我们介绍了概率论的基本内容,包括古典概型的一些计算方法以及研究随机 现象的有力工具一一随机变量。从本章起,我们开始讨论统计学的核心内容,即如何从一些 包含有随机误差,又并不完全的信息中得出科学的、尽可能正确的结论。在一般情况下,所 谓信息就是从实验或调査中得到的数据,这些数据显然带有一些我们既无法控制、也无法避 免的误差。换句话说,即使我们尽可能保持所有条件都不改变,当你把实验重做一遍时,所 得到的结果总会或多或少有所不同,这就是随机误差的影响。至于信息的不完全性,这主要 是因为在一般情况下我们不可能把所有感兴趣的东西都拿来进行测定。例如要研究中国人的 体型或某种病的流行程度,我们不可能把全中国每个人都测量一番,或对每个人进行体检, 只能是按照某种事先确定好实验方案挑选一些人进行体检或测量。再比如希望对一批产品是 否合格作出判断时,常常也不能对每个产品均做检验,只能是抽査少数产品。在这些情况下, 我们获得的信息显然是不够完整的。如何从这些不完整的信息出发,对我们感兴趣的事物整 体作出尽可能正确的判断呢?这就是统计学要解决的主要问题。 一般来说,我们获得的信息所包含的不确定性,主要来自以下几个方面:(1)测量过程 引入的随机误差:(2)取样随机性所带来的变化,即由于只取少数样品测量,那么取这一批 样品的测量结果与取另外一批当然会有差别:(3)我们所关心的性质确实发生了某种变化 显然只有第三种改变才是我们所要检测的。统计学的任务就是在前两种干挠存在的情况下, 对第三种改变是否存在给出一个科学的结论。 另外需要注意的一点是统计学是可能发生错误的。由于据以作出统计判断的信息是不完 全的,有误差的,我们也就无法保证统计学结论是百分之一百地正确。这与它的科学性并不 矛盾,我们所面对的就是这样一个并不完美的世界,我们对这个世界的认识也只能是一种相 对正确的真理,我们只能在此基础上作出尽可能正确的结论。同时,统计学一般不仅给出结 论,而且给出这一结论的可靠性,即它是正确的可能性有多大。这样,我们就可以对一旦犯 错误所造成的损害进行某种控制。总之,对于需要从有误差的实验数据中得出结论的科学工 作者来说,统计学是一种不可或缺的工具 、统计推断的两种途径:假设检验与参数估计 作出统计判断的主要工具就是假设检验。它的基本思路是这样的:首先,根据需要判断 的目标建立一个统计假设,它的主要要求是一但我们对这一假设是否成立作出了结论,就应 该能够对所要判断的目标作出明确的回答;其次,根据所建立的统计假设,利用统计学知识 建立起一个理论分布,根据这一理论分布必须能计算出我们观察到的实验结果出现的可能性 有多大;第三步,是算出实验结果出现的可能性后,把这可能性与人为规定的一个标准( 般取为0.05,称为显著性水平)进行比较,如果可能性大于这一标准,则认为统计假设很可 能是对的,即接受统计假设:若可能性小于这一标准,说明在统计假设成立的条件下,观测 到这一实验结果的可能性很小。一般来说,一个小概率事件在一次观测中是不应出现的,而 现在它竟然出现了,一个合理的解释就是它实际上不是一个小概率事件,我们把它当作一个 小概率事件是因为我们的统计假设不对,因此所算出来的它出现的概率也不对。在这种情况 下,我们就应拒绝统计假设。这样,我们就根据实验结果对统计假设是否成立作出了判断, 从而也对我们要解决的目标作出了明确的回答。根据统计假设的类型,我们可以把假设检验 进一步分为参数检验和非参数检验。 统计的另一个重要功能就是作出参数估计。在实践中,我们常常希望对某些参数给出估 计值,例如农作物的产量,产品的合格率或使用寿命,人群中某种疾病的发病率,等等。统 计学也可根据抽样结果对这一类问题作出回答。答案一般有两种类型,一种是给出该参数可
第三章 统计推断 §3.1 统计学的基本概念。 前面两章中我们介绍了概率论的基本内容,包括古典概型的一些计算方法以及研究随机 现象的有力工具——随机变量。从本章起,我们开始讨论统计学的核心内容,即如何从一些 包含有随机误差,又并不完全的信息中得出科学的、尽可能正确的结论。在一般情况下,所 谓信息就是从实验或调查中得到的数据,这些数据显然带有一些我们既无法控制、也无法避 免的误差。换句话说,即使我们尽可能保持所有条件都不改变,当你把实验重做一遍时,所 得到的结果总会或多或少有所不同,这就是随机误差的影响。至于信息的不完全性,这主要 是因为在一般情况下我们不可能把所有感兴趣的东西都拿来进行测定。例如要研究中国人的 体型或某种病的流行程度,我们不可能把全中国每个人都测量一番,或对每个人进行体检, 只能是按照某种事先确定好实验方案挑选一些人进行体检或测量。再比如希望对一批产品是 否合格作出判断时,常常也不能对每个产品均做检验,只能是抽查少数产品。在这些情况下, 我们获得的信息显然是不够完整的。如何从这些不完整的信息出发,对我们感兴趣的事物整 体作出尽可能正确的判断呢?这就是统计学要解决的主要问题。 一般来说,我们获得的信息所包含的不确定性,主要来自以下几个方面:(1)测量过程 引入的随机误差;(2)取样随机性所带来的变化,即由于只取少数样品测量,那么取这一批 样品的测量结果与取另外一批当然会有差别;(3)我们所关心的性质确实发生了某种变化。 显然只有第三种改变才是我们所要检测的。统计学的任务就是在前两种干挠存在的情况下, 对第三种改变是否存在给出一个科学的结论。 另外需要注意的一点是统计学是可能发生错误的。由于据以作出统计判断的信息是不完 全的,有误差的,我们也就无法保证统计学结论是百分之一百地正确。这与它的科学性并不 矛盾,我们所面对的就是这样一个并不完美的世界,我们对这个世界的认识也只能是一种相 对正确的真理,我们只能在此基础上作出尽可能正确的结论。同时,统计学一般不仅给出结 论,而且给出这一结论的可靠性,即它是正确的可能性有多大。这样,我们就可以对一旦犯 错误所造成的损害进行某种控制。总之,对于需要从有误差的实验数据中得出结论的科学工 作者来说,统计学是一种不可或缺的工具。 一、统计推断的两种途径:假设检验与参数估计 作出统计判断的主要工具就是假设检验。它的基本思路是这样的:首先,根据需要判断 的目标建立一个统计假设,它的主要要求是一但我们对这一假设是否成立作出了结论,就应 该能够对所要判断的目标作出明确的回答;其次,根据所建立的统计假设,利用统计学知识 建立起一个理论分布,根据这一理论分布必须能计算出我们观察到的实验结果出现的可能性 有多大;第三步,是算出实验结果出现的可能性后,把这可能性与人为规定的一个标准(一 般取为 0.05,称为显著性水平)进行比较,如果可能性大于这一标准,则认为统计假设很可 能是对的,即接受统计假设;若可能性小于这一标准,说明在统计假设成立的条件下,观测 到这一实验结果的可能性很小。一般来说,一个小概率事件在一次观测中是不应出现的,而 现在它竟然出现了,一个合理的解释就是它实际上不是一个小概率事件,我们把它当作一个 小概率事件是因为我们的统计假设不对,因此所算出来的它出现的概率也不对。在这种情况 下,我们就应拒绝统计假设。这样,我们就根据实验结果对统计假设是否成立作出了判断, 从而也对我们要解决的目标作出了明确的回答。根据统计假设的类型,我们可以把假设检验 进一步分为参数检验和非参数检验。 统计的另一个重要功能就是作出参数估计。在实践中,我们常常希望对某些参数给出估 计值,例如农作物的产量,产品的合格率或使用寿命,人群中某种疾病的发病率,等等。统 计学也可根据抽样结果对这一类问题作出回答。答案一般有两种类型,一种是给出该参数可
能性最大的取值,这叫做点估计;另一种是给出一个区间,并给出指定参数落入这一区间的 概率,这叫做区间估计。参数估计与假设检验所依据的统计学理论其实是一样的,它们的区 别只是以不同形式给出结果而己。本章主要介绍统计推断的一般原理及对总体均值和方差进 行统计推断的方法。 统计学常用术语: 个体:可以单独观测和研究的一个物体,一定量的材料或服务。也指表示上述物体,材料或 服务的一个定量或定性的特性值 总体:一个统计问题中所涉及的个体的全体 特性:所考查的定性或定量的性质或指标。 总体分布:当个体理解为定量特性值时,总体中的每一个个体可看成是某一确定的随机变量 的一个观测值,称这个随机变量的分布为总体分布 样本:按一定程序从总体中抽取的一组(一个或多个)个体。 样本量:样本中所包含的个体数目 观测值:作为一次观测结果而确定的特性值。 统计量:样本观测值的函数,它不依赖于未知参数。例如: 样本均值:x=∑x 样本方差:S2= 样本协方差 Vi=) 样本k阶属点矩:∑x 样本k阶中心矩:∑(x1-x 分位数:对随机变量X,满足条件P(X≤xn)≥p的最小实数x称为X或其分布的P分位数。 几点说明: 1°对每次观察来说,样本是确定的一组数。但在不同的观察中,它会取不同的值。因此作 为一个整体,应把样本视为随机变量,也有自己的分布。样本全部可能值的集合称为样本 空间 2°样本的任何函数,只要不含有未知参数,都可称为统计量。例如x2+x2,x1-3都是统 计量,x1+x2一/不是统计量,因为μ,o是总体参数,一般是未知数。构造统 计量的目的是把样本中我们关心的信息集中起来以便加以检验,因此针对不同的问题需要 构造不同的统计量。 3°为了使样本能真正反映总体的特性,我们要求它有代表性和随机性。即要求样本中的每
能性最大的取值,这叫做点估计;另一种是给出一个区间,并给出指定参数落入这一区间的 概率,这叫做区间估计。参数估计与假设检验所依据的统计学理论其实是一样的,它们的区 别只是以不同形式给出结果而已。本章主要介绍统计推断的一般原理及对总体均值和方差进 行统计推断的方法。 二、统计学常用术语: 个体:可以单独观测和研究的一个物体,一定量的材料或服务。也指表示上述物体,材料或 服务的一个定量或定性的特性值。 总体:一个统计问题中所涉及的个体的全体。 特性:所考查的定性或定量的性质或指标。 总体分布:当个体理解为定量特性值时,总体中的每一个个体可看成是某一确定的随机变量 的一个观测值,称这个随机变量的分布为总体分布。 样本:按一定程序从总体中抽取的一组(一个或多个)个体。 样本量:样本中所包含的个体数目。 观测值:作为一次观测结果而确定的特性值。 统计量:样本观测值的函数,它不依赖于未知参数。例如: 样本均值: = = n i i x n x 1 1 样本方差: = − − = n i i x x n S 1 2 2 ( ) 1 1 样本协方差: = − − − n i i i x x y y n 1 ( )( ) 1 1 样本 k 阶原点矩: = n i K i x n 1 1 样本 k 阶中心矩: = − n i K i x x n 1 ( ) 1 分位数:对随机变量 X,满足条件 P(X≤xp)≥p 的最小实数 xp 称为 X 或其分布的 P 分位数。 几点说明: 1°对每次观察来说,样本是确定的一组数。但在不同的观察中,它会取不同的值。因此作 为一个整体,应把样本视为随机变量,也有自己的分布。样本全部可能值的集合称为样本 空间。 2°样本的任何函数,只要不含有未知参数,都可称为统计量。例如 , 1 3 2 2 2 x1 + x x − 都是统 计量,而 x x x , 2 1 2 − + 不是统计量,因为μ,σ是总体参数,一般是未知数。构造统 计量的目的是把样本中我们关心的信息集中起来以便加以检验,因此针对不同的问题需要 构造不同的统计量。 3°为了使样本能真正反映总体的特性,我们要求它有代表性和随机性。即要求样本中的每
个个体都具有与总体相同的分布,且每个个体相互独立。这样的样本称为简单随机样本 有限总体无放回抽样的样本不是相互独立的。但若总体个数N很大,且样本含量n<0.1N, 则可近似认为是简单随机样本 抽样分布 前已述及,统计检验过程中要构造统计量把样本中我们关心的信息集中起来,以便加以 检验;而这种检验主要是通过计算统计量取到观测值的可能性大小,并把这种可能性与指定 标准(即显著性水平)比较来进行的。为了计算这种可能性,我们就需要知道统计量所服从 的理论分布。由于这些理论分布的推导需要较多的数学知识,同时它们的分布函数和密度函 数的数学表达式也很复杂,对于生物系的同学来说,掌握推导过程和这些表达式也没有什么 实际用途,因此本书略去了这一部分,有兴趣的同学可参考概率论或数理统计的教科书,例 如复旦大学编写的教材《概率论》。 下面我们就介绍一些常用统计量的理论分布。如无特别说明,假设所有样本均抽自正态 总体 1.样本线性函数的分布: 若X,X2,…Xn为一简单随机样本,其总体分布为N(μ,σ2),统计量u为: u=a1X1+a2X2+…+anX 其中a1,a2,…,a为常数,则u也为正态随机变量,且 E()=4 (3.1) D()=a 显然若取a=-,=1,2…,n,则uX为样本均值。此时E(X)=H,D(X)=-a2。 2.x2分布 设X1,Ⅹ2…Xn相互独立,且同服从N(0,1),则称随机变量 (3.2) 所服从的分布为x2分布,记为Y~x2(n),n称为它的自由度 3.t分布 设Ⅹ~N(0,1),Y~x2(n),且X,Y互相独立,则称随机变量 所服从的分布为t分布,记为Ttn)。n称为它的自由度 4F分布 设X~x2(m),Y~x2(n),且互相独立,则称随机变量 F- /m (34) n 所服从的分布为F分布,记为F~F(mn),(m,n)称为它的自由度。 5.正态总体样本均值与方差的分布 这一定理及它的推论构成了本章主要内容的理论基础
个个体都具有与总体相同的分布,且每个个体相互独立。这样的样本称为简单随机样本。 有限总体无放回抽样的样本不是相互独立的。但若总体个数 N 很大,且样本含量 n<0.1N, 则可近似认为是简单随机样本。 三、抽样分布 前已述及,统计检验过程中要构造统计量把样本中我们关心的信息集中起来,以便加以 检验;而这种检验主要是通过计算统计量取到观测值的可能性大小,并把这种可能性与指定 标准(即显著性水平)比较来进行的。为了计算这种可能性,我们就需要知道统计量所服从 的理论分布。由于这些理论分布的推导需要较多的数学知识,同时它们的分布函数和密度函 数的数学表达式也很复杂,对于生物系的同学来说,掌握推导过程和这些表达式也没有什么 实际用途,因此本书略去了这一部分,有兴趣的同学可参考概率论或数理统计的教科书,例 如复旦大学编写的教材《概率论》。 下面我们就介绍一些常用统计量的理论分布。如无特别说明,假设所有样本均抽自正态 总体。 1.样本线性函数的分布: 若 X1,X2,……Xn 为一简单随机样本,其总体分布为 N(μ,σ2 ), 统计量 u 为: u=a1X1+a2X2+…+anXn , 其中 a1,a2,…,an 为常数,则 u 也为正态随机变量,且 = = = = n i i n i i D u a E u a 1 2 2 1 ( ) ( ) (3.1) 显然若取 ai= n 1 , i=1,2,…,n,则 u= X 为样本均值。此时 1 2 ( ) , ( ) n E X = D X = 。 2. χ2 分布: 设 X1,X2…Xn 相互独立,且同服从 N(0,1),则称随机变量 = = n i Y Xi 1 2 (3.2) 所服从的分布为χ2 分布,记为 Y~χ2(n), n 称为它的自由度。 3. t 分布: 设 X~N(0,1),Y~χ2(n),且 X,Y 互相独立,则称随机变量 Y n X T / = (3.3) 所服从的分布为 t 分布,记为 T~t(n)。n 称为它的自由度。 4. F 分布 设 X~χ2(m),Y~χ2(n),且互相独立,则称随机变量 Y n X m F / / = (3.4) 所服从的分布为 F 分布,记为 F~F(m,n), (m,n)称为它的自由度。 5. 正态总体样本均值与方差的分布。 这一定理及它的推论构成了本章主要内容的理论基础
定理:若X1,X2…Xn为抽自总体N(μ,σ2)的简单随机样本,定义样本均值为 X X,,样本方差为:S (x-X),则有 (1)X与S2相互独立; (2)X~N(4,a2) (3.5) (3)(n-1)S2/o2~x2(n-1) (3.6) 推论1:统计量 X t(n-1) (3.7) 推论2:若X,X2…Xm为取自总体N(12a2)的样本,Y1,Y2…Yn为取自总体N(2,a2) 的样本,且它们互相独立,则 (m-1,n-1) 其中S12,S2分别为X1,…,Xm,Y1,…,Yn的样本方差 推论3:在推论2的条件下,若01=02,则: (X-1)-(1-12) ~l(m+n-2) (3.9) (m-1)+(n-1) 几点说明 1°有些书上样本方差定义为: (X1-X)2 我们的定义为: (x,-X) n-1 这是因为可证明E(S2)=02,而E(S2) 2°E(S2)=02,但E(S)≠o。这可用反证法证明如下 若E(S)=0,由方差定义,有 D(S)=E(S2)-(E(S) 0 这意味着S是一个常量,永不改变。这显然不可能。所以假设E(S)=0不成立 3°(3.3)式和(3.7)式中的n有不同的统计学意义。(3.3)式中的n是Y的自由度,而(3.7) 式中S2表达式已将它的自由度n1除掉了,此地除以√n是因为S2是总体方差估计值,而 X的方差为总体方差的1/n倍,因此使用(3.7)式才能将X标准化
定理:若 X1,X2…Xn 为抽自总体 N(μ,σ2)的简单随机样本,定义样本均值为: = = n i Xi n X 1 1 ,样本方差为: 2 1 2 ( ) 1 1 = − − = n i Xi X n S ,则有: (1) X 与 S 2 相互独立; (2) X ~N( 1 2 , n ) (3.5) (3)(n-1)S 2 /σ2 ~χ2 (n-1)。 (3.6) 推论 1:统计量 ~ ( 1) / − − = t n S n X T (3.7) 推论 2:若 X1,X2,…,Xm为取自总体 N ( , ) 2 1 1 的样本,Y1,Y2…Yn 为取自总体 N( 2 2 2 , ) 的样本,且它们互相独立,则: ~ ( 1, 1) 2 1 2 2 2 2 2 1 = F m − n − S S F (3.8) 其中 S1 2 , S2 2 分别为 X1,…,Xm,Y1,…,Yn 的样本方差。 推论 3:在推论 2 的条件下,若σ1=σ2,则: ~ ( 2) ) 1 1 ( ( 1) ( 1) ( 1) ( 1) ( ) ( ) 2 2 2 1 1 2 + − + − + − − + − − − − = t m n m n m n m S n S X Y T (3.9) 几点说明: 1°有些书上样本方差定义为: = = − n i n Xi X n S 1 2 2 ( ) 1 我们的定义为: ( ) = − − = n i Xi X n S 1 2 2 1 1 这是因为可证明 E(S 2)=σ2,而 E( 2 n S )= 1 2 n n − 。 2°E(S 2)=σ 2,但 E(S)≠σ。这可用反证法证明如下: 若 E(S)=σ,由方差定义,有: D(S)=E(S 2)-(E(S))2 =σ2 -σ2 = 0 这意味着 S 是一个常量,永不改变。这显然不可能。所以假设 E(S)=σ不成立。 3°(3.3)式和(3.7)式中的 n 有不同的统计学意义。(3.3)式中的 n 是 Y 的自由度,而(3.7) 式中 S 2 表达式已将它的自由度 n-1 除掉了,此地除以 n 是因为 S 2 是总体方差估计值,而 X 的方差为总体方差的 1/n 倍,因此使用(3.7)式才能将 X 标准化
§3.2假设检验的基本方法与两种类型的错误 在我们从一道例题入手,看看假设检验的基本做法和其中所涉及的一些理论性问题 例3.1某地区10年前普查时,13岁男孩子平均身高为1.51m,现抽查200个12.5岁到13.5 岁男孩,身高平均值为1.53m,标准差0.073m,问10年来该地区男孩身高是否有明显增 分析:从题目知10年前总体均值μ1=1.51m。现在抽取200个个体,得样本均值X=153m 样本标准差S=0.073m。现在总体均值μ未知。题目要求判断μ>μ1是否成立。 解决方法:先假设μ=μ1=1.51m。再看从这样一个总体中抽出一个n=200,X=153 S=0.073的样本的可能性有多大?如果这可能性很大,我们只能认为μ与μ1差别不大,即 μ=μ很可能成立。反之若可能性很小,则说明在假设μ=u1成立的条件下,抽出这样一个 样本的事件是一个小概率事件。小概率事件在一次观察中是不应发生的,但它现在发生了 一个合理的解释就是它本不是小概率事件,是我们把概率算错了。而算错的原因就是我们在 一开始就做了一个错误的假设μ=μ1。换句话说,此时我们应该认为μ>μ1,即男孩身高有 明显增长。这就是假设检验的基本思路。 按这一思路解题,首先需要明确以下几个问题 1°假设的建立。 零假设:记为H,针对要考查的内容提出。本例中可为:H6:μ=151。它通常为一个数值, 或一个半开半闭区间(例如可能为H:u≤151)。原则为:a)通过统计检验决定接受或拒绝 H后,可对问题作出明确回答;b)要能根据H建立统计量的理论分布。 备择假设:记为H,是除H外的一切可能值的集合。这里强调一切可能值是因为检验只能 判断H是否成立,若不成立则必须是H。H通常是一个区间。例如当H取为μ=151时, H应取为u≠151。此时若有理由认为μ>151或μ<151不可能出现,也可只取H为可能出 现的一半,即μ<151或μ冮151,这样可提高检验精度(原因参见单侧与双侧检验)。当H 取为μ≥151或μ≤151时,H则应相应取为μ<151或μ151。原则为:a)应包括除H外 的一切可能值:b)如有可能,应缩小备择假设范围以提高检验精度 2°小概率原理:小概率事件在一次观察中不应出现。这是一切统计检验的理论基础 注意:小概率事件不是不可能事件。观察次数多了,它迟早会出现。因此“一次”这个词是 重要的 3°两种类型的错误:统计量是随机变量,它的取值受随机误差等因素的影响,是可以变化 的。我们根据它作出的决定也完全可能犯错误。这一点无法绝对避免。统计上犯的错误可分 为以下两类 第一类错误:H正确,却被拒绝。又称弃真。犯这种错误的概率记为α。 第二类错误:H错误,却被接受。又称存伪。犯这种错误的概率记为β 两类错误的关系可用图3.1说明:
§3.2 假设检验的基本方法与两种类型的错误 现在我们从一道例题入手,看看假设检验的基本做法和其中所涉及的一些理论性问题。 例 3.1 某地区 10 年前普查时,13 岁男孩子平均身高为 1.51m,现抽查 200 个 12.5 岁到 13.5 岁男孩,身高平均值为 1.53m,标准差 0.073m,问 10 年来该地区男孩身高是否有明显增 长? 分析:从题目知 10 年前总体均值μ1=1.51m。现在抽取 200 个个体,得样本均值 X = 1.53 m, 样本标准差 S=0.073m。现在总体均值μ未知。题目要求判断μ>μ1 是否成立。 解决方法:先假设μ=μ1=1.51m。再看从这样一个总体中抽出一个 n=200, X = 153, S=0.073 的样本的可能性有多大?如果这可能性很大,我们只能认为μ与μ1 差别不大,即 μ=μ1 很可能成立。反之若可能性很小,则说明在假设μ=μ1 成立的条件下,抽出这样一个 样本的事件是一个小概率事件。小概率事件在一次观察中是不应发生的,但它现在发生了, 一个合理的解释就是它本不是小概率事件,是我们把概率算错了。而算错的原因就是我们在 一开始就做了一个错误的假设μ=μ1。换句话说,此时我们应该认为μ>μ1,即男孩身高有 明显增长。这就是假设检验的基本思路。 按这一思路解题,首先需要明确以下几个问题: 1°假设的建立。 零假设:记为 H0,针对要考查的内容提出。本例中可为:H0: μ=151。它通常为一个数值, 或一个半开半闭区间(例如可能为 H0:u≤151)。原则为:a)通过统计检验决定接受或拒绝 H0 后,可对问题作出明确回答;b)要能根据 H0 建立统计量的理论分布。 备择假设:记为 HA,是除 H0 外的一切可能值的集合。这里强调一切可能值是因为检验只能 判断 H0 是否成立,若不成立则必须是 HA。HA 通常是一个区间。例如当 H0 取为 μ=151 时, HA 应取为μ≠151。此时若有理由认为μ>151 或μ<151 不可能出现,也可只取 HA 为可能出 现的一半,即μ<151 或μ>151,这样可提高检验精度(原因参见单侧与双侧检验)。当 H0 取为μ≥151 或μ≤151 时,HA 则应相应取为μ<151 或μ>151。原则为:a)应包括除 H0 外 的一切可能值;b)如有可能,应缩小备择假设范围以提高检验精度。 2°小概率原理:小概率事件在一次观察中不应出现。这是一切统计检验的理论基础。 注意:小概率事件不是不可能事件。观察次数多了,它迟早会出现。因此“一次”这个词是 重要的。 3°两种类型的错误:统计量是随机变量,它的取值受随机误差等因素的影响,是可以变化 的。我们根据它作出的决定也完全可能犯错误。这一点无法绝对避免。统计上犯的错误可分 为以下两类: 第一类错误:H0 正确,却被拒绝。又称弃真。犯这种错误的概率记为α。 第二类错误:H0 错误,却被接受。又称存伪。犯这种错误的概率记为β。 两类错误的关系可用图 3.1 说明: