2、当随机变量x取某一特定值时,其概率等于0;即 P(x=c)= f(x)dx=0 (c为任意实数) 因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个 值的概率。 3、在一次试验中随机变量x之取值必在-∞<x<+∞范围内,为一必然事件。所以 P(-∞<x<+∞)=f(x)dx=l (4-5)式表示分布密度曲线下、横轴上的全部面积为1。 第三节正态分布 正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从 或近似服从正态分布的,如家畜的体长、体重、产奶量、产毛量、血红蛋白含量、血糖含 量等。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布 在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还 是实际应用中,均占有重要的地位。 、正态分布的定义及其特征 (一)正态分布的定义若连续型随机变量x的概率分布密度函数为 f(x) 其中μ为平均数,02为方差,则称随机变量x服从正态分布( normal distribution),记为x N(μ,2)。相应的概率分布函数为 dx (4-17) 分布密度曲线如图42所示。 f(x) 图4—2正态分布密度曲线
37 2、当随机变量x取某一特定值时,其概率等于0;即 = = = c c P(x c) f (x)dx 0 (c为任意实数) 因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个 值的概率。 3、在一次试验中随机变量x之取值必在-∞<x<+∞范围内,为一必然事件。所以 ( ) ( ) 1 + − P − x + = f x dx = (4-5) (4—5)式表示分布密度曲线下、横轴上的全部面积为1。 第三节 正态分布 正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从 或近似服从正态分布的,如家畜的体长、体重、产奶量、产毛量、血红蛋白含量、血糖含 量等。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布 在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还 是实际应用中,均占有重要的地位。 一、正态分布的定义及其特征 (一) 正态分布的定义 若连续型随机变量x的概率分布密度函数为 2 2 2 ( ) 2 1 ( ) − − = x f x e (4-16) 其中μ为平均数,σ2为方差,则称随机变量x服从正态分布(normal distribution),记为x~ N(μ,σ 2 )。相应的概率分布函数为 − − − = x x F x e dx 2 2 2 ( ) 2 1 ( ) (4-17) 分布密度曲线如图4—2所示。 图 4—2 正态分布密度曲线
(二)正态分布的特征由(-6)式和图4-2可以看出正态分布具有以下几个重要 特征: 1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=u; 2、f(x)在x=u处达到极大,极大值f() G√2r 3、f(x)是非负函数,以x轴为渐近线,分布从-∞至+∞; 4、曲线在x=μ土σ处各有一个拐点,即曲线在(-∞,μ-0)和(μ+0,+∞)区间上是 下凸的,在[μ-0,μ+0]区间内是上凸的 5、正态分布有两个参数,即平均数μ和标准差σ。μ是位置参数,如图4-3所示。当 恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。0 是变异度参数,如图4—4所示。当μ恒定时,0愈大,表示x的取值愈分散,曲线愈“胖”; 愈小,x的取值愈集中在μ附近,曲线愈“瘦 6、分布密度曲线与横轴所夹的面积为1,即 P(-∞<x<+∞) x=1 0=2 uuμ 图4-30相同而μ不同的三个正态分布图4-4u相同而0不同的三个正态分 、标准正态分布 由上述正态分布的特征可知,正态分布是依赖于参数μ和σ2(或0)的一簇分布,正 态曲线之位置及形态随μ和2的不同而不同。这就给研究具体的正态总体带来困难,需 将一般的N(μ,o2)转换为μ=0,o2=1的正态分布。我们称μ=0,o2=1的正态分布为标准 正态分布( standard normal distribution)。标准正态分布的概率密度函数及分布函数分别 记作中叫和中叫,由(4-6)及(4-7)式得 P(u) (4-8) 中() d 随机变量u服从标准正态分布,记作u~N(0,1),分布密度曲线如图4-5所
38 (二) 正态分布的特征 由(4—6)式和图4—2可以看出正态分布具有以下几个重要 特征: 1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=μ; 2、f(x)在x=μ处达到极大,极大值 2 1 f ( ) = ; 3、f(x)是非负函数,以x轴为渐近线,分布从-∞至+∞; 4、曲线在x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞) 区间上是 下凸的,在[μ-σ,μ+σ]区间内是上凸的; 5、正态分布有两个参数,即平均数μ和标准差σ。μ是位置参数,如图4—3所示。 当 σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。σ 是变异度参数,如图4—4所示。当μ恒定时,σ愈大,表示x的取值愈分散, 曲线愈“胖”; σ愈小,x的取值愈集中在μ附近,曲线愈“瘦”。 6、分布密度曲线与横轴所夹的面积为1,即: 1 2 1 ( ) 2 2 2 ( ) − + = = − + − − P x e dx x 二、标准正态分布 由上述正态分布的特征可知,正态分布是依赖于参数μ和σ2 (或σ)的一簇分布, 正 态曲线之位置及形态随μ和σ2的不同而不同。这就给研究具体的正态总体带来困难, 需 将一般的N(μ,σ2 )转换为μ=0,σ2 =1的正态分布。我们称μ=0,σ2 =1的正态分布为标准 正态分布(standard normal distribution)。标准正态分布的概率密度函数及分布函数分别 记作ψ(u)和Φ(u),由 (4-6)及(4-7) 式得: 2 2 2 1 ( ) u u e − = (4-8) u e du u u − − = 2 2 1 2 1 ( ) (4-9) 随机变量u服从标准正态分布,记作u~N(0,1),分布密度曲线如图4—5所示。 图 4—3 σ相同而μ不同的三个正态分布 图4—4 μ相同而σ不同的三个正态分 布
图4-5标准正态分布密度曲线 对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换 将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差 (standard normal deviate) 按(4-9)式计算,对不同的u值编成函数表,称为正态分布表,见附表1,从中可查到a 在意一个区间内取值的概率。这就给解决不同μ、的正态分布概率计算问题带来很大 方便 三、正态分布的概率计算 关于正态分布的概率计算,我们先从标准正态分布着手。这是因为,一方面标准正态 分布在正态分布中形式最简单,而且任意正态分布都可化为标准正态分布来计算:另一方 面,人们已经根据标准正态分布的分布函数编制成正态分布表(附表)以供直接查用 )标准正态分布的概率计算设u服从标准正态分布,则u在[u,2]内取值的概 率为: P(1≤l<l2) du e 2 du- 2 √2丌 d (4-11) 而Φ(au)与Φ(u)可由附表1查得。 附表1只对于-4.99≤u<4.99给出了Φ(u)的数值。表中,u值列在第一列和第一行, 第一列列出u的整数部分及小数点后第一位,第一行为u的小数点后第二位数值。例如 F=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行与0.05所在列相交处 的数值为0.95994,即Φ(1.75)=0.95994。有时会遇到给定Φ(u)值,例如Φ(a)=0.284,反 过来查值。这只要在附表1中找到与0.284最接近的值0.2843,对应行的第一列数-0.5,对 应列的第一行数值0.07,即相应的u值为F-0.57,亦即Φ(-0.57)=0.284。如果要求更精 确的u值,可用线性插值法计算 表中用了象.02336,.937674这种写法,分别是0.0002326和0.9997674的缩写,0表示 连续3个0,9表示连续3个9。 由(4-1)式及正态分布的对称性可推出下列关系式,再借助附表1,便能很方便地 计算有关概率
39 对于任何一个服从正态分布N(μ,σ2 )的随机变量x,都可以通过标准化变换: u=(x-μ)/σ (4-10) 将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差 (standard normal deviate)。 按(4-9)式计算,对不同的u值编成函数表,称为正态分布表,见附表1,从中可查到u 在意一个区间内取值的概率。这就给解决不同μ、σ 2的正态分布概率计算问题带来很大 方便。 三、正态分布的概率计算 关于正态分布的概率计算,我们先从标准正态分布着手。这是因为,一方面标准正态 分布在正态分布中形式最简单,而且任意正态分布都可化为标准正态分布来计算;另一方 面,人们已经根据标准正态分布的分布函数编制成正态分布表(附表1)以供直接查用。 (一) 标准正态分布的概率计算 设u服从标准正态分布,则u在[u1,u2]内取值的概 率为: P u u u e du e du e du u u u u u u u − − − − − = = − 1 2 2 2 2 1 2 2 1 2 1 2 1 1 2 2 1 2 1 2 1 ( ) =Φ(u2)-Φ(u1) (4-11) 而Φ(u1)与Φ(u2)可由附表1查得。 附表1只对于-4.99≤u<4.99给出了Φ(u)的数值。 表中,u值列在第一列和第一行, 第一列列出u的整数部分及小数点后第一位, 第一行为u的小数点后第二位数值 。例如, u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行与0.05 所在列相交处 的数值为0.95994,即Φ(1.75)=0.95994。有时会遇到给定Φ(u)值,例如Φ(u)=0.284, 反 过来查u值。这只要在附表1中找到与0.284最接近的值0.2843,对应行的第一列数-0.5,对 应列的第一行数值0.07,即相应的u值为u=-0.57,亦即Φ(-0.57)=0.284。如果要求更精 确的u值,可用线性插值法计算。 表中用了象.03 2336,.93 7674这种写法,分别是0.0002326和0.9997674的缩写,0 3表示 连续3个0,9 3表示连续3个9。 由(4-11) 式及正态分布的对称性可推出下列关系式,再借助附表1, 便能很方便地 计算有关概率: 图4—5 标准正态分布密度曲线