§3.5随机变量的数字特征、契贝晓夫有等式 我们已经知道离散型随机变量5的数学期望为 B5-2xP5=x) 现在,自然要问连续型随机变量的数学期望是什么?我们就来讨论这个问题。 设5是一个连续型随机变量,密度函数为p(x),取分点: Xo<1<Xn+ 则随机变量落在Ax=(X1,X41)中的概率为 p(x)ds 当△x,相当小时,就有 P(5eAx)≈px)Ax,0,l,…,n 这时,分布列为 X。 px)Ar,p(s,)Ar,Ps.)ar 的离散型随机变量可以看作是5的一种近似,而这个离散型随机变量的数学期望为 x,P(x,)Ax, 它近似地表达了连续型随机变量二的平均值。当分点愈密时,这种近似也就愈好,由数学 分析上述和式以积分 xp(x)ds 为极限,因而我们有下述定义。 定义3.7设5是一个连续型随机变量,密度函数为p(x),当 xp(x)< 时,称5的数学期望存在,且
§3.5 随机变量的数字特征、契贝晓夫有等式 我们已经知道离散型随机变量 的数学期望为 E = ( ) 1 i n i i x P = x = 现在,自然要问连续型随机变量的数学期望是什么?我们就来讨论这个问题。 设 是一个连续型随机变量,密度函数为 p(x) ,取分点: x 0 <x 1 <…<x n+1 则随机变量落在 i x =(x 1 ,x i+1 )中的概率为 P ( ∈ i x )= +1 ( ) i i x x p x dx 当 i x 相当小时,就有 P ( ∈ i x ) ( ) i p x i x ,i=0,1, …,n 这时,分布列为 [ 0 0 0 p(x ) x x 1 1 1 p(x ) x x n n n p x x x ( ) ] 的离散型随机变量可以看作是 的一种近似,而这个离散型随机变量的数学期望为 i i n i i x P x x = ( ) 1 它近似地表达了连续型随机变量 的平均值。当分点愈密时,这种近似也就愈好,由数学 分析上述和式以积分 − xp(x)dx 为极限,因而我们有下述定义。 定义 3.7 设 是一个连续型随机变量,密度函数为 p(x) ,当 − | x | p(x)dx 时,称 的数学期望存在,且
Bi-xp(x)dx (3.61) 这里要求|xp(x)k<o0的理由与离散型时要求立1x,P(5=x)<0 的理由是相同的。同离散型情形一样,连续型随机变量5的数学期望E5是5的可能取值 (关于概率)的平均。 例3.17设5在品b上均匀分布,求E5 解由例3.1己知5的密度函数为 1 ,a≤x≤b p(x)=b-a 0,其他 故 这个结果是显然的。因为5在品,b]上均匀分布,它取值的平均值当然应该在[品b)的 中间,也就是a+b。 例3.18(略) 例3.19(略) 例3.20(略) 定理32若5是一个连续型随机变量,密度函数为p(x),又f(x)是实变量x的函 数,且 [lf(x)I p(x)dx<o 则有 Ef)-广fx)p(x)k (3.65) 如果(x)满足定理3.1的条件,那么利用定理3.1即可证明定理。对多维情形也有类 似的定理,仍以二维为例,有 定理3.3设(5,)是二维连续型随机变量,密度函数为p(x,y),又f(x,y)是二元 函数,则随机变量5=f(5,)的数学期望为
E = − xp(x)dx (3.61) 这里要求 − | x | p(x)dx 的理由与离散型时要求 = = | | ( ) 1 i n i i x P x 的理由是相同的。同离散型情形一样,连续型随机变量 的数学期望 E 是 的可能取值 (关于概率)的平均。 例3.17 设 在[a, b]上均匀分布,求 E 解 由例 3.1 已知 的密度函数为 p(x)= − 0,其他 , 1 a x b b a 故 E = − a b dx b a x 1 = 2 | 2 1 2 x a b b a b a + = − 这个结果是显然的。因为 在[a, b]上均匀分布,它取值的平均值当然应该在[a, b]的 中间,也就是 2 a + b 。 例 3.18(略) 例 3.19(略) 例 3.20(略) 定理 3.2 若 是一个连续型随机变量,密度函数为 p(x) ,又 f (x) 是实变量 x 的函 数,且 − | f (x) | p(x)dx 则有 E f ( ) = − f (x) p(x)dx (3.65) 如果 f (x) 满足定理 3.1 的条件,那么利用定理 3.1 即可证明定理。对多维情形也有类 似的定理,仍以二维为例,有 定理 3.3 设 (,) 是二维连续型随机变量,密度函数为 p(x, y) ,又 f (x, y) 是二元 函数,则随机变量 = f ( ,) 的数学期望为
E5=Ef5,n=广f(x.y)p(,.ykd (3.66) 这里,当然也要求上述积分为绝对收敛 如同离散型随机变量,连续型随机变量的数学期望也具有下述性质: (1)若,则存在a≤5≤b,且a≤E5≤b: (2)对任一二维连续型随机变量(5,),若存在B5、E),则对任意的实数k1、k2, E(k5+k2门)存在且 E(k15+k2刀)=kE5+k,E7 (3.67) (3)又若5、刀相互独立,则E51存在且 E(n)=En (3.68) 这些性质的证明也与离散型场合相同只要把那里的和号“∑”换成积分号“「”,并把 分布列换成密度函数就可了,我们把它留给读者作为一个练习 接下米读者大概会想到应该讨论连续型随机变量的方差了。 正是如此,在前一章中已经知道E(5-E5)2可衡量随机变量5离开它的均值E(5) 的平均偏离程度,因而我们理所当然地有下述定义。 定义3.8若5是一个随机变量,又E(5-E5)2存在,则称E(5-E5)2是随机变 量5的方差,记作D5或5,并称√D5是5的根方差或标准差。 如果5的密度函数为p(x),则由前述的,有 D5-E(5-E5)2=广(x-E5}px) -[x2-2x·E5+(E)]px)d =x产px)dk-2B5.广xx)dt+(E) ▣c52-B5)2 (3.69 这一关系也是意料中的。因为它与离散型情形完全相同。 例3.21(略) 例3.22(略) 例3.23(略)
E = E f ( ,) = − − f (x, y) p(x, y)dxdy (3.66) 这里,当然也要求上述积分为绝对收敛。 如同离散型随机变量,连续型随机变量的数学期望也具有下述性质: (1)若,则存在 a≤ ≤b,且 a≤E ≤b; (2)对任一二维连续型随机变量 (,) ,若存在 E 、E ,则对任意的实数 1 k 、 2 k , E( 1 k + 2 k )存在且 E( 1 k + 2 k )= 1 k E + 2 k E (3.67) (3)又若 、 相互独立,则 E 存在且 E( )=E ·E (3.68) 这些性质的证明也与离散型场合相同只要把那里的和号“ ”换成积分号“ ”,并把 分布列换成密度函数就可了,我们把它留给读者作为一个练习。 接下来读者大概会想到应该讨论连续型随机变量的方差了。 正是如此,在前一章中已经知道 E( − E ) 2 可衡量随机变量 离开它的均值 E( ) 的平均偏离程度,因而我们理所当然地有下述定义。 定义 3.8 若 是一个随机变量,又 E( − E ) 2 存在,则称 E( − E ) 2 是随机变 量 的方差,记作 D 或 Var ,并称 D 是 的根方差或标准差。 如果 的密度函数为 p(x) ,则由前述的,有 D =E( − E ) 2 = − (x − E ) p(x)dx 2 = − [x − 2x E + (E ) ]p(x)dx 2 2 = − x p(x)dx 2 –2E ﹒ 2 xp(x)dx + (E) − = c 2 -(E ) 2 (3.69) 这一关系也是意料中的。因为它与离散型情形完全相同。 例 3.21(略) 例 3.22(略) 例 3.23(略)
我们知道方差反映了随机变量离开数学期望的平均偏离程度。如果随机变量为5,数 学期望为E5,方差为D5,那么对任意的大于零的常数B,事件(|5-E5|≥E)发 生的概率P(5-E5|≥£)应该与D5有一定的关系。粗糙地说,如果D5愈大,那么 P(|5B5|≥B)也会大一些,把这个直觉严格化,就是下面著名的契贝晓夫不等式,我 们把它写成定理的形式。 定理3,4对任意的随机变量5,若B5=,又D5存在,则对任意的正常数£,有 A15E51≥E2器 (3.71) 在契贝晓夫不等式给出的估计中,只需要知道数学期望E5及方差D5两个数字特征就够 了,因而使用起来是比较方便的。但是也正因为它没有完整地用到随机变量的统计规律一分 布函数或密度函数,所以一般来说,它给出的估计是比较粗的。例如,若5是4,σ) 分布的随机变量,则由不等式(3.71)可得估计 P(l5-a≥3o)≤ 品器0n 而的§32的(3.71)己经指出 P15-a|≤30)≈0.997 故有 P|5-al≥30)≈0.003 比较这两者的结果,可知契贝晓夫不等式给出的估计的确是粗糙一些。利用契贝晓夫不等式 可以证明下列事实:随机变量5的方差D5-0的充要条件是5取某个常数值的概率为1 (证明略),即 P(5=a)=1 (3.72) 离散型时方差所具有的性质,连续型时也同样具有。例如有 (1)若C是常数,则D(C5)=C2D52 (3.73) (2)对任意的常数C≠E5,有 D5E(5-C)2 (374) (3)若是D5、E5两个相互独立的连续型随机变量,且D5、D存在,则有
由定义我们不难知道,正态分布中的参数 ,正好是服从该分布的随机变量的标准差, 于是正态分布由它的数学期望及标准差唯一确定。 我们知道方差反映了随机变量离开数学期望的平均偏离程度。如果随机变量为 ,数 学期望为 E ,方差为 D ,那么对任意的大于零的常数 ,事件(| -E |≥ )发 生的概率 P(| -E |≥ )应该与 D 有一定的关系。粗糙地说,如果 D 愈大,那么 P(| -E |≥ )也会大一些,把这个直觉严格化,就是下面著名的契贝晓夫不等式,我 们把它写成定理的形式。 定理 3.4 对任意的随机变量 ,若 E =a,又 D 存在,则对任意的正常数 ,有 P(| -E |≥ )≤ 2 D (3.71) 在契贝晓夫不等式给出的估计中,只需要知道数学期望 E 及方差 D 两个数字特征就够 了,因而使用起来是比较方便的。但是也正因为它没有完整地用到随机变量的统计规律―分 布函数或密度函数,所以一般来说,它给出的估计是比较粗的。例如,若 是 N( 2 , ) 分布的随机变量,则由不等式(3.71)可得估计 P(| -a|≥ 3 )≤ 2 (3 ) D = 9 1 0.11 而的§3.2 的(3.71)已经指出 P(| -a|≤ 3 ) 0。997 故有 P(| -a|≥ 3 ) 0.003 比较这两者的结果,可知契贝晓夫不等式给出的估计的确是粗糙一些。利用契贝晓夫不等式 可以证明下列事实:随机变量 的方差 D =0 的充要条件是 取某个常数值的概率为 1 (证明略),即 P( =a)=1 (3.72) 离散型时方差所具有的性质,连续型时也同样具有。例如有 (1)若 C 是常数,则 D(C )= C 2 D 2 (3.73) (2)对任意的常数 C E ,有 D <E 2 ( −C) (3.74) (3)若是 D 、E 两个相互独立的连续型随机变量,且 D 、D 存在,则有
D(5+7)=D5+Dn (3.75) 这些性质的证明与离散型情形是相同的,这里不再作进一步的叙述。 对二维随机变量(5,)来说,数学期望E5、E)只反映了5与)各自的平均值,方 差D5、D1只反映了5与各自离平均值的偏离程度,它们对5与之间相互联系不提 供任何信息。前面己经指出,二维随机变量(5,)的密度函数pX,y)或分布列P)全面地描 述了(5,)的统计规律,其中包含有5与刀相互联系的内容。如同数学期望和方差一样, 当然也希望有一个数字特征能够在一定程度上反映这种联系。现在我们已经发现当5与门 相互独立时,有 E(5-E5)(0-E1=0 (376) 也就是说,当E(5-E)(”-E1)丰0时,5与”肯定不独立。这说明 E(5一E5)(?-E门)的数值在一定程度上反映了5与)相互间的联系。因而我们引入 下述定义。 定义3.9若(5,)是一个二维随机变量,又 E引(5-E5)(I-E1Ko 则称E(5-E5)(0-En)为5与n的协方差,并记作Cov(5,),即 Cov(5,)-E(5-E5)(1-E7) (3.77) 由协方差的定义可知它具有下述性质: )Cov(5,)=Cov(,5): (②)若a、b为两个任意常数,则 Cov(as,bn)=ab.Cov() (3)Cov(5+52,)=Cov(5i,)+Cov(52,7) 协方差的数值虽然在一定程度上反映了5与)相互间的联系,但它还受5与刀本身 数值大小的影响。譬如说,令5与)各自增大K倍,即气=Kξ,=K,这时5与门 间的相互联系和与刀间的相互联系应该是一样的,可是反映这种联系的协方差却增大了 K2倍,即有
D ( +) = D +D (3.75) 这些性质的证明与离散型情形是相同的,这里不再作进一步的叙述。 对二维随机变量 (,) 来说,数学期望 E 、E 只反映了 与 各自的平均值,方 差 D 、D 只反映了 与 各自离平均值的偏离程度,它们对 与 之间相互联系不提 供任何信息。前面已经指出,二维随机变量 (,) 的密度函数 p(x,y)或分布列 p ij 全面地描 述了 (,) 的统计规律,其中包含有 与 相互联系的内容。如同数学期望和方差一样, 当然也希望有一个数字特征能够在一定程度上反映这种联系。现在我们已经发现当 与 相互独立时,有 E ( − E ) ( –E )=0 (3.76) 也就是说,当 E ( − E ) ( –E ) 0 时, 与 肯定不独立。这说明 E ( − E ) ( –E )的数值在一定程度上反映了 与 相互间的联系。因而我们引入 下述定义。 定义 3.9 若 (,) 是一个二维随机变量,又 E| ( − E ) ( –E )|< 则称 E ( − E ) ( –E )为 与 的协方差,并记作 Cov (,) ,即 Cov (,) =E ( − E ) ( –E ) (3.77) 由协方差的定义可知它具有下述性质: (1)Cov (,) = Cov (, ) ; (2)若 a、b 为两个任意常数,则 Cov (a ,b) =ab﹒Cov (,) (3) Cov ( , ) 1 + 2 = Cov ( , ) 1 + Cov ( , ) 2 协方差的数值虽然在一定程度上反映了 与 相互间的联系,但它还受 与 本身 数值大小的影响。譬如说,令 与 各自增大 K 倍,即 = K 1 ,1 = K ,这时 与 间的相互联系和 与 间的相互联系应该是一样的,可是反映这种联系的协方差却增大了 K 2 倍,即有