China-ub.com 下载下 第2章基本统计概念的回顾27 例218 在债券等级一例中,债券等级的期望值是多少?我们很容易从表2-4中得到。 把变量Ⅻ的各可能值与其相对应的概率之积相累加即得债券等级的期望值。 因此,债券等级的(030)+2040)+3(0.30)=20 值为2,恰为Bb值 例219 在前一例中,债券收益的期望值是多少?我们仍旧可以从表2-4中得到。把变 量Y(收益)的各可能值与其相对应的概率之积相累加即得债券收益的期望值 85(0.36)+11.5(0.36)+17.5(0.28)=12.10 这就是债券收益的期望。 期望的性质 下面给出期望值的一些重要性质,在后面的学习中,你会发现这些性质非常有用: (1)常数的期望值是其自身。若b为一常数,则有: E(b) 例如,若b=2,则E(2)=2 (2)两随机变量和的期望值等于两变量期望值之和。哈定随机变量X和Y,有 E(+Y)=E(X)+E(Y) (2-20) (3)但是,E(XY)≠B( (2-21) 即两随机变量之比的期望值不等于该两个变量的期望值之比 (4)同样,一般情况, E(x)≠ECX)E(Y) 即一般而言,两随机变量积的期望值不等于两变量期望之积。但是,有例外的情况,如果 连机变量X和Y相互独立,则有 E(XYFECE(Y) (2-23) 回想一下变量X与y相互独立的概念:当且仅当f(X,Y)=f(X)f(Y)时x与Y称为相互独立 的。也就是说,两个变量的联合概率密度函数等于各变量的概率密度函数的乘积 (5)若a为常数,则有: E(aXFaE(x) (2-24) 即随机变量的常数倍的期望值等于该变量期望的常数倍。 若a,b为常数,那么 E(ax+b Fa E(X ) +E(b E(X) 我们利用性质(1),(2)和(5)可得到 例如,E(4X+7)=4E(X)+7 2.7.2方差:离散程度的度量 期望值简单地给出了随机变量密度的中心,但却没有表明单个值在均值附近是如何分散或 分布的。最常用的度量这种分散程度的工具是方差( varlance)。下面我们给出方差的定义。 1这条性质可以推广到两个以上的变量。因此有 E(+Y+2+W)=E()+E(Y+E(Z=E(W
第2章 基本统计概念的回顾介绍27 期望的性质 下面给出期望值的一些重要性质,在后面的学习中,你会发现这些性质非常有用: (1) 常数的期望值是其自身。若 b为一常数,则有: E ( b ) = b ( 2 - 1 9 ) 例如,若b=2, 则E( 2 ) = 2。 (2) 两随机变量和的期望值等于两变量期望值之和。 8给定随机变量X和Y,有, E (X+Y ) =E (X ) +E (Y ) ( 2 - 2 0 ) (3) 但是,E (X / Y )≠ ( 2 - 2 1 ) 即两随机变量之比的期望值不等于该两个变量的期望值之比。 (4) 同样,一般情况, E (XY ) ≠ E (X )E (Y ) ( 2 - 2 2 ) 即一般而言,两随机变量积的期望值不等于两变量期望之积。但是,有例外的情况,如果 随机变量X和Y相互独立,则有: E (X Y )= E (X )E (Y ) (2-23) 回想一下变量X 与Y 相互独立的概念:当且仅当 f ( X,Y ) = f (X ) f (Y )时X与Y 称为相互独立 的。也就是说,两个变量的联合概率密度函数等于各变量的概率密度函数的乘积。 (5) 若a为常数,则有: E (a X )= a E ( X ) ( 2 - 2 4 ) 即随机变量的常数倍的期望值等于该变量期望的常数倍。 (6) 若a,b为常数,那么, E (a X+b )=a E ( X ) +E(b) = a E ( X ) + b ( 2 - 2 5 ) 我们利用性质( 1 ),( 2 )和( 5 )可得到。 例如,E ( 4X+7)= 4E ( X ) + 7 2.7.2 方差:离散程度的度量 期望值简单地给出了随机变量密度的中心,但却没有表明单个值在均值附近是如何分散或 分布的。最常用的度量这种分散程度的工具是方差( v a r i a n c e )。下面我们给出方差的定义。 E(X) E(Y) 下载 在债券等级一例中,债券等级的期望值是多少?我们很容易从表 2 - 4中得到。 把变量X的各可能值与其相对应的概率之积相累加即得债券等级的期望值。 1 ( 0 . 3 0 ) + 2 ( 0 . 4 0 ) + 3 ( 0 . 3 0 ) = 2 . 0 因此,债券等级的期望值为 2,恰为B b值。 例2.18 在前一例中,债券收益的期望值是多少?我们仍旧可以从表 2 - 4中得到。把变 量Y(收益)的各可能值与其相对应的概率之积相累加即得债券收益的期望值。 8 . 5 ( 0 . 3 6 ) + 11 . 5 ( 0 . 3 6 ) + 1 7 . 5 ( 0 . 2 8 ) = 1 2 . 1 0 这就是债券收益的期望。 例2.19 1 这条性质可以推广到两个以上的变量。因此有, E(X+Y + Z + W)= E(X) +E(Y)+ E(Z)= E(W)
28第一部分概率与统计基础 China-ub.com 下载 随机变量X的期望值为E(X),为了简便,用符号u表示期望值(u为希腊字母)。则方差定义为: var(X)o=E(X-l. (2-26) 其中希腊字母σ2是常用的方差符号。式(2-26)表明随机变量的方差等于该变量与其均值之 差的平方的期望值。因而,方差表明了随机变量X的各取值与其期望值或均值的偏离程度。如 果所有X的值恰好都等于E(X),则方差为零,但如果X的值偏离均值幅度很大,则方差也相对 较大。如图2-6。注意方差不能为负。(为什么?) 最小方差 最大方差 连续型随机变量 图2-6同期望值的连续型随机变量的概率密度函数 σ2的正的方根o称为标准差( standard deviation,sd) (2-26)给出了方差的定义式。通常我们用下式计算方差:若X是离散型随机变量, var(X)=>(r-u)/() (2-27) 可用类似的公式计算连续型随机变量的方差。 式(2-27)表明,对于离散型随机变量,计算其方差,需先求出变量X与其期望值之差,然后求 其平方,再乘以其相应概率,对变量X的每一取值重复上述过程,最后把所有求得的值相加即得 例220 仍以例217为例,在那里我们求得变量(重复掷一颗骰子得到的正面朝上的数 字)的期望值为3.5,现求其方差。我们建立表2-7 表2-7随机变量X征面朝上的数字)方差 正面朝上的数字 概率 (X-uFf( (1-3.5)F(1/6) (2-3.5)(1/6) (4-3.5)(1/6) (5-3.5)(1/6) (6-3.5)(1/6) 求和=29167
随机变量X的期望值为E (X ),为了简便,用符号ux表示期望值(u为希腊字母)。则方差定义为: v a r (X )= x 2 = E (X-u x ) 2 ( 2 - 2 6 ) 其中希腊字母 x 2 是常用的方差符号。式( 2 - 2 6 )表明随机变量的方差等于该变量与其均值之 差的平方的期望值。因而,方差表明了随机变量 X 的各取值与其期望值或均值的偏离程度。如 果所有X的值恰好都等于E (X ),则方差为零,但如果 X的值偏离均值幅度很大,则方差也相对 较大。如图2 - 6。注意方差不能为负。(为什么?) 图2-6 同期望值的连续型随机变量的概率密度函数 x 2 的正的方根 x 称为标准差(standard deviation,s.d). 式( 2 - 2 6 )给出了方差的定义式。通常我们用下式计算方差:若 X 是离散型随机变量, ( 2 - 2 7 ) 可用类似的公式计算连续型随机变量的方差。 式( 2 - 2 7 )表明,对于离散型随机变量,计算其方差,需先求出变量X 与其期望值之差,然后求 其平方,再乘以其相应概率,对变量X 的每一取值重复上述过程,最后把所有求得的值相加即得。 表2-7 随机变量 X (正面朝上的数字)的方差 正面朝上的数字 概率 X f ( X ) ( X -ux ) 2 f (X) 1 1 / 6 ( 1-3 . 5 )2 ( 1 / 6 ) 2 1 / 6 ( 2-3 . 5 )2 ( 1 / 6 ) 3 1 / 6 ( 3-3 . 5 )2 ( 1 / 6 ) 4 1 / 6 ( 4-3 . 5 )2 ( 1 / 6 ) 5 1 / 6 ( 5-3 . 5 )2 ( 1 / 6 ) 6 1 / 6 ( 6-3 . 5 )2 ( 1 / 6 ) 求和=2.916 7 var(X) = (X -ux ) X å 2 f (X ) 28部分第一部分 概率与统计基础 下载 连续型随机变量 仍以例2 . 1 7为例,在那里我们求得变量 (重复掷一颗骰子得到的正面朝上的数 字)的期望值为3 . 5,现求其方差。我们建立表 2 - 7。 例2.20 最小方差 最大方差
Chin to cor 下载 第2章基本统计概念的回顾29 因此,其方差为29167。取正的平方根,得其标准差,约为1.7078。 (1)常数的方差为零。根据定义,一个常数没有变异性 (2)如果X与Y是两个相互独立的随机变量,那么, (2-28) 即两独立随机变量的和或差的方差等于两变量方差的和。 (3)如果b是一常数,那么, 即将变量加上一个常数不改变该变量的方差。例如,var(x+7)=var() (4)如果a为一常数,那么 var( ax)=avar(X) 即随机变量常数倍的方差等于该变量方差的常数平方倍。例如,var(5X)=25var(X)。 (5)如果a,b为常数,那么, var(a x+b)=a'var(X) (2-31) 由性质(3)和性质(4)得到。例如,var(5X+9)=25var(X) (6)如果X与Y相互独立,a,b为常数,那么, ar(a X+b y)=a'var( X)+bvar(Y 32) 前面的性质可得到。例如, var(3 X+5 Y)=9var( X)+25 var(Y) 2.7.3协方差 期望值和方差是描述单变量概率密度函数最常用的数字特征一一前者给出了中心值,后者 描述了单个值是围绕中心分布的程度。但是,一旦超出单变量概率密度函数的情况(比如例 2.14),就需要考虑除了期望值和方差之外,其他多维随机变量概率分布函数的数字特征 ( characteristics of multivariate ddfs),比如协方差( covariance),相关系数( correlation) 令随机变量x和y的期望分别为,,其协方差为 cov(X,1)=E[(X=u2-u,) (2-33) 式(2-33)表明,协方差是一种特殊形式的期望值,它是两变量同时变动的度量,我们从下 面的例中可以看到。 式(2-3)给出了协方差的定义式,通常用下式来计算协方差,这里假设X与Y是离散型随机 变量。 ∑(x-u)Y-,)(xy ∑∑ 注意在这个式子中有两个求和符号,这是因为协方差是对两个变量的所有取值求和。对于 连续型随机变量可用类似的公式计算协方差,只不过用积分符号代替求和符号 一般而言,两随机变量的协方差可正可负。如果两个变量同方向变动(比如,一个变量增 加,另一个变量也增加),则协方差为正,比如例221:如果两个变量反方向变动(比如,一个 变量增加,另一个变量却减少),则协方差为负
第2章 基本统计概念的回顾介绍29 因此,其方差为2.916 7。取正的平方根,得其标准差,约为 1.707 8。 方差的性质: (1) 常数的方差为零。根据定义,一个常数没有变异性。 (2) 如果 X 与Y是两个相互独立的随机变量,那么, var ( X + Y ) = var ( X ) + var ( Y ) ( 2 - 2 8 ) var ( X-Y ) = var ( X ) + var ( Y ) 即两独立随机变量的和或差的方差等于两变量方差的和。 (3) 如果b是一常数,那么, var ( X + b ) = var ( X ) ( 2 - 2 9 ) 即将变量加上一个常数不改变该变量的方差。例如, var (X+7) = var (X)。 (4) 如果a为一常数,那么, var ( a X ) = a 2var ( X ) ( 2 - 3 0 ) 即随机变量常数倍的方差等于该变量方差的常数平方倍。例如, var (5 X ) = 25 var ( X )。 (5) 如果a, b为常数,那么, var ( a X +b ) = a 2var ( X ) ( 2 - 3 1 ) 由性质( 3 )和性质( 4 )得到。例如,var(5 X +9) = 25 var ( X )。 (6) 如果 X 与 Y 相互独立,a, b为常数,那么, var (a X +b Y ) = a 2var ( X ) +b 2var ( Y ) ( 2 - 3 2 ) 由前面的性质可得到。例如, var (3 X +5 Y ) = 9var( X ) +25 var( Y ) 2.7.3 协方差 期望值和方差是描述单变量概率密度函数最常用的数字特征—前者给出了中心值,后者 描述了单个值是围绕中心分布的程度。但是,一旦超出单变量概率密度函数的情况 (比如例 2 . 1 4 ),就需要考虑除了期望值和方差之外,其他 多维随机变量概率分布函数的数字特征 (characteristics of multivariate DDFs),比如协方差( c o v a r i a n c e ),相关系数( c o r r e l a t i o n )。 令随机变量 X 和 Y 的期望分别为ux,uy,其协方差为: cov ( X , Y ) = E [ ( X - ux )( Y-uy ) ] ( 2 - 3 3 ) = E ( X Y ) - ux uy 式( 2 - 3 3 )表明,协方差是一种特殊形式的期望值,它是两变量同时变动的度量,我们从下 面的例中可以看到。 式( 2 - 3 3 )给出了协方差的定义式,通常用下式来计算协方差,这里假设 X与Y是离散型随机 变量。 ( 2 - 3 4 ) 注意在这个式子中有两个求和符号,这是因为协方差是对两个变量的所有取值求和。对于 连续型随机变量可用类似的公式计算协方差,只不过用积分符号代替求和符号。 一般而言,两随机变量的协方差可正可负。如果两个变量同方向变动 (比如,一个变量增 加,另一个变量也增加 ),则协方差为正,比如例 2 . 2 1;如果两个变量反方向变动 (比如,一个 变量增加,另一个变量却减少 ),则协方差为负。 cov( X,Y) = (X -ux ) Y åX å (Y - uy )f (X,Y) = XYf(X,Y)- uxuy Y åX å 下载
30第一部分概率与统计基础 China-sub con 例221 计算例214中变量X(债券等级)和变量Y(债券收益)的协方差。利用式(2-34)。 首先用表23给出的数据计算22xyf(x,y 22xf(x,Y)=(85)()(06+(85×2X010+(850300 +(11.5(1)(0.04)+(11.5)(2)(0.28)+(11.5)3)(0.04) +(17.5)(1)0.0)+(17.5)(2)(0.02)+(17.5(3(0.26) 由例2.18和例2.19可知,E(X)=l,=2.0,E(Y)=u=12.10。因而有 cov(X,Y)=2654-(20)(12.10)=2.34 即偾券等级与偾券收益的协方差为正。这个结果我们不难理解,看看我们是如 何编制债券等级的:等级3代表了风险最大的债券(也即B级)。因此,风险越高,期 望收益就越大。 协方差的性质 下面来看协方差的一些重要性质,在以后的学习中,我们会发现在回归分析中,这些性质 相当重要。 (1)若随机变量X,Y相互独立,则其协方差为零 很容易验证这条性质。如果两变量是独立的,则: E(XYFE(XE(Y) (2-35) 把上式带到式(2-33)中,得到两个变量的协方差为零 (2)cov(a+bx, c+dr)=bd cov(x,Y) 其中,a,b,c,d为常数。 (3)cov(X, X)=var(X) (2-37) 即变量与其自身的协方差就是变量的方差,可以从方差和协方差的定义加以验证 274相关系数 在前面讨论的债券等级一例中,我们得到债券等级与债券收益之间的协方差为+2.34,表 明这两个变量正相关。但是计算结果234并未告诉我们两变量之间的正相关程度有多大。如果 我们关注的是两变量的相关程度,则可用(总体)相关系数来刻画两变量之间的相关程度。相关 系数定义如下: cov(X,Y) 其中希腊字母p代表相关系数。 从式(2-38)很容易看出,两变量的相关系数等于它们的协方差与其各自的标准差之比。相 关系数是刻画两个随机变量线性相关程度的一个数字特征,即两变量之间线性相关程度有多大 1.相关系数的性质 相关系数有如下一些重要性质: (1)与协方差相同,相关系数可正可负。如果两变量之间的协方差为正,则其相关系数为正, 反之,若两变量之间的协方差为负,则其相关系数为负。简言之,相关系数与协方差同号 (2)相关系数介于-1到1之间。用符号表示为
协方差的性质 下面来看协方差的一些重要性质,在以后的学习中,我们会发现在回归分析中,这些性质 相当重要。 (1) 若随机变量 X,Y 相互独立,则其协方差为零。 很容易验证这条性质。如果两变量是独立的,则: E ( X Y ) =E ( X ) E ( Y )= ux uy ( 2 - 3 5 ) 把上式带到式( 2 - 3 3 )中,得到两个变量的协方差为零。 (2) cov ( a + b X , c + d Y ) = b d cov ( X , Y ) ( 2 - 3 6 ) 其中, a , b , c , d 为常数。 (3) cov ( X , X ) = var ( X ) ( 2 - 3 7 ) 即变量与其自身的协方差就是变量的方差,可以从方差和协方差的定义加以验证。 2.7.4 相关系数 在前面讨论的债券等级一例中,我们得到债券等级与债券收益之间的协方差为 + 2 . 3 4,表 明这两个变量正相关。但是计算结果 2 . 3 4并未告诉我们两变量之间的正相关程度有多大。如果 我们关注的是两变量的相关程度,则可用 (总体)相关系数来刻画两变量之间的相关程度。相关 系数定义如下: ( 2 - 3 8 ) 其中希腊字母 代表相关系数。 从式( 2 - 3 8 )很容易看出,两变量的相关系数等于它们的协方差与其各自的标准差之比。相 关系数是刻画两个随机变量线性相关程度的一个数字特征,即两变量之间线性相关程度有多大。 1. 相关系数的性质 相关系数有如下一些重要性质: (1) 与协方差相同,相关系数可正可负。如果两变量之间的协方差为正,则其相关系数为正, 反之,若两变量之间的协方差为负,则其相关系数为负。简言之,相关系数与协方差同号。 (2) 相关系数介于-1到1之间。用符号表示为: = cov( X,Y) sxsy 30部分第一部分 概率与统计基础 下载 计算例2 . 1 4中变量 X (债券等级)和变量 Y (债券收益)的协方差。利用式( 2 - 3 4 )。 首先用表2 - 3给出的数据计算 X Y f ( X , Y ): X Y f ( X , Y ) = (8.5) (1) (0.26)+(8.5)(2)(0.10)+(8.5)(3)(0.00) + ( 11.5)(1)(0.04) +(11 . 5 ) ( 2 ) ( 0 . 2 8 ) + ( 11.5)(3)(0.04) + ( 1 7 . 5 ) ( 1 ) ( 0 . 0 ) + ( 1 7 . 5 ) ( 2 ) ( 0 . 0 2 ) + ( 1 7 . 5 ) ( 3 ) ( 0 . 2 6 ) = 26.54 由例2 . 1 8和例2 . 1 9可知,E ( X )= ux = 2 . 0,E ( Y ) =uy = 1 2 . 1 0。因而有: cov ( X , Y ) = 26.54-(2.0) (12.10) = 2.34 即债券等级与债券收益的协方差为正。这个结果我们不难理解,看看我们是如 何编制债券等级的:等级3代表了风险最大的债券(也即B级)。因此,风险越高,期 望收益就越大。 Y åX å Y åX å 例2.21
China-ub.com 下载 第2章基本统计概念的回顾31 1≤p≤1 (2-39) 如果相关系数为1,则表示两变量完全正相关,如果相关系数为1,则表示两变量完全负 相关。通常p介于-1,1之间。 图2-7给出了相关系数的一些典型图案。 接近+1 p=1 p为正但接近0 p为负但接近于0 X 图2-7相关系数p的典型图形 例222 仍以债券等级一例为例,在例2.21中我们得到债券等级与债券收益之间的协 方差为2.34。从表2-4中给出的各变量的概率密度函数,读者能够很容易求得X(债 券等级)和y(债券收益)的标准差分别为0.77和3.60。因此,本例中的相关系数为 0.844 (0.77)(3.60) 注意:仅从协方差2.34,我们无法知道两变量间的协方差是高还是低。但是,根据相关系 数的大小就能够进一步确认变量之间的相关程度。由于ρ最大为1,所以观察值0.844表明两变 量高度正相关,因为0.844接近于1 相关系数的用法将在第6章回归分析中讨论 2.相关变量的方差 前面我们讨论了两独立变量和或差的方差的计算式。但是,如果随机变量不是独立的(即 是相关的),情况有会怎样呢?在此情况下,有如下计算公式
第2章 基本统计概念的回顾介绍31 -1 ≤ ≤ 1 ( 2 - 3 9 ) 如果相关系数为1,则表示两变量完全正相关,如果相关系数为- 1,则表示两变量完全负 相关。通常 介于-1,1之间。 图2-7 给出了相关系数的一些典型图案。 图2-7 相关系数 的典型图形 注意:仅从协方差2 . 3 4,我们无法知道两变量间的协方差是高还是低。但是,根据相关系 数的大小就能够进一步确认变量之间的相关程度。由于 最大为1,所以观察值0 . 8 4 4表明两变 量高度正相关,因为0 . 8 4 4接近于1。 相关系数的用法将在第6章回归分析中讨论。 2. 相关变量的方差 前面我们讨论了两独立变量和或差的方差的计算式。但是,如果随机变量不是独立的 (即 是相关的),情况有会怎样呢?在此情况下,有如下计算公式: 下载 r接近-1 =+1 =0 但 =0 a) d) e) g) h) f) b) c) =-1 接近+1 r为正但接近0 r为负但接近于0 仍以债券等级一例为例,在例 2 . 2 1中我们得到债券等级与债券收益之间的协 方差为2 . 3 4。从表2 - 4中给出的各变量的概率密度函数,读者能够很容易求得 X (债 券等级)和 Y (债券收益)的标准差分别为0 . 7 7和3 . 6 0。因此,本例中的相关系数为: = 2.34 (0.77)(3.60) » 0.844 例2.22