China-ub.com 下载下 第2章基本统计概念的回顾37 2.84样本相关系数 式(2-38)定义了两随机变量的总体相关系数。类似地,样本相关系数定义如下,通常用符 号r表示样本相关系数 X-X)(Y-1)/n-1) 样本cov(X,Y) (2-53) d(X)sd(r) 因此,样本相关系数( sample correlation)与总体相关系数有相同的性质;它们均位于-1与1 由表2-8给出的数据,读者很容易计算出X,y的样本标准差,然后求出p的估计值r 7026.20 =0.9111 所以,在这个例子中,股票价格与消费者加价格高度相关,因为计算出的相关系数接近于1。 2.8.5样本偏度与样本峰度 根据式(2-46)和式(2-47),用样本三阶矩和四阶矩来计算样本偏度与峰度。样本三阶矩(与 样本方差的计算公式相对照)为: (2-54)2 样本四阶矩为 S(X-X) (2-55) 利用表2-8给出的数据,读者可计算出样本三阶矩和四阶矩,然后可以验证道-琼斯指数均 值的样本偏度和峰度分别为0.4673和1.5456,表明道-琼斯指数均值的分布是正偏的,比正态 分布略“胖”一些。 29小结 本章介绍了概率、随机变量、概率密度、概率密度的数字特征(矩)等一些基本概念。我们 的目的并不是教授统计学,而是复习和回顾在本书后面讨论中所必须了解的一些基本统计概念 此,对这些概念的讨论更多的是直观的。 本章介绍了一些重要公式。这些公式告诉我们如何计算随机变量的概率以及如何估计概率 分布的数字特征,比如期望值(均值)、方差、协方差、相关系数、条件期望值等等。在介绍公 式的同时,我们仔细地区分了总体矩与样本矩,并给出相应的计算公式。因此,随机变量的期 望值E(X)是总体矩,即是知道总体的所有取值情况下X的均值。另一方面,又是样本矩,即 它是来自于总体的一个样本,并非全部总体的X的均值。在统计学中,总体和样本的两分性非 常重要,因为在许多实际运用过程中,我们仅有来自于总体的一两个样本,而且常常是通过这 些样本矩来推断总体矩。如何利用样本对总体进行推断,我们将在随后的两章中讨论 1如果样本足够大,可用除数n代替n-1
第2章 基本统计概念的回顾介绍37 2.8.4 样本相关系数 式( 2 - 3 8 )定义了两随机变量的总体相关系数。类似地,样本相关系数定义如下,通常用符 号 r 表示样本相关系数。 ( 2 - 5 3 ) 因此,样本相关系数(sample correlation)与总体相关系数有相同的性质;它们均位于- 1与1 之间。 由表2 - 8给出的数据,读者很容易计算出 X ,Y 的样本标准差,然后求出 的估计值 r : 所以,在这个例子中,股票价格与消费者加价格高度相关,因为计算出的相关系数接近于1。 2.8.5 样本偏度与样本峰度 根据式( 2 - 4 6 )和式( 2 - 4 7 ),用样本三阶矩和四阶矩来计算样本偏度与峰度。样本三阶矩 (与 样本方差的计算公式相对照 )为: ( 2 - 5 4 )1 样本四阶矩为: ( 2 - 5 5 ) 利用表2 - 8给出的数据,读者可计算出样本三阶矩和四阶矩,然后可以验证道 -琼斯指数均 值的样本偏度和峰度分别为 0.467 3和1.545 6,表明道-琼斯指数均值的分布是正偏的,比正态 分布略“胖”一些。 2.9 小结 本章介绍了概率、随机变量、概率密度、概率密度的数字特征 (矩)等一些基本概念。我们 的目的并不是教授统计学,而是复习和回顾在本书后面讨论中所必须了解的一些基本统计概念, 因此,对这些概念的讨论更多的是直观的。 本章介绍了一些重要公式。这些公式告诉我们如何计算随机变量的概率以及如何估计概率 分布的数字特征,比如期望值 (均值)、方差、协方差、相关系数、条件期望值等等。在介绍公 式的同时,我们仔细地区分了总体矩与样本矩,并给出相应的计算公式。因此,随机变量的期 望值 E ( X )是总体矩,即是知道总体的所有取值情况下 X 的均值。另一方面,ˉX 是样本矩,即 它是来自于总体的一个样本,并非全部总体的 X 的均值。在统计学中,总体和样本的两分性非 常重要,因为在许多实际运用过程中,我们仅有来自于总体的一两个样本,而且常常是通过这 些样本矩来推断总体矩。如何利用样本对总体进行推断,我们将在随后的两章中讨论。 ( X-X) 4 å n -1 ( X-X) 3 å n -1 r = 7 026.20 (12.696)(607 .40) = 0.9111 1 如果样本足够大,可用除数 n代替n-1 下载
38第一部分概率与统计基础 China-sub con 参考文献 正如本章前言部分提到的那样,本章只是对统计学的一些基本概念做一个简要和直观的介 绍,它并不是统计学基本教程。因此,建议读者手边能有一两本好的统计学教科书。下面介绍 些参考文献 1. Newbold, Paul: Statistics for Business and Economics, Prentice-Hall, Englewood Cliffs, NJ 这本书提供大量的实例,没有复杂的数学计算。 2. Hoel, Paul G. Introduction to Mathematial Statistcs, Wiley, New York 这本书简单介绍了数理统计学的各方面的知识。 3. Mood, Alexander M, Graybill, Franklin A, and Boes, Duane C. Introduction to the Theoi of statistics, McGraw-Hill, New York, 1974 这是一本标准的高级统计学教材 4. Mosteller, F, Rourke, R. and Thomas, G. Probability with Statistical Applications, Addision- 5. De Grott, Morris H. Pobability and Statistics(2nd ed. ) Addison-Wesley, Reading, Mass 习题 2.1解释概念 a)样本空间(b)样本点()事件(d)互斥事件(e)概率密度函数(①联合 密度函数(g)边缘概率密度函数(h)条件概率密度函数()统计独立性 22事件A,B能否既为互斥事件同时又相互独立? 23什么是概率密度函数的矩?最常用的矩有哪些? 4解释概念 (a)期望值(b)方差(c)标准差d)协方差(e)相关(f)条件期望值 5解释概念 (a)样本均值(b)样本方差(c)样本标准差(d)样本差协方差e)样本相关系数 2.6为什么说区分总体矩和样本矩很重要? 2.7按照(a)填空。 (a)期望值或均值是集中趋势的度量← b)方差是 的度量。 (c)协方差 是 的度量。(d)相关系数是.的度量 28随机变量X的均值为$50,标准差为$5,那么,方差为s25。对吗?为什么? 29判断正误并解释原因。 (a)虽然随机变量的期望值可正可负,但其方差总为正。(b)两变量的协方差与相关系 数同号。(c)一个随机变量的条件期望值和非条件期望值意义相同 d若两变量相互 独立,则其相关系数必定为零。(e)若两变量的相关系数为零,则它们相互独立。 2.10下列各式代表什么? 为常数(c)∑(2x+3y)(d∑ (e)∑(+4)(∑3(g)∑2(h) 2.11用求和符号表示下列各式 (b)x+2x2+3x2+4x4+5x,(c)(x2+y2)+(x2+y2
参考文献 正如本章前言部分提到的那样,本章只是对统计学的一些基本概念做一个简要和直观的介 绍,它并不是统计学基本教程。因此,建议读者手边能有一两本好的统计学教科书。下面介绍 一些参考文献: 1. N e w b o l d , P a u l :Statistics for Business and Economics,Prentice-Hall,Englewood Cliff s , N . J . 这本书提供大量的实例,没有复杂的数学计算。 2. Hoel,Paul G.: I n t roduction to Mathematial Statistcs, Wi l e y,New Yo r k . 这本书简单介绍了数理统计学的各方面的知识。 3. Mood,Alexander M., Graybill,Franklin A., and Boes,Duane C.:I n t roduction to the Theory of Statistics,McGraw-Hill,New Yo r k , 1 9 7 4 . 这是一本标准的高级统计学教材。 4. Mosteller, F.,Rourke,R.,and Thomas ,G.:P robability with Statistical Applications, A d d i s i o n - We s l e y, R e a d i n g , M a s s . 5. DeGrott,Morris H.:Pobability and Statistics(2nd ed.),Addison-We s l e y, R e a d i n g , M a s s . 习题 2.1 解释概念 (a) 样本空间 (b) 样本点 (c) 事件 (d) 互斥事件 (e) 概率密度函数 (f) 联合 概率密度函数 (g) 边缘概率密度函数 (h) 条件概率密度函数 (i) 统计独立性 2.2 事件 A,B 能否既为互斥事件同时又相互独立? 2.3 什么是概率密度函数的矩?最常用的矩有哪些? 2.4 解释概念 (a) 期望值 (b) 方差 (c) 标准差 (d) 协方差 (e) 相关 (f) 条件期望值 2.5 解释概念 (a) 样本均值 (b) 样本方差 (c) 样本标准差 (d) 样本差协方差 (e) 样本相关系数 2.6 为什么说区分总体矩和样本矩很重要? 2.7 按照( a )填空。 (a) 期望值或均值是集中趋势的度量。 (b) 方差是. . . . . . . . . . . .的度量。 (c) 协方差 是. . . . . . . . . . . .的度量。 (d) 相关系数是. . . . . . . . . . . . . . .的度量。 2.8 随机变量 X 的均值为$ 5 0 ,标准差为$ 5 ,那么,方差为$ 2 5。对吗?为什么? 2.9 判断正误并解释原因。 (a) 虽然随机变量的期望值可正可负,但其方差总为正。 (b) 两变量的协方差与相关系 数同号。 (c) 一个随机变量的条件期望值和非条件期望值意义相同。 (d) 若两变量相互 独立,则其相关系数必定为零。 (e) 若两变量的相关系数为零,则它们相互独立。 2.10 下列各式代表什么? (a) (b) a为常数 (c) (d) (e) (f) (g) (h) 2 . 11 用求和符号表示下列各式: ( a ) x1+ x2+…+ x5 (b) x1+2 x2+3 x3+4 x4+5 x5 (c) ( x1 2+ y1 2 )+( x2 2+ y2 2 ) +…+( xk 2+ yk 2 ) ( 4x 2 - 3) i=1 3 2 å i=1 10 3 å i i=1 3 (i + 4) å i=1 4 å xi j=1 2 åi=1 3 ( 2x i + 3yi) å yi i=1 2 ayi å i=1 6 x å i -1 i=1 4 å 38部分第一部分 概率与统计基础 下载
China-ub.com 下载 第2章基本统计概念的回顾39 2.12利用等式∑k=m+1 求下列各式 ()∑k(b)∑k(c)∑3k 213可以证明等式∑k=(m+1X2n+1 成立,利用该等式计算下列各式。 2.14随机变量的概率密度函数如下 f(x) a)求b?为什么?(b)求P(X≤2);P(X≤3);P(2≤X≤3)?(c)求X的期 望E(X)?(d)求X的方差var(X)? 2.15随机变量的变差系数用卩表示,其定义为 E(X)x的期望 X的标准差 计算习题214中的V值。如果X的单位为美元,那么V的单位是什么?(注:实际中,V 常以百分比的形式表示) 2.16下表给出了某项投资1年后预期的回报率及相应概率。 (a)求投资回报率的期望值? 报酬率X(%) (b)求投资回报率的方差和标准差? (c)求投资回报率的偏度系数和峰度系 0.45 (d)求累积概率密度函数及回报率小于等 于10%的概率? 2.17下表给出了变量X,Y的联合概率密度函数 0.04 0.12 (a)求X和Y的边缘(非条件)分布f(X),f(y (b)求条件概率密度函数,f(X|y),f(Y|x)? (c)求条件期望值E(x|y),E(Y|x)? (d)求E(X),E(y)? (e)求出的条件期望值与非条件期望值相同吗? ()X与Y相互独立吗?你是如何判断的 2.18下表给出了随机变量X,Y的联合概率密度函数,其中X表示投资项目A的1年期报
下载 第2章 基本统计概念的回顾介绍39 2.12 利用等式 求下列各式。 (a) (b) (c) 2.13 可以证明等式 成立,利用该等式计算下列各式。 (a) (b) (c) 2.14 随机变量的概率密度函数如下: X f ( X ) X f ( X ) 0 b 3 4b 1 2b 4 5b 2 3b (a) 求 b ? 为什么? (b) 求 P ( X≤2 );P (X≤3 );P ( 2≤X≤3 )? (c) 求 X 的期 望 E ( X )? (d) 求 X 的方差 var( X )? 2.15 随机变量的变差系数用 V 表示,其定义为: V= = 计算习题2 . 1 4中的 V 值。如果 X 的单位为美元,那么 V 的单位是什么?(注:实际中,V 通常以百分比的形式表示)。 2.16 下表给出了某项投资1年后预期的回报率及相应概率。 (a) 求投资回报率的期望值? (b) 求投资回报率的方差和标准差? (c) 求投资回报率的偏度系数和峰度系 数? (d) 求累积概率密度函数及回报率小于等 于1 0%的概率? 2.17 下表给出了变量 X,Y 的联合概率密度函数 X Y 1 2 3 1 0 . 0 3 0 . 0 6 0 . 0 6 2 0 . 0 2 0 . 0 4 0 . 0 4 3 0 . 0 9 0 . 0 4 0 . 0 4 4 0 . 0 6 0 . 1 2 0 . 1 2 (a) 求 X 和 Y 的边缘(非条件)分布 f ( X ),f ( Y )? (b) 求条件概率密度函数,f ( X|Y ) ,f (Y|X )? (c) 求条件期望值 E (X|Y ),E (Y|X )? (d) 求 E ( X ),E ( Y )? (e) 求出的条件期望值与非条件期望值相同吗? (f) X 与 Y 相互独立吗?你是如何判断的? 2.18 下表给出了随机变量 X ,Y 的联合概率密度函数,其中 X 表示投资项目A的1年期报 X的期望 X的标准差 E(X) x 4k 2 k =1 10 k å 2 10 20 k å 2 k=1 10 å k 2 = n(n +1)(2n +1) k =1 6 n å 3k k=10 100 k å k =10 100 k å k =1 500 å k = n(n + 1) k =1 2 n å 报酬率 X (%) f (X ) -2 0 0 . 1 0 -1 0 0 . 1 5 1 0 0 . 4 5 2 5 0 . 2 5 3 0 0 . 0 5 总计 1. 00
40第一部分概率与统计基础 China-ub.com 酬率,Y表示项目B的1年期报酬率。 Y () 0.27 0.08 0.16 (a)计算项目A的期望值的报酬率。 (b)计算项目B的期望值的报酬率。 (c)变量x与y相互独立吗?(提示:E(Xy)=∑∑xf(x)) 219已知E(X)=8,var(x)=4,求下列各式的期望值及方差? (a)Y=3X+2(b)Y=06X-4(c)Y=X/4(d)y=aX+b,其中a,b为常数 220证明:var(X=E[X-E(x)=E(X)2-[E(X)=E(x)-a (a)cov(X, YFE[(X-u,FE(XY)-uru 其中,u2=E(X),u=E(Y 如何用文字表述上列各式? 221利用等式(2-38)给出的总体相关系数的定义,证明 var( X+ y) =var( X )+var( Y )+2 (2-40a) var( X-y )=var( X )+var( Y)-2po or (2-41a) 22考虑上题给出的等式(2-40a)。令X代表债券的收益率(比如说,IBM),Y代表另一 种债券的收益率(比如说,一般物品)。令=16,G=9,p=-0.8。求X+Y的方差。它比va (X)+var(Y)大还是小。在此例中,是否同等投资于两种债券(即多样化)比完全投资于其中 种的收益大?这个问题是现代有价证券理论的精华所在。(参见 Richard brealey, Steward myer Priciples of Corporate finace, McGraw-Hill, New York, 1981) 223100个人中,有50人是民主党成员,40人是共和党成员,10人是无党派人士。在这 三类人中阅读《 Wall Street》杂志的比例分别是30%,60%,40%。若有一人正在读该杂志,问 这个人是共和党成员的概率是多少? 2.24表29给出了美国1979至1988年新成立公司与破产公司的数据 表29美国1979-1988年期间新成立公司(x)与破产公司(Y)数目 1980 l1742 1985 662047 57253 1981 581242 702738 61616 资料来源: Economic Report of the Presiden,1990, Table C.94p.402 (a)求新成立公司数目的均值和方差?(b)求破产公司数目的均值是和方差?(c)求 X与Y的协方差与相关系数?(d)这两个变量相互独立吗?(e)如果两个变量相关,是否 可以认为一个变量是另一个变量的“原因”。即是新公司的进入导致原有公司的破产,还是原 有公司的破产导致新公司的进入? 225在例214中,求var(X+Y)。你如何解释这个方差?
酬率,Y 表示项目B的1年期报酬率。 X (%) Y (%) -1 0 0 2 0 3 0 2 0 0 . 2 7 0 . 0 8 0 . 1 6 0 . 0 0 5 0 0 . 0 0 0 . 0 4 0 . 1 0 0 . 3 5 (a) 计算项目A的期望值的报酬率。 (b) 计算项目B的期望值的报酬率。 (c) 变量 X 与 Y 相互独立吗?(提示:E ( X Y ) = ) 2.19 已知 E ( X ) = 8,var ( X ) = 4,求下列各式的期望值及方差? (a) Y =3 X +2 (b) Y =0.6 X -4 (c) Y = X /4 (d) Y= a X +b, 其中 a , b 为常数 2.20 证明: var( X ) =E [ X-E ( X ) ]2= E ( X ) 2-[ E ( X ) ]2= E ( X ) 2-uX 2 (a) cov( X , Y )= E [( X-uX )( Y-uY )]= E ( X Y )-uX uY 其中,uX = E ( X ),uY = E (Y) 如何用文字表述上列各式? 2.21 利用等式( 2 - 3 8 )给出的总体相关系数的定义,证明: var( X + Y )=var( X )+var( Y ) + 2 sX sY ( 2 - 4 0 a ) var( X-Y )=var( X )+var( Y )-2 sX sY ( 2 - 4 1 a ) 2.22 考虑上题给出的等式( 2 - 4 0 a )。令 X 代表债券的收益率(比如说,I B M ),Y 代表另一 种债券的收益率(比如说,一般物品)。令 X 2 = 1 6, Y 2 = 9, =-0 . 8。求 X + Y 的方差。它比v a r ( X )+var( Y )大还是小。在此例中,是否同等投资于两种债券 (即多样化)比完全投资于其中一 种的收益大?这个问题是现代有价证券理论的精华所在。 (参见Richard Brealey, Steward Myers, Priciples of Corporate finace,McGraw-Hill,New Yo r k , 1 9 8 1 ) 2.23 100个人中,有5 0人是民主党成员, 4 0人是共和党成员, 1 0人是无党派人士。在这 三类人中阅读《Wall Street》杂志的比例分别是3 0%,6 0%,4 0%。若有一人正在读该杂志,问 这个人是共和党成员的概率是多少? 2.24 表2 - 9给出了美国1 9 7 9至1 9 8 8年新成立公司与破产公司的数据。 表2-9 美国1 9 7 9 - 1 9 8 8年期间新成立公司( X )与破产公司( Y )数目 年份 Y X 年份 Y X 1 9 7 9 524 565 7 564 1 9 8 4 634 911 52 078 1 9 8 0 533 520 11 742 1 9 8 5 662 047 57 253 1 9 8 1 581 242 16 794 1 9 8 6 702 738 61 616 1 9 8 2 566 942 24 908 1 9 8 7 685 572 61 622 1 9 8 3 600 400 31 334 1 9 8 8 685 095 57 099 资料来源:Economic Report of the Pre s i d e n t ,1 9 9 0 , Table C-94,p.402. (a) 求新成立公司数目的均值和方差? (b) 求破产公司数目的均值是和方差? (c) 求 X 与 Y 的协方差与相关系数? (d) 这两个变量相互独立吗? (e) 如果两个变量相关,是否 可以认为一个变量是另一个变量的“原因”。即是新公司的进入导致原有公司的破产,还是原 有公司的破产导致新公司的进入? 2.25 在例2 . 1 4中,求var( X + Y )。你如何解释这个方差? Xi Y =1 2 åX =1 4 å Yi f(Xi Yi) 40部分第一部分 概率与统计基础 下载
China-6、con 下载 2章基本统计概念的回顾 2.26参见习题1.6中的表1-2 (a)计算S&P500与CP的协方差以及CP与3月期国债利率的协方差,这是样本协方差还是 体协方差?(b)计算S&P500与CP的相关系数以及CP与3月期国债利率的相关系数,先 验地,你认为这些相关系数是正还是负,为什么?(c)如果CP与3月期国债利率正相关,是 否意味着以CPI来衡量的通货膨胀是较高国债利率的原因? 227参见习题16中的表1-3,令ER代表德国马克对美元的汇率(即一美元兑换多少德国马 克),RPR代表美国消费者价格指数与德国消费者价格指数之比。你预期ER与RPR是正相关还 是负相关?为什么?写出计算步骤。如果知道ER与1/RPR的相关关系,你会改变答案吗?为什
第2章 基本统计概念的回顾介绍41 2.26 参见习题1 . 6中的表1 - 2, (a) 计算S & P 5 0 0与C P I的协方差以及C P I与3月期国债利率的协方差,这是样本协方差还是 总体协方差? (b) 计算S & P 5 0 0与C P I的相关系数以及C P I与3月期国债利率的相关系数,先 验地,你认为这些相关系数是正还是负,为什么? (c) 如果C P I与3月期国债利率正相关,是 否意味着以C P I来衡量的通货膨胀是较高国债利率的原因? 2.27 参见习题1 . 6中的表1 - 3,令E R代表德国马克对美元的汇率 (即一美元兑换多少德国马 克),R P R代表美国消费者价格指数与德国消费者价格指数之比。你预期 E R与R P R是正相关还 是负相关?为什么?写出计算步骤。如果知道 E R与1 / R P R的相关关系,你会改变答案吗?为什 么? 下载