第二章离散型随机变量 二章齋常魔视变 §2.1一维随机变量及分布列 教学目的要求: 使学生掌握一维离散型随机变量的概念及其分布、掌握二项分布(二点分布)、普哇松 分布及它们之间的联系,会应用这些概念、分布求分布列 教材分析: l概括分析:概率论所要考察的是与各种随机现象有关的问题,并通过随机试验从数 量的侧面来研究随机现象的统规律性.为此,就有必要把随机试验的每一个可能的结果与 个实数联系起来随机变量正是为适应这种需要而引进的。随机变量实质上是定义在样 本空间Ω={e}上的一个实值单值函数X(e).从此,对随机事件的研究转变为对随机变量的 硏究,通过随机变量将各个事件联系起来,进而去研究随机试验的全部结果.而且,随机变 量的引入,使我们有可能借助于微积分等数学工具,把研究引向深入.一维离散型随机变量 是随机变量中最简单最基本的一种 2教学重点:一维离散型随机变量的概念及其分布列与分布函数 3教学难点:求一维离散型随机变量的分布列、分布函数 教学过程: 在第一章里,我们研究了随机事件及其概率,细心的读者可能会注意到,在某些例子 中,随机事件和实数之间存在着某种客观的联系.例如,在贝努里概型这一节中,曾经讨 论过“在n重贝努里试验中,事件A出现k次”这一事件的概率,如果令 2=n重贝努里试验中事件A出现的次数 则上述“n重贝努里试验中事件A出现k次”这个事件就可以简单地记作(5=k),从而有 P(5=k)=,p 并且ξ所有可能取到的数值也就是试验中事件A可能出现的次数:0,1,…,n.在另一些例 子中,随机事件与实数之间虽然没有上述那种“自然的”联系,但是我们常常可以人为地 给它们建立起一个对应关系.例如抛掷一枚均匀的硬币,可能出现正面,也可能出现反面, 现在约定 若试验结果出现正面,令η=1,若试验结果出现反面,令=0 这时就有
第二章 离散型随机变量 ·45· 第二章 离散型随机变量 §2.1 —维随机变量及分布列 教学目的要求: 使学生掌握一维离散型随机变量的概念及其分布、掌握二项分布(二点分布)、普哇松 分布及它们之间的联系,会应用这些概念、分布求分布列. 教 材 分 析 : 1.概括分析:概率论所要考察的是与各种随机现象有关的问题,并通过随机试验从数 量的侧面来研究随机现象的统规律性.为此,就有必要把随机试验的每一个可能的结果与 一个实数联系起来.随机变量正是为适应这种需要而引进的。随机变量实质上是定义在样 本空间 ={e}上的一个实值单值函数 X(e).从此,对随机事件的研究转变为对随机变量的 研究,通过随机变量将各个事件联系起来,进而去研究随机试验的全部结果.而且,随机变 量的引入,使我们有可能借助于微积分等数学工具,把研究引向深入.一维离散型随机变量 是随机变量中最简单最基本的一种. 2.教学重点:一维离散型随机变量的概念及其分布列与分布函数. 3.教学难点:求一维离散型随机变量的分布列、分布函数. 教 学 过 程 : 在第一章里,我们研究了随机事件及其概率,细心的读者可能会注意到,在某些例子 中,随机事件和实数之间存在着某种客观的联系.例如,在贝努里概型这一节中,曾经讨 论过“在 n 重贝努里试验中,事件 A 出现 k 次”这一事件的概率,如果令 =n 重贝努里试验中事件 A 出现的次数 则上述“n 重贝努里试验中事件 A 出现 k 次”这个事件就可以简单地记作( =k),从而有 P( =k)= k n p k q n-k . 并且 所有可能取到的数值也就是试验中事件A可能出现的次数:0,1,…,n.在另一些例 子中,随机事件与实数之间虽然没有上述那种“自然的”联系,但是我们常常可以人为地 给它们建立起一个对应关系.例如抛掷一枚均匀的硬币,可能出现正面,也可能出现反面, 现在约定 若试验结果出现正面,令 =1, 若试验结果出现反面,令 =0, 这时就有:
第二章离散型随机变量 试验结果出现正面}=(n=1),{试验结果出现反面}=(n=0) 在上面的讨论中,我们遇到了两个变量:5和n,这两个变量取什么值,在每次试验之 前是不能确定的,因为它们的取值依赖于试验的结果,也就是说它们的取值是随机的.人 们常常称这种变量为随机变量,由前面的两个例子可知,有了随机变量,至少使随机事件 的表达在形式上简洁得多了.但是这个好处毕竟只是形式上的,在以后的讨论中,大家会 看到引入“随机变量”这个概念还有更为深远的意义 在上述第一个例子中,对每一个试验结果,“自然地”对应着一个实数,而在第二个 例子中,这种对应的关系是人为地建立起来的.由此可见,无论是哪一种情形,所谓随机 变量,不过是试验结果(即样本点!)和实数之间的一个对应关系,这与数学分析中熟知的 函数”概念本质上是一回事.只不过在函数概念中,函数f(x)的自变量是实数x,而在 随机变量的概念中,随机变量ξ(O)的自变量是样本点O.因为对每一个试验结果O, 都有实数ξ(ω)与之对应,所以,ξ()的定义域是样本空间,显然值域是实数轴此外, 重要的一点是,虽然在试验之前不能肯定随机变量ξ(o)会取哪一个数值,但是对于任 实数a,我们可以研究{ξ(ω)=a}发生的概率,也就是ξ(O)取值的统计规律.在这 章里我们先研究一类比较特殊的随机变量 、离散型随机变量的概念 定义21定义在样本空间Ω上,取值于实数域R,且只取有限个或可列个(所谓“可 列个”值,是指这个变量所取的值可依某种次序一一列举,排成一列例如自然数全体就是 可列的)值的变量ξ=5(ω),称作是一维(实值)离散型随机变量简称为离散型随机变 [例1]设9={某无线电厂80年一季度出厂的12叶电视机},对O∈Ω,令 5(O)=在一年中出故障的次数 则ξ(ω)是上的一个一维离散型随机变量,ξ(ω)的可能取值范围为(0,1,2,…).在试 验(即取定某一台电视机)之前,并不能断定会取哪一个值,但是 我们可以知道(=0)、(5=1)、…这些事件发生的概率(也就 0次 l次 P(=0)P(5=1) 是在总体中所占的比例).事实上,可以把这些电视机一年中发 生故障次数的分布情况列成下表: Pi p2
第二章 离散型随机变量 ·46· {试验结果出现正面}=( =1), {试验结果出现反面}=( =0). 在上面的讨论中,我们遇到了两个变量: 和 ,这两个变量取什么值,在每次试验之 前是不能确定的,因为它们的取值依赖于试验的结果,也就是说它们的取值是随机的.人 们常常称这种变量为随机变量,由前面的两个例子可知,有了随机变量,至少使随机事件 的表达在形式上简洁得多了.但是这个好处毕竟只是形式上的,在以后的讨论中,大家会 看到引入“随机变量”这个概念还有更为深远的意义. 在上述第一个例子中,对每一个试验结果,“自然地”对应着一个实数,而在第二个 例子中,这种对应的关系是人为地建立起来的.由此可见,无论是哪一种情形,所谓随机 变量,不过是试验结果(即样本点!)和实数之间的一个对应关系,这与数学分析中熟知的 “函数”概念本质上是一回事.只不过在函数概念中,函数 f(x)的自变量是实数 x,而在 随机变量的概念中,随机变量 ( )的自变量是样本点 .因为对每一个试验结果 , 都有实数 ( )与之对应,所以, ( )的定义域是样本空间,显然值域是实数轴.此外, 重要的一点是,虽然在试验之前不能肯定随机变量 ( )会取哪—个数值,但是对于任 一实数 a,我们可以研究{ ( )=a}发生的概率,也就是 ( )取值的统计规律.在这一 章里我们先研究一类比较特殊的随机变量. 一、离散型随机变量的概念: 定义 2.1 定义在样本空间 上,取值于实数域 R,且只取有限个或可列个(所谓“可 列个”值,是指这个变量所取的值可依某种次序一一列举,排成一列例如自然数全体就是 可列的)值的变量 = ( ),称作是—维(实值)离散型随机变量,简称为离散型随机变 量. [例 1] 设 ={某无线电厂 80 年一季度出厂的 12 叶电视机},对 ∈ ,令 ( )=在一年中出故障的次数 则 ( )是上的一个一维离散型随机变量, ( )的可能取值范围为(0,1,2,…).在试 验(即取定某一台电视机)之前,并不能断定会取哪一个值,但是 我们可以知道( =0)、( =1)、…这些事件发生的概率(也就 是在总体中所占的比例).事实上,可以把这些电视机一年中发 生故障次数的分布情况列成下表: = = ( 0) ( 1) 0 1 P P 次 次 1 2 1 2 p p a a
第二章离散型随机变量 这对研究和改进电视机的质量当然是很有用的材料 随机变量的分布列 1.分布列的定义 般来说,如果离散型随机变量ξ的可能取值为a1(i=1,2,…), 也就有了相应的取值a的概率P(ξ=a;)=p,人们常常习惯地把它们写 成这种表格的形式 并且称(1)或(1)为随机变量(O)的分布列,也称为分布律,有时就 简称为分布 [例2]在n=5的贝努里试验中,设事件A在一次试验中出现的概率为P,令 5=5次试验中事件A出现的次数 5012 4 则由(1)知:P(5=)=,|pq I q 5pq' 10p'q 10p q 5p'q ≤k≤5 于是,5的分布列为 2.分布列的性质 由概率的性质可知,任一离散型随机变量的分布列{P}都有下述两个性质 (1)P≥0,i=1,2, (2)∑P2=1 反过来,任意一个具有以上两个性质的数列的{P},都有资格作为一个随机变量的分布列 分布列不仅明确地给出了(5=a)的概率,而且对于任意的实数a<b,事件(a≤5≤b)发生 的概率均可由分布列算出,因为 (a≤5≤b)=U(5=a) 于是由概率的可列可加性有: P(a≤5≤b)=∑P(5=a)=∑P 其中lab={i:a≤a;≤b},即使对R中更复杂的集合B,也有 P(∈B)=∑P5=a)=∑P i∈(B) 其中I(B)={i:a∈B}.由此可知,ξ()取各种值的概率都可由它的分布列通过计算而
第二章 离散型随机变量 ·47· 这对研究和改进电视机的质量当然是很有用的材料. 二、随机变量的分布列: 1.分布列的定义: 一般来说,如果离散型随机变量 的可能取值为 ai(i=1,2,…), 也就有了相应的取值 ai 的概率 P( =ai)=pi,人们常常习惯地把它们写 成这种表格的形式: 并且称(1)或(1’)为随机变量 ( )的分布列,也称为分布律,有时就 简称为分布. [例 2] 在 n=5 的贝努里试验中,设事件 A 在一次试验中出现的概率为 P,令 =5 次试验中事件 A 出现的次数 则由(1)知: P( =k)= k 5 p k q 5-k , 0≤k≤5 于是, 的分布列为: 2.分布列的性质: 由概率的性质可知,任一离散型随机变量的分布列{Pi}都有下述两个性质: (1)Pi≥0,i=1,2,…; (2) i=1 i p =1. 反过来,任意一个具有以上两个性质的数列的{Pi},都有资格作为一个随机变量的分布列. 分布列不仅明确地给出了( =ai)的概率,而且对于任意的实数 a<b,事件(a≤ ≤b)发生 的概率均可由分布列算出,因为 (a≤ ≤b)= a a b i i a ( = ) 于是由概率的可列可加性有: P(a≤ ≤b)= = a b i I P ai , ( ) = a b i I pi , 其中 a b I , ={i:a≤ai≤b},即使对 R 中更复杂的集合 B,也有 P( ∈B)= = ( ) ( ) i I B P ai = iI (B) pi 其中 I(B)={i:ai∈B}.由此可知, ( )取各种值的概率都可由它的分布列通过计算而 a 1 a 2 … p i p 1 p 2 … 0 1 2 3 4 5 pi q 5 5pq4 10p2 q 3 10p3 q 2 5p4 q p 5
第二章离散型随机变量 得到,这件事实常常说成是:分布列全面地描述了高散型随机变量的统计规律 三、几种特殊分布 项分布 到本节开始时的n重贝努里试验的例子,已知有 p=P(E=k 0≤k≤n 容易验证: 1)p>0,0≤k≤n; Pk k=0 k 在这个例子中,大家可以注意到 pq,0≤k≤n恰好是二项式(p+0)的展开式中的第k+1项,由此人们给 分布列P4=12q(0≤k≤n)起了一个名字称它为二项分布并且常常记 k pq=b(k; n,p) 一个随机变量的分布列如果是二项分布,也称该随机变量服从二项分布.所以上述 例子中的是服从二项分布b(k;n,p)的随机变量 在二项分布中,如果n=1,那么k只能取值0或1,这时显然有 也可以表示成右表 这个分布列称为0-1分布或二点分布,它是二项分布的特例,本节 开始时讨论过的抛掷均匀硬币的例子中,随机变量的n分布列为 它就是0-1分布当p=1/2时的特例 在第一章里曾经提到,必然事件Ω可以作为随机事件的极端情形来看待,相应地,在 2上有定义的恒等于常数a的变量ξ(虽然它的取值已经失去随机性),也可以看作为随 机变量的极端形这时,随机变量ξ的分布列为 P(2=a)=1 人们称这个分布为单点分布或退化分布
第二章 离散型随机变量 ·48· 得到,这件事实常常说成是:分布列全面地描述了离散型随机变量的统计规律. 三、几种特殊分布: 1.二项分布: 回到本节开始时的 n 重贝努里试验的例子,已知有 pk=P( =k)= k n p k q n-k , 0≤k≤n 容易验证: (1) pk>0, 0≤k≤n; (2) = n k pk 0 == − n k k n k p q k n 0 =(p+q)n =1. 在这个例子中,大家可以注意到 k n k k p q k n p − = , 0≤k≤n 恰好是二项式(p+q)n 的展开式中的第 k+1 项,由此人们给 分布列 k n k k p q k n p − = (0≤k≤n)起了一个名字,称它为二项分布,并且常常记 p q b(k;n, p) k n k n k = − 一个随机变量的分布列如果是二项分布,也称该随机变量服从二项分布.所以上述 例子中的 是服从二项分布 b(k;n,p)的随机变量. 在二项分布中,如果 n=1,那么 k 只能取值 0或 1,这时显然有 p0=q, p1=p 也可以表示成右表: 这个分布列称为 0—1 分布或二点分布,它是二项分布的特例,本节 开始时讨论过的抛掷均匀硬币的例子中,随机变量的 分布列为: 它就是 0—1 分布当 p=1/2 时的特例. 在第一章里曾经提到,必然事件 可以作为随机事件的极端情形来看待,相应地,在 上有定义的恒等于常数 a 的变量 (虽然它的取值已经失去随机性),也可以看作为随 机变量的极端形.这时,随机变量 的分布列为 P( =a)=1 人们称这个分布为单点分布或退化分布. 0 1 pi q p 0 1 pi 1/2 1/2
第二章离散型随机变量 2.几何分布 以上是一些只取有限个值的随机变量的例子,下面进一步讨论取可列个值的随机变 量的例子 [例3]在一个贝努里试验中,每次试验成功的概率为p,失败的概率为q 1-p(0p<1),设试验进行到第5次才出现成功,求的分布列 [解]由例1.26可知 P(5=k)=pq,k=1,2 容易看到p(k1,2,…)是几何级数∑p的一般项,于是人们称它为几何分布并 记 3.普哇松( Poisson)分布 观察某电话局在单位时间内收到用户的呼唤次数、某公共汽车站在单位时间里来站 乘车的乘客数、宇宙中单位体积内星球个数、耕地上单位面积内杂草的数目等,如果相 应的变量用 ξ表示,那么实践表明5的统计规律近似地为 P(5=k)=,e-2,k=0,1,2, 其中λ>0是某个常数,易于验证有 (1)P(5+).k=0,1,2,…;(2)∑P5=k)=∑e= 这个分布称作是参数为λ的普哇松( Poisson)分布,并常常记作P(k;2) [例4]在一个放射性物质的试验中,共观察了N=2608次,每次观察的时间间隔为 7.5秒,并记录到达指定区域内的质点数,若观察到有k个质点的次数为N,则N/N表示 有k个质点的频率,而P(k;3.870)表示参数A=3.870,5=k的概率,下表给出了两者的 对照值
第二章 离散型随机变量 ·49· 2.几何分布: 以上是一些只取有限个值的随机变量的例子,下面进一步讨论取可列个值的随机变 量的例子. [例 3] 在一个贝努里试验中,每次试验成功的概率为 p,失败的概率为 q= 1-p(0<p<1),设试验进行到第 次才出现成功,求 的分布列. [解] 由例 1.26 可知 P( =k)=pq k-1 ,k=1,2,… 容易看到 pq k-1 (k=1,2, …)是几何级数 = − 1 1 k k pq 的一般项,于是人们称它为几何分布,并 记 pq k-1=g(k,p). 3. 普哇松(Poisson)分布: 观察某电话局在单位时间内收到用户的呼唤次数、某公共汽车站在单位时间里来站 乘车的乘客数、宇宙中单位体积内星球个数、耕地上单位面积内杂草的数目等,如果相 应的变量用 表示,那么实践表明 的统计规律近似地为: P( =k)= − e k k ! ,k=0,1,2, … 其中 >0 是某个常数,易于验证有 (1) P( =k)>0,k=0,1,2, …; (2) 1 ! ( ) 0 0 = = = = − = k k k e k P k . 这个分布称作是参数为 的普哇松(Poisson)分布,并常常记作 P(k; ). [例 4] 在一个放射性物质的试验中,共观察了 N=2608 次,每次观察的时间间隔为 7.5 秒,并记录到达指定区域内的质点数,若观察到有 k 个质点的次数为 Nk,则 Nk/N 表示 有 k 个质点的频率,而 P(k;3.870)表示参数 =3.870, =k 的概率,下表给出了两者的 对照值