第五章数理统计的基本概念 教学目的要求: 1.要求学生掌握数理统计的基本概念,如:总体、样本、样本分布函数、样本函数、统 计量等。 2.会求样本分布函数,作直方图等处理数据的常用方法 3.掌握样本均值、样本方差、样本原点矩、样本中心矩等常用统计量。 教学重点 1.数理统计中常用的三大分布,如:x2-分布、t分布、F分布的定义和性质 2.正态总体统计量的分布 教学难点: 正态总体统计量的基本性质 §5.1母体与子样、经验分布函数 数理统计的基本内容: 收集、整理、分析观测大量随机现象所得的实验数据。 二、数理统计的基本任务: 硏究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念 特征作出科学的推断 三、基本概念: 1.总体:研究对象的全体所构成的集合(随机变量x可能取值集合代表总体某 指标)。 2.个体:组成总体的每一个单位。 3.样本:抽样结果得到x的一组实验数据(或观测值)。 4.样本容量:样本中包含的个体的个数 四、基本原则 5.随机抽样即:等可能的独立的抽取 6.由样本推断总体 五、基本假设: 7.无限总体(n/N≤0.1经验值) 8.独立同分布 六、样本分布函数:(经验分布函数) 设总体x中抽取容量为n样本,得到下面的样本频率分布表
第五章 数理统计的基本概念 教学目的要求: 1.要求学生掌握数理统计的基本概念,如:总体、样本、样本分布函数、样本函数、统 计量等。 2.会求样本分布函数,作直方图等处理数据的常用方法。 3.掌握样本均值、样本方差、样本原点矩、样本中心矩等常用统计量。 教学重点: 1.数理统计中常用的三大分布,如: 2 -分布、t-分布、F-分布的定义和性质。 2.正态总体统计量的分布 教学难点: 正态总体统计量的基本性质。 §5.1 母体与子样、经验分布函数 一、数理统计的基本内容: 收集、整理、分析观测大量随机现象所得的实验数据。 二、数理统计的基本任务: 研究如何进行观测以及如何根据观测得到的统计资料,对被研究的随机现象的一般概念 特征作出科学的推断。 三、基本概念: 1. 总体:研究对象的全体所构成的集合(随机变量 x 可能取值集合代表总体某一 指标)。 2. 个体:组成总体的每一个单位。 3. 样本:抽样结果得到 x 的一组实验数据(或观测值)。 4. 样本容量:样本中包含的个体的个数。 四、基本原则: 5. 随机抽样 即:等可能的独立的抽取 6. 由样本推断总体 五、基本假设: 7. 无限总体(n/N≤0.1 经验值) 8. 独立同分布 六、样本分布函数:(经验分布函数) 设总体 x 中抽取容量为 n 样本,得到下面的样本频率分布表:
观测值 x x 总计 频数 12 n 其中y<y< ∑m=n;∑f:=1 则有样本分布函数 0:x≤ F(x)={∑f,x<x≤x x≤x(1) 具有性质:(1)0≤F(x)≤1 (2)F(x)是非减函数 (4)F,(x)在每个观测值x处是左连续的,且为跳跃的, 跳跃度等于频率f(i=1,2,3,……t) 设总体分布函数为Fn(x),当n→∞时,由贝努里大数定理知 limP( F(x)-F()>E)=0 可见当样本容量充分大时Fn(x)-→F(x) 进一步由格里汶科定理 当n→∞时PSup|Fn(x)F(x))-mm→0 §5.2统计量及其分布 、样本函数: 从总体中抽取样本x1,x2…xn得到的观测值分别是xa,x(23,…,xm
观测值 x(1) x(2) … … x(t) 总 计 频 数 m1 m2 … … mt n 频 率 f 1 f 2 … … f t 1 其中 x(1) < x(2) <… … < x(t) t≤n; f t =mt /n; = i i mi 1 =n; = l i i f 1 =1; 则有样本分布函数: (1) ( ) ( 1) ( ) ( ) 0; ( ) ; 1; n t t t x x t n x x F x f x x x x x + = 具有性质:⑴ 0≤ Fn (x)≤1 ⑵ Fn (x)是非减函数 ⑶ Fn (- )=0 Fn (+ )=1 ⑷ Fn (x)在每个观测值 x(t) 处是左连续的,且为跳跃的, 跳跃度等于频率 f i (i=1,2,3,… … t) 设总体分布函数为 Fn (x),当 n→ 时,由贝努里大数定理知 n→ lim P( Fn (x)-F (x) > )=0 可见当样本容量充分大时 Fn (x) ⎯⎯p→ F (x) 进一步由格里汶科定理 当 n→ 时 P{ sup x Fn (x)-F (x) } ⎯⎯n−⎯.00→ 0 §5.2 统计量及其分布 一、样本函数: 从总体中抽取样本 x1,x2 ,… …, xn ,得到的观测值分别是 x(1) ,x(2) ,…, x(n)
则函数g(x,x2 xn)叫样本函数(n维随机函数 统计量 样本函数g(x1,x2 xn)中不含任何未知参数的随机变量。 、常用统计量: )样本均值x=∑x观测值 样本方差S=(x-x)=∑x-x 观测值Sn n(x-x)72x-x通常分母m换成m1,以保证无偏性 x (x1-x) 样本标准差Sn=Vsn= 观测值sn=sn (样本的k阶原点矩=∑x观测值 6样本的k阶中心矩U=n2(x-x)观测的=(x-x) 其中U=04n2=1 其中s=n12(x;-x)观测值=u n 当样本容量较大时,观测值x=∑m1x m(x (x 四、数理统计中的常用分布:
则函数 g( x1, x2 ,… …, xn )叫样本函数(n 维随机函数)。 二、统计量: 样本函数 g( x1, x2 ,… …, xn )中不含任何未知参数的随机变量。 三、常用统计量: ⑴ 样本均值 X = = n i xi n 1 1 观测值 x = = n i xi n 1 1 ⑵样本方差 Sn 2 = − = n i i xi x n 1 ( ) 1 = x n xi − 1 2 观测值 sn 2 = − = n i i xi x n 1 ( ) 1 = x n xi − 1 2 通常分母 n 换成 n-1,以保证无偏性。 ⑶样本标准差 n i n i n n x x s s − = = = 1 2 2 ( ) 观测值 n i n i n n x x s s − = = = 1 2 2 ( ) ; ⑷样本的 k 阶原点矩 = = n i k i k V x n 1 1 观测值 = = n i k i k V x n 1 1 ⑸样本的 k 阶中心矩 ( ) 1 1 U xi x n n k i k − = = 观测值 ( ) 1 1 U xi x n n k i k − = = ; 其中U1 0 u 2 = s n 2 1 1 − 其中 = s 2 1 1 n − − = n i k xi x 1 ( ) 观测值 2 =u 2 = s n 2 1 1 − 当样本容量较大时,观测值 m xi l i i n x = = 1 1 ( ) ( ) 1 1 2 1 2 s m x i x n l i i − − = = ( ) ( ) 1 2 1 2 m x i x n l i i − = = 四、数理统计中的常用分布:
()x-分布:设随机变量x,x2,……xk相互独立,并且都服从正态分 布N0,1),则x=x1+x2+……+x的概率密度 x 2(x)=0 E Dyy T2设x1与x2独立,且x:x()x2x(k2) 则x1+x2x(k1+k: 13上侧分位数,满足P(x>x(n)=fd,=a的数x,(m)则给定 2.t-分布: x~N(O)y~x(k)则随机变量t 的概率密度为 当自由度k→+∞,t-分布趋近与标准 kTPO 正态分布N(0,1) 分布 xx(k)yx(k)则F=2的概率密度为 /k2 k1+k2 k1 (x) k1、k2 k12k2 X k+k (kiX+k 其中k1分子自由度(第一自由度)k2分母自由度(第二自由度)
⑴ 2 -分布: 设随机变量 x1, x2 ,… …, xk 相互独立,并且都服从正态分 布 N(0,1),则 2 = x + x + 2 2 2 1 … …+ xk 2 的概率密度 2 (x) = x f e x k k k T 2 1 2 ) 2 ( 1 2 − − x>0; 2 (x) = x f 0 x≤0; Th1 E = x ( ) 2 k D = x ( ) 2 2*k; Th2 设 2 1 与 2 2 独立,且 ~ ( ) 1 2 2 x1 k ~ ( ) 2 2 2 x2 k 则 ~ ( ) 1 2 2 2 2 2 1 + k + k Th3 上侧分位数,满足 = = f d x x P n ( ) ( ) 2 2 ( ( )) 2 的数 ( ) 2 n 则给定 0< <1; 2. t-分布: x ~ N(0,1) ~ ( ) 2 2 y k 则随机变量 t= k y x 的概率密度为 ) 2 (1 2 ) 2 ( ) 2 1 ( ( ) 2 1 + + + − = k t k k P k T f x 当自由度 k → + ,t-分布趋近与标准 正态分布 N(0,1) 3. F-分布: ~ ( ) 1 2 x k ~ ( ) 2 2 y k 则 k k y x F 2 1 = 的概率密度为: f (x) F = ( ) 1 2 1 2 ) 2 ) ( 2 ( ) 2 ( 2 1 2 2 2 1 2 1 2 1 2 1 1 2 k x k k k k k k k k k k k k T T T + + − + + x>0; f (x) F =0 x≤0; 其中 k1 分子自由度(第一自由度) k 2 分母自由度(第二自由度);
§5.3次序统计量 Def5.3第i个次序统计量ξ(i):是关于子样ξ1,ξ2,、、ξn的函数,无论ξ1,2,、、 ξn取得怎样一组观测值x1,x2,、xn,它总是以其中第i个顺序值x(i)为其观测值. 注:(1)n个次序统计量,(1)≤ξ(2)、、≤ξ(n) 5(1)为最小次序统计量,(n)为最大统计量 (2)1,2,、、n相互独立,不一定有ξ(1)ξ(2)、、(n)相互独立,如 P243例5.2中P((1)=0)=19/27≠9/13P((1)=0|5(2)=1) 二、次序统计量的分布:(母体ξ是连续型) Th5.5若母体ξ有密度函数f(x)>0,a≤x≤b分布函数F(x),(1,52,、n) 为取自母体的一个子样,则第i个次序统计量ξ(i)的密度函数 (-1)(n-l) [FOr[-Forro a≤y≤b 其它 证明:事件(第i个次序统计量5(i)∈(y,y+△y)} e{(1)(2)…(n)∈(,y),()∈(,y+y),(…5)∈(+Ab) (a I+1 P(∈(y+4y b)=1-f(+△y) ∈(Uy+4y)=f(y)A y [F(y)[-F(y+△y) 令Ay→0时,由F(x)的连续性知 80)0- F(v[-F()f(0)asy≤6 其它
§5.3 次序统计量 Def 5.3 第 i 个次序统计量ξ(i):是关于子样ξ1,ξ2,、、ξn 的函数,无论ξ1,ξ2,、、、 ξn 取得怎样一组观测值x1,x2,、、、xn,它总是以其中第i个顺序值x(i)为其 观测值. 注:⑴ n 个次序统计量,ξ(1)≤ξ(2)、、、≤ξ(n) ξ(1)为最小次序统计量 , ξ(n)为最大统计量 ⑵ ξ1,ξ2,、、ξn 相互独立 ,不一定有ξ(1)ξ(2)、、、ξ(n)相互独立 ,如 P243 例 5.2 中 P(ξ(1)=0)=19/27≠9/13 P(ξ(1)=0∣ξ(2)=1) 二、次序统计量的分布: (母体ξ是连续型) Th5.5 若 母体ξ有密度函数 f(x)>0,a≤x≤b 分布函数 F(x),( ξ1,ξ2,、、ξn) 为取自母体的一个子样,则第 i 个次序统计量ξ(i)的密度函数 ( ) ( ) ( ) ( ) − − − − − 0 ( 1)!( )! ! [ ] [1 ] 1 f y i n i n y F y F y g i n i i 其它 a y b 证明: 事件{第 i 个次序统计量ξ(i) (y,y+ y )} {ξ(1)ξ(2)、、、ξ(n)∈(a,y), ξ(i) (y,y+ y ) , (y y b) i n ( ) , 1 + + 而 P( (a y)) F(y) k , = k=1,2、、、I+1 P (y y b) f (y y) t ( + , ) =1− + t=I+1,、、、、、n g m ( ) P (y y y) f y y i ( , + ) = ( ) ( ) ( 1)!( )! ! i n i n g y y i − − = [ ( )] [1 ( )] 1 F y F y y i n i − + − − 令 y → 0 时, 由 F(x) 的连续性知 ( ) ( ) ( ) ( ) − − − − − 0 ( 1)!( )! ! [ ] [1 ] 1 f y i n i n y F y F y g i n i i 其它 a y b