Stata软件基本操作和数据分析入门 第三讲概率分布和抽样分布 概率分布累积函数 1.标准正态分布累积函数norm(X) 2.t分布右侧累积函数 tail(df,x),其中df是自由度 3.x2分布累积函数chi2(d,x),其中df是自由度 4.x2分布右侧累积函数 chitai(d,x),其中df是自由度 5.F分布累积函数F(dl,dn2,X),dfl为分子自由度,dn2为分母 自由度 6.F分布右侧累积函数Fdf1,dn,X),dl为分子自由度,dn为 分母自由度 累积函数的计算使用 正态分布计算 X服从N(0,1),计算概率P(X<1.96) display norm (1.96) 9750021即概率P(X<1.96)=0.975001 display可简写为di,如: di norm(1.96),同样可以得到上述结果。 X服从N(0,1),计算概率P(X>196),则 di 1-norm(1.96) 0249979即概率P(X>1.96)=0.0249979 x服从N(H),则y=x-~N0.D,因此对其他正态分布只要在函 数括号中插入一个上述表达式就可以得到相应概率
Stata 软件基本操作和数据分析入门 第三讲 概率分布和抽样分布 概率分布累积函数 1. 标准正态分布累积函数 norm(X) 2. t 分布右侧累积函数 ttail(df,X) ,其中 df 是自由度 3. χ2分布累积函数 chi2(df,X) ,其中 df 是自由度 4. χ2分布右侧累积函数 chi2tail(df,X) ,其中 df 是自由度 5. F 分布累积函数 F(df1,df2,X),df1 为分子自由度,df2 为分母 自由度 6. F 分布右侧累积函数 F(df1,df2,X),df1 为分子自由度,df2 为 分母自由度 累积函数的计算使用 正态分布计算 X 服从 N(0,1),计算概率 P(X<1.96) . display norm(1.96) .9750021 即概率 P(X<1.96)=0.9750021 display 可简写为 di,如: di norm(1.96),同样可以得到上述结果。 X 服从 N(0,1),计算概率 P(X>1.96),则 . di 1- norm(1.96) .0249979 即概率 P(X>1.96)=0.0249979 X 服从 N(μ,σ 2 ),则 ~ (0,1) X Y N μ σ − = ,因此对其他正态分布只要在函 数括号中插入一个上述表达式就可以得到相应概率
例如:X服从N(100,62),计算概率P(X<176),则操作如下 di norm((1176-100)/6) 9750021 即:概率P(X<1176)=0.9750021 又如ⅹ服从N(1006),计算概率P(X>90),操作如下 dil-norm(90-100)6) 95220965 x2分布累积概率计算 设X服从自由度为1的x2分布,计算概率P(X>3.84),则操作如下 di1-chi2(1,3.84) 05004353 概率P(X>3.84)=0.05004353 设X服从自由度为3的x2分布,计算概率P(X<5),则操作如下 di chi2 (3, 5) 82820288 概率P(X<5)=0.82820288 x2分布右侧累积概率计算 设X服从自由度为1的x2分布,计算概率P(X>3.84),则操作如下 di chi2tail(1, 3. 84) 05004353 概率P(X>3.84)=0.05004353 设X服从自由度为3的x2分布,计算概率P(X<5,则操作如下 . di chi2(3, 5) 82820288 概率P(X<5)=0.82820288
例如:X 服从 N(100,62 ),计算概率 P(X<111.76),则操作如下 . di norm((111.76-100)/6) .9750021 即:概率 P(X<111.76)=0.9750021 又如 X 服从 N(100,62 ),计算概率 P(X>90),操作如下 . di 1-norm((90-100)/6) .95220965 χ2分布累积概率计算 设 X 服从自由度为 1 的χ2分布,计算概率 P(X>3.84),则操作如下 . di 1-chi2(1,3.84) .05004353 概率 P(X>3.84)=0.05004353 设 X 服从自由度为 3 的χ2分布,计算概率 P(X<5),则操作如下 . di chi2(3,5) .82820288 概率 P(X<5)=0.82820288 χ2分布右侧累积概率计算 设 X 服从自由度为 1 的χ2分布,计算概率 P(X>3.84),则操作如下 . di chi2tail(1,3.84) .05004353 概率 P(X>3.84)=0.05004353 设 X 服从自由度为 3 的χ2分布,计算概率 P(X<5),则操作如下 .di chi2(3,5) .82820288 概率 P(X<5)=0.82820288
t分布右侧累积概率计算 设t服从自由度为10的t分布,计算概率P(t>22),操作如下 di tail(10, 2.2) 02622053概率P(>22)=0.02622053(注意:这是右累积函数) 设t服从自由度为10的t分布,计算概率P(-2),操作如下 di l-ttail(10, -2) 03669402概率P(t<-2)=0.03669402 F分布累积概率计算 设F服从F(3,27),计算概率P(F<1),操作如下: diF3,27,1)注意这里的函数是大写F, stata软件中是区分大小写的 59208514 概率P(F<1)=0.59208514 设F服从F(4,40),计算概率P(F>3),操作如下: diI-F(4,40,3) 02954694 概率P(F>3)=0.02954694 F分布右侧累积概率计算 设F服从F(3,27),计算概率P(F<1),操作如下: di 1-Ftail(3, 27, 1) 注意这里的函数是大写F, stata软件中是区分大小写的 59208514 概率P(F<1)=0.59208514 设F服从F(4,40),计算概率P(F>3),操作如下: di tail(4, 40, 3) 02954694 概率P(F>3)=0.02954694
t 分布右侧累积概率计算 设 t 服从自由度为 10 的 t 分布,计算概率 P(t>2.2),操作如下 . di ttail(10,2.2) .02622053 概率 P(t>2.2)=0.02622053 (注意:这是右累积函数) 设 t 服从自由度为 10 的 t 分布,计算概率 P(t<-2),操作如下 . di 1-ttail(10,-2) .03669402 概率 P(t<-2)=0.03669402 F 分布累积概率计算 设 F 服从 F(3,27),计算概率 P(F<1),操作如下: . di F(3,27,1) 注意这里的函数是大写 F,stata 软件中是区分大小写的 .59208514 概率 P(F<1)=0.59208514 设 F 服从 F(4,40),计算概率 P(F>3),操作如下: . di 1-F(4,40,3) .02954694 概率 P(F>3)=0 .02954694 F 分布右侧累积概率计算 设 F 服从 F(3,27),计算概率 P(F<1),操作如下: . di 1-Ftail(3,27,1) 注意这里的函数是大写 F,stata 软件中是区分大小写的 .59208514 概率 P(F<1)=0.59208514 设 F 服从 F(4,40),计算概率 P(F>3),操作如下: . di Ftail(4,40,3) .02954694 概率 P(F>3)=0 .02954694
概率分布的临界值计算 正态分布的临界值计算函数 Inhorn(P) 例如:双侧Ua0s(即:左侧累积概率为0975),操作如下 di invnorm(0.975) 1959964即U05=1959964 t分布的临界值计算函数 invttail(df, P) 例如计算自由度为28的右侧累积概率为0.025的临界值t2s,a,操作 如下 di invttail(28.,0.025) 2.0484071 临界值t2a=2.0484071 x2分布的临界值计算函数 inchi(dfP)或 invchi2 tail(df, P) 例如:计算自由度为1的x2右侧累积概率为005的临界值x2a05,操 作如下: di invchi2(1, 0.95) 3.8414591 临界值x20as=3.8414591 或者操作如下: di invchi2tail(1, 0.05) 3.8414591 临界值x20=3.8414591
概率分布的临界值计算 正态分布的临界值计算函数 invnorm(P) 例如:双侧 U0.05(即:左侧累积概率为 0.975),操作如下 . di invnorm(0.975) 1.959964 即 U0.05=1.959964 t 分布的临界值计算函数 invttail(df,P) 例如计算自由度为 28 的右侧累积概率为 0.025 的临界值 t28,α,操作 如下 . di invttail(28,0.025) 2.0484071 临界值 t28,α=2.0484071 χ2分布的临界值计算函数 invchi2(df,P) 或 invchi2tail(df,P) 例如:计算自由度为 1 的χ2右侧累积概率为 0.05 的临界值χ2 0.05,操 作如下: . di invchi2(1,0.95) 3.8414591 临界值χ2 0.05=3.8414591 或者操作如下: . di invchi2tail(1,0.05) 3.8414591 临界值χ2 0.05=3.8414591
F分布的临界值计算函数invF(dl,dn2,P)或invF(d,dm2,P) 例如计算分子自由度为3和分母自由度27的右侧累积概率为0.05的 临界值,操作如下: di inVE(3,27,0.95) 2.9603513 临界值F0(3,27)=29603513 或者操作为: di inv tail(3, 27, 0.05) 2.9603513 临界值F05(3,27)=29603513 产生随机数 计算机所产生的随机数是通过一串很长的序列数模拟随机数,故 称为伪随机数,在实际应用这些随机数时,这些随机数一般都能具有 真实随机数的所有概率性质和统计性质,因此可以产生许许多多的序 列伪随机数,一个序列的第一个随机数对应一个数,这个数称为种子 数(see,因此可以利用种子数,使随机数重复实现。 设置种子数的命令为 set seed数。每次设置同一种子数,则产生 的随机序列是相同的。 产生(0,1)区间上的均匀分布的随机数 uniform 例如产生种子数为100的20个在(0,1)区间上的均匀分布的随机 数,则操作如下 lear 清除内存 set seed 100 设置种子数为100
F 分布的临界值计算函数 invF(df1,df2,P) 或 invF(df1,df2,P) 例如计算分子自由度为 3 和分母自由度 27 的右侧累积概率为 0.05 的 临界值,操作如下: . di invF(3,27,0.95) 2.9603513 临界值 F0.05(3,27)= 2.9603513 或者操作为: . di invFtail(3,27,0.05) 2.9603513 临界值 F0.05(3,27)= 2.9603513 产生随机数 计算机所产生的随机数是通过一串很长的序列数模拟随机数,故 称为伪随机数,在实际应用这些随机数时,这些随机数一般都能具有 真实随机数的所有概率性质和统计性质,因此可以产生许许多多的序 列伪随机数,一个序列的第一个随机数对应一个数,这个数称为种子 数(seed),因此可以利用种子数,使随机数重复实现。 设置种子数的命令为 set seed 数。每次设置同一种子数,则产生 的随机序列是相同的。 产生(0,1)区间上的均匀分布的随机数 uniform() 例如产生种子数为 100 的 20 个在(0,1)区间上的均匀分布的随机 数,则操作如下: clear 清除内存 set seed 100 设置种子数为 100