set seed 100设置种子数为100set obs 20设置样本量为20产生20个在(0,1)区间上均匀分布的随机数。gen r-uniformOlist显示这些随机数结果如下I1..71852962..16467283..92580414..18337365..00673276..74133617..35999438..16345439..44555310..648904911..379943112..596489513..025134614..216440215..684847916..127001817..646625818..186928819..452238420..067132利用均匀分布随机数进行随机分组:例:某实验要把20只大鼠随机分为2组,每组10只,请制定随机分组方案和措施。第一步、把20只大鼠编号,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20。并且标明。第二步、用Stata软件制定随机分组方案,操作如下:
set seed 100 设置种子数为 100 set obs 20 设置样本量为 20 gen r=uniform() 产生 20 个在(0,1)区间上均匀分布的随机数。 list 显示这些随机数 结果如下 r 1. .7185296 2. .1646728 3. .9258041 4. .1833736 5. .0067327 6. .7413361 7. .3599943 8. .1634543 9. .445553 10. .6489049 11. .3799431 12. .5964895 13. .0251346 14. .2164402 15. .6848479 16. .1270018 17. .6466258 18. .1869288 19. .4522384 20. .067132 利用均匀分布随机数进行随机分组: 例:某实验要把 20 只大鼠随机分为 2 组,每组 10 只,请制定随 机分组方案和措施。 第一步、把 20 只大鼠编号,1,2,3,4,5,6,7,8,9,10, 11,12,13,14,15,16,17,18,19,20。并且标明。 第二步、用 Stata 软件制定随机分组方案,操作如下:
清除内存clearset seed 200设置种子数为200设置样本量为20set obs 20建立编号1至20range no120产生在(0,1)均匀分布的随机数gen r=uniformO设置分组变量group的初始值为1gen group=1对随机数从小到大排序sortr设置最大的10个随机数所对应的记录in 11/20replace group=2为第2组,即:最小的10个随机数所对应的记录为第1组按照编号排序sortnolist显示随机分组的结果结果如下:norgroup21.1.95120072.22.52498763.31.51299864.4.1264391 5.52,58661616.26.70592097.71.26332868.82.56446889.91.117103310210..95406511.111.482286312.112.3347736213.13.567890214.214.799443115.151.118050316.162.983429917.171.280787418.181.09524519.192.944605120.201.3467524
clear 清除内存 set seed 200 设置种子数为 200 set obs 20 设置样本量为 20 range no 1 20 建立编号 1 至 20 gen r=uniform() 产生在(0,1)均匀分布的随机数 gen group=1 设置分组变量 group 的初始值为 1 sort r 对随机数从小到大排序 replace group=2 in 11/20 设置最大的 10 个随机数所对应的记录 为第 2 组,即:最小的 10 个随机数所 对应的记录为第 1 组 sort no 按照编号排序 list 显示随机分组的结果 结果如下: no r group 1. 1 .9512007 2 2. 2 .5249876 2 3. 3 .5129986 1 4. 4 .126439 1 5. 5 .5866161 2 6. 6 .7059209 2 7. 7 .2633286 1 8. 8 .5644688 2 9. 9 .1171033 1 10. 10 .954065 2 11. 11 .4822863 1 12. 12 .3347736 1 13. 13 .5678902 2 14. 14 .7994431 2 15. 15 .1180503 1 16. 16 .9834299 2 17. 17 .2807874 1 18. 18 .095245 1 19. 19 .9446051 2 20. 20 .3467524 1
随机分组整理如下第一组7编号341112915171820第二组编号125681013141619产生服从正态分布N(u,)的随机数invnorm(uniformO)*o+μ。例如产生10个服从正态分布N(100,6)的随机数,操作如下:清除内存clear设置种子数为200set seed 200设置样本量为10set obs 10产生服从N(100,6)的随机数gen x=invnorm(uniformO)*6+100list显示随机数结果如下:x1.109.93972.100.37613.100.19554.93.139685.101.31316.103. 2497.96.20138.100.97399.92.8624410.110.1137教学应用:考察样本均数的分布。由于个体变异的原因,样本均数x的抽样误差(其定义为样本均数
随机分组整理如下 第一组 编号 3 4 7 9 11 12 15 17 18 20 第二组 编号 1 2 5 6 8 10 13 14 16 19 产生服从正态分布N(μ,σ 2 )的随机数invnorm(uniform())*σ+μ。 例如产生 10 个服从正态分布N(100,62 )的随机数,操作如下: clear 清除内存 set seed 200 设置种子数为 200 set obs 10 设置样本量为 10 gen x=invnorm(uniform())*6+100 产生服从N(100,62 )的随机数 list 显示随机数 结果如下: x 1. 109.9397 2. 100.3761 3. 100.1955 4. 93.13968 5. 101.3131 6. 103.249 7. 96.2013 8. 100.9739 9. 92.86244 10. 110.1137 教学应用:考察样本均数的分布。 由于个体变异的原因,样本均数 X 的抽样误差(其定义为样本均数
与总体均数的差值)是不可避免的,并且样本均数的抽样误差是呈随机变化的。对于一次抽样而言,无法考察样本均数的抽样误差的规律性,但当大量地重复抽样,计算每次抽样的样本均数,考察样本均数x的随机分布规律性和统计特征。举例如下:利用计算机模拟产生100000个服从正态分布N(100,6)的样本,样本量分别为n=4,n=9,n=16,n=36,每个样本计算样本均数。这里关键处是要清楚什么是样本量(每次抽样所观察的对象个数,也就是每个样本的个体数n)、什么是样本个数(指抽样的次数),现以n=4为例,一条记录存放一个样本,样本量n=4,也就是每个样本的第1个数据放在第1列,第2个数据放在第2列,第3个数据放在第3列,第4个数据放在第4列,因此第1行是第一个样本,第2行是第2个样本,第100000行是第100000个样本,计算样本均数放在第5列,因此共有100000个样本均数。具体操作如下清除内存clear扩大虚拟内存为60M60msetmemory设置记录数为100000set obs 100000设置种子数为200set seed 200产生第1个随机数据gen x1=invnorm(uniform(0)*6+100产生第2个随机数据gen x2=invnorm(uniformO)*6+100产生第3个随机数据gen x3=invnorm(uniformO)*6+100产生第4个随机数据gen x4-invnorm(uniform0)*6+100计算平均数,并且存放在变量名为gen mean=(x1+x2+x3+x4)/4mean
与总体均数的差值)是不可避免的,并且样本均数的抽样误差是呈随 机变化的。对于一次抽样而言,无法考察样本均数的抽样误差的规律 性,但当大量地重复抽样,计算每次抽样的样本均数 X ,考察样本均 数 X 的随机分布规律性和统计特征。举例如下: 利用计算机模拟产生 100000 个服从正态分布N(100,62 )的样本,样 本量分别为n=4,n=9,n=16,n=36,每个样本计算样本均数。这里 关键处是要清楚什么是样本量(每次抽样所观察的对象个数,也就是 每个样本的个体数n)、什么是样本个数(指抽样的次数),现以n=4 为 例,一条记录存放一个样本,样本量n=4,也就是每个样本的第 1 个 数据放在第 1 列,第 2 个数据放在第 2 列,第 3 个数据放在第 3 列, 第 4 个数据放在第 4 列,因此第 1 行是第一个样本,第 2 行是第 2 个样本,第 100000 行是第 100000 个样本,计算样本均数放在第 5 列,因此共有 100000 个样本均数。具体操作如下: clear 清除内存 set memory 60m 扩大虚拟内存为 60M set obs 100000 设置记录数为 100000 set seed 200 设置种子数为 200 gen x1=invnorm(uniform())*6+100 产生第 1 个随机数据 gen x2=invnorm(uniform())*6+100 产生第 2 个随机数据 gen x3=invnorm(uniform())*6+100 产生第 3 个随机数据 gen x4=invnorm(uniform())*6+100 产生第 4 个随机数据 gen mean=(x1+x2+x3+x4)/4 计算平均数,并且存放在变量名为 mean
以样本均数为数据,计算其平均值和sumean标准差结果ObsMinMaxVariable|MeanStd.Dev.mean10000099.983883.00222587.97424112.0461现共有100000个样本,每个样本计算一个样本均数,因此有100000个样本均数,现在把一个样本均数X视为一个数据,把100000个样本均数视为一个样本量为100000的新样本(这个样本里有100000个x),计算这100000个X的平均值和标准差:得到:这100000个X的平均值=99.98388非常接近总体均数μ=100这 10000 个X的标准差=3. 002225~号=号=3(理论上可以证明样VnV4本均数的总体均数与样本所在的总体的总体均数相同,样本均数的标准差-样本所在总体的总体标准差)Nn再考察这100000个X的频数图graph mean,bin(50) xlabel ylabel norm
su mean 以样本均数为数据,计算其平均值和 标准差 结果 Variable | Obs Mean Std. Dev. Min Max -+- mean | 100000 99.98388 3.002225 87.97424 112.0461 现共有 100000 个样本,每个样本计算一个样本均数,因此有 100000 个样本均数,现在把一个样本均数 X 视为一个数据,把 100000 个样 本均数视为一个样本量为 100000 的新样本(这个样本里有 100000 个 X ),计算这 100000 个 X 的平均值和标准差:得到: 这 100000 个 X 的平均值=99.98388 非常接近总体均数μ=100 这 100000 个 X 的标准差=3.002225 6 3 n 4 σ ≈ = = (理论上可以证明样 本均数的总体均数与样本所在的总体的总体均数相同,样本均数的标 准差= n 样本所在总体的总体标准差 ) 再考察这 100000 个 X 的频数图 graph mean,bin(50) xlabel ylabel norm