我们注意到,当样本量充分大时,Z值和t值十分接近,因此,即使σ2未知,也仍然可 以取K=Z:但在小样本条件下,Z值和t值差别较大,所以在实践中,只有当o2未知且样本 量较小(n<30)时才用t值,即取K=t 四、估计量的优良标准 由于抽样指标是一个随机变量,随着抽取的样本不同,便有不同的估计值,因此,要判 断一种估计量的好环,仅从某一次试验的结果来衡量是不够的,而应从多次重复试验中,看 这种估计量是否在某种意义上最接近于被估计参数的真值。一般地说,用抽样指标估计总体 指标应该有三项基本要求或标准,满足这三项要求的估计就可以被认为是合理的估计或优良 的估计,这三项要求即是抽样估计的三条优良标准。 1、无偏性 用样本指标估计总体指标要求所有可能的样本指标的平均值等于对应的总体指标值。 就是说,虽然每一次的抽样指标和未知的总体指标可能有偏误,但在多次反复的估计中 各个抽样指标的平均值应该等于总体指标,即用抽样指标来作估计平均说来是没有偏误的。 所以,样本指标是对应的总体指标的无偏估计量 关于这一点,可以用概率的方法加以证明 证明:设总体容量有N个:Y1,Y2,…,Yn,则: y=(Y1+Y2+…+Yn)/N 又设样本容量有n个,y1,y2,…,y,则: y=[y1+y2+…+yn]/n 所以 E()=y1+y+…+y)=nE()+E(2)+…+EO 由于y,y2,…,y都是取自总体Y,Y2,…,Y中,当n充分大时,它与总体同分布, 所以,E(y1)=E(y2)=…=E(yn)=(Y)=Y,因此 E(y)=-( 证毕 致性 用样本指标估计总体指标要求当样本容量充分大时,抽样指标也充分地靠近总体指标。 换言之,随着样本单元数n的无限增大(无限接近于总体单元数N),抽样指标和总体指标间 的绝对离差可以无限缩小 以平均数为例,证明如下: 设a为任意小的正数,依大数定律有 lim P(y-E(Ka)= 由平均数无偏性知道,抽样平均数的期望值等于总体平均数,即E(j)=,则有: P(y-rke 这表明,当样本单位数无限增大时,抽样平均数和总体平均数的绝对离差小于任意常数
我们注意到,当样本量充分大时,Z 值和 t 值十分接近,因此,即使σ 2 未知,也仍然可 以取 K=Z;但在小样本条件下,Z 值和 t 值差别较大,所以在实践中,只有当σ 2 未知且样本 量较小(n<30)时才用 t 值,即取 K=t。 四、估计量的优良标准 由于抽样指标是一个随机变量,随着抽取的样本不同,便有不同的估计值,因此,要判 断一种估计量的好环,仅从某一次试验的结果来衡量是不够的,而应从多次重复试验中,看 这种估计量是否在某种意义上最接近于被估计参数的真值。一般地说,用抽样指标估计总体 指标应该有三项基本要求或标准,满足这三项要求的估计就可以被认为是合理的估计或优良 的估计,这三项要求即是抽样估计的三条优良标准。 1、无偏性 用样本指标估计总体指标要求所有可能的样本指标的平均值等于对应的总体指标值。 就是说,虽然每一次的抽样指标和未知的总体指标可能有偏误,但在多次反复的估计中 各个抽样指标的平均值应该等于总体指标,即用抽样指标来作估计平均说来是没有偏误的。 所以,样本指标是对应的总体指标的无偏估计量。 关于这一点,可以用概率的方法加以证明: 证明:设总体容量有 N 个:Y1,Y2,…,Yn,则: Y =(Y1+Y2+…+Yn)/N 又设样本容量有 n 个,y1,y2,…,yn,则: y =[y1+y2+…+yn]/n 所以 [ ( ) ( ) ( )] 1 ( ) ( ) 1 2 1 2 n n E y E y E y n n y y y E y E = + + + + + + = 由于 y1,y2,…,yn 都是取自总体 Y1,Y2,…,Yn 中,当 n 充分大时,它与总体同分布, 所以,E(y1)=E(y2)=…=E(yn)=E(Y)= Y ,因此 Y Y Y Y n E y n = + + + = 个 ( ) 1 ( ) 证毕。 2、一致性 用样本指标估计总体指标要求当样本容量充分大时,抽样指标也充分地靠近总体指标。 换言之,随着样本单元数 n 的无限增大(无限接近于总体单元数 N),抽样指标和总体指标间 的绝对离差可以无限缩小。 以平均数为例,证明如下: 设α为任意小的正数,依大数定律有 lim ( − ( ) ) =1 → P y E y n 由平均数无偏性知道,抽样平均数的期望值等于总体平均数,即 E( y )= Y ,则有: lim ( − ) ) = 1 → P y Y n 这表明,当样本单位数无限增大时,抽样平均数和总体平均数的绝对离差小于任意常数
a(a>0)的概率趋近于1。这就是抽样估计的一致性。 3、有效性 用抽样指标估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。即: 用抽样平均数和总体某一变量来估计总体平均数,虽然两者都是无偏估计量,而且在每一次 的估计中两种估计量和总体平均数都可能有离差,但样本平均数更靠近在总体平均数的周围, 平均说来它的离差比较小,所以对比而言,抽样平均数是更为优良的估计量 由于样本变量和总体变量是同分布的,依方差性质可知: ()=∑a2=2(na2) 故V(歹)<σ所以,用抽样平均数估计总体平均数比用总体的变量X估计总体平均数更为有
α(α>0)的概率趋近于 1。这就是抽样估计的一致性。 3、有效性 用抽样指标估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。即: 用抽样平均数和总体某一变量来估计总体平均数,虽然两者都是无偏估计量,而且在每一次 的估计中两种估计量和总体平均数都可能有离差,但样本平均数更靠近在总体平均数的周围, 平均说来它的离差比较小,所以对比而言,抽样平均数是更为优良的估计量。 由于样本变量和总体变量是同分布的,依方差性质可知: = = = = n i i n n n n V y 1 2 2 2 2 2 ( ) 1 1 ( ) 故 V( y )<σ 2 所以,用抽样平均数估计总体平均数比用总体的变量 X 估计总体平均数更为有 效
第三章简单随机抽样 第一节简单随机抽样概述 、简单随机抽样的概念 简单随机抽样也叫作纯随机抽样。其概念可有两种等价的定义方法: 定义之一:简单随机抽样就是从总体N个抽样单元中,一次抽取n个单元时,使全部可 能的A=(N)种不同的样本被抽到的概率均相等,即都等于1/A 按简单随机抽样,抽到的样本称为简单随机样本。 按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。 但当N与n都比较大时,要列出全部可能的样本是不现实的。因此,按上述定义进行抽样是 不太方便的 定义之二:简单随机抽样是从总体的N个抽样单元中,每次抽取一个单元时,使每一个 单元都有相等的概率被抽中,连续抽n次,以抽中的n个单元组成简单随机样本 由于定义二无需列举全部可能的样本,故比较便于组织实施。但按这个定义进行抽样时, 仍然需要掌握一个可以赖以实施抽样的抽样框 二、简单随机抽样的具体实施方法 常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签 并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次抽一个号签, 连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可 能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到 等概率。因此,实际工作中常常使用随机数法 (二)随机数法 随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机 产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产 生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机 数,特别在n比较大时。 1、随机数表及其使用方法 随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表 所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用 种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一 个随机数字。为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。根据不 同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。 目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,1955年出版的100 万数字随机数表,它按五位一组排列,共有20万组:肯德尔和史密斯编制,1938年出版的 10万数字随机数表,它也按五位一组排列,共有25000组。我国常用的是中国科学院数学研 究所概率统计室编印的《常用数理统计表》中的随机数表 随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本 简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点: ①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的
第三章 简单随机抽样 第一节 简单随机抽样概述 一、简单随机抽样的概念 简单随机抽样也叫作纯随机抽样。其概念可有两种等价的定义方法: 定义之一:简单随机抽样就是从总体 N 个抽样单元中,一次抽取 n 个单元时,使全部可 能的 ( ) N A = n 种不同的样本被抽到的概率均相等,即都等于 1/A。 按简单随机抽样,抽到的样本称为简单随机样本。 按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。 但当 N 与 n 都比较大时,要列出全部可能的样本是不现实的。因此,按上述定义进行抽样是 不太方便的。 定义之二:简单随机抽样是从总体的 N 个抽样单元中,每次抽取一个单元时,使每一个 单元都有相等的概率被抽中,连续抽 n 次,以抽中的 n 个单元组成简单随机样本。 由于定义二无需列举全部可能的样本,故比较便于组织实施。但按这个定义进行抽样时, 仍然需要掌握一个可以赖以实施抽样的抽样框。 二、简单随机抽样的具体实施方法 常用的有抽签法和随机数法两种。 (一)抽签法 抽签法是先对总体 N 个抽样单元分别编上 1 到 N 的号码,再制作与之相对应的 N 个号签 并充分摇匀后,从中随机地抽取 n 个号签(可以是一次抽取 n 个号签,也可以一次抽一个号签, 连续抽 n 次),与抽中号签号码相同的 n 个单元即为抽中的单元,由其组成简单随机样本。 抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可 能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到 等概率。因此,实际工作中常常使用随机数法。 (二)随机数法 随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机 产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产 生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机 数,特别在 n 比较大时。 1、随机数表及其使用方法 随机数表是由 0 到 9 的 10 个阿拉伯数字进行随机排列组成的表。 所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用 一种特制的电器或用计算机,将 0 至 9 的 10 个数字随机地自动摇出,每个摇出的数字就是一 个随机数字。为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。根据不 同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。 目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,1955 年出版的 100 万数字随机数表,它按五位一组排列,共有 20 万组;肯德尔和史密斯编制,1938 年出版的 10 万数字随机数表,它也按五位一组排列,共有 25000 组。我国常用的是中国科学院数学研 究所概率统计室编印的《常用数理统计表》中的随机数表。 随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本。 简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点: ①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的
②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。遇到1至N的数可直接 使用;遇到其它的数不能直接使用。 ③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。可从起 点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部 单元号,中途不能变更。 ④在重复抽样时,遇到重复的数字应重复使用:在不重复抽样时,遇到重复的数字应舍 去不用。 随机数表法一般分下述几步 第一步:确定起点页码,如用笔尖在随机数表上随杋指定一点,若落点数字(或距落点最 近的数字)为奇数,则确定起点在第1页:否则,起点在第二页 第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点 的行数。由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行 数。为保证等概性,当落点处的数为“00”时,则行数应取作50。然后依同样的方法再确定 起点的列数。 第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或向右),每次取一个 r位数。通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽 取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即 r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第 行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单 元组成样本。 然而,按上述步骤抽样,由于每个总体单元只对应一个数字,因此,所读取随机数的放 弃比例可能很高,这在大样本时将使抽样过程变得很费事。为避免这种现象,可以在不违反 等概率原则的条件下令每个总体单元同时对应多个数字,以加快抽样的速度 一般说来,当N为一个r位数字时,要取一个从一到N间的随机数字,可以随机取1至N 的一个数字,其中N′为N的最大r倍的整倍数。如果N为kN,总体内每一单元便配上1 到N’的k个数,符合随机数字的单元算是中选,此时放弃的随机数字比例便是 (10-N")/10°。这时的N也不一定要取r位,如果能取r'位(r'>r),而使N的r’位整位 数与N"相差极小即可。 快速抽取的常用方法有: 余数法。如果N是个r位数,由1到N"随机取一个数R,而N′是N的最大r位整倍数, 则编号等于R除N所得余数的单元便被选中 商数法。如果N是个r位数,由0到N-1随机取出一个数R而使N是N的最大整倍数 只要R除k的商是(i-1),则第i个单元便被选中。其中k=N"/N。由于k远比N小,所以此 法的计算过程较余数法简便。 修正余数法。如果总体内单元个数N是个r位数,且N"是个不小于N而适于用作除数 的较大r位数,而N"为N′的最大r位整倍数,则如果R是用r位随机数字取得的数字,待 选单元的号码便会是R除N的余数,其中只要R不大于N”而余数不是0也不大于N就可以。 在其他情形时,被抽中数字必须放弃而重复进行。如果N′=N,本法便简化成余数法;如果 这时的余数是0,等选单元的号码便选N。这时的放弃比例是[(N′-N)/10](N"/N 此外也可以用修正商数法或独立选择数位法等以加速抽样 2、随机数骰子及其使用方法 随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上 刻有0-9的数字各2个。每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不 同颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷的方法。但正规的方法是
②设总体容量为 N,若 N 的位数为 r,则一定要从 r 位数中抽取。遇到 1 至 N 的数可直接 使用;遇到其它的数不能直接使用。 ③当 r≥2 时,可从含有起点数字左边的 r 位数开始,也可从右边的 r 位数开始。可从起 点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部 单元号,中途不能变更。 ④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍 去不用。 随机数表法一般分下述几步: 第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最 近的数字)为奇数,则确定起点在第 1 页;否则,起点在第二页。 第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点 的行数。由于每页只有 50 行,所以当落点处的两位数大于 50 时,则取其减去 50 的差数为行 数。为保证等概性,当落点处的数为“00”时,则行数应取作 50。然后依同样的方法再确定 起点的列数。 第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或向右),每次取一个 r 位数。通常,若所需抽的数是一位数或两位数(即 r=1 或 2),则由起点开始,依次向右抽 取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即 r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移 10 位(或 r 位),再从第 一行开始向下继续抽取,直到取足所需的 n 个 r 位数为止,以这 n 个 r 位数所对应的总体单 元组成样本。 然而,按上述步骤抽样,由于每个总体单元只对应一个数字,因此,所读取随机数的放 弃比例可能很高,这在大样本时将使抽样过程变得很费事。为避免这种现象,可以在不违反 等概率原则的条件下令每个总体单元同时对应多个数字,以加快抽样的速度。 一般说来,当 N 为一个 r 位数字时,要取一个从一到 N 间的随机数字,可以随机取 1 至 N 的一个数字,其中 N 为 N 的最大 r 倍的整倍数。如果 N 为 kN,总体内每一单元便配上 1 到 N 的 k 个数,符合随机数字的单元算是中选,此时放弃的随机数字比例便是 (10r - N )/10r。这时的 N 也不一定要取 r 位,如果能取 r 位( r >r),而使 N 的 r 位整位 数与 N 相差极小即可。 快速抽取的常用方法有: 余数法。如果 N 是个 r 位数,由 1 到 N 随机取一个数 R,而 N 是 N 的最大 r 位整倍数, 则编号等于 R 除 N 所得余数的单元便被选中。 商数法。如果 N 是个 r 位数,由 0 到 N -1 随机取出一个数 R 而使 N 是 N 的最大整倍数, 只要 R 除 k 的商是(i-1),则第 i 个单元便被选中。其中 k= N /N。由于 k 远比 N 小,所以此 法的计算过程较余数法简便。 修正余数法。如果总体内单元个数 N 是个 r 位数,且 N 是个不小于 N 而适于用作除数 的较大 r 位数,而 N 为 N 的最大 r 位整倍数,则如果 R 是用 r 位随机数字取得的数字,待 选单元的号码便会是 R 除 N 的余数,其中只要 R 不大于 N 而余数不是 0 也不大于 N 就可以。 在其他情形时,被抽中数字必须放弃而重复进行。如果 N =N,本法便简化成余数法;如果 这时的余数是 0,等选单元的号码便选 N。这时的放弃比例是[( N -N)/10r]( N / N )。 此外也可以用修正商数法或独立选择数位法等以加速抽样。 2、随机数骰子及其使用方法 随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上 刻有 0-9 的数字各 2 个。每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是 3-6 个)不 同颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷的方法。但正规的方法是
将一个或n个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打 开盒子,读出骰子表示的数字。一个骰子一次产生一个0—9的随机数。要产生一个m位数字 的随机数,就需要同时使用m个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位 数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用m次(规定第一次产生的数字 为最高位数,最后一次产生的数字为最末位即个位数字等)。特别规定m个骰子的数字(或一 个骰子m次产生的数字)都为0时,表示10 当使用随机数骰子进行抽样时,特别是如何根据摇随机数骰子方法获得的随机数R。来读 取所要求的随机数R有多种方法。下面是我国国家标准GBl0111,《利用随机数骰子进行随机 抽样的方法》中规定的适用于简单随机抽样的读取随机数的方法。 方法之一:若骰子表示的R。≤N,则取R=R;若R0>N,则舍弃不用,另行重摇。重 复上述过程,直到取得n个不同的随机数为止 方法之二:如果骰子表示的R0≤N,则取R=Ra:如果R。>N,设R0=K1N+R1(0≤ R<N),当K1+1)N>10"时,舍弃,重摇。而当(K1+1)N≤10"时,取R=R,或R=N(若 R=0)。重复上述过程,直到获得n个不同的随机数为止 方法之三:若骰子表示的随机数R0≤N,则取RRo:若R。>N则取一个大于N的适当整 数M(一般为方便起见取M2×10,2.5×10,3×10或5×10等),设R=KM+R2(K2为整 数,0≤R2<N),则当(K2+1)M>10°时,舍弃,重摇;当(K2+1)M≤10时,取R=R2或R=N(若R=0) 重复上述过程,直到获得n个不同的随机数为止。 例:N=4562,m=4,取M=5000 若R=3150,取R=R 若Ra=6897=1×5000+1897,K2=1,(K2+1)M=10 则:R=1897,故取R=R2=1897 方法三和方法二都是为提高效率,减少舍弃重摇次数所采取的措施,尤其是方法三在适 当选用M时,既方便又快速。 也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽 样效果。表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机 抽样。以下是两个有名的试验 试验一:随意数试验。让六个人写下100个自己随意想到的三位数,将这些数内的0、1 2、…、9数字列成次数分布表如下(表3.1): 表3.1六个人的0、1、2、…9的次数分布 人的编号 数字 期望次数 50 59 483057 19 3026262 123932354235 254230234437 9 2320 29 合计300300300300300300 300
将一个或 n 个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打 开盒子,读出骰子表示的数字。一个骰子一次产生一个 0-9 的随机数。要产生一个 m 位数字 的随机数,就需要同时使用 m 个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位 数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用 m 次(规定第一次产生的数字 为最高位数,最后一次产生的数字为最末位即个位数字等)。特别规定 m 个骰子的数字(或一 个骰子 m 次产生的数字)都为 0 时,表示 10m。 当使用随机数骰子进行抽样时,特别是如何根据摇随机数骰子方法获得的随机数 R0来读 取所要求的随机数 R 有多种方法。下面是我国国家标准 GB10111《利用随机数骰子进行随机 抽样的方法》中规定的适用于简单随机抽样的读取随机数的方法。 方法之一:若骰子表示的 R0≤N,则取R=R0;若 R0>N,则舍弃不用,另行重摇。重 复上述过程,直到取得n个不同的随机数为止。 方法之二:如果骰子表示的 R0≤N,则取R=R0;如果 R0>N,设 R0=K1N+R1(0≤ R1<N),当(K1+1)N>10m时,舍弃,重摇。而当(K1+1)N≤10m时,取R=R1,或R=N(若 R1=0)。重复上述过程,直到获得 n 个不同的随机数为止。 方法之三:若骰子表示的随机数 R0≤N,则取 R R0;若 R0>N 则取一个大于 N 的适当整 数 M(一般为方便起见取 M=2×10m-1 ,2.5×10m-1,3×10m-1 或 5×10m-1 等),设 R0=K2M+R2(K2 为整 数,0≤R2<N),则当(K2+1)M>10m 时,舍弃,重摇;当(K2+1)M≤10m 时,取 R=R2 或 R=N(若 R2=0)。 重复上述过程,直到获得 n 个不同的随机数为止。 例:N=4562,m=4,取 M=5000 若 R0=3150,取 R=R0 若 R0=6897=1×5000+1897, K2=1,( K2+1)M=104 则:R2=1897,故取 R=R2=1897 方法三和方法二都是为提高效率,减少舍弃重摇次数所采取的措施,尤其是方法三在适 当选用 M 时,既方便又快速。 也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽 样效果。表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机 抽样。以下是两个有名的试验: 试验一:随意数试验。让六个人写下 100 个自己随意想到的三位数,将这些数内的 0、1、 2、…、9 数字列成次数分布表如下(表 3.1): 表 3.1 六个人的 0、1、2、…9 的次数分布 数字 人的编号 期望次数 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 50 1 38 29 34 59 29 48 30 57 33 27 20 19 28 31 20 22 50 39 34 34 24 24 55 40 28 29 15 27 20 18 31 15 30 25 30 26 26 27 31 15 12 39 32 35 42 35 25 42 30 23 44 37 9 28 23 20 27 29 30 30 30 30 30 30 30 30 30 30 合计 300 300 300 300 300 300 300