抽样过程是:从总体N个单位中,要随机抽取一个容量为n的样本,每次从 总体中抽取一个单位,把它看作一次试验,每次抽出一个单位后,把结果登记下 来,又重新放回总体中,参加下一次抽选,连续进行几次试验构成一个样本 特点:①重复抽样由n次相互独立的试验构成 ②每次试验是在相同的条件下进行的(总体单位相等); ③每个单位中选的机会在各次都是完全一样的(N)。 例如:总体有A、B、C、D四个单位,要从中随机重复抽取两个单位构成 个样本。先从四个单位中抽取一个单位,结果登记后放回,然后再从相同的四个 单位中抽取第二个单位,就构成了一个样本,全部可能抽取的样本数目有: CA、CB、CC、CD BA、BB、BC、BD DA、DB、DC、DD 第一个单位为A,第二个可能为A、B、C、D, 第一个单位可能是A、B、C、D中的任何一个,第一个抽定后,都可搭配四 个样本,则样本的可能数目为4×4=42。 般地说,从总体N个单位中,随机重复抽取n个单位构成一个样本,则共 可抽取N个样本 2.不重复抽样 从总体N个单位中,要抽取一个容量为n样本,每次从总体中抽取一个单位, 不再放回参加下一次的抽选,连续进行n次抽取,就构成了一个样本。 其特点:样本是由几次连续抽取结果构成,实质上等于一次同时从总体中抽 取n个样本单位。 ①连续n次抽选的结果不是相互独立的; ②第一次抽取的结果影响下一次的抽取,每抽一次,总体的单位就少一个; ③每个单位的中选机会在各次是不相等的。 例如:总体有A、B、C、D四个单位,用随机不重复的方法从中抽取两个单 位构成一个样本,则全部可能的样本数为 AB、AC、ADBA、BC、BD
抽样过程是:从总体 N 个单位中,要随机抽取一个容量为 n 的样本,每次从 总体中抽取一个单位,把它看作一次试验,每次抽出一个单位后,把结果登记下 来,又重新放回总体中,参加下一次抽选,连续进行几次试验构成一个样本。 特点:①重复抽样由 n 次相互独立的试验构成; ②每次试验是在相同的条件下进行的(总体单位相等); ③每个单位中选的机会在各次都是完全一样的( N 1 )。 例如:总体有 A、B、C、D 四个单位,要从中随机重复抽取两个单位构成一 个样本。先从四个单位中抽取一个单位,结果登记后放回,然后再从相同的四个 单位中抽取第二个单位,就构成了一个样本,全部可能抽取的样本数目有: AA、AB、AC、AD CA、CB、CC、CD BA、BB、BC、BD DA、DB、DC、DD 第一个单位为 A,第二个可能为 A、B、C、D, 第一个单位可能是 A、B、C、D 中的任何一个,第一个抽定后,都可搭配四 个样本,则样本的可能数目为 4×4=4 2。 一般地说,从总体 N 个单位中,随机重复抽取 n 个单位构成一个样本,则共 可抽取 N n个样本。 2.不重复抽样 从总体 N 个单位中,要抽取一个容量为 n 样本,每次从总体中抽取一个单位, 不再放回参加下一次的抽选,连续进行 n 次抽取,就构成了一个样本。 其特点:样本是由几次连续抽取结果构成,实质上等于一次同时从总体中抽 取 n 个样本单位。 ①连续 n 次抽选的结果不是相互独立的; ②第一次抽取的结果影响下一次的抽取,每抽一次,总体的单位就少一个; ③每个单位的中选机会在各次是不相等的。 例如:总体有 A、B、C、D 四个单位,用随机不重复的方法从中抽取两个单 位构成一个样本,则全部可能的样本数为: AB、AC、AD BA、BC、BD
第一个单位有四种抽法,可能是A、B、C、D中的任一个,而第一个单位选 定后,第二个单位只有三种抽法,所以全部可能的样本数目为4×3=12种。 第一次4种可能,每一种都搭配3个样本。 般地说,从总体N个单位中,随机不重复抽取n个单位构成一个样本,则 共有样本为 N(N-1)(N-2)…(N-n+1) (N-n)! 第一个单位有N种抽法,第二个单位有N-1种抽法,第n个单位有N-(n-1) 种,总共抽n个单位∴为(N-n+1) 由此可见,在相同的样本容量要求下,不重复抽样的样本个数总是比重复抽 样的样本个数少。 (二)根据对样本的要求不同,抽样方法又有考虑顺序的抽样、不考虑顺序 的抽样之分。 1.考虑顺序的抽样:从总体N个单位中随机抽取n个单位构成样本,不但要 考虑样本各单位的组成成份,而且要考虑各单位的中选顺序。如AB、BA二者虽 然成份相同,但中选顺序不同,在考虑顺序的情况下算两个样本 2.不考虑顺序的抽样:从总体N个单位中抽取n个单位构成一个样本,只考 虑样本各单位的构成成份如何,不考虑各单位的中选顺序。如AB、BA虽然顺序 不同,但二者的组成成份相同,在不考虑顺序的条件下,只能算一个样本 (三)互叉抽样的样本数目 (考虑顺序在数学上叫排列,不考虑顺序叫组合) 1.考虑顺序的不重复抽样的样本数目(即前面不重复抽样的数目) 即通常所说的不重复排列数,从总体N个单位中每次抽取n个单位不重复排 列,组成样本的可能数目记作N 例如,总体有A、B、C、D四个单位,要从中随机抽取两个单位构成一个样 先从总体的四个单位中抽取第一个单位,第一个单位可能是A、B、C、D中
CA、CB、CD DA、DB、DC 第一个单位有四种抽法,可能是 A、B、C、D 中的任一个,而第一个单位选 定后,第二个单位只有三种抽法,所以全部可能的样本数目为 4×3=12 种。 第一次 4 种可能,每一种都搭配 3 个样本。 一般地说,从总体 N 个单位中,随机不重复抽取 n 个单位构成一个样本,则 共有样本为: ! ( 1)( 2) ( 1) ( )! N N N N N n N n 第一个单位有 N 种抽法,第二个单位有 N-1 种抽法,第 n 个单位有 N-(n-1) 种,总共抽 n 个单位为(N- n+1) 由此可见,在相同的样本容量要求下,不重复抽样的样本个数总是比重复抽 样的样本个数少。 (二)根据对样本的要求不同,抽样方法又有考虑顺序的抽样、不考虑顺序 的抽样之分。 1.考虑顺序的抽样:从总体 N 个单位中随机抽取 n 个单位构成样本,不但要 考虑样本各单位的组成成份,而且要考虑各单位的中选顺序。如 AB、BA 二者虽 然成份相同,但中选顺序不同,在考虑顺序的情况下算两个样本。 2.不考虑顺序的抽样:从总体 N 个单位中抽取 n 个单位构成一个样本,只考 虑样本各单位的构成成份如何,不考虑各单位的中选顺序。如 AB、BA 虽然顺序 不同,但二者的组成成份相同,在不考虑顺序的条件下,只能算一个样本。 (三)互叉抽样的样本数目 (考虑顺序在数学上叫排列,不考虑顺序叫组合) 1.考虑顺序的不重复抽样的样本数目(即前面不重复抽样的数目) 即通常所说的不重复排列数,从总体 N 个单位中每次抽取 n 个单位不重复排 列,组成样本的可能数目记作 n AN 。 例如,总体有 A、B、C、D 四个单位,要从中随机抽取两个单位构成一个样 本。 先从总体的四个单位中抽取第一个单位,第一个单位可能是 A、B、C、D 中
的任何一个,当第一个单位抽出后,不再放回,然后再从剩下的三个中的任何 个 AB、AC、AD DA、DB、DC 第一个抽中A后,A可以搭配三个样本,同样,第一个是B、C、D时它们也 可分别搭配三个样本,则样本的可能数目为:4×3=12 般地,从总体N个单位中,随机不重复抽取n个单位构成一个样本,则共 可抽取A=N(N-1)N-2)…(-n+1)=_M 个样本 (N-n) 又如表2-1资料。 表2 N 样本的可能数目 10 A2=10×9=90 10 A10=10×9×8×7=5040 2.考虑顺序的重复抽样(即前面重复抽样)的样本数目 从总体N个单位中每次抽取n个允许重复的排列组成样本的可能数目记作 例如总体有A、B、C、D四个单位,要从中随机抽取两个单位构成一个样本 先从总体的四个单位中抽取第一个单位,它可能是A、B、C、D中的任何 个,当第一个单位中抽出后,把结果登记下来再放回,然后从相同的四个单位中 抽取第二个样本单位,它也可能是A、B、C、D中的任何一个 BA、BB、BC、BD DA、DB、DC、DD 第一个为A,它可搭配四个样本,同样B、C、D都分别可以搭想四个样本, 总共为4×4=42=16个 般地说,从总体N个单位中随机重复抽取n个单位进行排列,则共可抽取 N个样本。又如表2-2资料
的任何一个,当第一个单位抽出后,不再放回,然后再从剩下的三个中的任何一 个。 AB、AC、AD BA、BC、BD CA、CB、CD DA、DB、DC 第一个抽中 A 后,A 可以搭配三个样本,同样,第一个是 B、C、D 时它们也 可分别搭配三个样本,则样本的可能数目为:4×3=12。 一般地,从总体 N 个单位中,随机不重复抽取 n 个单位构成一个样本,则共 可抽取 个样本 又如表 2-1 资料。 表 2-1 2.考虑顺序的重复抽样(即前面重复抽样)的样本数目 从总体 N 个单位中每次抽取 n 个允许重复的排列组成样本的可能数目记作 n BN 。 例如总体有 A、B、C、D 四个单位,要从中随机抽取两个单位构成一个样本。 先从总体的四个单位中抽取第一个单位,它可能是 A、B、C、D 中的任何一 个,当第一个单位中抽出后,把结果登记下来再放回,然后从相同的四个单位中 抽取第二个样本单位,它也可能是 A、B、C、D 中的任何一个 AA、AB、AC、AD、 BA、BB、BC、BD CA、CB、CC、CD、 DA、DB、DC、DD 第一个为 A,它可搭配四个样本,同样 B、C、D 都分别可以搭想四个样本, 总共为 4×4=4 2=16 个 一般地说,从总体 N 个单位中随机重复抽取 n 个单位进行排列,则共可抽取 N n个样本。又如表 2-2 资料。 N n 样本的可能数目 10 2 10 4 10 9 8 7 5040 4 A10 n N N! = N(N -1)(N - 2) (N - n +1)= (N - n)! A
表2-2 样本的可能数目 2 B=102 4 B6=10+=1000 3.不考虑顺序的不重复抽样的样本数目(不重复组合数) 从总体N个单位中每次抽取n个不允许重复的组合,组成样本的可能数目记 作记作C。 An V!_N(N=1)2,(N=n+1) n! (N-n)!n n 这是因为一个组合的样本,进行排列可有n!个样本。如AB进行排列有: AB、BA2×1=2个排列样本; 又如A、B、C进行排列有:ABC、ACB、BAC、BCA、CAB、CBA3×2=6个 排列样本。因此,用考虑顺序的不重复抽样的样本数目除以n!即为不考虑顺序 的不重复抽样的样本数目。 例如,从A、B、C、D四个单位中随机重复抽取n个单位,其样本的数目为: 考虑顺序的不重复样本数目为4 BA、BC、BD CA、CB、CD DA、DB、DC 共12个,从中把重复的删去,只剩下6个样本。 用上面的公式计算: 4×3 (N-1)…( n 又如表2-3资料。 表2-3 N 样本的可能数目 10×9 45 10×9×8×7 4 =210 4×3×2 4.不考虑顺序的重复抽样的样本数目(可重复组合数)
表 2-2 3.不考虑顺序的不重复抽样的样本数目(不重复组合数) 从总体 N 个单位中每次抽取 n 个不允许重复的组合,组成样本的可能数目记 作记作 。 这是因为一个组合的样本,进行排列可有 n!个样本。如 AB 进行排列有: AB、BA 2×1=2 个排列样本; 又如 A、B、C 进行排列有:ABC、ACB、BAC、BCA、CAB、CBA 3×2=6 个 排列样本。因此,用考虑顺序的不重复抽样的样本数目除以 n!即为不考虑顺序 的不重复抽样的样本数目。 例如,从 A、B、C、D 四个单位中随机重复抽取 n 个单位,其样本的数目为: 考虑顺序的不重复样本数目为 n AN AB、AC、AD BA、BC、BD CA、CB、CD DA、DB、DC 共 12 个,从中把重复的删去,只剩下 6 个样本。 用上面的公式计算: 6 2 4 3 n CN ! ( 1) ( 1) n N N N n 又如表 2-3 资料。 表 2-3 N n 样本的可能数目 10 2 45 2 10 9 10 4 210 4 3 2 10 9 8 7 4.不考虑顺序的重复抽样的样本数目(可重复组合数) N n 样本的可能数目 10 2 10 100 2 2 B10 10 4 10 10000 4 4 B10
记作D8,它等于从N+n-1个单位中抽取n个单位的不重复组合数即: A DN=C (N+n-1)! (N+n-1-n)!n! A 在C的基础上扩大总体单位数,∴重复数目>不重复 例如,从总体A、B、C、D四个单位中随机重复抽取2个单位进行组合,则 样本的个数为 不考虑顺序的不重复抽样N:AB、AC、AD、BC、BD、CD 在前一个基础上增加重复的4个则为 不考虑顺序的重复抽样D:AA、AB、AC、AD、BB、BC、BD、CC、CD、DD 共10个 D"=CMm/≈(4+2-1)5×4×3×2=10 用公式计算 (4-1)2!3×2×2 又如表2-4资料。 表2-4 n 样本的可能数目 (10+2-1)!11×10×9×8×7×6×5×4×3×2 10 =55 (10-1)2!9×8×7×6×5×4×3×2×2 (10+4-1)!13×12×11×10 10 4 =715 (10-1)!4 4×3×2 从以上例子可看到:①重复抽样比不重复抽样的样本数目多得多;②样本容 量增大,则样本的数目也增多。 第三节抽样误差 一、抽样误差的意义 (一)概念 这里的误差是指抽样指标与总体指标之差的绝对值。在抽样调查过程中,会 产生各种各样的误差,根据其产生的原因不同分为 1.登记性误差:由于观察、登记、计量、计算上的差错计起而产生的抽样指 标与总体指标之间的误差
记作 n DN ,它等于从 N+n-1 个单位中抽取 n 个单位的不重复组合数即: ( 1 )! ! ( 1)! ! 1 1 N n n n N n n A D C n n N n N n nN 在 C 的基础上扩大总体单位数,重复数目>不重复 例如,从总体 A、B、C、D 四个单位中随机重复抽取 2 个单位进行组合,则 样本的个数为: 不考虑顺序的不重复抽样 n CN : AB、AC、AD、BC、BD、CD 在前一个基础上增加重复的 4 个则为: 不考虑顺序的重复抽样 : AA、AB、AC、AD、BB、BC、BD、CC、CD、DD 共 10 个 用公式计算: 10 3 2 2 5 4 3 2 (4 1)!2! (4 2 1)! 1 nN n n DN C 又如表 2-4 资料。 表 2-4 N n 样本的可能数目 10 2 10 2 1! 11 10 9 8 7 6 5 4 3 2 55 (10 1)!2! 9 8 7 6 5 4 3 2 2 10 4 (10 4 1)! 13 12 11 10 715 (10 1)!4! 4 3 2 从以上例子可看到:①重复抽样比不重复抽样的样本数目多得多;②样本容 量增大,则样本的数目也增多。第三节 抽样误差 一、抽样误差的意义 (一)概念 这里的误差是指抽样指标与总体指标之差的绝对值。在抽样调查过程中,会 产生各种各样的误差,根据其产生的原因不同分为: 1.登记性误差:由于观察、登记、计量、计算上的差错计起而产生的抽样指 标与总体指标之间的误差