例:有22025三个数,其几何平均数为2×20×25=1000=10 例:在相等的时间区间里,马驹的体重为 50kg 60kg 72kg 这个数列是把50kg,一而再地乘以因数1.2而得。这会使人感到60kg应该是在50kg 和72kg间的一个合理的平均数。但按算术平均数计应为61kg而不是60kg。若用几何 平均数G=√50*72=60kg 例:番茄育种,可由两亲本果重预测F果重,并和实际F1果重进行比较。 =10.36g,p2=0.45g G=VP2=10.36x0.45=2.16g x-1036+045-541 实际F1平均果重2.33g,说明果重性状是作相乘式基因作用的。 计算几何平均数工作量大,概念也不十分清楚,若有一观察值为零,就不能计算。 如有负值,所得结果就会成为负数或虚数所以运用范围有限。一般常用呈等比关系的数 列求平均数。如前例马驹生长。 1.6.2平均数的计算 1.非频数资料 直接计算:下=∑ n 当数据较大时,可做适当转换,x,-C,x=x+C 2.频数资料 (1)离散型数据 其中,X=组值,f-频数,N=总频数,k=组数 例: x f 0 0 2 2 3 2 6
21 例:有 2 20 25 三个数,其几何平均数为 2 20 25 1000 10 3 3 = = 例:在相等的时间区间里,马驹的体重为 50kg 60kg 72kg 这个数列是把 50kg,一而再地乘以因数 1.2 而得。这会使人感到 60kg 应该是在 50kg 和 72kg 间的一个合理的平均数。但按算术平均数计应为 61kg 而不是 60kg。若用几何 平均数 G= 5072 = 60 kg 例:番茄育种,可由两亲本果重预测 F1 果重,并和实际 F1 果重进行比较。 p1 = 10.36 g, p2 = 0.45 g G= p1 p2 = 10.36 0.45 = 2.16 g 5.41 2 10.36 0.45 = + x = 实际 F1 平均果重 2.33g,说明果重性状是作相乘式基因作用的。 计算几何平均数工作量大,概念也不十分清楚,若有一观察值为零,就不能计算。 如有负值,所得结果就会成为负数或虚数所以运用范围有限。一般常用呈等比关系的数 列求平均数。如前例马驹生长。 1.6.2 平均数的计算 1. 非频数资料 直接计算: n x x = 当数据较大时,可做适当转换, xi −C , x = x + C ‘ 2. 频数资料 (1)离散型数据 ( ) N fx x k i i = = 1 其中,x=组值,f =频数,N=总频数,k=组数 例: x f x f 1 0 0 2 1 2 3 2 6
U.0+2+6=27 x-T 3 (2)连续型数据 (fm). x=2 N 其中,m-组值,f频数,N-总频数,k-组数 1.6.3变异数 每个样本都有一群观察值,一平均数作为样本的代表值。平均数代表性的优势依样 本内各观察值的变异程度而定。因而,为了更全面的描述样本,只有平均数是不够的, 还必须度量其变异度。常用极差、平均离差和标准差。 1极差 R=max x-min x 例:三个样本1487 x=5 456522D20.5S23=0.816 5555R3=0D3=0S3=0 在样本容量n≤I0时,可采用。R易受不正常值的影响。 2.平均离差(Mean Deviation) 了解每个观察值与平均数极差的程度。可用观察值与各平均数的离差来表示x,-x即 离均若。平均的离均差为北-司。但是离均老之和等于零,故采用绝对值-习 上例样本1:-+-+8-+0-0=H+++2_0=25 4 4 4 3.标准离差(Standard Deviation) 由于离均差之和等于零,将各个离均差平方后再相加得到离均差平方和,简称平方 和∑(-x(sum of sugare). 由于各样本所包含的观察值数目不同,为了便于比较,用平方和除以,得平均平
22 ( ) 2.7 3 0 2 6 3 3 1 = + + = = i fx x (2)连续型数据 ( ) N fm x k i = 1 其中,m-组值,f-频数,N-总频数,k-组数 1.6.3 变异数 每个样本都有一群观察值,一平均数作为样本的代表值。平均数代表性的优势依样 本内各观察值的变异程度而定。因而,为了更全面的描述样本,只有平均数是不够的, 还必须度量其变异度。常用极差、平均离差和标准差。 1.极差 R=max x-min x 例:三个样本 1 4 8 7 R1 =7 D1=2.5 S1= 3.46 3 125 = x = 5 4 5 6 5 R2=2 D2=0.5 S2= 0.816 3 2 = 5 5 5 5 R3=0 D3=0 S3=0 在样本容量 n≤10 时,可采用。R 易受不正常值的影响。 2.平均离差(Mean Deviation) 了解每个观察值与平均数极差的程度。可用观察值与各平均数的离差来表示 x x i − 即 离均差。平均的离均差为 ( ) n x x i − 。但是离均差之和等于零,故采用绝对值 n x x i − 上例样本 1: ( ) ( ) ( ) ( ) 2.5 4 10 4 4 1 3 2 0 4 1 5 4 5 8 5 7 5 = = + + + = = − + − + − + − 3.标准离差(Standard Deviation) 由于离均差之和等于零,将各个离均差平方后再相加得到离均差平方和,简称平方 和 ( − ) 2 x x i (sum of suqare)。 由于各样本所包含的观察值数目不同,为了便于比较,用平方和除以 n,得平均平
方和(mcanu网ae)简称均方或方差(variace)二北-式】 样本的方差用S表示,定义为:S-二- n-1 为了使度量变异的单位与观察值单位相同,引入均方的平方根。5区飞二司 n-1 (1)包括了每个观察值与平均值的变异, (2)避免绝对值,适于代数运算, (3)∑k-式最小. (4)68%的数据在x±S范围内,57%的数据在x±D范围内。 n-l是自由度,指独立观测值的个数。在计算S时,有n个离均差,但只有n-l个 是自由变动的。df=nm-1 目前广泛采用S来度量样本内各个观察值的变异程度和表明平均数的代表性能。S 越小,样本的变异程度越小,反之愈大。 标准差大小受观察值影响,其单位与观察值相同。标准差的计算,利用等效式公式: -2,] n2 =∑x.2*∑x心 ∑ 区- ②r① S-\n-1 n-1 l.7变异系数(Cofficient of variance,CV) 两组样本x极近时可用S比较,极差较大时不可。 例:10岁A=120±5.0cm 8个月B=70±4.0cm 23
23 方和(mean square)简称均方或方差(variance) ( ) n x x i − 2 。 样本的方差用 S 2 表示,定义为:S 2= ( ) 1 2 − − n x x i 为了使度量变异的单位与观察值单位相同,引入均方的平方根。S= ( ) 1 2 − − n x x i (1)包括了每个观察值与平均值的变异, (2)避免绝对值,适于代数运算, (3) ( − ) 2 x x i 最小, (4)68%的数据在 x ±S 范围内,57%的数据在 x ±D 范围内。 n-1 是自由度,指独立观测值的个数。在计算 S 时,有 n 个离均差,但只有 n-1 个 是自由变动的。df=n-1 目前广泛采用 S 来度量样本内各个观察值的变异程度和表明平均数的代表性能。S 越小,样本的变异程度越小,反之愈大。 标准差大小受观察值影响,其单位与观察值相同。标准差的计算,利用等效式公式: ( ) ( ) ( ) + = − = − + − = − 2 2 2 2 2 2 2 2 2 2 n n x n x x x n x n x x x n x x x x = ( ) − n x x 2 2 S= ( ) ( ) 1 1 2 2 2 − − = − − n n x x n x x 1.7 变异系数(Cofficient of variance,CV) 两组样本 x 极近时可用 S 比较,极差较大时不可。 例:10 岁 A=120±5.0cm 8 个月 B=70±4.0cm
CV-S cv1-0-002 cv2-若-057 当两个样本的观察值单位不同时,即两种性状,如cm、kg(身高、体重)也不能直接 比较。 例:大学男生身高:165±12cm CV1=0.073 58.3±4.8kg CV2=0.082
24 CV= x S CV1= 0.042 120 5 = CV2= 0.057 70 4 = 当两个样本的观察值单位不同时,即两种性状,如 cm、kg(身高、体重)也不能直接 比较。 例:大学男生身高:165±12cm CV1=0.073 58.3±4.8kg CV2=0.082
第二章概率的基本知识 要点:要求掌握概率的两种定义和运算法则,建立起频率稳定性的概念 2.1随机现象与统计规律 2.1.1.必然现象 客观世界中有两类现象:一类是确定性现象(必然现象)。例从高空抛一重物一定 会落到地面上;纯水在一个标准大气压下加热到100℃一定会沸腾;小麦从播种到收获 总要经过发芽、生长、抽穗、开花、灌浆等几个阶段:一年有四季变化。 这类现象的特点:在一定的条件下必然会出现可以预言的某种肯定的结果。 在准确地重复某些条件下,试验的结果总是肯定的,或是根据它过去的状态,在相 同条件下完全可以预言将来的发展。 早期的科学就是研究这一类现象的规律性的。必然现象的每一个结果称为必然事 件。 2.1.2随机现象 生物界变异的普遍存在,使我们在研究许多问题时遇到随机现象。 人们还会遇到另一类现象,这类现象的特点是:在一定的条件下,其结果却是不可 预言的,不确定的。 在相同的条件下,重复进行试验,具有多种可能发现的结果,每次究竞发生哪一种 结果事先不能肯定,这类现象称为随机现象。 例:打扑克摸牌、生男生女、种子发芽与否、新生儿性别、取100粒种子,可能有 99、98、97.发芽、动物一胎的产仔数:一年的降雨、降雪量、某种害虫是否发生, 随机现象受许多随机因素影响。随机现象的种种结果称为随机试验。如年初问今年松毛 虫是否发生?可能结果是. 2.13.随机事件 随机现象的各种结果称为随机事件,简称事件。用A、B、C.表示。 如新生儿性别有两个可能结果:男、女,生男为随机事件A,生女为随机事件B。 又如:“三尺三”株高这一随机现象,可能结果是140.5-143.5cm、143.5-146.5cm 146.5-149.5cm.,则 事件A:140.5-143.5cm 事件B:143.5-146.5cm 25
25 第二章 概率的基本知识 要点:要求掌握概率的两种定义和运算法则,建立起频率稳定性的概念 2.1 随机现象与统计规律 2.1.1. 必然现象 客观世界中有两类现象:一类是确定性现象(必然现象)。例从高空抛一重物一定 会落到地面上;纯水在一个标准大气压下加热到 100℃一定会沸腾;小麦从播种到收获 总要经过发芽、生长、抽穗、开花、灌浆等几个阶段;一年有四季变化。 这类现象的特点:在一定的条件下必然会出现可以预言的某种肯定的结果。 在准确地重复某些条件下,试验的结果总是肯定的,或是根据它过去的状态,在相 同条件下完全可以预言将来的发展。 早期的科学就是研究这一类现象的规律性的。必然现象的每一个结果称为必然事 件。 2.1.2 随机现象 生物界变异的普遍存在,使我们在研究许多问题时遇到随机现象。 人们还会遇到另一类现象,这类现象的特点是:在一定的条件下,其结果却是不可 预言的,不确定的。 在相同的条件下,重复进行试验,具有多种可能发现的结果,每次究竟发生哪一种 结果事先不能肯定,这类现象称为随机现象。 例:打扑克摸牌、生男生女、种子发芽与否、新生儿性别、取 100 粒种子,可能有 99、98、97.发芽、动物一胎的产仔数;一年的降雨、降雪量、某种害虫是否发生, 随机现象受许多随机因素影响。随机现象的种种结果称为随机试验。如年初问今年松毛 虫是否发生?可能结果是. 2.1.3.随机事件 随机现象的各种结果称为随机事件,简称事件。用 A、B、C.表示。 如新生儿性别有两个可能结果:男、女,生男为随机事件 A,生女为随机事件 B。 又如:“三尺三”株高这一随机现象,可能结果是 140.5-143.5cm、143.5-146.5cm、 146.5-149.5cm.,则 事件 A:140.5-143.5cm 事件 B:143.5-146.5cm