绪论 生物统计学的概念、任务和内容 一、生物统计学的概念 概念:生物统计学的特殊性在于“统计”二字上。统计的汉语意思字面上理解是“统 计算”。生物学研究中通过观察、测量、实验可以得到许多数据,这些数据参差不齐, 杂乱无章,必须对其进行统计分析,找出内在联系与规律。 例:抛钱币一一统计规律性 生物统计学的英文为Biometry,它是来自希腊文的两个词根,一个是“Bios”-生 命,另一个是“metron'”-测量。所以合起来的意思是“生命的测量学”。它是用数理统 计的原理和方法来分析和解释生物界的各种现象和规律的科学。 著名生物统计学家杨纪珂赋词综括生物统计学的内涵, 七律西江月 事物皆含规律, 拾得锦囊数百, 奈何变异重重。 收存花粉千种。 恰如云阵护苍龙, 春来大地漫东风 只见一磷半缝。 蝶使蜂媒相送。 性质、意义 基础课、必修课 现代生物学发展的趋势:精确化、定量化。 贝费里奇在《科学研究的艺术》中说:“没有利用数学的学科不称为科学。 恩格斯在19世纪0年代的《自然辩证法》手稿中说:“数学的应用在生物学中等 于零”。 最近半个世纪才出现生物数学(联合国教科文组织1974年正式承认其为独立学 科)。 二、生物统计学的任务 通过对样本的研究来推断总体的性质。生物统计学的核心问题就是总体与样本的关 系问题。 总体:研究对象的全部。举例。 样本:总体的一部分
1 绪 论 生物统计学的概念、任务和内容 一、 生物统计学的概念 概念:生物统计学的特殊性在于“统计”二字上。统计的汉语意思字面上理解是“统一 计算”。生物学研究中通过观察、测量、实验可以得到许多数据,这些数据参差不齐, 杂乱无章,必须对其进行统计分析,找出内在联系与规律。 例:抛钱币——统计规律性 生物统计学的英文为 Biometry,它是来自希腊文的两个词根,一个是“Bios”-生 命,另一个是“metron”-测量。所以合起来的意思是“生命的测量学”。它是用数理统 计的原理和方法来分析和解释生物界的各种现象和规律的科学。 著名生物统计学家杨纪珂赋词综括生物统计学的内涵。 七律 西江月 事物皆含规律, 拾得锦囊数百, 奈何变异重重。 收存花粉千种。 恰如云阵护苍龙, 春来大地漫东风, 只见一磷半缝。 蝶使蜂媒相送。 性质、意义 基础课、必修课 现代生物学发展的趋势:精确化、定量化。 贝费里奇在《科学研究的艺术》中说:“没有利用数学的学科不称为科学。 恩格斯在 19 世纪 70 年代的《自然辩证法》手稿中说:“数学的应用在生物学中等 于零”。 最近半个世纪才出现生物数学(联合国教科文组织 1974 年正式承认其为独立学 科)。 二、生物统计学的任务 通过对样本的研究来推断总体的性质。生物统计学的核心问题就是总体与样本的关 系问题。 总体:研究对象的全部。举例。 样本:总体的一部分
这样一个由样本推断总体的过程在认识论中叫做由特殊到一般,方法论中叫归纳, 逻辑论中叫做归纳逻辑。 生物统计学与其它学科的关系 生物统计学属于生物数学的范畴,在生物学日益定量化、精确化的时代,生物学的 各分支都与其有着密切的联系, 宏观方面: 动植物分类学、动植物生态学都大量地应用生物统计学为研究手段。数量生态学、 数值分类学是成功地应用数理统计的典范。如种群分布格局、种间关系、聚类分析、群 落演替的马尔柯夫过程等等。 微观方面: 所有实验学科所得数据的处理。微观模型的建立。遗传学中某种基因或表型出现的 概率,对遗传学定律的验证。在农、医两大应用生物学领域更由极为广泛的应用。讲课 中,将以这两方面为主题介绍生物统计学的原理及方法。 三、生物统计学的主要内容 从统计方法的主要内容来讲,大致可分为四方面: 1,数据整理及其基本分析 大样本(样本中个体数很多)情况下,需通过数据初步整理之后,再从资料中计算 出三个主要统计量:x、S、S用以推断总体特征: x一集中性 S一离散性 S,一可靠性(用x估计μ时,这个估计的变异性) 2.统计推断(显著性检验) (1)平均数间差异的比较 两组或两组以上数据的平均数孰优孰劣?有无显著差异。例如两个试验田的小麦产 量:甲:300公斤,乙:280公斤。两者有无差异?(u检验,t检验) (2)x?检验一属性的统计分析 有许多性状不能直接用测量的方法加以衡量。一般称之为属性性状。通过对具有相 同属性的计数来分析理论值与观察值之间的差异。 2
2 这样一个由样本推断总体的过程在认识论中叫做由特殊到一般,方法论中叫归纳, 逻辑论中叫做归纳逻辑。 生物统计学与其它学科的关系 生物统计学属于生物数学的范畴,在生物学日益定量化、精确化的时代,生物学的 各分支都与其有着密切的联系。 宏观方面: 动植物分类学、动植物生态学都大量地应用生物统计学为研究手段。数量生态学、 数值分类学是成功地应用数理统计的典范。如种群分布格局、种间关系、聚类分析、群 落演替的马尔柯夫过程等等。 微观方面: 所有实验学科所得数据的处理。微观模型的建立。遗传学中某种基因或表型出现的 概率,对遗传学定律的验证。在农、医两大应用生物学领域更由极为广泛的应用。讲课 中,将以这两方面为主题介绍生物统计学的原理及方法。 三、生物统计学的主要内容 从统计方法的主要内容来讲,大致可分为四方面: 1. 数据整理及其基本分析 大样本(样本中个体数很多)情况下,需通过数据初步整理之后,再从资料中计算 出三个主要统计量: x 、S、 x S 用以推断总体特征: x—集中性 S—离散性 x S —可靠性 (用 x 估计 μ 时,这个估计的变异性) 2. 统计推断(显著性检验) (1)平均数间差异的比较 两组或两组以上数据的平均数孰优孰劣?有无显著差异。例如两个试验田的小麦产 量:甲:300 公斤,乙:280 公斤。两者有无差异?(u 检验,t 检验) (2)χ 2 检验—属性的统计分析 有许多性状不能直接用测量的方法加以衡量。一般称之为属性性状。通过对具有相 同属性的计数来分析理论值与观察值之间的差异
(3)方差分析 目的是进行多个平均数之间的比较。其原理是利用数学方法(线性可加性)把试验中 的总变异分解为由不同变异原因所形成的各种变异,并进行显著性检验与多重比较。 3.相关与回归 对两个变量之间相互关系的密切程度的研究称为相关。以相关系数表示。 回归是指两个或两个以上的变量间存在着从属关系,即一个变量(X)变化时,引 起另一个变量(Y)的相应变化,它们的从属关系可以用回归分析的方法进行研究。通 过回归分析,可以根据实际数据建立回归方程,用以对某些指标进行预测和预报。例如 用父母的身高来预测子女的身高(子女的身高-父高+母高×18) 2 4.试验设计 所谓试验设计,主要是指任何选择实验材料,进行合理的分组处理,其目的是为了尽 量减少和控制实验误差,并对实验误差作出无偏的估计。为了使实验结果成为有用而可 靠的科学资料,在开始实验之前认真地进行试验设计是非常必要的。 四、生物统计学地发展概况 1.统计学的诞生与发展 生物统计是数理统计的具体应用,因此我们应当了解几位对数理统计学的创立和发 展有重大贡献的科学家 数理统计最早的起源可追溯到十七世纪它与政治济济有关,因为要对国家收入、税 率、保险、人口普查、长寿、死亡等作出定量的描述与分析。最早的人口统计学家有 J.Graunt(1620-1674)和W.pety(1623-1687)。此外,当时闲暇阶层在赌博中的胜负、 输赢对概率论的发展也起了推动作用。对发展概率论作出重要贡献的人是B.pascal (1623-1662)和Pde Fermat(1601-1665)以及J.Bernoulli(1654-1705),他们为概率 论的发展奠定了基础。 A.de Moivre(1667-1756)第一个在解决养老金问题上把统计学同概率论结合起来, 并由二项分布近似地推出了正态分布,这对生物统计的理论发展十分重要。 较晚期的统计学发展受到了天文学家的推动,象S.Laplace(1749-1827)和K.Gauss (1777-1855)在对天文观测的误差估计中提出了著名的“最小二乘法”,这对统计学的 发展作出了不朽的贡献。 Katler(比利时)(1796-1874)首先把概率论的基本原理引进统计学的研究领域
3 (3)方差分析 目的是进行多个平均数之间的比较。其原理是利用数学方法(线性可加性)把试验中 的总变异分解为由不同变异原因所形成的各种变异,并进行显著性检验与多重比较。 3. 相关与回归 对两个变量之间相互关系的密切程度的研究称为相关。以相关系数表示。 回归是指两个或两个以上的变量间存在着从属关系,即一个变量(X)变化时,引 起另一个变量(Y)的相应变化,它们的从属关系可以用回归分析的方法进行研究。通 过回归分析,可以根据实际数据建立回归方程,用以对某些指标进行预测和预报。例如 用父母的身高来预测子女的身高(子女的身高= 1.08 2 父高+母高 ) 4. 试验设计 所谓试验设计,主要是指任何选择实验材料,进行合理的分组处理,其目的是为了尽 量减少和控制实验误差,并对实验误差作出无偏的估计。为了使实验结果成为有用而可 靠的科学资料,在开始实验之前认真地进行试验设计是非常必要的。 四、生物统计学地发展概况 1. 统计学的诞生与发展 生物统计是数理统计 的具体应用,因此我们应当了解几位对数理统计学的创立和发 展有重大贡献的科学家. 数理统计最早的起源可追溯到十七世纪.它与政治济济有关,因为要对国家收入、税 率、保险、人口普查、长寿、死亡等作出定量的描述与分析。最早的人口统计学家有 J.Graunt(1620-1674)和 W. pety(1623-1687)。此外,当时闲暇阶层在赌博中的胜负、 输赢对概率论的发展也起了推动作用。对发展概率论作出重要贡献的人是 B. pascal (1623-1662)和 P.de Fermat(1601-1665)以及 J.Bernoulli(1654-1705),他们为概率 论的发展奠定了基础。 A.de Moivre(1667-1756)第一个在解决养老金问题上把统计学同概率论结合起来, 并由二项分布近似地推出了正态分布,这对生物统计的理论发展十分重要。 较晚期的统计学发展受到了天文学家的推动,象 S.Laplace(1749-1827)和 K.Gauss (1777-1855)在对天文观测的误差估计中提出了著名的“最小二乘法”,这对统计学的 发展作出了不朽的贡献。 Katler(比利时)(1796-1874)首先把概率论的基本原理引进统计学的研究领域
成为数理统计的创始人。而数理统计学这一名词是1867年德国的维德斯坦发表《关于 数理统计学及其在国民经济和保险学中的应用》一文而首先使用的。 2.生物统计学的起源 最早建立生物统计思想的是A.Quetelet(1796-1874)他把统计学的理论应用于解决 生物学、医学和社会学中的问题。引进了“平均人”的概念,第一个认识到在大量的变 异数据之中蕴藏着规律性,这正是近代生物统计学中最重要的思想。 最早应用生物统计方法的另一位生物学家是C.达尔文(1809-1882),他的进化论的 本质正是生物统计,。G.孟德尔(1822-1884)在1866年发表的关于豌豆杂交试验的研 究结果也是一个生物统计的问题。达尔文、孟德尔是最早应用生物统计学方法的人。 3.生物统计学的发展 生物统计学的重要发展是在十九世纪以后。1870年英国遗传学家F.Galton (1822-1911)通过研究人类体高的遗传,认为子女的体高与父母的体高有着直接的关 系,发现子女的体高与他们的父母的体高有回归的趋势,这就是在数理统计中“回归 术语的由来,Galton18870年提出回归一词,因而,后人推崇他为生物统计学的创始人, 称他为“生物统计和优生学之父”。 K.Pearson(1857-1936)在1899年提出了一个测量实际数与理论预计数之间的偏离 度的指数x2。x2在属性统计分析中有着重要的作用,同年他创建了《Biometrika》(生 物统计学报)刊物,并建立了一所数理统计学校。他的学生W.Gosset(古斯特) (1876-1937)对样本标准差做了不少研究,在1908年以“student”(“学生氏”)笔名 将“t-检验”发表于《Biometrika》刊物上,此后t检验法成为当代生物统计学中基本工 具之一。 1923年英国的生物学家R.Fisher(1890-1962)第一个把变异来源不同的均方值称 为F值。当F值大于理论上5%概率水准的F值时,该项变异来源的必然性效应就从偶 然性变量中分析出来。这个分析方法,被称为方差分析。在生物统计中,方差分析应用 的很广,特别是在他发表了《试验研究工作中的统计方法》的专著后,对推动和促进农 业科学、生物学和遗传学的研究和发展起了一定的奠基作用。 J.Neyman(纳耶曼)在1936年,E.S.Pearson在1938年分别提出一种统计假设检验学 说,对促进理论研究及对试验研究做出结论具有实用价值
4 成为数理统计的创始人。而数理统计学这一名词是 1867 年德国的维德斯坦发表《关于 数理统计学及其在国民经济和保险学中的应用》一文而首先使用的。 2. 生物统计学的起源 最早建立生物统计思想的是 A.Quetelet(1796-1874)他把统计学的理论应用于解决 生物学、医学和社会学中的问题。引进了“平均人”的概念,第一个认识到在大量的变 异数据之中蕴藏着规律性,这正是近代生物统计学中最重要的思想。 最早应用生物统计方法的另一位生物学家是 C.达尔文(1809-1882),他的进化论的 本质正是生物统计,。G.孟德尔(1822-1884)在 1866 年发表的关于豌豆杂交试验的研 究结果也是一个生物统计的问题。达尔文、孟德尔是最早应用生物统计学方法的人。 3. 生物统计学的发展 生物统计学的重要发展是在十九世纪以后。1870 年英国遗传学家 F.Galton (1822-1911)通过研究人类体高的遗传,认为子女的体高与父母的体高有着直接的关 系,发现子女的体高与他们的父母的体高有回归的趋势,这就是在数理统计中 “回归” 术语的由来,Galton1870 年提出回归一词,因而,后人推崇他为生物统计学的创始人, 称他为“生物统计和优生学之父”。 K.Pearson(1857-1936)在 1899 年提出了一个测量实际数与理论预计数之间的偏离 度的指数 2 x 。 2 x 在属性统计分析中有着重要的作用,同年他创建了《Biometrika》(生 物统计学报)刊物,并建立了一所数理统计学校。他的学生 W.Gosset(古斯特) (1876-1937)对样本标准差做了不少研究,在 1908 年以“student”(“学生氏”)笔名 将“t-检验”发表于《Biometrika》刊物上,此后 t 检验法成为当代生物统计学中基本工 具之一。 1923 年英国的生物学家 R.Fisher(1890-1962)第一个把变异来源不同的均方值称 为 F 值。当 F 值大于理论上 5%概率水准的 F 值时,该项变异来源的必然性效应就从偶 然性变量中分析出来。这个分析方法,被称为方差分析。在生物统计中,方差分析应用 的很广,特别是在他发表了《试验研究工作中的统计方法》的专著后,对推动和促进农 业科学、生物学和遗传学的研究和发展起了一定的奠基作用。 J.Neyman(纳耶曼)在 1936 年,E.S .Pearson 在 1938 年分别提出一种统计假设检验学 说,对促进理论研究及对试验研究做出结论具有实用价值
4.我国在统计学及生物学方面的工作 李悝(前455-前395)是我国古代统计学家之一。他在《尽地力之教》一书中,对 五口之家,运用平均数和分组法进行分析,首先把收成分组,分为丰年和饥年,丰年又 按上中下分组,饥年按大中小分组,并且计算平均产量。他是我国最早运用复合分组的 人。 我国最早写统计学著作的是沈秉诚,他在1909年就著有《统计学纲领》。这本书是 在日本印刷的,对我国早期的统计学观点的形成和以后的发展都有影响。 三十年代,生物统计已成为农学系的必修课程,最早出版的有王绶编著的《实用生 物统计法》(1935年出版,1953年再版) 5。现代生物统计学 七十年代以来,由于电子计算机的日益普及,本来由于计算量太大而不得不放弃的 统计问题获得了生命力,使其应用更为广泛。 五、生物统计学在生产实践中的应用 生物统计学是应用数学的一个分支。半个世纪来,它的应用范围不断扩大。在遗传 学中,作为研究变异的统计方法,在农学中田间试验与分析,医学中药物试验与分析、 饲养试验、动物群体生态实验、群体遗传与选种统计。 六、生物统计学的学习方法 1、掌握基本概念 2、熟记公式 3、大量作习题 4、在具体研究中要随时应用所学的统计方法。 七、教学计划 本课程共安排了54个学时,主要讲授概率的理论分布、统计推断、方差分析和回 归分析等内容。另外实验设计也是重点讲授的一章。 在教学过程中。我们还要随堂作两次试验。一是抽样试验,一是两因素方差分析试 验。 八、参考书目 主要参考书目:杜容謇的《生物统计学》 其它参考书: 杨纪珂、齐翔林《现代生物统计》安徽教育出版社
5 4. 我国在统计学及生物学方面的工作 李悝(前 455-前 395)是我国古代统计学家之一。他在《尽地力之教》一书中,对 五口之家,运用平均数和分组法进行分析,首先把收成分组,分为丰年和饥年,丰年又 按上中下分组,饥年按大中小分组,并且计算平均产量。他是我国最早运用复合分组的 人。 我国最早写统计学著作的是沈秉诚,他在 1909 年就著有《统计学纲领》。这本书是 在日本印刷的,对我国早期的统计学观点的形成和以后的发展都有影响。 三十年代,生物统计已成为农学系的必修课程,最早出版的有王绶编著的《实用生 物统计法》(1935 年出版,1953 年再版) 5. 现代生物统计学 七十年代以来,由于电子计算机的日益普及,本来由于计算量太大而不得不放弃的 统计问题获得了生命力,使其应用更为广泛。 五、生物统计学在生产实践中的应用 生物统计学是应用数学的一个分支。半个世纪来,它的应用范围不断扩大。在遗传 学中,作为研究变异的统计方法,在农学中田间试验与分析,医学中药物试验与分析、 饲养试验、动物群体生态实验、群体遗传与选种统计。 六、生物统计学的学习方法 1、掌握基本概念 2、熟记公式 3、大量作习题 4、在具体研究中要随时应用所学的统计方法。 七、教学计划 本课程共安排了 54 个学时,主要讲授概率的理论分布、统计推断、方差分析和回 归分析等内容。另外实验设计也是重点讲授的一章。 在教学过程中。我们还要随堂作两次试验。一是抽样试验,一是两因素方差分析试 验。 八、参考书目 主要参考书目:杜容謇的《生物统计学》 其它参考书: 杨纪珂、齐翔林《现代生物统计》 安徽教育出版社