生物信息学 教案 2010/2011第一学期 教师 蔡禄 内蒙古科技大学 数理与生物工程学院 2010年9月
1 生 物 信 息 学 教 案 2010/2011 第一学期 教师 蔡 禄 内蒙古科技大学 数理与生物工程学院 2010 年 9 月
教材: 蔡禄生物学信息教程2006年北京化学工业出版社 主要参考书: 1、孙啸等生物信息基础2004年清华大学出版社 &、TK Attwood等Introduction to Bioinformatics2002年北京大学出版社 3、李衍达孙之荣译Bioinformatics:A practice guide to the analysis of genes and proteins2000年清华大学出版社 R.Durbin Biological sequence analysis-Probabilistic models of proteins and nucleic acids2002年清华大学出版社 授课对象:生物技术生物工程本科 课程性质:生物技术专业必修课 生物工程专业选修课 学时:课堂40学时,上机10学时(自愿)
2 教材: 蔡禄 生物学信息教程 2006 年 北京 化学工业出版社 主要参考书: 1、 孙啸 等 生物信息基础 2004 年 清华大学出版社 2、 T K Attwood 等 Introduction to Bioinformatics2002 年 北京大学出版社 3、 李衍达 孙之荣译 Bioinformatics:A practice guide to the analysis of genes and proteins 2000 年清华大学出版社 4、 R. Durbin 等 Biological sequence analysis-Probabilistic models of proteins and nucleic acids 2002 年 清华大学出版社 授课对象:生物技术 生物工程本科 课程性质:生物技术专业必修课 生物工程专业选修课 学时:课堂 40 学时,上机 10 学时(自愿)
课程名称:生物信息辱 授课章节 第1章生物信息学引论(6学时) 目的要求 介绍生物信息学的基本概念,指出生物信息学的研究目标和任务、研究意义、基本 方法和前沿书术 重占,生物信自学概今 重点难点 难点:生物信息学与其他生物学科的观念上的革新 还原论思 对照“综合 生物并非只是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂论”解释 而有序的过程。如果说物理学是研究物质和能量的学科,那么生命科学就是研究生 命物质其出上的信息的学科」 “生物信自 我们对生命的奥秘还不甚了解,对生命信息的组 、传递和表达还知之其少 学”产生的背 既然这牵涉到信息的组织、传递和表达,我们就可以用信息科学的方法和技术来尝 试认识和分析生命信息 §1.1引言 随着基因组计划的迅速发展,生物数据的积累速度不断加快。因此,也就对生 物数据的科学分析方法和实用分析工具提出了更新、更高的要求。在这个过程中 需要对实验数据进行处理并及时进行理论分析,在此基础上解释实验现象,认识导 致实验现象发生的本质,在“整合”、“系统”等全新理念下探索固有的生物学规律, 进而了解和堂据生命的物质基础和生命的本质。 1.11生物信息学基本概念 无论从理论上来讲还是从实际情况来看,生物信息学的实质就是利用数理知识、 信息和计算机科学及技术来研究生物学信息的组织、传递和表达规律等问题。 广义的生物信息学是指以核酸蛋白质等生物大分子为主要研究对象,以信息 广义概念 数理、计算机科学为主要研究手段,以计算机网络为主要研究环境,以计算机软件 为主要研究 对序列数 居进行存储、管理、注释、 加工,对各种数据库进 询、搜索、比较、分析,构建各种类型的专用数据库信息系统,研究开发面向生物 学家的新一代计算机软件:并利用数理统计、模式识别、动态规划、密码解读、语 意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法,对序列、结 构数据进行定性和定量分析,从中获取基因编码、基因调控、序列结构功能关系等 理性知识阐明细陶、婴宫和个休的发生、发有、恋、 衰亡的基本规律和时空联 系,探索生命起源、生物进化、生命本质等重大理论问题 立“生物学周期表 计算分子生物学主要研究分析方法,开发分析工具,促进生物分子数据的分析。 相关领域定 生物计算主要是用计算机技术分析和处理生物学数据。 1.1.2生物信息学的研究目标和任务 羯示生物分子数据隐含的生物学信息是其长远目标和根本任务 从三个方面 目前生物信息学的主要任务包括3个方面: 论述 第一是收集和管理生物分子数据。 第二是进行数据处理和分析。目前生物信息学的主要研究对象是DNA和蛋白 质。在DNA分析方面,若重分析DNA序列中的基因信息及基因表达调控信息,分 析基因表达数据,分析基因之间的相互作用关系,比较不同种属的基因组,研究基 2
2 课程名称:生物信息学 授课章节 第 1 章 生物信息学引论(6 学时) 目的要求 介绍生物信息学的基本概念,指出生物信息学的研究目标和任务、研究意义、基本 方法和前沿技术。 重点难点 重点:生物信息学概念。 难点:生物信息学与其他生物学科的观念上的革新 还原论思想 生物并非只是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂 而有序的过程。如果说物理学是研究物质和能量的学科,那么生命科学就是研究生 命物质基础上的信息的学科。 我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。 既然这牵涉到信息的组织、传递和表达,我们就可以用信息科学的方法和技术来尝 试认识和分析生命信息。 §1.1 引言 随着基因组计划的迅速发展,生物数据的积累速度不断加快。因此,也就对生 物数据的科学分析方法和实用分析工具提出了更新、更高的要求。在这个过程中, 需要对实验数据进行处理并及时进行理论分析,在此基础上解释实验现象,认识导 致实验现象发生的本质,在“整合”、“系统”等全新理念下探索固有的生物学规律, 进而了解和掌握生命的物质基础和生命的本质。 1.1.1 生物信息学基本概念 无论从理论上来讲还是从实际情况来看,生物信息学的实质就是利用数理知识、 信息和计算机科学及技术来研究生物学信息的组织、传递和表达规律等问题。 广义的生物信息学是指以核酸蛋白质等生物大分子为主要研究对象,以信息、 数理、计算机科学为主要研究手段,以计算机网络为主要研究环境,以计算机软件 为主要研究工具,对序列数据进行存储、管理、注释、加工,对各种数据库进行查 询、搜索、比较、分析,构建各种类型的专用数据库信息系统,研究开发面向生物 学家的新一代计算机软件;并利用数理统计、模式识别、动态规划、密码解读、语 意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法,对序列、结 构数据进行定性和定量分析,从中获取基因编码、基因调控、序列-结构-功能关系等 理性知识,阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联 系,探索生命起源、生物进化、生命本质等重大理论问题,最终建立“生物学周期表”。 计算分子生物学主要研究分析方法,开发分析工具,促进生物分子数据的分析。 生物计算主要是用计算机技术分析和处理生物学数据。 1.1.2 生物信息学的研究目标和任务 揭示生物分子数据隐含的生物学信息是其长远目标和根本任务。 目前生物信息学的主要任务包括 3 个方面: 第一是收集和管理生物分子数据。 第二是进行数据处理和分析。目前生物信息学的主要研究对象是 DNA 和蛋白 质。在 DNA 分析方面,着重分析 DNA 序列中的基因信息及基因表达调控信息,分 析基因表达数据,分析基因之间的相互作用关系,比较不同种属的基因组,研究基 对照“综合 论”解释 “生物信息 学”产生的背 景 广义概念 相关领域定 义 从三个方面 论述
因组中非编码区域的生物学功能。在蛋白质分析方面,若重分析蛋白质序列与蛋白 质结构及功能之间的关系,预测蛋白质的结构和功能,研究蛋白质的进化关系。 第三个方面是开发分析工具和实用软件,解决具体的问题, 为具体的生物信 学应用服务。 1.1.3生物信息学的研究意义 从5个方面论 生物信息学研究是从理论上认识生物本质的必要途径 生物信息学的出现将改变生物学的研究方式 随着分子生物学研究的深入,必然需要生物信息学。 生物信息学在指导实验、精心没计实验方面将会发挥重要的作用。 生物信息学研究在医学上也有重要的意义。 S1.2生物信息学的产生与发展 1.2.1生物信息学的发展历史 生物信息学的发展大致经历了3个阶段: 按历史顺序 (1)前基因组时代(20世纪90年代前) 介绍重要事 20世纪50年代,生物信息学就已经开始孕育。 1962年,Zucherkandl和Pauling研究序列变化与进化之间的关系,开创了一个 新的领域 分子进化 1964年,蛋白质结构预测的研究由Davies的工作开始。氨基酸序列的收集是这 注意结合领 个时期的一项重要工作,1967年Dayhoff发表了蛋白质序列图集,该图集后来演变 域前沿问题 进解,调动学 为著名的蛋白质信息源(PR)。 生学习兴趣 20世纪60年代是生物信息学形成雏形的阶段。 从20世纪70年代初期到80年代初期 出现 一系列若名的序列比较方法 在20世纪70年代,还不断涌现出许多生物信息分析方法。 20世纪80年代以后,出现了一批生物信息服务机构和生物信息数据库。 (②)基因组时代(20世纪90年代后至2001年) 生物信息学的真正发展则是在20世纪90年代,在人类基因组计划的推动下, 主物信息学 (3)后基因组时代(2001年至今) 随若后基因组时代的到来,生物信息学研究的重点逐步转移到功能基因组信息 研究。其具体表现在: (1)将已知基因的序列与功能联系在一起进行研究: 从以常规克隆为基础的基因分离转向以序列分析和功能分析为基础的 志因分离 (3) 从单个基因致病机理的研究转向多个基因致病机理的研究: (4)从组织与组织之间的比较来研究功能基因组和蛋白质组,组织与组织 之间的比较主要表现在:正常与疾病组织之间的比较,正常与激活组 织之间的比较,疾病与处理(或治疗)组织之间的比较,不同发育过 程的比较等 (5) 标志是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合 出现了蛋白质组学、药物基因组学、比较基因组学、功能基因组学、 系统生物学、整合生物学等学科。 (6)研究思路也发生了本质的变化,从传统的还原论研究生命过程转到了
3 因组中非编码区域的生物学功能。在蛋白质分析方面,着重分析蛋白质序列与蛋白 质结构及功能之间的关系,预测蛋白质的结构和功能,研究蛋白质的进化关系。 第三个方面是开发分析工具和实用软件,解决具体的问题,为具体的生物信息 学应用服务。 1.1.3 生物信息学的研究意义 生物信息学研究是从理论上认识生物本质的必要途径。 生物信息学的出现将改变生物学的研究方式。 随着分子生物学研究的深入,必然需要生物信息学。 生物信息学在指导实验、精心没计实验方面将会发挥重要的作用。 生物信息学研究在医学上也有重要的意义。 §1.2 生物信息学的产生与发展 1.2.1 生物信息学的发展历史 生物信息学的发展大致经历了 3 个阶段: (1) 前基因组时代(20 世纪 90 年代前) 20 世纪 50 年代,生物信息学就已经开始孕育。 1962 年,Zucherkandl 和 Pauling 研究序列变化与进化之间的关系,开创了一个 新的领域——分子进化。 1964 年,蛋白质结构预测的研究由 Davies 的工作开始。氨基酸序列的收集是这 个时期的一项重要工作,1967 年 Dayhoff 发表了蛋白质序列图集,该图集后来演变 为著名的蛋白质信息源(PIR)。 20 世纪 60 年代是生物信息学形成雏形的阶段。 从 20 世纪 70 年代初期到 80 年代初期,出现了一系列著名的序列比较方法。 在 20 世纪 70 年代,还不断涌现出许多生物信息分析方法。 20 世纪 80 年代以后,出现了一批生物信息服务机构和生物信息数据库。 (2) 基因组时代 (20 世纪 90 年代后至 2001 年) 生物信息学的真正发展则是在 20 世纪 90 年代,在人类基因组计划的推动下, 生物信息学才得以迅猛发展。 (3) 后基因组时代 (2001 年至今) 随着后基因组时代的到来,生物信息学研究的重点逐步转移到功能基因组信息 研究。其具体表现在: (1) 将已知基因的序列与功能联系在一起进行研究; (2) 从以常规克隆为基础的基因分离转向以序列分析和功能分析为基础的 基因分离; (3) 从单个基因致病机理的研究转向多个基因致病机理的研究; (4) 从组织与组织之间的比较来研究功能基因组和蛋白质组,组织与组织 之间的比较主要表现在:正常与疾病组织之间的比较,正常与激活组 织之间的比较,疾病与处理(或治疗)组织之间的比较,不同发育过 程的比较等 (5) 标志是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合。 出现了蛋白质组学、药物基因组学、比较基因组学、功能基因组学、 系统生物学、整合生物学等学科。 (6) 研究思路也发生了本质的变化,从传统的还原论研究生命过程转到了 综合论思想 综合论方法研究基因和各种生物大分子是怎样通过网络 从 5 个方面论 述 按历史顺序 介绍重要事 件 注意结合领 域前沿问题 讲解,调动学 生学习兴趣
综合论思想。综合论方法研究基因和各种生物大分子是怎样通过网络 丽控方式形成一个生物系统的。提出了层次抽提和相互作用网路等概 1.2.2我国生物信息学发展现状 我国的生物信息学工作是逐步发展起来的。20世纪80年就有若干科研院所的介绍国内有 生物、物理、信息、数学等学科的工作者从事生物信息学的研究工作。 关单位和有 近几年来,国内对生物信息学的研究和应用越来越重视。 关专家 我国在基因组信息的收集与发布方面开展了 一些工 目前,我国基因组和蛋白质组研究在国际上己经占据了重要的地位:在生物信 息学研究和应用方面,相信经过科学家的努力,经过多学科专家的合作,完全有可 能赶上甚至超过世界先进水平。 12.3我国生物信息学研究的发展方向 以国家自然 从国内权威的政府科学研究基金“国家自然科学基金”的资助方向可大致了解 科学基金 我国生物信息学研究的主流发展方向。 863计划、香 数理学部设立了一个“理论物理学及其交叉科学若干前沿问题”的重大项目 山会议等介 数理学部环设立了重点项日“基因功能流测的生物信息学”,项日强调发展物理绍 与生物、化学、数学结合的新实验和理论方法来探索生物系统调控的基本规律 生命科学学部的“生物化学与分子生物学学科” “遗传学与发育生物学学科 “生物物理与生物医学工程学科”,信息学部的“电子科学学科”均把“生物信息学 方向作为重要的前沿领域资助。 目前我国生物信息学研究的主要方向: 束立国家生物医学箭摇库与服条系纷 2 人类基因组的信息结构 (3)、功能基因组相关信息分析 (④以、遗传密码起源与生物进化(尤其是分子进化)的过程与机制 (⑤、非编码区分析和DNA语言研究,是最重要的课题之一。 (6、基于结构的药物设计 此外,结合重大科学间题的研究,发挥我国在理论生物学和信息科学领域的研 究特色,发展生物信息学的新理论、新方法、新技术和新软件也是重要的发展方向 如何进一步根据我国在生物学方面的特点,建立高水平的理论与实验体系,加 快培养优秀的青年人才,是发展我国生物信息学研究最为迫切的任务之一。 $13生物信息学的基本方法与前沿技术 1.3.1基本方法 目前,生物信息学研究的基本方法主要有以下几种 ()、建立生物数据库 针对生物信息学特定的研究与开发工作,必须建立自己的数据库或数据获取界 面 (②、数据库检索 越来越多的数据库检索工具已投入实际应用。 (3)、序列分析 分子序列分析是生物信息学的核心方法,包括从序列对位排列(Sequence
4 综合论思想。综合论方法研究基因和各种生物大分子是怎样通过网络 调控方式形成一个生物系统的。提出了层次抽提和相互作用网络等概 念。 1.2.2 我国生物信息学发展现状 我国的生物信息学工作是逐步发展起来的。20 世纪 80 年就有若干科研院所的 生物、物理、信息、数学等学科的工作者从事生物信息学的研究工作。 近几年来,国内对生物信息学的研究和应用越来越重视。 我国在基因组信息的收集与发布方面开展了一些工作 目前,我国基因组和蛋白质组研究在国际上已经占据了重要的地位;在生物信 息学研究和应用方面,相信经过科学家的努力,经过多学科专家的合作,完全有可 能赶上甚至超过世界先进水平。 1.2.3 我国生物信息学研究的发展方向 从国内权威的政府科学研究基金“国家自然科学基金”的资助方向可大致了解 我国生物信息学研究的主流发展方向。 数理学部设立了一个“理论物理学及其交叉科学若干前沿问题”的重大项目 数理学部还设立了重点项目“基因功能预测的生物信息学”,项目强调发展物理 与生物、化学、数学结合的新实验和理论方法来探索生物系统调控的基本规律。 生命科学学部的“生物化学与分子生物学学科”、“遗传学与发育生物学学科”、 “生物物理与生物医学工程学科”,信息学部的“电子科学学科”均把“生物信息学” 方向作为重要的前沿领域资助。 目前我国生物信息学研究的主要方向: (1)、建立国家生物医学数据库与服务系统 (2)、人类基因组的信息结构分析 (3)、功能基因组相关信息分析 (4)、遗传密码起源与生物进化(尤其是分子进化)的过程与机制 (5)、非编码区分析和 DNA 语言研究,是最重要的课题之一。 (6)、基于结构的药物设计 此外,结合重大科学问题的研究,发挥我国在理论生物学和信息科学领域的研 究特色,发展生物信息学的新理论、新方法、新技术和新软件也是重要的发展方向 之一。 如何进一步根据我国在生物学方面的特点,建立高水平的理论与实验体系,加 快培养优秀的青年人才,是发展我国生物信息学研究最为迫切的任务之一。 §1.3 生物信息学的基本方法与前沿技术 1.3.1 基本方法 目前,生物信息学研究的基本方法主要有以下几种 (1)、建立生物数据库 针对生物信息学特定的研究与开发工作,必须建立自己的数据库或数据获取界 面。 (2)、数据库检索 越来越多的数据库检索工具已投入实际应用。 (3)、序列分析 分子序列分析是生物信息学的核心方法,包括从序列对位排列(Sequence 介绍国内有 关单位和有 关专家 以国家自然 科学基金、 863 计划、香 山会议等介 绍