alignment),到序列同源比较和进化分析,直至基因组分析和蛋白质组分析等 ④队、统计模型 越来越多的统计模型已用于生物信息学研究。例如,隐马尔可夫模型(hidde Markov model,HMM)在基因识别和药物设计中具有重要的应用价值:最大似然模 型(maximum likelihood model,MLM)已成为序列进化分析中的一种常规方法。 (5)、算法 在生物信息学实际工作中已建立了大量算法,如自动序列拼接、外显子预测和 同源比较算法等。 13.2前沿技术 (、数据管理技术 集中式大型分子据库(如GenBank embl和DDB】第). 新的发展趋势是应用互操作()以及数字图书馆(digita library)技术来进行异构数据库集成。 (②小数据仓库、数据挖掘与数据库中的知识发现技术 (仔、图像处理与可视化技术 S1.4生物信息学的主要研究内容 研究范畴是以基因组DNA序列的信息分析作为出发点,分析基因组结构,寻找 或发现新基因,分析基因调控信息,并在此基础上研究基因的功能,研究基因的产 结合最新发 物即蛋白质,模拟和预测蛋白质的空间结构,分析蛋白质的性质,其结果将为基于 展方向讲解, 靶分子结构的药物分子设计和蛋白质分子改性设计提供依据。 力求让学理 生物信息学主要有以下几个方面的研究内容。 学习生物信 1.4.1生物分子数据的收集与管理 息学最新的 动态 有组织地搜集和管理这些数据是各项工作的前提。具体的工作包括构建数据库 系统,建立网络服务器,开发数据查询和搜索工具,设计数据分析软件和数据可视 化软件。 生物信息学发展很快,各种数据库不断涌现,并各有不同的特色 对于核酸序列,有3个权威组织在管理各自的数据库,EMBL、GenBank和DDB 蛋白质序列数据库:美国生物医学基金会建立的P叫R及瑞士生物信息学研究所 和欧洲分子生物学实验室共同维护的SWISS-PROT 著名的蛋白质结构数据库是:美国Brookhaven实验室的大分子数据库PDB。 数据库的内容十分丰富,除上述DNA序列、蛋白质序列和结构数据库之外,还 有表达序列标记数据库、序列标记位点数据库、蛋白质序列功能位点数据库、 基因 图谱数据库等一些具有特殊功能的数据库 1.4.2数据库搜索及序列比较 生物学研究人员希望能够通过搜索序列数据库找到与新序列同源的已知序列, 并根据同源性推测新序列的生物功能 搜索同源 予列在 一定程度 就是通过序列比较寻找相似序列.。在分子生物学中 DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构 的相似,也可能是功能的相似。 对于DNA序列,同源搜索除有助于确定其功能之外,还有助于确定编码区域, 确定基因。对于蛋白质,我们希望能够直接从蛋白质序列准确地预测蛋白质的结构 5
5 alignment),到序列同源比较和进化分析,直至基因组分析和蛋白质组分析等。 (4)、统计模型 越来越多的统计模型已用于生物信息学研究。例如,隐马尔可夫模型(hidden Markov model,HMM)在基因识别和药物设计中具有重要的应用价值;最大似然模 型(maximum likelihood model,MLM)已成为序列进化分析中的一种常规方法。 (5)、算法 在生物信息学实际工作中已建立了大量算法,如自动序列拼接、外显子预测和 同源比较算法等。 1.3.2 前沿技术 (1)、数据管理技术 集中式大型分子数据库(如 GenBank, EMBL 和 DDBJ 等)。 新的发展趋势是应用互操作(database interoperation)以及数字图书馆(digital library)技术来进行异构数据库集成。 (2)、数据仓库、数据挖掘与数据库中的知识发现技术 (3)、图像处理与可视化技术 §1.4 生物信息学的主要研究内容 研究范畴是以基因组 DNA 序列的信息分析作为出发点,分析基因组结构,寻找 或发现新基因,分析基因调控信息,并在此基础上研究基因的功能,研究基因的产 物即蛋白质,模拟和预测蛋白质的空间结构,分析蛋白质的性质,其结果将为基于 靶分子结构的药物分子设计和蛋白质分子改性设计提供依据。 生物信息学主要有以下几个方面的研究内容。 1.4.1 生物分子数据的收集与管理 有组织地搜集和管理这些数据是各项工作的前提。具体的工作包括构建数据库 系统,建立网络服务器,开发数据查询和搜索工具,设计数据分析软件和数据可视 化软件。 生物信息学发展很快,各种数据库不断涌现,并各有不同的特色。 对于核酸序列,有3个权威组织在管理各自的数据库,EMBL、GenBank和DDBJ。 蛋白质序列数据库:美国生物医学基金会建立的 PIR 及瑞士生物信息学研究所 和欧洲分子生物学实验室共同维护的 SWISS-PROT 著名的蛋白质结构数据库是:美国 Brookhaven 实验室的大分子数据库 PDB。 数据库的内容十分丰富,除上述 DNA 序列、蛋白质序列和结构数据库之外,还 有表达序列标记数据库、序列标记位点数据库、蛋白质序列功能位点数据库、基因 图谱数据库等一些具有特殊功能的数据库。 1.4.2 数据库搜索及序列比较 生物学研究人员希望能够通过搜索序列数据库找到与新序列同源的已知序列, 并根据同源性推测新序列的生物功能。 搜索同源序列在一定程度上就是通过序列比较寻找相似序列。在分子生物学中 DNA 或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构 的相似,也可能是功能的相似。 对于 DNA 序列,同源搜索除有助于确定其功能之外,还有助于确定编码区域, 确定基因。对于蛋白质,我们希望能够直接从蛋白质序列准确地预测蛋白质的结构 结合最新发 展方向讲解, 力求让学生 学习生物信 息学最新的 动态
和功能。 序列比较的基本操作就是比对(alignment),即将两个序列的各个字符(代表核君 酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列 其结果是找出两个 序列共有的排列顺序,这是序列相似程度的一种定性描述, 它反映出在什么部位两 个序列相似,在什么部位两个序列存在差别。最优比对反映了两个序列的最大相似 程度,寻找最优比对的基本算法就是动态规划算法。 与序列两两比对不一样,多重序列比对研究的是多个序列的共性。序列的多重 比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 1.4.3基因组序列分析 目前生物信息学的大量工作是针对基因组DNA序列的。 在DNA序列分析方面,识别蛋白质编码区域或识别基因是最关赞的 从编平风域可以推导出其因的结构及其对成的蛋白质序列。实哈则定DNA序列 要比测定蛋白质序列容易得多,因此可以通过实验测定 一段基因的序列,并由此推 导蛋白质的氨基酸序列。 有许多线索可用于帮助寻找基因,如蛋自质编码区域的统计特征、基因结构中 的一些特殊信号位点、基因转录调控区域的蛋白质结合位点等。 在寻找基因的过程中,首先试图发现在DNA序列中哪一部分为蛋白质编码, 果在一段DNA区域含有许多终止密码子,则它成为编码区域的可 。这虽然 不能准确地说明蛋白质编码区域从什么地方开始,到什么地方结束,但却可以帮助 猜测编码区域位于何处。 编码区域统计特征、基因结构特征及基因调控信息组织特征,都可用以推测在 DNA序列中为蛋白质编码的区域处于什么地方。 除寻找基因之外,详细分析非编码区域也是非常有意义的,目前的主要工作是 分析与基因表达调控相关 信息,分析各种功能位点 分析基因转 录调控元件 功能位点是DNA序列上一些特殊的片段,是蛋白质因子作用的位点,是与基因 转录、翻译有关的信号序列,包括启动子、起始编码、转录剪切位点等。 1.4.4基因表达数据的分析与处理 分析基因表达数据是目前生物信息学研究的热点和重点 块基因芯片就可以产生 千个基因的表达数据,数据处理量大幅度增加,数 据之间的关系也更加复杂。对基因表达数据,在大规模数据集上进行分析、归纳, 可以了解基因表达的时空规律,探索基因表达的代谢控制,了解基因的功能,理解 遗传网络,提供疾病发病机理的信息。 目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为 类,在此基础上寻找相关基因,分析基因的功能。 分析基因的转录调控 所用方法主要有相关分析方法、模式识别技术中的聚类方法和分类方法、人工 智能中的自组织映射神经网络等。此外,还有主成分分析方法,利用主成分分析可 以在多维数据集合中确定关键变量的特点,分析在不同条件下基因响应的规律和特 征 国际上在基因调控网络分析方面进行了许多有意义的工作 1.4.5蛋白质结构预测 蛋白质是组成生物体的基本物质,是生命活动的主要承担者,一切生命活动都 与蛋白质有关
6 和功能。 序列比较的基本操作就是比对(alignment),即将两个序列的各个字符(代表核苷 酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是找出两个 序列共有的排列顺序,这是序列相似程度的一种定性描述,它反映出在什么部位两 个序列相似,在什么部位两个序列存在差别。最优比对反映了两个序列的最大相似 程度,寻找最优比对的基本算法就是动态规划算法。 与序列两两比对不一样,多重序列比对研究的是多个序列的共性。序列的多重 比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 1.4.3 基因组序列分析 目前生物信息学的大量工作是针对基因组 DNA 序列的。 在 DNA 序列分析方面,识别蛋白质编码区域或识别基因是最关键的。 从编码区域可以推导出基因的结构及其对应的蛋白质序列。实验测定 DNA 序列 要比测定蛋白质序列容易得多,因此可以通过实验测定一段基因的序列,并由此推 导蛋白质的氨基酸序列。 有许多线索可用于帮助寻找基因,如蛋白质编码区域的统计特征、基因结构中 的一些特殊信号位点、基因转录调控区域的蛋白质结合位点等。 在寻找基因的过程中,首先试图发现在 DNA 序列中哪一部分为蛋白质编码,如 果在一段 DNA 区域含有许多终止密码子,则它成为编码区域的可能性极小。这虽然 不能准确地说明蛋白质编码区域从什么地方开始,到什么地方结束,但却可以帮助 猜测编码区域位于何处。 编码区域统计特征、基因结构特征及基因调控信息组织特征,都可用以推测在 DNA 序列中为蛋白质编码的区域处于什么地方。 除寻找基因之外,详细分析非编码区域也是非常有意义的,目前的主要工作是 分析与基因表达调控相关的信息,分析各种功能位点,分析基因转录调控元件。 功能位点是 DNA 序列上一些特殊的片段,是蛋白质因子作用的位点,是与基因 转录、翻译有关的信号序列,包括启动子、起始编码、转录剪切位点等。 1.4.4 基因表达数据的分析与处理 分析基因表达数据是目前生物信息学研究的热点和重点。 一块基因芯片就可以产生上千个基因的表达数据,数据处理量大幅度增加,数 据之间的关系也更加复杂。对基因表达数据,在大规模数据集上进行分析、归纳, 可以了解基因表达的时空规律,探索基因表达的代谢控制,了解基因的功能,理解 遗传网络,提供疾病发病机理的信息。 目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为 一类,在此基础上寻找相关基因,分析基因的功能,分析基因的转录调控。 所用方法主要有相关分析方法、模式识别技术中的聚类方法和分类方法、人工 智能中的自组织映射神经网络等。此外,还有主成分分析方法,利用主成分分析可 以在多维数据集合中确定关键变量的特点,分析在不同条件下基因响应的规律和特 征。 国际上在基因调控网络分析方面进行了许多有意义的工作。 1.4.5 蛋白质结构预测 蛋白质是组成生物体的基本物质,是生命活动的主要承担者,一切生命活动都 与蛋白质有关
因此,分析处理蛋白质数据的重要性并不低于分析DNA序列数据。在分析处理 蛋白质序列时将面对一个问题,即根据蛋白质序列预测蛋白质结构,也就是第二遗 传密码的问题 蛋白质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的功能时需要了 解蛋白质的空间结构。 已知蛋白质序列数与己知的结构数严重不平衡,蛋白质序列数据库中的数据量 大大超过结物数据库中的数据量。虽然蛋白质结构的测定方法省所改进,但仍不的 满足实际需要,需要发展理论预测的方法。 蛋白质结构预测分为二级结构预测和空间结构预测。 在二级结构预测方面主要有以下几种不同的方法,即立体化学方法、图论方法、 统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法和人工神 经网络方法。 预测蛋白质二级结构时需要考虑全局信息和进化信息等。预测准确率超过 %的 个软件是基于神经网络的PHDsec系统,该系统除使用序列的局部信息外 还使用了序列的进化信息。 在空间结构预测方面,比较成功的理论方法是同源模型法。 §1.5生物信息学的应用 生物信息学在理论上促进了生物学(特别是分子生物学)的发展,使人类对生 命本质的认识更加深刻。生物信息学改变了传统的生物学研究方法,提高了生物学 实验的科学性和研究的效率。 在应用方面,生物信息学大大促进了人类基因组的研究,己成为生物工程、生 物医药产业和高科技农业的巨大推动力,今后还将在功能基因组学研究和蛋白组学 研究中发挥其突出的作用。 1.5.1生物信息的经济价值与生物信息学市场 公司和企业都在重点从事基因组学、蛋白组学、药物基因组学或生物芯片的研 究和开发工作,而这些领域的研究和应用完全依赖于生物信息学。 国际生物信息学产业和市场逐步形成。 生物信息蕴藏着巨大的经济价值。许多国家的政府机构和公司纷纷投资生物信 息产业,其中制药业对生物信息的需求最大, 尽管生物信息学实际和潜在的市场规模很难分析,但确已呈现出良好的势头。 表1山粗略地反映了国外生物信息学的市场调查和预测情况。表12则列出了国外 些主要的生物信息公司的研究计和项目。从中可以发现信息集成技术、疾病基因 和药物设计己成为热门项目。 1.5.2基因组分析 生物信息学在基因组分析中的应用反映出以下几个方面的特点: ①、将已知基因的序列与功能联系在一起: ②、从基于常规克隆的基因分类转向基于序列及功能分析的基因分类 从单个基因致病机制的研究转向 个基因致病机制的研究: ④、从组织与组织之间的比较来研究功能基因组和蛋白质组 ⑤、从基因组和蛋白质组的结构与功能关系来预测三级结构和功能,并从三级 结构和功能反推可能的序列: 通过比较不同生物物种的基因组来进行分子进化研究。其中,组织与组织之何
7 因此,分析处理蛋白质数据的重要性并不低于分析 DNA 序列数据。在分析处理 蛋白质序列时将面对一个问题,即根据蛋白质序列预测蛋白质结构,也就是第二遗 传密码的问题。 蛋白质的生物功能由蛋白质的结构所决定,因此在研究蛋白质的功能时需要了 解蛋白质的空间结构。 已知蛋白质序列数与已知的结构数严重不平衡,蛋白质序列数据库中的数据量 大大超过结构数据库中的数据量。虽然蛋白质结构的测定方法有所改进,但仍不能 满足实际需要,需要发展理论预测的方法。 蛋白质结构预测分为二级结构预测和空间结构预测。 在二级结构预测方面主要有以下几种不同的方法,即立体化学方法、图论方法、 统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法和人工神 经网络方法。 预测蛋白质二级结构时需要考虑全局信息和进化信息等。预测准确率超过 70 %的第一个软件是基于神经网络的 PHDsec 系统,该系统除使用序列的局部信息外, 还使用了序列的进化信息。 在空间结构预测方面,比较成功的理论方法是同源模型法。 §1.5 生物信息学的应用 生物信息学在理论上促进了生物学(特别是分子生物学)的发展,使人类对生 命本质的认识更加深刻。生物信息学改变了传统的生物学研究方法,提高了生物学 实验的科学性和研究的效率。 在应用方面,生物信息学大大促进了人类基因组的研究,已成为生物工程、生 物医药产业和高科技农业的巨大推动力,今后还将在功能基因组学研究和蛋白组学 研究中发挥其突出的作用。 1.5.1 生物信息的经济价值与生物信息学市场 公司和企业都在重点从事基因组学、蛋白组学、药物基因组学或生物芯片的研 究和开发工作,而这些领域的研究和应用完全依赖于生物信息学。 国际生物信息学产业和市场逐步形成。 生物信息蕴藏着巨大的经济价值。许多国家的政府机构和公司纷纷投资生物信 息产业,其中制药业对生物信息的需求最大。 尽管生物信息学实际和潜在的市场规模很难分析,但确已呈现出良好的势头。 表 1-1 粗略地反映了国外生物信息学的市场调查和预测情况。表 1-2 则列出了国外一 些主要的生物信息公司的研究计划和项目。从中可以发现信息集成技术、疾病基因 和药物设计已成为热门项目。 1.5.2 基因组分析 生物信息学在基因组分析中的应用反映出以下几个方面的特点: ①、将已知基因的序列与功能联系在一起; ②、从基于常规克隆的基因分类转向基于序列及功能分析的基因分类; ③、从单个基因致病机制的研究转向多个基因致病机制的研究; ④、从组织与组织之间的比较来研究功能基因组和蛋白质组 ⑤、从基因组和蛋白质组的结构与功能关系来预测三级结构和功能,并从三级 结构和功能反推可能的序列; 通过比较不同生物物种的基因组来进行分子进化研究。其中,组织与组织之间
的比较主要包括:正常组织与疾病组织之间的比较:正常组织与激活组织之间的比 较:疾病组织与处理(治疗)的组织之间的比较:相同组织在不同发育过程中的比 较 不同生物的基因组比较具有重要的理论与应用价值。 1.5.3基因芯片 芯片技术的突出特点是高度并行化、多样化、微型化和自动化等,因而被广泛 用于测序、转录情况分析、不同基因型细胞的表型分析以及基因诊断、药物设计等 领域 成为后基因组时代基因功能分析的支摔技术 随若DNA芯片或蛋白质芯片的高通量检测获得数据能力的迅速增加,如何进行 快速有效的数据分析成为生物信息学的一项重要任务。 1.5.4药物开发 基因组研究对现代与未来药物学和药理学产生了重大影响 ,尤其为新药筛选 药靶设计和分子药理学研究,以及疑难病的药物设计和途径选择等提供了新的方法 论基础。 1.5.5基因组到生命 美国能源部又提出一个新的战略计划 -“基因组到生命”计划(genomes tolife) 该计划旨在认识基因组是如何转化为生命的。基因组中的基因按照一定的时间和空 间规律被表达成蛋白质,而蛋白质需要和其他蛋白质或者核酸合作,结合起来形成 有机的“分子机器”。 1.5.6其他应用领域 1、寄生虫与流行病学研究 在寄生虫学研究中,以下几个方面涉及生物信息学的工作: (1)基因组测序 2)电子古隆 (3)种下比较 (④)种间比较 (⑤)基因表达式村 2.农作物基因组分析 对重要农作物及经济植物进行基因组分析也需要生物信息学工具。 3.神经科学 每年全世界约新增1500个神经图像研究项目,所产生的数据量达10“数 量级。在这一领域中,数据共享问题已十分突出。 §1.6生物信息学教育与学习 1.6.1生物信息学教育项目 由于对生物信息学的需求如此迅猛,即使是像美国这样的发达国家也面临着生 物信息学人才供不应求的局面。 英国鉴于国内对生物信息学专业人才日益迫切的需求。 生物信息学人才培养是当务之急。生物信息学是一个交叉学科研究领域,这对 生物信息学研究人员在知识结构上提出了非常高的要求,特别是对于来自数学或计 8
8 的比较主要包括:正常组织与疾病组织之间的比较;正常组织与激活组织之间的比 较;疾病组织与处理(治疗)的组织之间的比较;相同组织在不同发育过程中的比 较。 不同生物的基因组比较具有重要的理论与应用价值。 1.5.3 基因芯片 芯片技术的突出特点是高度并行化、多样化、微型化和自动化等,因而被广泛 用于测序、转录情况分析、不同基因型细胞的表型分析以及基因诊断、药物设计等 领域,成为后基因组时代基因功能分析的支撑技术之一。 随着 DNA 芯片或蛋白质芯片的高通量检测获得数据能力的迅速增加,如何进行 快速有效的数据分析成为生物信息学的一项重要任务。 1.5.4 药物开发 基因组研究对现代与未来药物学和药理学产生了重大影响,尤其为新药筛选、 药靶设计和分子药理学研究,以及疑难病的药物设计和途径选择等提供了新的方法 论基础。 1.5.5 基因组到生命 美国能源部又提出一个新的战略计划—“基因组到生命”计划(genomes to life), 该计划旨在认识基因组是如何转化为生命的。基因组中的基因按照一定的时间和空 间规律被表达成蛋白质,而蛋白质需要和其他蛋白质或者核酸合作,结合起来形成 有机的“分子机器”。 1.5.6 其他应用领域 1、寄生虫与流行病学研究 在寄生虫学研究中,以下几个方面涉及生物信息学的工作: (1) 基因组测序 (2) 电子克隆 (3) 种下比较 (4) 种间比较 (5) 基因表达式样 2. 农作物基因组分析 对重要农作物及经济植物进行基因组分析也需要生物信息学工具。 3. 神经科学 每年全世界约新增 1500 个神经图像研究项目,所产生的数据量达 1014数 量级。在这一领域中,数据共享问题已十分突出。 §1.6 生物信息学教育与学习 1.6.1 生物信息学教育项目 由于对生物信息学的需求如此迅猛,即使是像美国这样的发达国家也面临着生 物信息学人才供不应求的局面。 英国鉴于国内对生物信息学专业人才日益迫切的需求。 生物信息学人才培养是当务之急。生物信息学是一个交叉学科研究领域,这对 生物信息学研究人员在知识结构上提出了非常高的要求,特别是对于来自数学或计
算机专业的研究人员,不仅要掌握生物学的基础知识,还要求深入了解生物学中的 相关问顺。显妖,这样的人才不是单一学科能够培养出来的,要求路学科地培养 物学和信息科学的复合型人才 ,高等院校具有多学科交叉的优势 是培养这类人才 的主要场所。我们一方面要培养生物学与信息科学的高水平复合型人才,另一方面, 需要加强对现有从事生物研究的科技人员进行生物信息学的培训。 国外生物信息学教有主要是研究生学位教有。 我围生物信息学教有也在春起直追 表13部分生物信息学网上课程 1.7.2生物信息学的学习与实践 具有一定生物学和计算机基础的学生,应通过学习逐渐掌握以下内容: ①、搏索网上生物信息学资源 ②、建立自己的生物信息学数据库和网页 运用BLAST等 工具检索数据库 ④、识别和翻译基因组序列中的可读框(ORF) )、申子克降 ⑥、多序列对位排列 ①、构建系统发有树 国、基因组分析和蛋白质组分析基础 与其他学科相比,生物信息学更应强调学生的实践。许多方法和工具都是针对 特定问题发展起来的,既不太成熟也不系统,这就需要学习者进行实际操作,发现 问题,探索解决途径。 问题与练习 1、什么是生物信息学? 2、生物信息学的主要研究任务是什么? 3、我国生物信息学的主要发展方向是什么 4、简述你所了解的人类基因组计划 简述你所了解的生物信息学的基本方法和前沿技术 6、生物信息学目前的主要研究内容 课堂小结:1、本章主要让学生对生物信息学产生兴趣 2、强调生物信息学在现代生物学发展中的重要地位,学习的意义 3、一定要结合前沿知识和科研问题,让学生感受到这一学科日新月异的变化。 9
9 算机专业的研究人员,不仅要掌握生物学的基础知识,还要求深入了解生物学中的 相关问题。显然,这样的人才不是单一学科能够培养出来的,要求跨学科地培养生 物学和信息科学的复合型人才。高等院校具有多学科交叉的优势,是培养这类人才 的主要场所。我们一方面要培养生物学与信息科学的高水平复合型人才,另一方面, 需要加强对现有从事生物研究的科技人员进行生物信息学的培训。 国外生物信息学教育主要是研究生学位教育。 我国生物信息学教育也在奋起直追。 表 1-3 部分生物信息学网上课程 1.7.2 生物信息学的学习与实践 具有一定生物学和计算机基础的学生,应通过学习逐渐掌握以下内容: ①、搜索网上生物信息学资源 ②、建立自己的生物信息学数据库和网页 ③、运用 BLAST 等工具检索数据库、 ④、识别和翻译基因组序列中的可读框(ORF) ⑤、电子克隆 ⑥、多序列对位排列 ⑦、构建系统发育树 ⑧、基因组分析和蛋白质组分析基础 与其他学科相比,生物信息学更应强调学生的实践。许多方法和工具都是针对 特定问题发展起来的,既不太成熟也不系统,这就需要学习者进行实际操作,发现 问题,探索解决途径。 问题与练习 1、 什么是生物信息学? 2、 生物信息学的主要研究任务是什么? 3、 我国生物信息学的主要发展方向是什么? 4、 简述你所了解的人类基因组计划 5、 简述你所了解的生物信息学的基本方法和前沿技术 6、 生物信息学目前的主要研究内容 课堂小结: 1、本章主要让学生对生物信息学产生兴趣 2、强调生物信息学在现代生物学发展中的重要地位,学习的意义 3、一定要结合前沿知识和科研问题,让学生感受到这一学科日新月异的变化