生物信息学 普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第五章:真核生物基因组的注释
第五章:真核生物基因组的注释 普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics
第一节蛋白质编码基因的注释 注释策略: (一)、基于证据的注释,即根据已有的实验证据 (如cDNA)、表达序列标签(EST)和蛋白质序 列进行蛋白质编码基因的注释 。 (二)、从头开始(ab initio)的基因预测,即只根 据基因组的DNA序列对蛋白质编码基因进行预测。 (三)、重新(de novo)基因预测,即通过与其他 物种的基因组进行比较,从而预测一个新基因组 中的蛋白质编码基因
第一节 蛋白质编码基因的注释 注释策略: (一)、基于证据的注释,即根据已有的实验证据 (如cDNA)、表达序列标签(EST)和蛋白质序 列进行蛋白质编码基因的注释。 (二)、从头开始(ab initio)的基因预测,即只根 据基因组的DNA序列对蛋白质编码基因进行预测。 (三)、重新(de novo)基因预测,即通过与其他 物种的基因组进行比较,从而预测一个新基因组 中的蛋白质编码基因
训练 数据集 来自于其他 全长-cDNA 仅目标 重新 基因组的经 从头开始 基因组 基于 EST蛋白 预测 过比对的 序列 证据 (相同或相关 DNA序列 基因组) 低 精度 高 组合 RT-PCR 和测序 假基因 基因结构 图51蛋白质编码基因预测流程图
一、基于证据的基因注释 (一)顺式比对 顺式比对是使用被注释基因组的cDNA或者蛋白质序 列与基因组序列进行比对后得到的最好的比对位点, 而这个位点常常被认为就是转录或者翻译形成cDNA 或者蛋白质的基因。 常用的顺式比对程序如AAT、SIM4、Splign等
一、基于证据的基因注释 (一)顺式比对 顺式比对是使用被注释基因组的cDNA或者蛋白质序 列与基因组序列进行比对后得到的最好的比对位点, 而这个位点常常被认为就是转录或者翻译形成cDNA 或者蛋白质的基因。 常用的顺式比对程序如AAT、SIM4、Splign等
(二)反式比对 反式比对是使用cDNA或者蛋白质序列与基因组进行 比对得到同源位点(比对所用的cDNA或者蛋白质并 不来自于这个位点,往往属于同一个基因家族)。 常用的反式比对工具有BLAT、Exonerate和 GeneWise
(二)反式比对 反式比对是使用cDNA或者蛋白质序列与基因组进行 比对得到同源位点(比对所用的cDNA或者蛋白质并 不来自于这个位点,往往属于同一个基因家族)。 常用的反式比对工具有BLAT、Exonerate和 GeneWise