J Inherit Metab Dis 0.3 Br J Dermatol J Neurol Sci oBrain Eur J Pediatr 0 Pediatr Res Pediatrics Acta Paediatr Scand J Pediatr Brl灯Haemato1。oJ clin Invest Am J MedoAm J Med Genet Arch Derhatolnarei clin Endocrinoi xetab o Bl.ood m了Diac1 do N Eng1 J Med-一Aah0 phthaimo1 Disease Areh Dis childo O4o晚nn Neurol Ann Intern Med o o Biochem Biophys Res Commun J Neurol Neurosurg Psychiatry J Biol Chem clineangeneto oum且ered Am J Ophthalmol o cLancet Biochim Biophys Acta Science o oProe Natl Acad Sei U 8 A Hemoglobino JAMA Cell Nature o Ann Hum Ge Cell Genet Genetics 1.0
图3-4涉及“genetics”和“disease”学术刊物的分布分析 横轴:来自包含以下和遗传作图有关的至少一个单词(遗传、 位点、标记、染色体、定位、分配、连接、克隆、候选、图 谱、突变、突变子、筛选、多态、缺失、等位基因)的期刊 的论文百分率; 纵轴:来自包含以下和表型描述有关的至少一个单词(活度、 损伤、临床、活化的、治疗、复验、病理、生化的、缺陷、 失常、缺乏)的期刊的论文百分率;注意有些含有“基因” 或“遗传”这些文字的期刊并没被包含在这个区域里(该文 分析仅限于OMIM中那些高引用率的期刊) 2025/5/27 BIOINFORMATICS 17
2025/5/27 BIOINFORMATICS 17 图3-4 涉及“genetics”和“disease”学术刊物的分布分析 横轴:来自包含以下和遗传作图有关的至少一个单词(遗传、 位点、标记、染色体、定位、分配、连接、克隆、候选、图 谱、突变、突变子、筛选、多态、缺失、等位基因)的期刊 的论文百分率; 纵轴:来自包含以下和表型描述有关的至少一个单词(活度、 损伤、临床、活化的、治疗、复验、病理、生化的、缺陷、 失常、缺乏)的期刊的论文百分率;注意有些含有“基因” 或“遗传”这些文字的期刊并没被包含在这个区域里(该文 分析仅限于OMIM中那些高引用率的期刊)
近年来,生物学资料的快速增长使信息科学有了 用武之地,而复杂的分子生物信息又对传统的数据处 理技术提出了新的挑战。大规模、复杂数据的分析工 作不可能由人工手算,也很难用传统的图像处理技术 和生物统计方法来完成。 理与生物工程学院 2025/5/27 BIOINFORMATICS 18
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 18 近年来,生物学资料的快速增长使信息科学有了 用武之地,而复杂的分子生物信息又对传统的数据处 理技术提出了新的挑战。大规模、复杂数据的分析工 作不可能由人工手算,也很难用传统的图像处理技术 和生物统计方法来完成
因而,一批新的信息处理技术被引入到这一领域并 逐渐发挥重要作用。这些技术可统称为“生物信息学的 数据挖掘(data mining),工具”。目前,数据挖掘和知 识发现(knowledge data discovery,KDD)工具除包括 常规数据分析技术外,还有专家系统(expert system)、 数 机器学习(machine learning)、神经网络(neural 星 network)和遗传算法(genetic algorithm)等。 物 工 程 院 2025/5/27 BIOINFORMATICS 19
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 19 因而,一批新的信息处理技术被引入到这一领域并 逐渐发挥重要作用。这些技术可统称为“生物信息学的 数据挖掘(data mining)工具” 。目前,数据挖掘和知 识发现(knowledge data discovery, KDD)工具除包括 常规数据分析技术外,还有专家系统(expert system)、 机 器 学 习 (machine learning) 、 神 经 网 络 (neural network)和遗传算法(genetic algorithm)等
§3.2生物信息学资源 3.2.1基因组信息 基因组信息主要来源于各类核苷酸序列数据库。 核酸序列是了解生物体结构、功能、发育和进化的出 发点。国际上最重要的公共核苷酸序列数据库有3个: 分别是美国生物技术信息中心NCBI的GenBank(http: /www.ncbi.nlm.nih.gov/),日本遗传研究所的DDBj (http:/ww.ddbj.nig.ac.jp)和欧洲分子生物学实验室 理与生物 的EMBL(http:/www.embl-heidelberg.de/)。 学院 2025/5/27 BIOINFORMATICS 20
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 20 §3.2 生物信息学资源 3.2.1 基因组信息 基因组信息主要来源于各类核苷酸序列数据库。 核酸序列是了解生物体结构、功能、发育和进化的出 发点。国际上最重要的公共核苷酸序列数据库有3个: 分别是美国生物技术信息中心NCBI的GenBank (http: //www.ncbi.nlm.nih.gov/) , 日 本 遗 传 研 究 所 的 DDBJ (http://www.ddbj.nig.ac.jp/)和欧洲分子生物学实验室 的EMBL (http://www. embl-heidelberg.de/)