EMBnet 必 EMBnet(European Molecular Biology Network)建立于1988年,由多个 位于欧洲及欧洲以外的成员国节点及专业节点组成。除了上面提到的欧 痂生物信息孚研究所MBEB引,瑞士生物信意研究所SB、澳大利亚国 家基因组学信息服务(AGRIS)以及中国北京大学的生物信息中心PKU CBI都是EMBneti的成员。它们不仅为本国用户提供生物信息资源及生物 计算服务,同时提供用户支持、培训以及进行相关的生物信息研究与开 发。比如专业蛋百质分析系统ExPASy就是由SB开发及维护,而通角蛋 白质资源UniProt则由EMBL-EBI及SB、PIR共同进行维护的。由于 EMBneti的成员国节点及专业节点各自包含了大量的公共数据信息及自 行开发的数据库及分析工具,因此可作为生物学数据资源的补充来源。 相关信息可以从http:/w.embnet.org/en/members/National和 http:lw.embnet.ora/en/nembers/Specialist中查到
EMBnet ❖ EMBnet (European Molecular Biology Network)建立于1988年,由多个 位于欧洲及欧洲以外的成员国节点及专业节点组成。除了上面提到的欧 洲生物信息学研究所EMBL-EBI,瑞士生物信息研究所SIB、澳大利亚国 家基因组学信息服务(AGRIS)以及中国北京大学的生物信息中心PKUCBI都是EMBnet的成员。它们不仅为本国用户提供生物信息资源及生物 计算服务,同时提供用户支持、培训以及进行相关的生物信息研究与开 发。比如专业蛋白质分析系统ExPASy就是由SIB开发及维护,而通用蛋 白质资源UniProt则由EMBL-EBI及SIB、PIR共同进行维护的。由于 EMBnet的成员国节点及专业节点各自包含了大量的公共数据信息及自 行开发的数据库及分析工具,因此可作为生物学数据资源的补充来源。 相关信息可以从http://www.embnet.org/en/members/National 和 http://www.embnet.org/en/members/Specialist中查到
第二节生物学数据库的内容与结构 ~数据存储基础 冬平面文件格式 冬序列格式 冬XML格式 关系型数据库
第二节 生物学数据库的内容与结构 ❖ 数据存储基础 ❖ 平面文件格式 ❖ 序列格式 ❖ XML格式 ❖ 关系型数据库
数据存储基础 信息是存储在计算机临时或永久存储器中的 一串字节 。 获取信息需要控制两个方面。第一是数据被 编译为字节的方式,或者成为数据格式。第 二是运用哪些程序能够编码(写)和解码 (读)这些数据 冬目前最常用的格式类型:平面文件格式、 XML和关系型数据库
数据存储基础 ❖ 信息是存储在计算机临时或永久存储器中的 一串字节。 ❖ 获取信息需要控制两个方面。第一是数据被 编译为字节的方式,或者成为数据格式。第 二是运用哪些程序能够编码(写)和解码 (读)这些数据 。 ❖ 目前最常用的格式类型:平面文件格式、 XML和关系型数据库
平面文件格式一Flat File ·这种格式是将多个记录以特殊约定的分隔符(比如 “或“”)进行区分,而每一个记录内的众多字段 也是通过一些特定的分隔符(如“,”或“:” 加以区分。数据库文件就是由这些字段及内容所组 成,并不包含什么隐藏的计算机指令。 冬优点:通用性(跨平台);容易为pe程序进行解 析和处理;专用的fat-file数据分析器可以用来将数 据导入到数据管理系统。 缺点:检索复杂,冗余字段较多,大容量数据库难 以处理
平面文件格式—Flat File ❖ 这种格式是将多个记录以特殊约定的分隔符(比如 “/” 或“|”)进行区分,而每一个记录内的众多字段 也是通过一些特定的分隔符(如“,”或“:”) 加以区分。数据库文件就是由这些字段及内容所组 成,并不包含什么隐藏的计算机指令。 ❖ 优点:通用性(跨平台) ;容易为perl程序进行解 析和处理;专用的flat-file数据分析器可以用来将数 据导入到数据管理系统。 ❖ 缺点:检索复杂,冗余字段较多,大容量数据库难 以处理
Flatfile格式(UniProt CYC HUMAN部分 ID CYC HUMAN Reviewed 105AA AC P99999:A4D166:P00001:Q61NUR2:06Nx69:Q96Ev4: 21-JUL-1986,integrated into UniProtKB/Swiss-Prot. 23-JA3H-2007, sequence version 2. DE 04-DEC-2007,entry version 56. DE Cytochrome c. GN Name-CYCS:synonyms-CYC 05 Homo sapiens (Human). o Eukaryotat Metazoa!Chordata Cranlata Vertebrata Euteleostomi oc Mammalia/Eutheria Euarchontoglires;Primates:Haplorrhini: Catarrhini:Hominidae:Homo. OX NCBI_TaxID-9606; RN r11 RP NUCLEOTIDE SEQUENCE [GENOMIC DNAJ. RX MEDLINE-89071746:2ubM恤d-2849112: RA Evans M.J..Scarpulla R.C. RT "The human somatic cytochrome c gene:two classes of processed RT pseudogenes demarcate a period of rapid molecular evolution." RL Pr0c,1Nat1,cad.3c1,U.S.A,85:9625-9629(19881. 【】 cc -!-FUNCTION:Electron carrier protein.The oxidized form of the c cytochrome c heme group can accept an electron from the heme group of the cytochrome cl subunit of cytochrome reductase.Cytochrome c cc then transfers this electron to the cytochrome oxidase complex, cc the final protein carrier in the mitochondrial electron-transport cc chain. cc Copyrighted by the UniProt Consortium,see http://www.uniprot.org/terma c Distributed under the Creative Commons Attribution-NoDerivs License
Flatfile 格式(UniProt CYC_HUMAN 部分)