不同注释软件比较 1)目前基因组注释的软件绝大多数都是根据已 有基因结构的数据编写的,具有很多的经验成 分 2)由于各家用的注释软件不同,注释结果有 很大的差别,如人类基因组测序计划(HGP注 释的基因与 Ceara公司注释的基因仅2/3一致 Number of identical cDNA alignments produced by four different programs on a set of 5,016 cDNA sequences Program gap2 est genome GeneSeqer sim4 489 4.342 4,784 gap2 4.274 4.839 est genome 4,257 Genome Biology Vol 3 No 6 Haas et aL
不同注释软件比较 1) 目前基因组注释的软件绝大多数都是根据已 有基因结构的数据编写的,具有很多的经验成 分. 2) 由于各家采用的注释软件不同, 注释结果有 很大的差别, 如人类基因组测序计划(HGP)注 释的基因与Celara公司注释的基因仅2/3一致
不同注释软件之间的效率 Performance of three popular gene prediction programs on 42 semiartificial genomic sequences containing 178 known human gene sequences(9o0 exons). Sensitivity(敏感性) is percentage of exons that are predicted correctly. Specificity(专一性)is percentage of predicted exons that are correct. Reproduced with changes from yada et al. 2002 Cold Spring harbor genome Sequencing and Biology Meeting, May 7-11, 2002. FGENESH is by far the most accurate of three programs 效率与准确率比较 program sensitivity specificity missed exon(%)wrong exon(%) FGENESH 77.1 65.7 9.6 23.2 GenScan 66.5 44.9 12.0 40.9 HMMGene 69.5 36.6 15.5 55.5 引自:http://www.softberry.com/berry.phtml
不同注释软件之间的效率 Performance of three popular gene prediction programs on 42 semiartificial genomic sequences containing 178 known human gene sequences (900 exons). Sensitivity(敏感性) is percentage of exons that are predicted correctly. Specificity( 专 一 性 ) is percentage of predicted exons that are correct. Reproduced with changes from Yada et al., 2002 Cold Spring Harbor Genome Sequencing and Biology Meeting, May 7-11, 2002. FGENESH is by far the most accurate of three programs. 效率与准确率比较 ------------------------------------------------------------------------------------------ program sensitivity specificity missed exon (%) wrong exon (%) ------------------------------------------------------------------------------------------ FGENESH 77.1 65.7 9.6 23.2 GenScan 66.5 44.9 12.0 40.9 HMMGene 69.5 36.6 15.5 55.5 ------------------------------------------------------------------------------------------ 引自: http://www.softberry.com/berry.phtml
基因的命名规则 迄今为止国际上还没有一个普遍公认的适合所有生物种 属的基因命名规则.由于历史,习惯以及其它各种原 因,基因命名中常常存在许多同名歧义,或者同义歧 名的现象.许多基因在生物的不同发育阶段具有不同 的功能,这一点也给准确的基因命名造成了实际困难 很多科学家都希望基因的命名标准化,曾经在1997年 和1999年举行了两次有关基因命名的研讨会,但因研 究领域的不同以及基因命名本身存在的复杂问题,无 法达成一个统一的意见。目前不同生物种属的基因命 名规则仍由各相关领域的专家讨论分别制定,然后推 荐给研究者选择采用
基因的命名规则 迄今为止国际上还没有一个普遍公认的适合所有生物种 属的基因命名规则. 由于历史, 习惯以及其它各种原 因, 基因命名中常常存在许多同名歧义, 或者同义歧 名的现象. 许多基因在生物的不同发育阶段具有不同 的功能, 这一点也给准确的基因命名造成了实际困难. 很多科学家都希望基因的命名标准化,曾经在1997年 和1999年举行了两次有关基因命名的研讨会,但因研 究领域的不同以及基因命名本身存在的复杂问题, 无 法达成一个统一的意见。目前不同生物种属的基因命 名规则仍由各相关领域的专家讨论分别制定, 然后推 荐给研究者选择采用
人类基因的命名规则(1) 1)人类基因命名委员会( Human Gene nomenclature Committee, HGNC)给基因下的定义是,控制某一表型和某种生物学功能的DNA片 段。当一个基因缺少可识别的功能特征时,可以通过一段DNA顺序,转 录产物或者同源基因来表述。 2)一段DNA顺序或基因组中某一位点是否具备可以指定基因符号的条件, 可以参照下述例子执行 1.具有孟得尔单基因性状的遗传特征并有确定表型的位点,如 BBS1, Bardet- Biedi syndrome1( Bardet- Biedl综合症1)。 2和一个已知的标记连锁或相关,参于一个复杂性状的形成但 未鉴定的基因,如IDM6, insulin- dependent diabetes mellitus6(依赖胰岛素的糖尿病皿 ellitus6) 3.具有足够的结构、功能和表达的数据证明克隆的DNA片段是 个完整的基因,如CO8, cytochrome c oxidase subunit VIII(细胞色素氧化酶亚基8)。 4某个基因的无功能的拷贝,即假基因,如Ⅰ9P1 interleukin9 receptor pseudogene1(细胞间质素9受体假 基因1)
人类基因的命名规则(1) 1) 人类基因命名委员会(Human Gene Nomenclature Committee, HGNC)给基因下的定义是,控制某一表型和某种生物学功能的DNA片 段 。当一个基因缺少可识别的功能特征时,可以通过一段DNA顺序,转 录产物或者同源基因来表述。 2) 一段DNA顺序或基因组中某一位点是否具备可以指定基因符号的条件, 可以参照下述例子执行: 1.具有孟得尔单基因性状的遗传特征并有确定表型的位点,如 BBS1, Bardet-Biedi syndrome 1 (Bardet-Biedl综合症1)。 2.和一个已知的标记连锁或相关,参于一个复杂性状的形成但 未鉴定的基因,如IDDM6, insulin-dependent diabetes mellitus 6(依赖胰岛素的糖尿病mellitus6). 3.具有足够的结构、功能和表达的数据证明克隆的DNA片段是一 个完整的基因,如COX8,cytochrome c oxidase subunit VIII (细胞色素氧化酶亚基8)。 4.某个基因的无功能的拷贝,即假基因,如IL9RP1, interleukin 9 receptor pseudogene 1(细胞间质素9受体假 基因1)
人类基因的命名规则(2 5)和已知基因重叠并由反义链编码的基因,如IGF2AS, insulin ike growth factor2, antisense(类胰岛素生长因子2反义 基因)。 6)可转录但不翻译却具功能的DNA片段,如ST,X( inactive) specific transcript(X染色体专一性失活转录物)。 7)细胞学表型推测存在某个或某些与此相关的基因,LOH8CR1 loss of heterozygosity,18, chromosomal region1(异质杂 合性18染色体区域1)。 8)由EST簇集判断存在一个可能的基因,如 Clore1, chromosome 1 open reading frame1(染色体1开放读框)。 9)由GDB( the genome database)指定编号的表达顺序片段,如 DXYS155E。 10)由顺反子产生的可以和其它编码顺序机械分开,不发生重叠, 具有独立基因产物的mNA,如 SNURF, SNRPN upstream reading frame( SNRPN上游读框)
人类基因的命名规则(2) 5) 和已知基因重叠并由反义链编码的基因,如IGF2AS,insulinlike growth factor 2, antisense (类胰岛素生长因子2反义 基因)。 6) 可转录但不翻译却具功能的DNA片段,如XIST, X (inactive)- specific transcript (X染色体专一性失活转录物)。 7) 细胞学表型推测存在某个或某些与此相关的基因,LOH18CR1 , loss of heterozygosity, 18, chromosomal region 1(异质杂 合性18染色体区域1)。 8) 由EST簇集判断存在一个可能的基因,如C1orf1 ,chromosome 1 open reading frame 1(染色体1开放读框)。 9) 由GDB(the Genome Database)指定编号的表达顺序片段,如 DXYS155E。 10) 由顺反子产生的可以和其它编码顺序机械分开,不发生重叠, 具有独立基因产物的mRNA,如SNURF ,SNRPN upstream reading frame (SNRPN上游读框)