4.1.3.2概念性翻译 如图4-7给定一个DNA序列,可以利用遗传 密码将其翻译为蛋白质序列,这种方式称为概 念性翻译(conceptual translation)。与基于生 化实验的蛋白质翻译不同的是,概念性翻译仅 通过理论推导或计算获得。对任意一个DNA序 列,可能并不知道哪一个碱基代表CDS的起始 数 ,也不知道其阅读方向。这种情况下,不妨试 用六框翻译(six-frame translation)。 与生 工程 院 2025/5/27 BIOINFORMATICS 26
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 26 4.1.3.2 概念性翻译 如图4-7给定一个DNA序列,可以利用遗传 密码将其翻译为蛋白质序列,这种方式称为概 念性翻译(conceptual translation)。与基于生 化实验的蛋白质翻译不同的是,概念性翻译仅 通过理论推导或计算获得。对任意一个DNA序 列,可能并不知道哪一个碱基代表CDS的起始 ,也不知道其阅读方向。这种情况下,不妨试 用六框翻译(six-frame translation)
六框翻译通过移动阅读框起始碱基,获得 6个潜在的蛋白质序列。其中,3个是正向翻译 ,3个是反向翻译,6种可能的蛋白质中至多只 有一种是正确的。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 27
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 27 六框翻译通过移动阅读框起始碱基,获得 6个潜在的蛋白质序列。其中,3个是正向翻译 ,3个是反向翻译,6种可能的蛋白质中至多只 有一种是正确的
查询序列 1 ggccagatgg aacatattgc tttcgggagc acaaggatcg ggtctactac gtctcggagc 61 ggattttgaa gctgagcgag tgcttcggct acaagcagct ggtgtgcgtg ggcacctgct 121 tcggcaagtt ctccaagacc aacaaactga agttccatat cacggcgctc tactacttgg 181 cgccctacgc ccagtacaag gtgtgggtga agcectcctt cgagcagcag tttctctacg 六框翻译氨基酸 正向序列1 GQMEHIAFGSTRIGSTISRSGF*S*ASASATSSWCAWAPASASSPRPTN*SSISRRSTTWRPTPSTRCG*SPPSSSSFST 正向序列2 ARWNILLSGAQGSGLLRLGADFEAERVLRLQAAGVRGHLLRQVLQDQQTEVPYHGALLLGALRPVQGVGEALLRAAVSLR 正向序列3 PDGTYCFREHKDRVYYSERILKISECFGYKQLVCVGTCFGKFSKTNKLKFHTTALYYLAPYAQYKVWKPSFEQQFLY 反向序列1 RRETAARRRASPTPCTGRRAPSSRAP*YGTSVCWSWRTCRSRCPRTPAACSRSTRSASKSAPRRSRPDPCAPESNMFHLA 反向序列2 VEKLLLEGGLHPHLVLGVGRQVVERRDMELQFVGLGELAEAGAHAHQLLVAEALAQLQNPLRDVVDPILVLPKAICSM 反向序列3 PRNCCSKEGFTHTLYWAGAKSAVMNFSLLVLENLPKQVPIHTSCLPKHSLSFKIRSETTRSLCSRKQYPSG (*代表一个终止密码子) 图4-7六框氨基酸翻译
查询序列 1 ggccagatgg aacatattgc tttcgggagc acaaggatcg ggtctactac gtctcggagc 61 ggattttgaa gctgagcgag tgcttcggct acaagcagct ggtgtgcgtg ggcacctgct 121 tcggcaagtt ctccaagacc aacaaactga agttccatat cacggcgctc tactacttgg 181 cgccctacgc ccagtacaag gtgtgggtga agcectcctt cgagcagcag tttctctacg 六框翻译氨基酸 正向序列1 GQMEHIAFGSTRIGSTISRSGF*S*ASASATSSWCAWAPASASSPRPTN*SSISRRSTTWRPTPSTRCG*SPPSSSSFST 正向序列2 ARWNILLSGAQGSGLLRLGADFEAERVLRLQAAGVRGHLLRQVLQDQQTEVPYHGALLLGALRPVQGVGEALLRAAVSLR 正向序列3 PDGTYCFREHKDRVYYVSERILKISECFGYKQLVCVGTCFGKFSKTNKLKFHTTALYYLAPYAQYKVWVKPSFEQQFLY 反向序列1 RRETAARRRASPTPCTGRRAPSSRAP*YGTSVCWSWRTCRSRCPRTPAACSRSTRSASKSAPRRSRPDPCAPESNMFHLA 反向序列2 VEKLLLEGGLHPHLVLGVGRQVVERRDMELQFVGLGELAEAGAHAHQLLVAEALAQLQNPLRDVVDPILVLPKAICSIW 反向序列3 PRNCCSKEGFTHTLYWAGAKSAVIWNFSLLVLENLPKQVPI'HTSCLPKHSLSFKIRSETTRSLCSRKQYVPSG (*代表一个终止密码子) 图4-7 六框氨基酸翻译
2X 从图4-7中可以看出,用不同的阅读框翻 译CDS可能获得不同的蛋白质编码序列。哪一 种是“正确”的呢?通常认为是可读框(ORF) 即没有终止密码子(TGA,TAA或TAG)打断 的阅读框。 数理与生物工程学院 2025/5/27 BIOINFORMATICS 29
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 29 从图4-7中可以看出,用不同的阅读框翻 译CDS可能获得不同的蛋白质编码序列。哪一 种是“正确”的呢?通常认为是可读框(ORF ) 即没有终止密码子(TGA,TAA或TAG)打断 的阅读框
RNA需要翻译为蛋白质方能发挥其生物 学作用,因此,核酸序列的可读框架(Open reading frame,ORF)的分析便成为核酸分析的一 个重要部分。基于遗传密码表,可通过计算机 方便地分析核酸序列的读码框。对于真核生物 而言,一条全长cDNA序列将只含有单一的开放 阅读框架。 理与生物工程学 2025/5/27 BIOINFORMATICS 30
2025/5/27 BIOINFORMATICS 数 理 与 生 物 工 程 学 院 30 mRNA需要翻译为蛋白质方能发挥其生物 学作用,因此,核酸序列的可读框架 (Open reading frame, ORF)的分析便成为核酸分析的一 个重要部分。基于遗传密码表,可通过计算机 方便地分析核酸序列的读码框。对于真核生物 而言,一条全长cDNA序列将只含有单一的开放 阅读框架