密码子使用偏好 Phe UUU 15(0.51)ser UCU 32(1.86) Tyr UAU 18(0.64) Cys UGU 5(1.00) UUC 44 Ucc38(2.21) UAd38(1.36) UG5(1.00) Leu UvA 2(0.07) UCA 2(0.12)Ter UAA Ter UGA UUG8(0.27) UCG5(0.29)Ter UAG Trp UGG8(1.00) Leu CuU 11(0.36)d Pro Ccu 9(0.48) His CAU 5(0.36) ArgCGUt 89(3.93) cUc18(0.60) ccc0(0.00 CAC 1.64 cGC!46(2.03) CUA(003) CCA 11(0.59) GIn CAA 15(0.3 CGA|1(0.04) cUG|!41(4.67) CCG55(293) CA673(166 CGG|0(0.00) lle auu 29(0.69)Thr ACU 19(0.78) Asn aau 4(0. 11) Ser AGU 3(0.17) AUC98(231)AcC63(257) AACL66(189) AGC23(1.34) AUAL0(0.00 ACA 3(0.12)GInAAA 77(1.35) Arg AGA 0(0.00) Met AUG 60(1.00) ACG13(0.53) AAG37(0.65) AGG0(0.00) Val GUu 55(1.53)Ala GCU 30(0.94) Asp GaUl 60(0 83)Gly GGUt 78(2.40) GUC21(0.58) Gcc19(059) GAC66(1.17 GGC|47(1.45) GUA34(094) GCA 30(0.94)GluGAA 147(1 52) GGA|0(0.04) GUG34(094)GCG|49(1.53)GAG46(048)GGG5(0.15 大肠杆菌RNA聚合酶
密码子使用偏好 大肠杆菌RNA聚合酶
重复序列识别 重复类型: Name Direct repeats Inverted repeats Common aagct. aagct aagct. tcgaa Complementary aagct.. ttcga aagct.. agctt RY aagct. ggatc aagct. ctagg KM aagct.cctag aagct. gatcc RY:置换KM:颠倒
重复序列识别 重复类型: Name Direct Repeats Inverted Repeats Common aagct...aagct aagct...tcgaa Complementary aagct...ttcga aagct...agctt RY aagct...ggatc aagct...ctagg KM aagct...cctag aagct...gatcc RY:置换 KM:颠倒
识别限制性内切酶位点 门限制性内切酶位点 GGATCC CCATGG 35 BamH工 5—G GATCC 3 -5 CCATG G
识别限制性内切酶位点 限制性内切酶位点 GGATCC CCATGG 5’- -3’ 3’- -5’ 5’- -3’ 3’- -5’ BamHⅠ G GATCC CCATG G
基因识别 门分类 鲁生物信息学方法( dry lab) 在生物信息学分析基础上,利用计算机来协助发现基因 计算机辅助的基因识别 实验方法( wet lab) 通过实验研究来寻找验证基因 口生物信息学方法在基因识别中发挥着重要的作用 ●啤酒酵母中的基因(6000多)大约60%是通过信息 分析得到的
基因识别 分类 生物信息学方法 (dry lab) 在生物信息学分析基础上,利用计算机来协助发现基因。 计算机辅助的基因识别 实验方法 (wet lab) 通过实验研究来寻找验证基因 生物信息学方法在基因识别中发挥着重要的作用 啤酒酵母中的基因(6000多)大约 60% 是通过信息 分析得到的
原核基因识别 门重点在于识别编码区域 启动区5UTR 编码区 3UTR终止区 起始密码子 终止密码子 TATAAT盒 保守序列: TTGACA
原核基因识别 重点在于识别编码区域