扩展的遗传学字母表或UPAC编码 符号含义 说明 G G Guanine Adenine Th C Cytosine R G or a Purine or Pyrimidine M C Amino A—G—G or T Keto or C Strong interaction (3 H bonds) W Aor T Weak interaction(2 H bonds) A or c or t Not-G B G or t or c not-A G or c or a not-T(not-U) D G or a or t not-C 2021/1/26N G or A or T or CAny
2021/1/26 11 符 号 含 义 说 明 G G Guanine A A Adenine T T Thymine C C Cytosine R G or A Purine Y T or C Pyrimidine M A or C Amino K G or T Keto S G or C Strong interaction (3 H bonds) W A or T Weak interaction (2 H bonds) H A or C or T Not-G B G or T or C not-A V G or C or A not-T(not-U) D G or A or T not-C N G or A or T or C Any 扩展的遗传学字母表或IUPAC编码
20种标准氨基酸的英文简写 氨基酸名称英文缩写简写氨基酸名称英文缩写简写 甘氨酸 GI G 丝氨酸 Se er S 丙氨酸 Ala A 苏氨酸 Thr 缬氨酸 Val 天冬酰胺 A 异亮氨酸 谷酰胺 GIn 亮氨酸 Leu 酪氨酸 T 苯丙氨酸 Phe F 组氨酸 His 脯氨酸 Pro P 天冬氨酸 Asp 甲硫氨酸 Met 谷氨酸 Glu 色氨酸 T 赖氨酸 半胱氨酸 精氨酸 TNQYHDEKR2 Arg 2021/1/26
2021/1/26 12 氨基酸名称 英文缩写 简 写 氨基酸名称 英文缩写 简 写 甘氨酸 Gly G 丝氨酸 Ser S 丙氨酸 Ala A 苏氨酸 Thr T 缬氨酸 Val V 天冬酰胺 Asn N 异亮氨酸 Ile I 谷酰胺 Gln Q 亮氨酸 Leu L 酪氨酸 Tyr Y 苯丙氨酸 Phe F 组氨酸 His H 脯氨酸 Pro P 天冬氨酸 Asp D 甲硫氨酸 Met M 谷氨酸 Glu E 色氨酸 Trp W 赖氨酸 Lys K 半胱氨酸 Cys C 精氨酸 Arg R 20种标准氨基酸的英文简写
关于部分特定的符号的规定 A一代表字母表 A*一代表由字母表A中字符所形成的一系列有限 长度序列或字符串或序列的集合 a、b、c一代表单独的字 S、t、u、v代表A*中的序列 —代表序列s的长度 2021/1/26
2021/1/26 13 • — 代表字母表 • A* — 代表由字母表A中字符所形成的一系列有限 长度序列或字符串或序列的集合 • a、b、c—代表单独的字符 • s、t、u、v—代表A*中的序列 • |s|—代表序列s的长度 关于部分特定的符号的规定
为了说明序列s的子序列和s中的单个字符,在s中各字符 之间用数字标明分割边界 例如,设s= ACCACGTA,则s可表示为 s:;指明第位或第位之间的子序列,0≤is≤|N s:;一为空序列 i1s:一表示s中的第i个字符,简记为s 子序列a:s:;称为前缀,即 prefix((si) 子序列;S:称为后缀,即 suffix(,计+1) 2021/1/26
2021/1/26 14 为了说明序列s的子序列和s中的单个字符,在s中各字符 之间用数字标明分割边界 例如,设s=ACCACGTA,则s可表示为 0A1C2C3A4C5G6T7A8 – i :s:j 指明第i位或第j位之间的子序列, 0 i j |s| – i :s: i — 为空序列 – i-1 :s:i —表示s 中的第i 个字符,简记为si – 子序列0 :s:i 称为前缀,即prefix(s,i) – 子序列i :s:|s|称为后缀,即suffix(s, |s|-i+1)
子序列与子串 s的子序列:选取s中的某些字符(或删除s中的某 些字符)而形成s的子序列 例如:TTT是 ATATAT的子序列。 s的子串 是由s中相继的字符所组成。 例如:TAC是 AGTACA的子串, 但不是 TTGAO的子串(是子序列) 子串是子序列(连续子序列) 子序列不一定是子串 2021/1/26
2021/1/26 15 子序列与子串 s的子序列:选取s中的某些字符(或删除s中的某 些字符)而形成s的子序列 例如: TTT 是 ATATAT的子序列。 s的子串: 是由s中相继的字符所组成。 例如: TAC是AGTACA的子串, 但不是TTGAC的子串(是子序列) 子串是子序列(连续子序列) 子序列不一定是子串