续表 英文名称三字母缩写单字母缩写 结构式H2N-C-R 电点 COOH 丝氨酸 羟基氨基 H2 N--C-CH--CH 苏氨酸 Threonine 5.02 食 半胱氨酸 H2N—C-CHg-SH 硫氨基 酸|蛋氨酸 Methionine H,N-C-CH2-CH2-S-CHs COoH 天冬酰胺 N 5.41 酰 胺酸氨基 H 谷氨酰胺| Glutamine H2 N-C-CHr"- 天冬氨酸 H2 N-C-CH2-COOH 性氨基酸 谷氨酸 Glutamic acidGlu H2N--C-CH2-CH2-COOH 3.22 OOH ≌ 组氨酸 Histidine 碱性氨基酸 H2N-C--CH2-CH2-CH2-CH2 NH2 COOH 精氨酸 H2N-CCH2-CHy--CH2-NH--C 10.76
计算机处理时用单字母代码更为简便。单字母代码还可代表不定氨基酸,如B代表天 冬氨酸或天冬酰胺,U代表硒代半胱氨酸,Z代表谷氨酸或谷氨酰胺,X代表任意氨基酸, “*”代表翻译终止,“一”代表不定长度的空隙 以不同的氨基酸分子为基本单位,靠一分子中的羧基和另一分子中的氨基脱水形成酰胺 键(肽键)而连接起来,就形成了蛋白质的多肽链状结构(一级结构)。链内氨基酸连接后 的片段,称为氨基酸残基。一级结构指链中氨基酸种类和排列次序,同时也指链间二硫键的 位置。 蛋白质多肽间以二硫键和非共价键作用力如氢键、静电相互作用、范德瓦耳斯引力相互 作用和疏水键等交联,导致多肽键折叠盘曲成一定的形状,构成了蛋白质的二、三、四级 结构 高度亲水的多肽链中极性基团通过形成氢键使得极性被中和,形成内部疏水、表面亲水 的蛋白质结构。如果氢键在链内出现,则形成a螺旋( (a-helix)结构,每圈螺旋中包含3.6 个残基,第n个残基的CO与第n+4个残基的NH形成氢键,构成13元环,故又称3613 螺旋;如果氢键出现于链间,则形成β忻叠结构(β pleated sheet structure),也称β结构 ( structure)或β构象(} conformation)。折叠的肽链经180°回折形成“U”型的β转角 (βturn),也称回折( reverse turn)或弯曲( Bbend)或发夹结构( hairpin structure)。β 转角中第一个残基的cO与第四个残基的NH成氢键(四残基转角)。除了β转角外,还有 y转角(为三残基转角)。肽链中没有共同点或无确定规律性的那段二级结构称为无规则卷 曲( radon coil)。二级结构还有π螺旋(π helix)和Ω环( n loop)等。π螺旋为胶原蛋白 的二级结构,是由三条肽链组成的右手三股螺旋或右手超螺旋。Ω-环为6~16个氨基酸残 基组成的肽链卷曲,成Q字母形 蛋白质在二级结构的基础上,按一定方式以非共价键再盘曲折叠形成蛋白质的三级结 构,在空间结构上常呈紧密的球状分子。 在三级结构基础上,一些蛋白质单位(亚基)可以通过非共价键聚集为复杂的四级结 构,构成巨大的蛋白质分子。有些蛋白质可有数个至数千个亚基,但并非所有蛋白质分子都 具有四级结构 生命的物质基础是蛋白质。蛋白质的一级结构是由遗传基因决定的,一级结构又决定了 蛋白质的空间结构。但由于蛋白质空间结构的复杂性,其一级结构与三级结构之间尚未找到 一对应的关系。虽然蛋白质在体内折叠受到多种因素影响,蛋白质序列仍是决定空间结构 的主要因素。正因为蛋白质具有如此复杂的空间结构,它才能在生命活动中体现出多种多样 的功能,表现出各种各样的生物活性。空间结构的改变,会引起生物活性的改变。蛋白质在 人体中除了构成细胞外,还通过构成各种酶蛋白、抗体蛋白、脂蛋白、离子通道等来维持细 胞的活动。一些外源性病原体如细菌、病毒复制的蛋白质以及机体本身过度产生或无控制增 生某些蛋白质,均可引起疾病。如果以这些引起疾病的蛋白为药物作用的靶点,阻断其生物 合成过程,即能达到治疗疾病的目的 蛋白质分子和其他物种一样,也有着进化过程,在进化中其进化树基本一致。同源的物 种在进化中保持着保守性。同源蛋白质( homologous protein)有着相似的来源、相似的空 间结构和生物功能。因此,可以利用蛋白质的一级结构即氨基酸序列作为蛋白质同源性 ( homology)的判据。结构的同源性越强,则蛋白质的功能越相近 蛋白质的一级结构在生物进化中保留着一些保守的结构单元。在一定的稳定的环境中
定长度的蛋白质总是自动折叠为特征结构,这一长度的序列称为结构域或功能域(do main)。结构域具有特定的功能,某蛋白质中所有结构域组合起来组成蛋白质的全部功能 不同的蛋白质有着不同特征的结构域,结构域通常对应着二级结构。有些蛋白质只含有一个 结构域,大的蛋白质往往含有多个结构域。构成蛋白质的各结构域形状可能很相似,也可能 很不相同。同源蛋白往往有着相似的结构域。因此比较蛋白质的同源性可以从结构域着手 而不必作整个氨基酸序列的比较。 在比结构域更小的层次上,序列上有着一些相似的与功能相关的肽段区域,这些特定的 序列称为模体( motif)。蛋白质同源性的测定,对于确定物种亲缘关系和预测新蛋白质序列 的功能有着重要意义。在低等生物中也能发现高等生物的“近亲”蛋白质,它们的序列同源 性强,生物功能相近,因此低等生物的蛋白质可以作为同源高等生物蛋白质的研究模型。 2.3.2核酸 核酸( nucleic acid)是一种线性多聚体,其基本结构单元是核苷酸( nucleotide)。核苷 酸由碱基、戊糖和磷酸三部分组成(见图2-7)。一个核苷酸的戊糖与另一个核苷酸的磷酸 通过3′,5′-磷酸二酯键按照不同的排列顺序聚合而形成长链大分子 碱基 H,N 腺嘌呤(A) 碱基 磷酸 H 碳原子上基团 构成核糖核酸 成脱氧核糖核酸 胸腺嘧啶(T)胞嘧啶(C) 尿嘧啶(U) (a)核苷酸的结构通式 (b)0基组分的母环结构 图2-7核苷酸的基本构成 根据所含戊糖种类不同,核酸可分为脱氧核糖核酸( deoxyribonucleic acid,DNA)和 核糖核酸( ribonucleic acid,RNA)两大类。DNA主要分布在细胞核中,RNA则存在于细 胞质和细胞核中。RNA主要有三种,即信使RNA( messenger RNA,mRNA),核蛋白 RNA( ribosomal rna,rRNA)和转运RNA( transfer RNA,tRNA 构成核苷酸的碱基分为嘌呤和嘧啶两大类。前者有腺嘌呤( adenine,A)和鸟嘌呤 ( guanine,G),DNA和RNA中均含有A和G;后者有胞嘧啶( cytosine,C)、胸腺嘧啶 thymine,T)和尿嘧啶( uracil,U),C存在于DNA和RNA中,T只存在于DNA中, 而U则存在于RNA中。 计算机处理时以标准符号A、C、G、T、U代表碱基。DNA中的T在RNA中换成U。 对于多义的或不定的碱基,也用标准符号来表示。R代表A或G,Y代表T或C,K代表G
或T,M代表A或C,S代表G或C,W代表A或T,B代表G或T或C(非A),D代表 G或A或T(非C),H代表A或C或T(非G),V代表G或C或A(非T),N代表A 或G或C或T(任意),X代表未知,“一”代表不定长度的空隙。 碱基与戊糖缩合成核苷( nucleoside)。核苷中戊糖的羟基被磷酸酯化,形成核苷酸。 RNA的基本单位是腺苷酸( adenylate,AMP)、鸟苷酸( guanylate,GMP)、胞苷酸(cyt idylate,cMP)和尿苷酸( uridylate,UMP);DNA的基本单位是脱腺苷酸( deoxyade nylate,dAMP)、脱氧鸟苷酸( deoxyguanylate,dGMP)、脱氧胞苷酸( deoxycytidylate, dCMP)和脱氧胸腺苷酸( deoxythymidylate,dTMP) 在体内,5′-核苷酸的磷酸基可进一步磷酸化成核苷二磷酸和核苷三磷酸,它们都含有 高能磷酸键,比如腺苷二磷酸(AD)和腺苷三磷酸(ATP),为体內许多生化变化和机能 活动的直接能源。体内许多核苷酸的衍生物可以构成一些酶的辅酶,如辅酶Ⅰ、辅酶Ⅱ和黄 素腺嘌呤二核苷酸(FDA)。 核酸的一级结构是指核苷酸在核酸分子中的排列顺序。链内核苷酸在连接后的片段,称 核苷酸残基。核酸的多核苷酸链在次级键的基础上,还可形成更为复杂的二级及三级结构 DNA的二级结构为两条反向平行的多核苷酸主链盘绕形成的双螺旋结构,两链之间通过碱 基的配对连接而成。碱基配对靠氢键相互作用按照互补规律进行,即A与T通过形成两个 氢键相配对,G与C通过形成三个氢键相配对。配对的碱基称为互补碱基,DNA分子中两 条链称为互补链。双螺旋结构上有两条螺形槽沟,较深的称为大沟,较浅的称为小沟。在沟 内能遇到核苷酸残基的碱基,因此与蛋白质的相互识别和结合有关。而在双螺旋表面,是脱 氧核糖和磷酸的重复结构,似乎与信息无关。双螺旋DNA链进一步扭曲盘旋形成超螺旋结 构,即DNA的三级结构。RNA以单链形式存在,在RNA分子的某些区域,单链可以自身 折叠形成局部双链区,双链区的碱基也相互配对,A与U,G与C为互补碱基。有些区域 碱基无法配对,形成突环。这就是RNA的二级结构。在此基础上RNA分子可以再盘旋扭 曲,形成三级结构。 遗传的物质基础是核酸。核酸的核苷酸序列决定了蛋白质的氨基酸序列,而蛋白质的功 能是由它的氨基酸序列决定的。DNA在细胞分裂时每股螺旋复制出与自身互补的子代 DNA,使生命特征遗传;DNA还能转录出mRNA,后者指导翻译生成蛋白质。具体来说, 就是DNA双螺旋携带着遗传信息指导单股的信使核糖核酸(mRNA)的合成(由于DNA 和mRNA都是由4种核苷酸组成,好比同一种文字的两种版本,此过程称为转录),mRNA 再指导蛋白质的合成(因mRNA和蛋白质的组成不同,好比是两种文宇,故此过程称为 翻译)。 DA转函RN翻[蛋白质折程作用功能 这就是遗传信息在生物体内的流动方向,即中心法则。核酸作为与生命信息的储存和传 递有关的重要生物大分子,可以作为药物设计的重要的靶点 以核酸作为药物作用靶的作用模型有插入剂( intercalator)的插入作用、DNA双链与 第三条多核苷酸形成DNA三股螺旋和基因调控蛋白。从DNA双螺旋槽沟的结构信息,可 以得知配基与之相互作用的情况。配基通过槽沟可以与碱基接近,从一个大沟能识别4个碱 基,从一个小沟只能识别2个碱基,因此一个识别分子必须很大,才能具有高度的特异性。 RNA可在双链区和核糖上的2-羟基与配基作用
反义核苷酸(参见2.4.5.3)是根据核酸杂交原理设计的,按特定基因的核酸序列,人 工合成与之互补的DNA或mRNA链,它结合在特定核酸链上,从而选择性地抑制特定基 因的转录或翻译功能。该技术能根据已知序列基因设计出特异性干扰其表达的药物,特别是 对于开发作用于基因水平上的高度特异性新型抗病毒和抗肿瘤药物等具有重要的价值。ISIS 公司研究开发的福米韦森( Fomivirsen, Vitravene,IsIs2922)可特异性作用于靶mRNA, 用于治疗艾滋病所致巨细胞病毒视网膜炎,在1998年获美国FDA批准上市,为世界上第一 个反义寡核苷酸药物。 生命体内合成核酸的途径有从头合成和吸收养料或其他组织中核酸降解产生的碱基或核 苷合成新的核苷酸。利用核酸的生物合成,制成结构有异于天然核苷的核苷类药物,可以干 扰病原体核酸的正常合成而达到治疗目的 基因组学( genomics)研究的开展,为识别药物作用新靶点以及发现和设计药物开辟了 一条新的途径。基因组( genome),即单倍体染色体上的全套基因,为生命体遗传信息传递 的结构和功能单位,决定了发育、生殖、生长、疾病、衰老和死亡等所有生命现象。人类基 因组计划完成了总数为30亿碱基对的人类基因组DNA全序列的测定,从而有可能在此基 础上识别出人体内约10万个基因的结构和功能,全面而系统地解读和破译人类遗传物质的 全部信息,揭示生命的奥秘 在结构基因组学基本完成之后,科学家着手后基因组学( post-genomics)研究,对基 因精确测序,并进一步分析其位置、结构和功能。开展功能基因组研究,发现一批与疾病相 关的功能基因;开展药物基因组学研究,产生药用基因,进而进行基于基因的药物研究,甚 至为不同的个体寻找新靶点药物,对药物设计提出了更高的要求和更大的挑战 在人类基因组中,不同个体的基因,约有9.9%是相同的,另外的0.1%有差别,即基 因的多态性决定了人类个体间的差异,如身材、肤色和天赋等方面的差别。药物的基因多态 性可以表现为药物作用靶点的多态性,以及药物效应动力学和药物代谢动力学(参见2.5) 的多态性。这些多态性的存在可能导致药物疗效和毒副作用的个体间差异,也就是说同一种 药物会对不同的人产生不同的效果,因此对不同人的药物选择可以根据基因的差别来决定。 由此而产生的药物遗传学( pharmacogenetics就是研究药物引起机体反应的个体遗传差异 来实现个体化药物治疗,根据每个人体内的基因分态作为选择药物和确定该药物的有效性 毒副反应和使用剂量的依据。可以预计将来每个人都会有各自的基因碎片图,据此来选择药 物。药物基因组学( pharmacogenomics)通过研究基因序列变异对同一药物的不同反应以 及每个个体基因组上存在的不同药物靶点的情况,来寻找药用基因或药物靶基因,这将成为 发现从源头上治疗疾病的新颖和高效药物的途径。 基因作为遗传信息载体,其表达需经mRNA储存和翻译调控以及翻译后加工,因此基 因在某程度上并不能直接反映蛋白质的表达水平和功能水平。蛋白质是生物功能的体现者, 许多药物作用和治疗都是在蛋白质水平。蛋白质组学( proteomics)是一门研究细胞内全部 蛋白质的组成及其活动规律的学科,它从整体的蛋白质水平上,在贴近生命活动的层次上来 探讨和揭示生命活动的规律和重要生理、病理现象的本质。蛋白质组( proteome)为基因组 表达的所有相应的蛋白质,它具有多样性和可变性。基因组学和蛋白质组学的兴起,标志着 生命科学的研究从传统的单一性探索上升为高通量、整体性研究。蛋白质组学研究比起基因 组学研究,可能更为实用,更具潜在的经济效益,是发现药物作用靶点的一个新的技术平 台,可能会成为一系列新药发现的突破口。应用双向凝胶电泳和液相色谱质谱联用这两种