Reviews and Monographs综述与专论 回场回 D)】生物化学与生物物理进展 202 (:1273129 in Bic and Biophysics www.pibb.ac.cn 核磁共振波谱法在蛋白质三维结构 解析中的应用 尹林申峻丞杨立群” (中山大学化学学院,聚合物复合材料及功能材料教育有部重点实验室,广东省高性能树脂基复合材料重点实验室,广州51025) 摘要蛋白质特定的三维结构与其生物功能密切相关,因此,研究蛋白质的三维结构有助于揭示其生物功能机制。将核础 共振(NMR)波谱法应用于研究溶液状态下蛋白质的三维结构,能够更加准确地揭示蛋白质结构与生物功能之间的关系。 本文综述了NMR解析蛋白质三维结构的理论和技术方法,以及NMR结合其他生物物理手段,并铺以分子建模计算法研究 蛋白质三维结构的研究进展和最新方法,为精准解析蛋白质的三维结构提供思路及策略。 关键词核磁共振波谱法,蛋白质三维结构,同位素标记蛋白质,结构约束,蛋白质分子激发态结构。超大蛋白质复合体 的三维结构 中图分类号Q5,Q6.Q7 D0L:10.16476.pibb.2021.0065 每一种蛋白质都有自己特殊的空间结构,被称 难题而限制其在蛋白质三维结构研究中的应用:第 为三维结构或空间构象。蛋白质作为一种重要的生 一,随着蛋白质的氨基酸数目和分子质量的增加 物大分子,参与进行大多数生命活动(如酶催化代 造成NMR共振信号峰严重重叠:第二,横向弛豫 谢、免疫调节、细胞信息传递、载体运输以及能量 速率(R)的加快,致使NMR信号峰增宽和分辨 供应等),所以,研究蛋白质的三维结构对揭示其 率变差。因此,本文主要概述NMR解析蛋白质三 生物功能至关重要。这些理论有助于更深层次认识 维结构的理论和技术方法,以及NMR结合其他生 蛋白质在健康生理活动和疾病产生过程中发挥的作 物物理手段,并辅以分子建模计算法研究蛋白质三 用和机制,也将促进相关疾病的临床诊治和药物 维结构的研究进展和最新方法,为精准解析蛋白质 设计。 的三维结构提供思路及策略。 尽管X射线衍射法已被广泛用于解析蛋白质三 维结构,然而,该方法仍然存在一些缺陷,例如X 1核磁共振波谱法解析蛋白质三维结构的 射线衍射法只能用于研究蛋白质晶体的静态结构, 理论概述 并且一些蛋白质因结构的无序性而难以形成晶体 自旋量子数不为零的原子核(主要为H、℃、 (或形成的晶体存在缺陷而不足以X射线衍射法研 N、℉和P等),它们在外加静磁场中自旋运动 究)。相比之下,核磁共振(nuclear magnetic 时存在着不同的能级,相邻两能级间的能量差 resonance,.NMR)波谱法更适合用于研究溶液状 (△E)为: 态下蛋白质的三维结构,能够更加准确地揭示蛋白 △E=hH (1) 质结构与生物功能之间的自然规律口。 式中,y为磁旋比,=h2π(h为普朗克常数),。 2DNMR技术已广泛用于解析较小分子质量 (≤10ku)蛋白质的三维结构。虽然3D和4D *广东省自然科学基金(2017B030311007)资助项目。 率通讯联系人。 NMR技术逐渐被用于解析分子质量较高的蛋白质 Tel:020-39339796.E-mail:vanglg @mail.sysu.edu cn 的三维结构,但是,NMR测试技术仍然面临两大 收稿日期:2021-08-31,接受日期:2021-10-12
Reviews and Monographs 综述与专论 生物化学与生物物理进展 Progress in Biochemistry and Biophysics 2022,49(7):1273~1290 www.pibb.ac.cn 核磁共振波谱法在蛋白质三维结构 解析中的应用* 尹 林 申峻丞 杨立群** (中山大学化学学院,聚合物复合材料及功能材料教育部重点实验室,广东省高性能树脂基复合材料重点实验室,广州 510275) 摘要 蛋白质特定的三维结构与其生物功能密切相关,因此,研究蛋白质的三维结构有助于揭示其生物功能机制。将核磁 共振 (NMR) 波谱法应用于研究溶液状态下蛋白质的三维结构,能够更加准确地揭示蛋白质结构与生物功能之间的关系。 本文综述了NMR解析蛋白质三维结构的理论和技术方法,以及NMR结合其他生物物理手段,并辅以分子建模计算法研究 蛋白质三维结构的研究进展和最新方法,为精准解析蛋白质的三维结构提供思路及策略。 关键词 核磁共振波谱法,蛋白质三维结构,同位素标记蛋白质,结构约束,蛋白质分子激发态结构,超大蛋白质复合体 的三维结构 中图分类号 Q5,Q6,Q7 DOI:10.16476/j.pibb.2021.0065 每一种蛋白质都有自己特殊的空间结构,被称 为三维结构或空间构象。蛋白质作为一种重要的生 物大分子,参与进行大多数生命活动(如酶催化代 谢、免疫调节、细胞信息传递、载体运输以及能量 供应等),所以,研究蛋白质的三维结构对揭示其 生物功能至关重要。这些理论有助于更深层次认识 蛋白质在健康生理活动和疾病产生过程中发挥的作 用和机制,也将促进相关疾病的临床诊治和药物 设计。 尽管X射线衍射法已被广泛用于解析蛋白质三 维结构,然而,该方法仍然存在一些缺陷,例如X 射线衍射法只能用于研究蛋白质晶体的静态结构, 并且一些蛋白质因结构的无序性而难以形成晶体 (或形成的晶体存在缺陷而不足以X射线衍射法研 究)。 相 比 之 下 , 核 磁 共 振 (nuclear magnetic resonance,NMR) 波谱法更适合用于研究溶液状 态下蛋白质的三维结构,能够更加准确地揭示蛋白 质结构与生物功能之间的自然规律[1] 。 2D NMR 技术已广泛用于解析较小分子质量 (≤10 ku) 蛋白质的三维结构[2]。虽然 3D 和 4D NMR技术逐渐被用于解析分子质量较高的蛋白质 的三维结构,但是,NMR测试技术仍然面临两大 难题而限制其在蛋白质三维结构研究中的应用:第 一,随着蛋白质的氨基酸数目和分子质量的增加, 造成NMR共振信号峰严重重叠;第二,横向弛豫 速率 (R2 ) 的加快,致使NMR信号峰增宽和分辨 率变差。因此,本文主要概述NMR解析蛋白质三 维结构的理论和技术方法,以及NMR结合其他生 物物理手段,并辅以分子建模计算法研究蛋白质三 维结构的研究进展和最新方法,为精准解析蛋白质 的三维结构提供思路及策略。 1 核磁共振波谱法解析蛋白质三维结构的 理论概述 自旋量子数不为零的原子核(主要为1 H、13C、 15N、19F和13P等),它们在外加静磁场中自旋运动 时存在着不同的能级,相邻两能级间的能量差 (ΔE)为: ΔE = γℏH0 (1) 式中,γ为磁旋比,ℏ=h/2π (h为普朗克常数),H0 ∗ 广东省自然科学基金(2017B030311007)资助项目。 ∗∗ 通讯联系人。 Tel:020-39339796,E-mail:yanglq@mail.sysu.edu.cn 收稿日期:2021‑08‑31,接受日期:2021‑10‑12
1274 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) 为静磁场强度」 HNCACO、HNCOCA、HNCO.,CA等l。根据 在外加静磁场中。原子核绕其自旋轴旋转。自 NMR软件结合NMR技术所获得的H、N」 旋轴与静磁场保持某一夹角而围绕静磁场方向讲动 1C0、C和1C化学位移、摆合常数和质子间距 的频率(为 离,推算蛋白质主链中氨基酸的序列及其二面角结 ) 构参数 ,得出蛋白质的二级结构。通过测定NOP 当用频率为仙,的射频照射静磁场中自旋运动 顺磁弛豫增强 paramagnetic relaxation 的原子核时,原子核才能有效地吸收射频辆射的能 enhancement.PRE)以及残余偶极揭合(residua 量,从低能级跃汗至高能级,实即核磁共振。所 dipolar coupling,RDC)等NMR参数获得蛋白质 以,核磁共振波谱来源于原子核能级间的跃迁,即 的三维结构约束参数(包括原子间空间距离、化学 键空间取向等),进一步结合NMR计算软件解析 的原子核发生共振跃迁 录发生 核破 蛋白质的 维结构 时的信号蜂位置和强度,得到核磁共振波谱,其 以常用的3DN/CH三共振HNCA和 振信号反映了官能团和构象等分子结构信息。通常 HN(CO)CA NMR为例,蛋白质分子中的氨基酸通 将日、C和N原子核的磁共根技术应用于蛋白质 过磁化矢量传递(图1b①)。HNCA可测定同一个 的结构解析,例如桶讨NR实验获得化学位移 氨基酸内的H和N原子与C原子的关联(以第 她豫时间、耦合常数、核奥弗泽效应( 个氨基酸为例),以及第个氨基酸的H产和N原 用于研究蛋 子与第 质的三维站构及其分子动力学等 1个氨基酸C原子的关联;HN(CO)C 通常只提供同一个氨基酸内的F和N原子与邻 NMR解析蛋白质三维结构的流程图如图1a所 近氨基酸C原子之间的关联信息。在蛋白质样品 示。为了避免蛋白质共振信号峰的重叠,提高其分 3DNMR谱图中(图1b②),诵过上术关联信息解 讲率,一般需要制备N、C或H标记的蛋白质 析蛋白质主链中氨基酸的序列结构(图1b③),根 采用5NCH三共振多维核磁技术采集堂验数据 据质子间压离和一面角结物参数(图1④)。并第 对共振信号进行分析、筛选及归属 主要相关的 用化学位移预测法解析二级结构 。结合结构约束 NMR技术包括HNCA、HN(CO)CA,HNCC 数,通过NMR计算软件进行计算可获得蛋白质的 HN(CA)CO、 HNCACB、 HN(CO)CACB 维结构。 a 白的 42 ④ 0Q 2 IN(COXCA Fig.1 Process ar ing pr ensional structure 《a)NR解析蛋白质三维结的流得图。( 共振NCA和N(CO)CA NMRS解析蛋白质三维结构的示意图:①H、C 和N原子核相关自旋系统及NMR数据采集及共振信号分析:②蛋白质样品3DNR请图示意图:③解析氨基酸序列结构:④二面角 (。和y)及质子问距离示章图
·1274· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 为静磁场强度。 在外加静磁场中,原子核绕其自旋轴旋转,自 旋轴与静磁场保持某一夹角而围绕静磁场方向进动 的频率(ω0 )为: ω0 = γH0 (2) 当用频率为 ω0的射频照射静磁场中自旋运动 的原子核时,原子核才能有效地吸收射频辐射的能 量,从低能级跃迁至高能级,实现核磁共振。所 以,核磁共振波谱来源于原子核能级间的跃迁,即 用一定射频的电磁波对样品进行照射,使特定结构 环境中的原子核发生共振跃迁,记录发生核磁共振 时的信号峰位置和强度,得到核磁共振波谱,其共 振信号反映了官能团和构象等分子结构信息。通常 将1 H、13C和15N原子核的磁共振技术应用于蛋白质 的结构解析,例如通过 NMR 实验获得化学位移、 弛豫时间、耦合常数、核奥弗豪泽效应 (nuclear Overhauser effect,NOE) 等参数,用于研究蛋白 质的三维结构及其分子动力学等[3-7] 。 NMR解析蛋白质三维结构的流程图如图1a所 示。为了避免蛋白质共振信号峰的重叠,提高其分 辨率,一般需要制备15N、13C或2 H标记的蛋白质, 采用15N/13C/1 H三共振多维核磁技术采集实验数据, 对共振信号进行分析、筛选及归属,主要相关的 NMR 技 术 包 括 HNCA、 HN(CO)CA、 HNCO、 HN(CA)CO、 HNCACB、 HN(CO)CACB、 HNCACO、HNCOCA、HNCOi-1CAi 等[8-20]。根据 NMR 软 件 结 合 NMR 技 术 所 获 得 的1 HN 、 15N、 13CO、13Cα 和13Cβ 化学位移、耦合常数和质子间距 离,推算蛋白质主链中氨基酸的序列及其二面角结 构参数,得出蛋白质的二级结构。通过测定NOE、 顺 磁 弛 豫 增 强 (paramagnetic relaxation enhancement,PRE) 以及残余偶极耦合 (residual dipolar coupling,RDC) 等 NMR 参数获得蛋白质 的三维结构约束参数(包括原子间空间距离、化学 键空间取向等),进一步结合 NMR 计算软件解析 蛋白质的三维结构。 以 常 用 的 3D 15N/13C/1 H 三 共 振 HNCA 和 HN(CO)CA NMR为例,蛋白质分子中的氨基酸通 过磁化矢量传递 (图1b①),HNCA可测定同一个 氨基酸内的1 HN和15N原子与13Cα 原子的关联 (以第 i个氨基酸为例),以及第i个氨基酸的1 HN和15N原 子与第i−1个氨基酸13Cα 原子的关联;HN(CO)CA 通常只提供同一个氨基酸内的1 HN和15N 原子与邻 近氨基酸13Cα 原子之间的关联信息。在蛋白质样品 3D NMR谱图中 (图1b②),通过上述关联信息解 析蛋白质主链中氨基酸的序列结构 (图1b③),根 据质子间距离和二面角结构参数 (图1b④),并采 用化学位移预测法解析二级结构。结合结构约束参 数,通过NMR计算软件进行计算可获得蛋白质的 三维结构。 Fig. 1 Process and schemes of investigating protein three-dimensional structure 图1 解析蛋白质三维结构的流程及示意图 (a) NMR解析蛋白质三维结构的流程图。(b) 3D 15N/13C/1 H三共振HNCA和HN(CO)CA NMR解析蛋白质三维结构的示意图:①1 H、13C 和15N原子核相关自旋系统及其NMR数据采集及共振信号分析;②蛋白质样品3D NMR谱图示意图;③解析氨基酸序列结构;④二面角 (ϕCα-N和ψCα-C)及质子间距离示意图
2022:49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 1275 硫代半乳糖苷(PTG)为诱导剂。目前研究工作 2研究蛋白质三维结构的核磁共振波谱法 主要集中在通过改造该系统中的质粒来提高蛋白质 21蛋白质的同位素标记 的溶银性及产量】 蛋白质的同位素标记包括以下过程:构建含有 由于大肠杆菌表达系统对于一些含有特殊结构 目标蛋白基因序列的质粒,将其导入宿主生物体, 的蛋白质(如含二硫键的蛋白质等)普适性较差 在含有同位素标记物的培养基中进行培养,通过宿 所以发展起来了真核生物表达系统(包括酵母细 主生物表达得到同位素标记蛋白质,采用生化技术 胞,昆虫细胞和哺到动物细胞表状系统))。尽管 进行分离纯化 ,获得高纯度的同位素标记蛋白质。 毕赤座母(Pichia pastoris)常用干表达NC产 2.11标记方法 标记的蛋白质,但是,仍然存在一些缺陷,例如在 均匀同位素标记法被广泛用于蛋白质的同位素 氘代介质中表达时间较长以及选择性地甲基质子化 标记。它主要以N标记的NHCI或(NH)SO 效率较低等 昆虫细胞和哺乳动物细胞表边 作为唯一氨源,℃标记的葡萄糖、甘油、甲醇或 系统需要使用含同位素标记氨基酸的培养基,导致 丙围酸作为唯一的碳源,对蛋白质讲行均匀 制备同位素标记蛋白质的成本较为昂贵。 的NC双标记。为了提高NMR谱灵敏度和 分 些对宿主细胞具有毒性的蛋白质,可采用无细胞表 通常在含D,OH,0的培养基中制备全氘代或剖 达系统】 其特点是具有较高的蛋白质表达 分氘代的N/CP阳三标记蛋白质样品,进行三共 效 振多维核磁测试。 .1.3纯化技术 为了克服大量质子被氘取代而干扰NOE法解 采用同位素标记法及在各种表达系统中得到的 析蛋白质结构的问题,发展了对4种甲基氨基酸 菌体,需要利用生化技术讲一步分离提纯才能获得 选择性地甲基质子化法回 高纯度的同位素标记蛋白样品,主要包括茵体内含 列例如,在含有CH标记葡萄糖 N标记NH,CI利 蛋白的释放 总蛋白的富到 层析色谱法分 D.O的细菌培养基中,加人3HC-a-酮异戊酸 纯、 蛋白质的浓缩以及纯度鉴定等过程。其中层析 (a-ketoisovalerate)制备含有CH,-标记Val和Leu 色谱分离是最重要的一步,它直接决定同位素标记 残基的N/CH蛋白质,加入3.3.HC--围 蛋白样品的纯度和产率。根据同位素标记蛋白不同 酸(a-ketobutyrate)制备含有CH标记le残基 的物理性质(如等申点、容解度、申荷性质等) 的NCH蛋白质 可采用多种层析色谱分离技术, 例如亲和层析色谱 片段同位素标记法有助于降低NMR信号峰的 (如Ni-NTA和Glutathione Sepharose色谱法 重叠程度,用于无序蛋白质(disordered protein 离子交换色谱法(如DEAE色谱法)、体积排阻色 结构的测定、高分子质量蛋白质的结构解析以及蛋 i法(如Superdex、Sephacryl、Sepharose 白质构象变化的研究等1。该方法通过对两个 Sephadex伍满上) 或以上的蛋白质片段进行分别表达,对不同的组分 2.2核磁共振实验数据的采集及其解析的软件 采用不同的同位素标记(N℃阳) 再将这些 22.1 振实验数据采集 白质片段连接起来,组成具有同位素标记片段的完 近年来针对核磁共振技术采集时间长和信噪比 整目标蛋白,主要有表达蛋白连接法(expressed 较低等问题,发展了一些新的NMR实验数据采集 protein ligation.EPL)、蛋白反式剪接法(protein 技术,如非均匀采样(non-uniform sampling)l物 rans-splic g,PTS)和天然化学连接法(native SOFAST (band-selective optimized-flip-angle short- emicalig NCL)等 ADAP (as 2.12表达系统 directed data collection algorithm utilizing a 通常采用的表达系统为原核生物表达系统、直 probabilistic toolkit in NMR) BEST (band 核生物表达系统以及无细胞表达系统。大肠杆菌 selective excitation short-transient)44451,GFT (G. (E.Co)是原核生物表达系统中代表性的表达宿 natrix Fourier t阳nsform)[】将影f由 主它能在各种同位志标记环培中表状蛋白质、 本较低。所以 NMR研究中大肠杆菌表达系 快速采样,信噪比较高,更有利于研究溶液状态下 最为常用,主要以pET为表达载体,异丙基B-D 不稳定的蛋白质二维结构
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1275· 2 研究蛋白质三维结构的核磁共振波谱法 2.1 蛋白质的同位素标记 蛋白质的同位素标记包括以下过程:构建含有 目标蛋白基因序列的质粒,将其导入宿主生物体, 在含有同位素标记物的培养基中进行培养,通过宿 主生物表达得到同位素标记蛋白质,采用生化技术 进行分离纯化,获得高纯度的同位素标记蛋白质。 2.1.1 标记方法 均匀同位素标记法被广泛用于蛋白质的同位素 标记[21]。它主要以15N 标记的 NH4Cl 或(NH4 )2SO4 作为唯一氮源,13C标记的葡萄糖、甘油、甲醇或 丙酮酸作为唯一的碳源,对蛋白质 进 行 均 匀 的15N/13C双标记。为了提高NMR谱灵敏度和分辨 率,通常在含D2O/H2O的培养基中制备全氘代或部 分氘代的15N/13C/2 H 三标记蛋白质样品,进行三共 振多维核磁测试。 为了克服大量质子被氘取代而干扰NOE法解 析蛋白质结构的问题,发展了对 4 种甲基氨基酸 (Ala、Val、Leu、Ile) 选择性地甲基质子化法[22] 。 例如,在含有13C/2 H标记葡萄糖、15N标记NH4Cl和 D2O 的细菌培养基中,加入 3- 2 H, 13C-α-酮异戊酸 (α-ketoisovalerate) 制备含有13CH3-标记 Val 和 Leu 残基的15N/13C/2 H蛋白质[23] ,加入3,3- 2 H, 13C-α-酮丁 酸 (α-ketobutyrate) 制备含有13CH3-标记 Ile 残基 的15N/13C/2 H蛋白质[24] 。 片段同位素标记法有助于降低NMR信号峰的 重叠程度,用于无序蛋白质 (disordered protein) 结构的测定、高分子质量蛋白质的结构解析以及蛋 白质构象变化的研究等[25-28] 。该方法通过对两个 或以上的蛋白质片段进行分别表达,对不同的组分 采用不同的同位素标记 (15N/13C/2 H),再将这些蛋 白质片段连接起来,组成具有同位素标记片段的完 整目标蛋白,主要有表达蛋白连接法 (expressed protein ligation,EPL)、蛋白反式剪接法 (protein trans-splicing,PTS) 和天然化学连接法 (native chemical ligation,NCL)等[29-31] 。 2.1.2 表达系统 通常采用的表达系统为原核生物表达系统、真 核生物表达系统以及无细胞表达系统。大肠杆菌 (E. coli) 是原核生物表达系统中代表性的表达宿 主,它能在各种同位素标记环境中表达蛋白质,成 本较低。所以,在NMR研究中大肠杆菌表达系统 最为常用,主要以pET为表达载体,异丙基-β-D- 硫代半乳糖苷 (IPTG) 为诱导剂。目前研究工作 主要集中在通过改造该系统中的质粒来提高蛋白质 的溶解性及产量[32] 。 由于大肠杆菌表达系统对于一些含有特殊结构 的蛋白质 (如含二硫键的蛋白质等) 普适性较差, 所以发展起来了真核生物表达系统 (包括酵母细 胞、昆虫细胞和哺乳动物细胞表达系统)[33] 。尽管 毕赤酵母 (Pichia pastoris) 常用于表达15N/13C/2 H 标记的蛋白质,但是,仍然存在一些缺陷,例如在 氘代介质中表达时间较长以及选择性地甲基质子化 效率较低等[34-35] 。昆虫细胞和哺乳动物细胞表达 系统需要使用含同位素标记氨基酸的培养基,导致 制备同位素标记蛋白质的成本较为昂贵[36-37] 。一 些对宿主细胞具有毒性的蛋白质,可采用无细胞表 达 系 统 , 其 特 点 是 具 有 较 高 的 蛋 白 质 表 达 效率[38-39] 。 2.1.3 纯化技术 采用同位素标记法及在各种表达系统中得到的 菌体,需要利用生化技术进一步分离提纯才能获得 高纯度的同位素标记蛋白样品,主要包括菌体内含 蛋白的释放、总蛋白的富集、层析色谱法分离提 纯、蛋白质的浓缩以及纯度鉴定等过程。其中层析 色谱分离是最重要的一步,它直接决定同位素标记 蛋白样品的纯度和产率。根据同位素标记蛋白不同 的物理性质 (如等电点、溶解度、电荷性质等), 可采用多种层析色谱分离技术,例如亲和层析色谱 法 (如 Ni-NTA 和 Glutathione Sepharose 色谱法)、 离子交换色谱法 (如DEAE色谱法)、体积排阻色 谱 法 ( 如 Superdex、 Sephacryl、 Sepharose 和 Sephadex色谱法)。 2.2 核磁共振实验数据的采集及其解析的软件 2.2.1 核磁共振实验数据采集 近年来针对核磁共振技术采集时间长和信噪比 较低等问题,发展了一些新的NMR实验数据采集 技术,如非均匀采样 (non-uniform sampling)[40]、 SOFAST (band-selective optimized-flip-angle shorttransient)[41-42] 、 ADAPT-NMR (assignmentdirected data collection algorithm utilizing a probabilistic toolkit in NMR)[43] 、 BEST (bandselective excitation short-transient)[44-45]、GFT (Gmatrix Fourier transform)[46] 、 投 影 重 建 (projection reconstruction)[47] 等。这些技术能实现 快速采样,信噪比较高,更有利于研究溶液状态下 不稳定的蛋白质三维结构
1276 生物化学与生物物理进展Prog.Biochem.Biophys. 2022:49(7) 非均匀采样技术不仅保持特了较高的信噪比,而 2.2.2解析核磁共振信号的软件 日将实验数据采集时间缩短为原来的1门16。已 由NMR实验数据得到的谱图,需要对共振信 得到了广泛应用。它主要是在间接维度 号进行归属,经过结构计算和评估才能获得较为准 (indirect dimension)中对NMR数据进行随机选择 确的蛋白质三维结构。然而,对于 一些分子质量轮 性采样,结合特定采样限制因素(例如在每个间接 高的蛋白质,由于其信号蜂的数量显著增多,导致 维度下每个采集时间应至少测量1次等),将得到 NMR谱图解析较为困难。目前已出现了多种化学 的低分辨率数据经过重建算法(reconstruction 位移自动归属软件,用于分析蛋白质主链和侧链的 algorithm)处理,在 一定程度上得到与均匀采样技 结构以及NOESY信号 包括CYANAY PNE-SPARKY.2、APSY 术相当的NMR数据[知]。数据重建算法包括多维分 PONDEROSA NMRNet!、ADAPTNMR4]等。化学位移自动 解法()a、最大堉 归属的在线服务器主要为-PINE web server(htp 重构法(maximum entropy reconstruction)a)、非 i-pine.nmrfam.wisc. nac等改进 等间距数据的傅立叶变换算法(Fourier transform CYANAY中的FLYA算法 能自动归属超大分 algorithms for non-equispacedata)u、机器学习法 质量蛋白质甲基的NOSEY信号。为了获得蛋白质 (nachine learning)】、稀琉多维迭代线形增强法 的三维结构,需要根据田、C、1N化学位移及 (sparse multidimensional iterative lineshape NOE等结构约束参数、采用计算软件计算蛋白质 enhanced,SMLE)ia等 的二级结构和三维结构(表1)。 Table 1 Calculation software of protein s ondary structure unit and three-dime ional structure 表!蛋白质二级结构单元和三维结构的计算软件 考文 结构榄拟软件,依据化学位移日属经验性测蛋白质主链的 bv/NMRPipe/alox/ 16 C之间的旋转角y) CYANA 结构计算软件,在已知氨枯酸序列的前提下,根据NMR实验hph vanaore/vikifindex pboftutorials [56 获取的约束条件(二面角钓束、原子距离约束等)进行蛋白 结构计算,用带白动归属NOESY信号的功能 CNS 根据NOE、合常数、化学位移和偶极祸合 http//ens-online.or/v1.3 [66 Ambe 流约束条件对蛋白质结 位移 、残基偶树 167 NO正号自动自属和蛋白质结构计算软件,采用选代结构计 http://aria.pasteur.frl 6别 算法提高NOE信号归属的效率 PROCHECK 蛋白质结构质量评估在线软件,评估目的蛋白质结构与高分https/ervicesn.mbi.ucla.edu/PROCHECK/ 69列 辨事的蛋白质品体结构之间各结构参数的差异(包括健长 二面角及原子问距离等) 23核磁共振波谱法解析蛋白质的氨基酸序列和 酸侧链质子信号主要分布在0~4ppm,主链及侧链 一级结构单元 的酰胺质子主要分布在7~10ppm,芳香环上的质 获得N、℃或H同位素标记的高纯度蛋白质 样品后,在解析三维结构之 需要进行NMR实验 2.31 统的辨识及蛋白质的氨 的可行性论证 包括选取适合的缓冲溶液体系和测 酸序列解析 试温度以保证在测试过程中蛋白质结构和性质的稳 常见的20种氨基酸残基中有15种残基即为 定性。通过考察NMR线宽的浓度依懒性来判断蛋 个自旋系统,其余5种氨基酸残基则含有多个自旋 白质是否发生聚集等。如果NMR普线太宽(或 系统。根据蛋白质分子质量的大小。通常采用以下 则需要改变实验条件进行改 两种方法进行氨基酸残基自旋系统的辨识以及氨基 善。在蛋白质HNMR谱图中,甲基及脂肪族氨基 酸序列结构的解析
·1276· 生物化学与生物物理进展 Prog. Biochem. Biophys. 2022;49(7) 非均匀采样技术不仅保持了较高的信噪比,而 且将实验数据采集时间缩短为原来的 1/2~1/6,已 得 到 了 广 泛 应 用[48-49]。 它 主 要 是 在 间 接 维 度 (indirect dimension) 中对 NMR 数据进行随机选择 性采样,结合特定采样限制因素(例如在每个间接 维度下每个采集时间应至少测量1次等),将得到 的 低 分 辨 率 数 据 经 过 重 建 算 法 (reconstruction algorithm)处理,在一定程度上得到与均匀采样技 术相当的NMR数据[50] 。数据重建算法包括多维分 解法(multidimensional decomposition)[48] 、最大熵 重构法 (maximum entropy reconstruction)[49]、非 等间距数据的傅立叶变换算法 (Fourier transform algorithms for non-equispaced data)[51] 、机器学习法 (machine learning)[52]、稀疏多维迭代线形增强法 (sparse multidimensional iterative lineshapeenhanced,SMILE)[53]等。 2.2.2 解析核磁共振信号的软件 由NMR实验数据得到的谱图,需要对共振信 号进行归属,经过结构计算和评估才能获得较为准 确的蛋白质三维结构。然而,对于一些分子质量较 高的蛋白质,由于其信号峰的数量显著增多,导致 NMR谱图解析较为困难。目前已出现了多种化学 位移自动归属软件,用于分析蛋白质主链和侧链的 结 构 以 及 NOESY 信 号 , 包 括 CYANAY[54-56]、 PINE-SPARKY.2[57] 、APSY[58-60] 、PONDEROSA[61] 、 NMRNet[62]、ADAPT-NMR[43] 等。化学位移自动 归属的在线服务器主要为I-PINE web server(http:// i-pine.nmrfam.wisc.edu/)[63]。Pritisanac 等[64] 改进 了CYANAY中的FLYA算法,能自动归属超大分子 质量蛋白质甲基的NOSEY信号。为了获得蛋白质 的三维结构,需要根据1 H、13C、15N 化学位移及 NOE 等结构约束参数、采用计算软件计算蛋白质 的二级结构和三维结构(表1)。 2.3 核磁共振波谱法解析蛋白质的氨基酸序列和 二级结构单元 获得15N、13C或2 H同位素标记的高纯度蛋白质 样品后,在解析三维结构之前需要进行NMR实验 的可行性论证,包括选取适合的缓冲溶液体系和测 试温度以保证在测试过程中蛋白质结构和性质的稳 定性,通过考察NMR线宽的浓度依赖性来判断蛋 白质是否发生聚集等。如果 NMR 谱线太宽 (或 NMR 峰重叠严重),则需要改变实验条件进行改 善。在蛋白质1 H NMR谱图中,甲基及脂肪族氨基 酸侧链质子信号主要分布在0~4 ppm,主链及侧链 的酰胺质子主要分布在 7~10 ppm,芳香环上的质 子信号主要分布在6~8 ppm。 2.3.1 氨基酸残基自旋系统的辨识及蛋白质的氨基 酸序列解析 常见的20种氨基酸残基中有15种残基即为一 个自旋系统,其余5种氨基酸残基则含有多个自旋 系统。根据蛋白质分子质量的大小,通常采用以下 两种方法进行氨基酸残基自旋系统的辨识以及氨基 酸序列结构的解析。 Table 1 Calculation software of protein secondary structure unit and three-dimensional structure 表1 蛋白质二级结构单元和三维结构的计算软件 软件 TALOS+ CYANA CNS Amber Aria PROCHECK 功能简介 结构模拟软件,依据化学位移归属经验性预测蛋白质主链的 二面角(即Cα—N之间的旋转角ϕ和Cα—C之间的旋转角ψ) 结构计算软件,在已知氨基酸序列的前提下,根据NMR实验 获取的约束条件(二面角约束、原子距离约束等)进行蛋白 质结构计算,附带自动归属NOESY信号的功能 结构计算软件,根据NOE、耦合常数、化学位移和偶极耦合 等约束条件进行蛋白质结构计算 生物分子模拟和分析程序,根据NOE、化学位移、残基偶极 耦合常数和扭转角等约束条件对蛋白质结构进行优化 NOE信号自动归属和蛋白质结构计算软件,采用迭代结构计 算法提高NOE信号归属的效率 蛋白质结构质量评估在线软件,评估目的蛋白质结构与高分 辨率的蛋白质晶体结构之间各结构参数的差异(包括键长、 二面角及原子间距离等) 网址 https://spin.niddk.nih.gov/NMRPipe/talos/ http://www.cyana.org/wiki/index.php/Tutorials http://cns-online.org/v1.3/ http://ambermd.org/index.php http://aria.pasteur.fr/ https://servicesn.mbi.ucla.edu/PROCHECK/ 参考文献 [65] [56] [66] [67] [68] [69]
2022:49(7) 尹林,等:核磁共振波谱法在蛋白质三雏结构解析中的应用 1277: 分子质量低于14k如的蛋白质一般不需要进行 结构单元的二面角。例如,右毛α螺旋3 同位素标记,其氨基酸自旋系统可用2 D'H NMR 3.9Hz(6=-57),3螺旋1U.=42Hz(6= 技术(如COSY、DQF-COsY、RCT-COSY和 -60),反平行B折叠u=89业(=-139) 0CSY)进行识别 此技犬与N ESY联用可识 平行B折叠 72 别氨基酸的序列结构。其中COSY类技术提供同 安拱速率的质于易形设氢健,通过N0sY测定金 氨基酸的酰胺质子与F质子(NHH,)的关联信 白质样品在H,0和D,0中的质子交换速率来研究氢 息,NOESY提供氨基酸内酰胺质子与邻近氨基酸 键相互作用n。 H严质子(NH,H)的关联信息。由于NOESY和 基干氨基酸N、C和日化学位移数据库的化 将这两种谱 学位移二级结构预测法也常用于解析蛋白质的二级 图的名 半沿着对角线叠合组成 张NOES 结构单元 。然而 由于蛋白质的化学位移容易受 COSY谱 在COSY谐中从NH-H,信号峰的氨 原子核局部磁环境影响.导致其化学位移包含多利 基酸残基自旋系统出发,分别作水平线和垂直线 信息(二级结构单元、侧链构象、氢键、动力学 得到NH和H化学位移,以H原子的化学位移作 溶剂化作用等)。为了更加准确地获得蛋白质 为起占做水平线从NOESY谱中找到NH,的氨 级结构的单一信息,建立了化学位移标志识别法 酸残基自旋系统。 自旋系统的 (chemical shift inde 即根据其数据库建立 顺序。 各种氨基酸白旋系统中N ℃和H的化学位移桐 对于较高分子质量的蛋白质,因为自旋系统信 志参考值,用于解析蛋白质的二级结构单元 号蜂数目增加而容易产生信号峰的重叠,所以,需 相关软件主要有NMRPipe],在线分析服务器主 要制备N/C或N/CH标记的蛋白质样品,采 要为TALOS+Neb Server(https/sDin.niddk nih 用1NCH异核多维NMR排行酸白旋系统 erver/talos/)CSI 2.0 Web Serve 识别,进 步解析氨基酸的序列 Bar等 (http://csi.wishartlab.com/ 将NCH三共振实验应用于解析钙调蛋白 2.4蛋白质的三维结构解析 (16.7ku)的结构以来,出现了更多的三共振脉冲 2.4.1核磁共振波谱法解析蛋白质三维结构 技术:a.分子质量约为1030ku的单链蛋白质,常 在蛋白质氨基酸序列和二级结构单元的解析基 用的三共据实验技术主要有HNCA、HN(COCA 上,通NMR实验讲一测岸结构约束参数 HNCO.HN(CA)CO CBCA(CO)NH CBCANH 包括原子间空间距离 化学键空间取向等) 结 HNCACB和HN(CO)CACB等:b.分子质量高 计算软件计算蛋白质 结构开评估其可官性和 30ku的蛋白质,则需在上述基础上联用TROSY以 确性。NOE和PRE实验可获得原子空间距离约束 及4D、5D和6 D NMR 7 参数,化学罐空间取可知酒时RDC宾验来获 在实际应用中.可将NCH三共振实验按 取(图2) 照关联类型以两个为 组的形式分成4组三共振 MR谱图 a.HNCA (残基内谱图)和H NOE信号强度与两个偶极相互作用的质子之 CA(残基间谱图)b.HNCO(残基间谱图)和 间距离(,1.85A)的六次方成反比。在蛋 HN(CA)CO(残基内谱图):c.CBCANH(残基内 白质三维结构研究中,主要根据NOESY谱图的 接图)和CBCA(CO)NH(残其间谱图) NOE信号强度非得短程距离的质子间距离约吏参 d HncacB(残基内诺图)和HN COICACB(残 数(图2a)。蛋白质三维结构析的准确性依干 OE信号的获取数量和正确归属 然而 伴随者 232 蛋白质的二级结构单元解析 蛋白质分子质量的增加,NOESY谱易出现信号 通过以下NMR技术可测定蛋白质的二级结构 简并和重叠严重的问题。近期出现的异核多绍 单元(α螺旋、B转角、B折叠和无规线团)以及结 NOESY技术,即根据与H键合的异核(C或N) 构特征参数(质子间距离、二面角和氢键相互作 化学位移来分辨NOE交叉信号蜂,能够通过增加 用).a NOESY用王识别有质子间距离≤5A结 维度的方式来减小信县简并和重叠的间顺。对 构特征的二级结构单元: b.DQF-C SY用于测定 分子质量较小的蛋白质(<30k如 常用2DH C.-N-H三键的帮合常数(Jw),进一步确定二级 NOESY、3DsNW"aC-edited-NOESY、3Dc(N/
2022;49(7) 尹林,等:核磁共振波谱法在蛋白质三维结构解析中的应用 ·1277· 分子质量低于14 ku的蛋白质一般不需要进行 同位素标记,其氨基酸自旋系统可用 2D 1 H NMR 技 术 (如 COSY、 DQF-COSY、 RCT-COSY 和 TOCSY)进行识别,这些技术与NOESY联用可识 别氨基酸的序列结构。其中COSY类技术提供同一 氨基酸的酰胺质子与 Hα 质子 (NHi - α H)i 的关联信 息,NOESY提供氨基酸内酰胺质子与邻近氨基酸 Hα 质子 (NHi+1- α H)i 的关联信息。由于 NOESY 和 COSY谱图都具有对角对称性,因此,将这两种谱 图的各一半沿着对角线叠合组成一张 NOESYCOSY 谱[70] ,在 COSY 谱中从 NHi - α Hi信号峰的氨 基酸残基自旋系统出发,分别作水平线和垂直线, 得到NHi和α Hi化学位移,以α Hi原子的化学位移作 为起点做水平线,从NOESY谱中找到NHi+1的氨基 酸残基自旋系统,得出各氨基酸残基自旋系统的 顺序。 对于较高分子质量的蛋白质,因为自旋系统信 号峰数目增加而容易产生信号峰的重叠,所以,需 要制备15N/13C 或15N/13C/2 H 标记的蛋白质样品,采 用15N/13C/1 H异核多维NMR进行氨基酸自旋系统的 识别,进一步解析氨基酸的序列。自 Bax 等[8] 将15N/13C/1 H 三 共 振 实 验 应 用 于 解 析 钙 调 蛋 白 (16.7 ku) 的结构以来,出现了更多的三共振脉冲 技术:a. 分子质量约为10~30 ku的单链蛋白质,常 用的三共振实验技术主要有 HNCA、HN(CO)CA、 HNCO、HN(CA)CO、CBCA(CO)NH、CBCANH、 HNCACB 和 HN(CO)CACB 等;b. 分子质量高于 30 ku的蛋白质,则需在上述基础上联用TROSY以 及4D、5D和6D NMR[71-75] 。 在实际应用中,可将15N/13C/1 H 三共振实验按 照关联类型以两个为一组的形式分成 4 组三共振 NMR 谱图:a. HNCA (残基内谱图) 和 HN(CO) CA (残基间谱图);b. HNCO (残基间谱图) 和 HN(CA)CO (残基内谱图);c. CBCANH (残基内 谱 图 ) 和 CBCA(CO)NH ( 残 基 间 谱 图 ); d. HNCACB (残基内谱图) 和HN(CO)CACB (残 基间谱图)。 2.3.2 蛋白质的二级结构单元解析 通过以下NMR技术可测定蛋白质的二级结构 单元(α螺旋、β转角、β折叠和无规线团)以及结 构特征参数 (质子间距离、二面角和氢键相互作 用):a. NOESY用于识别具有质子间距离 ≤ 5 Å结 构特征的二级结构单元;b. DQF-COSY 用于测定 Cα-N-H三键的耦合常数(3 JHNαH),进一步确定二级 结构单元的二面角。例如,右手 α 螺旋3 JHNαH = 3.9 Hz (ϕ = − 57º), 310 螺 旋3 JHNαH = 4.2 Hz (ϕ = −60º),反平行 β 折叠3 JHNαH = 8.9 Hz (ϕ=−139º), 平行β折叠3 JHNαH = 9.7 Hz(ϕ=−119º)[76] ;c. 具有慢 交换速率的质子易形成氢键,通过NOESY测定蛋 白质样品在H2O和D2O中的质子交换速率来研究氢 键相互作用[77] 。 基于氨基酸15N、13C和1 H化学位移数据库的化 学位移二级结构预测法也常用于解析蛋白质的二级 结构单元。然而,由于蛋白质的化学位移容易受到 原子核局部磁环境影响,导致其化学位移包含多种 信息 (二级结构单元、侧链构象、氢键、动力学、 溶剂化作用等)[78] 。为了更加准确地获得蛋白质二 级结构的单一信息,建立了化学位移标志识别法 (chemical shift index,CSI),即根据其数据库建立 各种氨基酸自旋系统中15N、13C和1 H的化学位移标 志参考值,用于解析蛋白质的二级结构单元[79-80] 。 相关软件主要有NMRPipe[81] ,在线分析服务器主 要 为 TALOS+ Web Server (https://spin. niddk. nih. gov/bax/nmrserver/talos/) 和 CSI 2.0 Web Server (http://csi.wishartlab.com/)[65,82] 。 2.4 蛋白质的三维结构解析 2.4.1 核磁共振波谱法解析蛋白质三维结构 在蛋白质氨基酸序列和二级结构单元的解析基 础上,通过 NMR 实验进一步测定结构约束参数 (包括原子间空间距离、化学键空间取向等),结构 计算软件计算蛋白质三维结构并评估其可靠性和准 确性。NOE和PRE实验可获得原子空间距离约束 参数,化学键空间取向则通过 RDC 实验来获 取(图2)。 a. NOE NOE 信号强度与两个偶极相互作用的质子之 间距离(rH-H,1.8~5 Å)的六次方成反比[83] 。在蛋 白质三维结构研究中,主要根据 NOESY 谱图的 NOE 信号强度获得短程距离的质子间距离约束参 数 (图2a)。蛋白质三维结构解析的准确性依赖于 NOE 信号的获取数量和正确归属。然而,伴随着 蛋白质分子质量的增加,NOESY谱易出现信号峰 简并和重叠严重的问题。近期出现的异核多维 NOESY技术,即根据与1 H键合的异核(13C或15N) 化学位移来分辨NOE交叉信号峰,能够通过增加 维度的方式来减小信号峰简并和重叠的问题。对于 分子质量较小的蛋白质 (< 30 ku),常用2D 1 H-1 H NOESY、 3D 15N/13C-edited-NOESY、 3D 13C( 15N)/