化合物。这些生物大分子结构的解析,包括一级结构(序列)和高级结构(空间结构)的解 析,是一项十分艰巨的工作。现在有十万余种蛋白质的一级结构已测得,其中近万种三维结 构已获得,并达到高分辨率。人类所有基因的DNA序列测定已完成。生物大分子的序列测 定和空间结构的测定或模建都离不开计算机的辅助。比如在蛋白质测序中,用二维聚丙烯酰 胺凝胶电泳技术,将蛋白质经过二次垂直方向上的分离,其结果可能为一拥有近千个蛋白点 的电泳图。根据氨基酸分析鉴定,用计算机软件进行图像分析和数据处理,以此结果上网查 询蛋白质数据库或与之对应的基因库,分析与已知的结构是否匹配,确定出是否为一新的蛋 白质。利用计算机的计算、图形显示等功能,可以模拟出分子的三维结构 1.7计算机辅助合成路线设计 药物研究与开发的重要一环是药物的合成。合成路线的设计,可以凭合成化学家的经验 并参考文献方法,也可以从已知知识中找出共同规律,类比推断出合成路线。利用计算机辅 助设计(CAD)技术进行有机合成设计自20世纪60年代后期以来日益得到重视,其理论与 实践日臻完善。基于已知合成路线的检索型设计是用合成反应管理软件把文献中已积累的大 量有机合成路线存人计算机,同时将可供选择使用的原料信息也存储起来,制成合成反应数 据库。只要研究人员提出欲合成的化合物,计算机就可以根据特定的要求去选择最佳的合成 路线。在人工智能技术的辅助下,基于反应规律的推理型设计还可推断出数据库中所没有的 新的合成路线。 1.8化学制药过程 一般的药品开发都要经过实验室小试、中试,再到工业大规模生产这几个过程。利用计 算机模拟技术,可以绕过小试和中试这两个阶段,直接进行一次放大。这项技术根据实验室 所做的化学反应实验结果和工业生产中的各种经验及规律,提出合理的数学模型,通过计算 机模拟工业生产,获得大规模工业生产设计所需要的各种数据,缩短药物开发生产的时间 现已出现了用计算机和机器人控制的自动化制药工厂,药物在密闭的空间生产,使药物生产 污染少、品质优、效率高 1.9数据源的共享、国际联检与计算机网络通讯 随着药学科学的飞速发展和与其他相关学科的相互渗透,文献数量剧增,人工检索已难 于适应要求。借助计算机检索服务,可以在几分钟内完成一个课题的全面检索工作,大大节 省科研人员查找资料的时间。世界各科技强国都致力于发展计算机检索系统,并进行国际性 大协作,把科学技术情报作为世界各国共享的财富。 使用计算机可进行定期情报检索,根据用户预定的主题词定期从现刊中检索出有关情 报,跟踪同类专题的动态和进展;也可进行追溯检索,普查一定时段内的情报资料,全面系 统了解有关课题的信息;还可进行国际联机检索,解决某些课题检索的急需,有着较高的时 效性。国际联检系统终端往往通过电话线或通讯网络与多个世界联机系统相联,可多达几百个 数据库,具有极大的信息量,数据库更新周期又较短。缺点是上机操作复杂,检索费用高 DIALOG是目前世界上最大的国际联检系统,从1963年开始建造,1972年正式使用 存储专业面很广,包括自然科学和社会科学各个领域,其中与药物设计有关的有CA SEARCH等数据库。据统计,在国内已开通十多个国际联检系统, DIALOG使用最多,占
总机时的80%以上,其中的 CA SEARCH是使用最多的数据库,又占了80%以上。CA SEARCH数摆库的信息来源于世界上化学文献收藏最全的美国化学文摘( Chemical Ab stract,CA),使用 CA SEARCH,可以进行特定化学物质制备与生产的文献检索,也可以 进行新合成化合物的查新 美国科学情报研究所出版的科学引文索引( Science citation index,sCI)除手册外还有 光盘版和联机检索,联机检索可快捷方便地检索到1周前的收录,时效性极强。 20世纪80年代,以美国化学文摘社(CAS)为主,由德国专业信息中心(FIZ)和日 本科技信息中心( JICST)加盟,成立了国际科技信息检索网( Scientific and Technical In- formation Network, STN international),提供了多学科数据库的联检。如由1000多万个记 录组成的主题CA数据库 CA File;收载1967年以前老文献的 CAOLD File;有着1700多万 个CA登录号的各种化学物质登录号数据库 REGISTRY;反应数据库 CASREACT和专利 数据库 MARPAT;英国 Derwent药物数据库DDFB/ DRUGB(收载1964年至1982年)和 DDFU/ DRUGU(收载1983年以后);新药物产品数据库 DRUGLAUCH(1982年以后)。 以全球性计算机信息网络 Internet为主要标志的信息高速公路工程的实施,打破了时空 界限,使不同国家和地区的研究工作者通过 Internet网络及时交流和互换所需的各种信息, 从根本上解决了信息交换和资源共享的问题。 Internet和信息资源具有动态性,内容新而 全。 Internet的服务器主要有文件传送协议( (file transfer protocol,ftp),fp允许用户登录 到计算机上,套录各种资源; Gopher服务器是191年开始运行的一种信息检索工具; www服务器( World Wide Web,万维网),是一种基于超文本方式的信息检索工具,除 浏览传统的文件信息外,还可以显示与文本内容相关的图像、影视和声音。 Internet用户定 期访问某一专题的wwW服务器或 Gopher服务器,就可以了解到这一领域的最新动态。通 信讨论组( mailing list)是 Internet提供的又一服务,用户参加特定的通信讨论组有助于了 解许多信息,与同行共同讨论感兴趣的问题,相当于参加一次真正的专业学术会议。有些国 际会议也可进行 Internet的实况转播。电子邮件(emai)服务是 Internet最常用的一项功 能,是同国内外建立联系与广泛交流的快速、有效、经济的工具。 Internet的远程登录 elne)允许用户将本地计算机连接到远方的主机上,作为终端使用远方主机,比如信息 检索,或利用计算机辅助药物设计工作站上的软、硬件资源运算自已的程序。一些专业杂志 还在网上开创了网络杂志,如 Science Online,比传统的印刷媒体发表周期更短,影响范围 更广,查阅和链接更方便,交流手段更新。 药物设计工作者可以从 Internet上检索到化学信息学、生物信息学及药学资料和数据。 比如, Protein Data Bank是可通过 Gopher服务器、WWW或ftp访问的美国布鲁克海文 ( Brookhaven)国家实验室蛋白质数据库; Nucleic Acid Database为美国 Rutgers大学的核酸 晶体结构数据库,可通过 e-mail: ftp、 Gopher和WWW访问该库; X Mol Information为 在WWW服务器环境下显示分子三维模型的程序; NIH Molecular Modeling Home Page是 由美国国立卫生研究所(NIH)提供的关于分子模型技术方面的信息; Journal of molecular modeling是可通过WWw浏览的电子出版物,它能快速出版分子模型技术领域的研究论 文; UTMB NMR Center提供Www环境下各种有关核磁共振的信息; wWW Virtual li-- brary: Crystallography为wwW虚拟图书馆的晶体学主页。通过 nternet还可以参加某 专题领域的通信讨论组,如 CHEM-COMP( Computational Chemistry List)为计算化学讨 论组; CHEM-MOD( Modeling in Chemistry)为化学模型技术讨论组; Pharmacy Mail Ex
hange为药学讨论组; STR-NMR( Structural NMr)为结构核磁共振讨论组。在 Internet 上也能进行各种各样的联机检索,比如前述的 DIALOG系统、STN系统和SCI等网上检 索。这些信息的获取与交流,对于跟踪世界最新动态,进行高水平的药物设计研究是不可或 1.10药物筛选自动化 化合物的广泛药理筛选是发现新药的传统方法和有效途径。可供筛选的化合物来源相当 广泛,包括合成化合物、天然提取物、微生物发酵液以及通过组合化学技术获得的化合物 这些化合物的数量极大,为避免漏筛某方面的活性,一般还要经过几十种药理模型的筛选, 由计算机和机器人组成的筛选系统可以高速、高效和大规模地、自动地筛选样品。目前, 10μg的化合物已足以供几十种药理模型筛选,而且每天可筛选多达上万个化合物,从而提 供有研究与开发价值的先导化合物。 1.11计算机化学 药学是一门基于化学和生命科学上的学科。现代化学早已突破了传统化学的研究范围 与其他学科结合形成了众多边缘学科。这些新产生的边缘学科往往成为化学发展的前沿,为 现代药学科学的突飞猛进提供了坚实的理论基础。比如化学与数学及计算机科学的结合,产 生了计算机化学,用计算机来快速处理化学中的复杂、繁琐的数学计算。量子化学、分子力 学、分子动力学、分子模拟和分子图形学、计算机辅助合成设计和计算机辅助药物设计均属 计算机化学( computer chemistry)的研究领域。计算机化学另有一个类似的名词——计算 化学( computational chemistry),常指需大量计算的化学分支学科的集成,如量子化学、 NMR计算等。分子图形学、计算机辅助药物设计等实用方法和技术是在计算化学的基础上 衍生出来的。 量子化学是运用量子力学来处理化学问题。量子力学理论应用到具体的化学体系时,要 涉及到对分子(多电子体系)的复杂计算,必须借助计算机。量子力学是研究分子结构和性 质的最重要的方法,实验中常常用量子力学方法计算得到分子力学和分子动力学参数,甚至 计算机分子图形学也要用到此计算,再从量子力学结果中分析并建立分子模型。而分子力 学、分子动力学和计算机图形学又是计算机辅助药物设计的基础。第4章中将较详细地介绍 这些知识。 1.12组合化学 组合化学( combinatorial chemistry)是一项综合化学、生物学、组合数学、计算机信 息处理技术、机器人技术、测试技术等多项理论和技术的新型技术。利用组合化学能在短时 间内合成数目惊人的化合物,经过高效生物活性筛选,从中发现一批具有活性和开发前景的 药物前体。它是新药研究的一项崭新的技术。组合化学技术涉及两大方面,即组合化学合成 和群集筛选。计算机辅助下的组合化学研究主要包括设计及合理分组组合构建块、自动合 成、设计及分组组合化学库、自动筛选以及数据处理、统计、分析等信息管理。 1.13蛋白质工程 人们在研究蛋白质结构与功能关系时,希望通过改变天然蛋白质结构,创造出与天然蛋
白质有所不同的符合人们特定需要的非天然的蛋白质,从而提高蛋白质对热、pH、水解或 氧化的稳定性,或改进生物活性,或降低毒性,或制成具有生物靶向作用的蛋白质类或多肽 药物。蛋白质工程是在蛋白质空间结构和结构与功能研究的基础上,借助计算机计算功能、 图形显示功能和辅助设计功能,确定某一蛋白质分子的改造。按设计方案,或进行局部的定 位突变或化学修饰;或对不同蛋白质中不同功能的区段作分子裁剪与拼接;或作全新蛋白质 设计( de novo protein design),从头设计出具有所需功能的非天然蛋白质,通过DNA重组 技术手段,克隆并表达出杂合蛋白质,获得新的蛋白质分子。蛋白质工程融合了遗传工程、 蛋白质化学、蛋白质晶体学和计算机技术,它为合理药物设计提供了源泉和前提,而合理药 物设计又拓宽了蛋白质工程的研究范围。 1.14计算机辅助药物设计 计算机辅助药物设计即利用计算机的计算、逻辑判断、图形显示等功能进行药物设计。 设计中许多繁重的工作,如计算、数据的存储和处理、显示、预测等,均由计算机来完成。 如果没有计算机,仅靠人脑是不可能完成以上工作的 随着计算机科学的进步,以及数学、化学、物理学、生物化学、药物化学、分子生物学 和结构生物学等基础学科的发展,利用量子化学、分子力学、分子动力学计算,以及用计算 机图形学、数据库技术、人工智能技术进行药物分子设计的研究在不断地发展、丰富和完 善,从而推动药物设计理论和技术的不断发展。药物结构及其活性关系的研究已由以往的二 维平面分析上升到如今的三维空间研究,开辟了药物研究的新天地。根据理论计算数据和物 理化学测定数据,使用计算机分子图形模拟功能,可以展示已知三维结构的生物大分子,显 示模拟药物与受体间契合情况,并计算相互作用的能量变化,研究药物分子的药效构象、诱 导契合和与受体作用的动态过程,设计出新的药物分子;还可以预测仅知一级结构的生物大 分子的三维结构,进而反推出作用于该生物大分子的药物应有的结构式和空间结构;还能根 据一系列同类药物的结构活性数据,抽提出药物作用的基本结构,间接地设计出新的药物分 子;此外,还可进一步优化药物的分子结构,增加药物与受体之间的作用强度,或提髙药物 的生物利用度。它不仅能够大大减少寻找新药的盲目性和偶然性,也能为药物学家提供理论 思维形象化的表达,是药物设计强有力且方便、直观的手段。 概括地说,下列药物设计过程离不开计算机的辅助: ◇化学和生物信息处理 ◇药效基团生成 ◇计算化学计算 ◇药物作用模型 ◇化学计量学处理 ◇药理活性预测 ◇组合化学 ◇二维和三维构效分析 ◇分子模型化 ◇合成数据库设计 ◇全新药物设计 计算机辅助药物设计从20多年前的初始阶段发展到现在,已形成了一门新兴学科,显 示出了强大的威力,大大地提高了药物设计水平,并且趋于定向化和合理化,为加速药物设 计开辟了广阔的前景。后续内容将着重介绍计算机辅助药物设计的理论基础、有关技术、研 究方法和应用
如果一个人掌握了他的学科的基础理论,并且学会了独 立地思考和工作,他必定会找到他自己的道路。而且,比起 那种主要以获得细节知识为其培训内容的人来,他一定会更 好地适应进步和变化 爱因斯坦【德裔美籍物理学家】 2药物设计的基本概念和理论基础 新药的设计和发现一直是药物化学( medicinal chemistry)的核心内容。药物化学原属 有机化学的一个分支学科,与生命科学密切相关,它是研究药物设计、发现和合成药物、阐 述药物化学性质、探讨药物与生物体相互作用规律的综合性、交叉性学科 有目的的合理的药物设计方法是基于对药物作用本质的认识。本章简要介绍与药物相互 作用的生物大分子的基本类型与基本概念,药物作用的方式与本质。此外还将介绍药物设计 从构效关系研究到定量构效关系研究,再到现在的三维定量构效关系研究的发展过程、方法 和作用,以及药物设计研究中常用的数据处理方法。 2.1药物的化学结构 作为人类防治疾病,维护自身健康,保持世代生生不息的药物,其结构千变万化,有着 丰富的化学多样性。但大部分药物是由碳、氢、氧、氮等原子组成的有机化合物,有的药物 还含有硫、磷、氯、溴、氟等元素。大部分药物分子具有中等的分子量(约150~500),中 等的脂水分配系数,并有常见的活性官能团取代,如醇羟基、酚羟基、氨基、胍基、脒基、 卤素、羧基、氰基、硝基、酰氨基、咪唑基、吲哚基和吡啶基等。 在有机化合物中,原子与原子之间通过共价键互相连接形成分子,原子之间形成共价键 将使体系能量降低。凡形成一个新键或打断一个旧键所释放或所吸收的能量称为键能 ( bond energy),键能越大,意味着形成的键越稳定。常见的共价键键能见表2-1。 表2-1共价键键能/(kJ/mol) 共价键类型键能共价键类烈键能共价键类键能共价键类型键能 CN H-S C→F 501 CBr