[Pharmaceuticals] Computer-Aided Drug Design and Drug Discovery:A Prospective Analysis¶
基于结构的药物设计(Structure-Based Drug Design, SBDD)¶
SBDD 利用生物靶标的三维结构信息,旨在理解潜在药物如何嵌合并与其相互作用。
流程: 1. Virtual Screening → 虚拟筛选 2. Structure-based Pharmacophore → 基于结构的药效团 3. Docking & Dynamic Simulations → 分子对接与动力学模拟 4. De novo design → 从头设计
基于配体的药物设计(Ligand-Based Drug Design, LBDD)¶
LBDD 不要求已知靶标结构,而是侧重于已知药物分子及其药理学特征,用以设计新的候选药物。
流程: 1. Ligand-based Pharmacophore → 基于配体的药效团 2. 2D Similarity & 3D QSAR → 二维相似性与三维QSAR(定量构效关系) 3. Scaffold Hopping → 骨架跃迁 4. ADMET Prediction → ADMET预测
Lipinski 五规则¶
在 CADD 中,遵循 Lipinski 五规则 对获得良好的口服成药性至关重要,即理想化合物应尽量减少对分子量、脂溶性、氢键供体和氢键受体等标准的违反。
分子建模(Molecular Modeling)¶
构建分子结构的三维模型,尤其是蛋白质和配体的三维模型。
| 方法 | 程序 |
|---|---|
| 同源建模/比较建模:以同源蛋白已通过实验确认的结构为指导,构建目标蛋白的三维模型。 | MODELLER, SWISS-MODEL, Phyre2, RaptorX, I-TASSER |
| 从头建模(Ab Initio Modeling):不使用实验数据,通过采样蛋白构象空间构建目标蛋白三维模型。 | Rosetta, QUARK, AlphaFold, ESMFold, PCONS5 |
| 穿线法(Threading):将目标蛋白序列与已知结构蛋白序列比对,从而建立三维模型。 | MUSTER, 3D-PSSM, LOMETS, HHpred |
| 混合建模(Hybrid Modeling):结合两种或多种建模方法,提高预测结构准确性。 | CABS-flex, PrimeX, GalaxyHomomer |
| 分子动力学:使用经典力学或量子力学模拟蛋白随时间的行为。 | GROMACS, NAMD, CHARMM |
| 基于知识的方法:利用现有的蛋白结构和功能知识预测目标蛋白结构。 | ProSMoS, ProQ3D, I-TASSER-2GO |
| 无模板方法:不使用模板或同源蛋白构建目标蛋白三维模型。 | CONFOLD2, MetaPSICOV, TrRosetta |
| 片段组装方法:通过组装已知蛋白结构片段建立目标蛋白三维模型。 | PEP-FOLD3, Robetta, QUARK |
分子对接与虚拟筛选(Docking and Virtual Screening)¶
分子对接是预测药物分子与靶蛋白结合时取向与位置的过程。它估计药物与靶标之间的结合亲和力,而这在药物设计中至关重要。
定量构效关系(QSAR)¶
QSAR 建模研究分子化学结构与其生物活性之间的关系。通过统计方法,QSAR 模型可以根据新化合物的结构属性预测其药理活性,从而使化学家能够有依据地修改分子结构,以增强药效或减少副作用。
药效团建模(Pharmacophore Modeling)¶
药效团是分子中实现其药理活性所必需关键特征的空间排列。药效团建模是现代药物发现的重要组成部分,其核心在于识别对分子药理活性至关重要的关键分子特征的空间布局。
药物代谢与药代动力学预测(DMPK)¶
药物代谢稳定性、溶解性以及在体内的分布方式(药代动力学)发挥着关键作用。CADD 提供的工具可以预测化合物的 DMPK 性质,使研究人员能够预见并解决与药物代谢、生物利用度及潜在药物-药物相互作用相关的问题。
从头药物设计(De Novo Drug Design)¶
与通过修饰现有分子的方法不同,从头药物设计是从零开始创造全新的药物分子。这项技术利用计算算法生成符合特定标准的新分子结构,为大量新型候选药物打开了大门
机器学习¶
药物-药物相互作用预测¶
药物发现中的一项挑战,是理解新药可能如何与患者正在服用的其他药物发生相互作用。机器学习算法能够处理大量已知药物-药物相互作用数据库,从而预测新化合物可能产生的有害组合。
药物再利用(Drug Repurposing)¶
药物再利用是为现有药物寻找新的治疗用途。通过分析海量数据集,机器学习可以识别现有药物的新靶点,从而节省传统药物发现中所需的时间和成本。
药物设计中的生成对抗网络(GANs)¶
GAN 是一种人工智能形式,其中两个神经网络——生成器和判别器——协同训练。生成器创建分子结构,而判别器对其进行评估。随着训练推进,生成器会逐渐擅长创建可行且可能具有生物活性的分子结构,这些结构可在实验室中进一步合成和测试。
预测毒理学¶
候选药物在临床试验中失败的主要原因之一,是未能预见的毒性。机器学习模型能够通过分析历史药物毒性数据来预测潜在不良效应,从而在发现早期剔除潜在有毒化合物。此外,通过利用分子量、脂溶性和电子性质等描述符,QSAR 模型能够通过关联分子结构与其潜在毒性来预测毒理效应。其他描述符,如溶解性、代谢稳定性及毒性基团(toxicophores)的识别,也能提供更全面的见解,从而促进计算毒理学中的早期危害识别与实验测试优先级排序。
多组学数据的整合¶
疾病状态与药物相互作用背后的生物系统极其复杂,具有多层次调控与相互作用。要全面理解这些系统,必须分析不止一个“组学”层面——包括基因组、转录组、蛋白质组和代谢组等。
将这些多组学数据整合到 CADD 中,可确保药物发现采取更全面的方法。单一组学研究虽然提供有价值的信息,但只揭示了生物学拼图的一部分。通过结合多个组学层次的数据,研究者能够更全面地理解疾病状态、潜在药物靶点及整体细胞动态。基因组数据能够揭示疾病可能的遗传驱动因素。当其整合进 CADD 时,尤其是在某些具有明确遗传成分的疾病中,如特定癌症,可用于指导药物靶点搜索。
转录组代表细胞内所有 RNA 分子,反映当前正在被转录的基因。整合转录组数据可以揭示细胞在 mRNA 水平上对药物的可能反应,甚至提示潜在副作用或替代通路。虽然基因和转录本很重要,但蛋白质往往才是药物的直接靶标。蛋白质组数据有助于理解药物-蛋白相互作用、翻译后修饰以及潜在脱靶效应。
代谢组学,即对生物系统中小分子的研究,可提供药物代谢、其与内源性代谢物相互作用,以及药效和毒性潜在生物标志物等关键信息。除了分别研究单个组学层之外,系统生物学采取了更整合的方法。通过基于多组学数据构建相互作用网络,研究者可以预测药物可能如何影响整个通路或网络,从而对药物作用形成更系统性的理解。虽然每一个“组学”层次都能提供宝贵见解,但它们的联合使用有可能彻底改变 CADD。通过以多组学整合来拥抱生物学的复杂性,药物发现将更接近于更有效、更个体化的治疗解决方案。
将实验数据与 CADD 融合¶
分子动力学模拟可以预测分子随时间变化的行为,但 X 射线晶体学或核磁共振(NMR)等实验技术则能提供分子的“快照”,从而验证或修正这些模拟。高通量筛选、检测分析及其他实验方法产生了丰富的数据。这些数据可通过 AI 和其他 CADD 工具加以挖掘,从而发现可能被忽略的模式、关系或候选药物。随着实验结果数据库不断增长,CADD 中使用的预测模型也可得到更有效训练。这种整合不断提升 CADD 模型的准确性,使其随时间推移更加可靠。