深势科技 Uni-FEP: 兼顾 CADD 专家及药物化学的先导化合物优化需求

FEP 是什么？对小分子的药物设计有什么帮助？FEP 适合 fast-follow/first-in-class 的项目么？

在回答这些问题以前，我们先来纠正一个很多人会犯的一个错误：

CADD（计算机辅助药物设计）里的分子对接（docking）是药物设计人员最常使用的功能。据我所知，有不少人会将计算结果的打分值（Scoring）作为分子好坏的标准。

下图来源于薛定谔公司 Dr. Jenny Chambers 的《Introduction to Structure-Based Drug Design》。图里说的很清楚，对接的打分结果和活性（IC50，Kd，EC50）无关，也不能用来对分子的好坏进行排序，仅能作为富集分子的工具。

Docking 因为其打分函数不准确以及采样不足限制了这种方法的精度。有其他的 CADD 工具可以实现么？可以比较准确的预测化合物的活性（结合自由能）？比如基于分子动力学的 MM/PB(GB)SA？

浙江大学药学院的侯廷军教授在这一领域研究多年，在最新的 Review 中（Chem. Rev. 2019, 119, 16, 9478–9508），侯教授认为 MM/PB(GB)SA 在小分子药物研发中的作用主要有两类：①基于对接的虚拟筛选后的再评估②精确分析小分子-蛋白质的相互作用。

关于 MM/PB(GB)SA 的预测精度，文章中是这么说的：

"However, they cannot serve as a basis for developing more accurate methods and predict true drug candidates in drug design without experimental verification because of their relatively limited accuracy (compared with FEP and TI)."

这也和其他业内专家的观点一致，「对于 MM/PB(GB)SA 的预测能力是不做预期的」

那 FEP 和 TI 又是什么呢？

FEP：Free energy perturbation（自由能微扰）

TI：Thermodynamic integration（热力学积分）

FEP、TI 以及 MM/PB(GB)SA 都是常用的自由能计算方法，关于 FEP/TI【自由能专题 1：原理与方法】文章中是这样介绍的：

自由能微扰法：Free Energy Perturbation (FEP) 和热力学积分法：Thermodynamic Integration (TI)。这类方法从原理上来讲比较严格，计算结果也较为准确，但需要长时间的数据采集，对计算体系有严格的限制，只能适合较为简单，而且这类方法一般只能计算两个配体之间相对结合自由能，因此在以往的药物设计中的应用受到了很大的限制, 但是得益于近些年计算机性能的迅猛发展，由于这类方法计算的准确度高，已成为药物设计中的研究自由能的主流方法。

而两者又有一定的差别：TI 是对 FEP 的模拟数据的另一种分析方法，分子动力学模拟的轨迹和能量数据，经过 FEP 或 TI 分析，计算出过程的自由能变。而 TI 的缺陷在于，其原理上难以分析通过 REST2 等增强采样方法获得的数据，因此限制了在结合模式复杂、口袋柔性大的复合物等场景的应用。TI 暂且不表。

FEP 的理论基础最早可以回溯到 1930 年代的 Peierls 的工作（Eur. Phys. J. A 1933, 80, 763−791），1954 年，美国马里兰大学的理论物理学家和化学家 Robert Zwanzig 推导出了 FEP 的主方程：

自由能微扰（FEP）方法直到 1980 年代才引起计算机辅助药物设计（CADD）领域的关注：1986 年，休斯顿大学的 J. Andrew McCammon 发表了题为「Dynamics and Design of Enzymes and Inhibitors」的文章（J. Am. Chem. Soc. 1986, 108, 13, 3830–3832），这代表着 FEP 方法在 CADD 领域首次应用。1989 年，加州大学旧金山分校的 Peter Kollman 教授首次进行了 FEP 的前瞻性研究，对三肽类嗜热菌蛋白酶抑制剂的活性进行了预测（J. Am. Chem. Soc. 1989, 111, 15, 5649–5658）。

解释下：关于 FEP 的回顾性研究（Retrospective study）和前瞻性研究（Prospective study）区别：回顾性研究是先有实验数据，后再进行 FEP 计算，是一种验证性的工作；前瞻性研究是先有 FEP 计算，后再进行实验验证，是一种预测性的工作。

随后，FEP 方法在学术界得到了进一步的应用，比如耶鲁大学 William L. Jorgensen 教授在 20 世纪初开始，发表了多篇运用 FEP 方法辅助 Xa 因子抑制剂/非核苷类 HIV-1 逆转录酶抑制剂研发的文章。

不过，受制于力场的准确性、采样算法的效率以及算力，一直没有在制药工业界获得广泛的运用。随着力场、采样算法、算力等方面的发展，薛定谔公司在 2014 年发布了商业化 FEP 计算工具 FEP+。

随后薛定谔公司在 2015 年的 JACS 上发表了关于 FEP 计算预测亲和力的重磅文章（J. Am. Chem. Soc. 2015, 137, 2695−2703），他们针对 8 个靶点/199 个小分子配体的亲和力进行了预测，并且和实验值进行比较，达到了非常高的相关性。下图的虚线代表 1.0 kcal/mol 的误差，折算下来是 5-10 倍的 IC50 活性差距：这意味着 FEP 最终实现了药物设计人员梦寐以求的、化学精度的预测。

同时，文章中也对比了对接打分（Glide SP）和 MM-GBSA 预测的相关性，结果显而易见。

再解释下：或许很多人会疑惑结合自由能和活性（Ki，Kd，IC50）到底啥关系？【CADD | 自由能微扰简介】这篇文章给出了详细的解释，由于公式太过复杂，仅截取部分内容，有兴趣的阅读全文哈。

关于自由能提升（kcal/mol）和活性改善相关性的详细计算过程见图，来源，B 站：

随着薛定谔上述文章的发表，可被工业界应用的 FEP 技术引起了各大制药公司的兴趣，2016 年的 5 月和 8 月，各大制药公司进行了多次的 FEP 研讨会，并将讨论的内容和结论发表在期刊上（J Comput Aided Mol Des,2016, 30, 1139–1141）。

上述的制药公司包括：默克/辉瑞/安进/拜耳/强生/诺华/BMS/GSK/福泰

各大 BigPharma 不仅仅是感兴趣，发现真的好用，可以加速研发之后，也逐渐将 FEP 作为重要的新药研发工具，并发表了多篇有影响力的期刊文章。

比如，辉瑞的科学家利用 FEP 技术对 17 个不同五并六元杂环骨架的 SYK 抑制剂进行预测，并通过实验得到验证，得到了细胞活性提高 10 倍的化合物（ChemMedChem 2016, 11, 217 – 233）。

罗氏的科学家在 JMC 上发表了一篇很有意思的文章（J. Med. Chem. 2017, 60, 6, 2485–2497）。为了探索组织蛋白酶 L 的 S2 口袋，依据不同的伯胺共构建了 3325 个分子的化合物库。利用四种方法进行筛选，分别是①FEP 计算（FEP+），②药物化学家基于之前 SAR 进行的挑选（MC，Med Chem），③专家通过结合模式以及相互作用的分析，进行人工挑选（MM，SBDD），④基于 MAB 力场优化的对接来预测的分子结合模式，再经过人工挑选（DOMF，Docking）。

经过实验测试之后的结果，下图更直观。和 reference 化合物相比，FEP 筛选出来的化合物实验结果更好，10 个化合物有 8 个超过 reference，远远超过其他三种方法。

强生的科学家在进行 PDE2A 抑制剂开发的 hit-to-lead 阶段，利用 FEP 预测了 265 个设计的分子，并最终合成了 100 个化合物，经过生物测试评估，得到了高活性、高选择性、高 BBB 渗透、in vivo 验证的先导化合物 46（J. Med. Chem. 2020, 63, 21, 12887–12910）。

文章中，也对比了 FEP 和 docking 的效果，直接搬运下：

"FEP correctly identified 90% (9 out of 10) of the 10 most active amongst its best ranked 10, compared to 20% (2 out of 10) from docking."

阿斯利康的科学家在 EED 抑制剂的后期优化阶段，利用 FEP 对苯并二氢呋喃环上 7 位的 R 取代基（下图）进行了预测，并通过实验验证，得到了理化性质/细胞活性提高的化合物（Bioorg. Med. Chem. Lett. 39 (2021) 127904）。

默克的科学家最近发表了非常重要的利用 FEP 加速研发的回顾性文章（J. Chem. Inf. Model. 2020, 60, 11, 5457–5474）。详细的介绍参见【自由能方法及应用（二）结合自由能计算在默克药物研发实践中的大规模前瞻性评估】。这里直接搬运一下部分内容：

「从 2016 年到 2019 年，作者前瞻性地将 FEP+应用于12个靶点和23个化合物系列，进行了超过 35,000 个独立扰动计算。最终，作者获得了6,000多个化学实体的有效预测，合成和测试了400多个预测得到的新颖分子，产生了大量的前瞻性数据，提供了该方法在典型小分子药物发现的实际流程中准确性的详细评估。」

拜耳在 2014 年底就在内部的研发中部署了 FEP+，截止 2016 年的数据，已有80%的项目、多达16个靶点使用了 FEP，40%的化学家会经常使用 FEP 计算（2016 Workshop on Free Energy Methods in Drug Design）。

葛兰素史克的科学家同样在 2016 年的 workshop 上披露了内部使用 FEP 的情况。超过 800 个化合物进行了 FEP 计算，下图左则是 8 个项目 251 个化合物实验值/预测值拟合的情况，可以看到大部分化合物的预测还是相当准确的（2016 Workshop on Free Energy Methods in Drug Design）。

优时比（UCB BioPharma）的 Zara Sands 博士在 European Alchemical Free Energy Workshop 2019 会议上介绍了优时比内部使用 FEP 的经验和具体案例。

各大 BigPharma 已经广泛的、深入的使用 FEP 功能，FEP 计算也已成为药物研发必备工具之一了；那众多的 Biotech 公司呢？

薛定谔就不用说了吧，作为最早推出商用化 FEP 工具「FEP+」的 Biotech，不仅发表了大量的高水平的 FEP 文章，加速了自由能计算领域的发展；并且在新药项目中，早已把 FEP+运用的炉火纯青，并且陆续开发了诸如 protein FEP，AL-FEP 等研发利器。

很多 Biotech 公司（Nimbus、Agios、硕迪生物 etc）或者 BigPharma（礼来、赛诺菲）和薛定谔合作的项目中，也借助了薛定谔的 FEP+等计算工具。

RAPT Therapeutics的科学家在 FEP 的帮助下，得到了高体外/体内活性的 USP7 抑制剂（J. Med. Chem. 2020, 63, 5398−5420）。

Blueprint Medicines的 Aysegul Ozen 博士在 Free Energy Workshop 2020 上介绍使用 FEP 和 protein FEP 加速激酶抑制剂研发的具体案例，建议去 Youtube 上找来看看，非常棒的分享（Youtube 搜索 Aysegul Ozen）。

此外，Aysegul Ozen 还介绍了他们验证和部署 FEP 的情况，目前已经在内部 5 个项目中成功应用了 FEP。

Silicon Therapeutics在 STING 抑制剂研发过程中，从近 2 万个分子中，经过相对自由能计算（FEP）预测，最终挑选了 200 个分子进行合成，并最终获得了临床候选分子 SNX281（Youtube，Physics-Driven Discovery of SNX281）；SNX281 正在进行和 K 药联用的抗肿瘤一期临床研究。

Relay therapeutics则把自由能计算（FEP）作为 Dynamo™平台中 Physics-based simulations 的重要组成模块。

那 FEP 到底能做什么？

自由能微扰（Free Energy Perturbation,FEP）计算可用来预测同系物的相对结合自由能变化。在 FEP 计算中，分子通过非物理（「炼金术」）途径逐渐转变为结构上密切相关的类似物。通过对这些互相转化的终态之间的自由能差（ΔΔG）的计算评估，可以获得与实验值相比约 1kcal/mol 的预测精度。下图即为相对自由能计算的热力学循环图，也是 FEP 计算重要的基本原理。

FEP 的典型应用场景有哪些？这里借用下薛定谔公司的 Presentation。

简单说，就两类：①提升化合物的活性；②保持化合物活性的基础上优化其他成药性质。

所以，回到文章开始的问题，fast-follow/first-in-class 的项目是非常适合用 FEP 的。

FEP 算的到底准不准呢？

虽然已经有众多公司在使用 FEP 加速新药研发了，但是我想很多人看到这里最大的疑问还是 FEP 算的准不准？

首先，FEP 已是业界公认的精度最高的计算结合自由能的方法，换句话说，就是目前预测活性最准的方法了，已经有非常多的研究文献确证了这一点。

其次，FEP 计算的精度受多种因素影响。

例如：强生的科学家在用 FEP 指导优化 BACE1 抑制剂的过程中，发现 FEP 预测的准确度和 MD 的模拟时长（1ns~20ns；2ns~40ns）密切相关（J. Chem. Theory Comput. 2017, 13, 1439−1453 / J. Chem. Inf. Model. 2016, 56, 9, 1856–1871）。

例如：强生的科学家们在开发脂肪酸酰胺水解酶（FAAH）抑制剂的过程中，发现了一个有趣的现象（J. Chem. Theory Comput. 2018, 14, 5815−5822）。抑制剂左右两边片段（下图虚线方框）用 FEP 预测的准确性是不一样的，左边共 32 个化合物，相关系数 0.79；右边共 16 个化合物，相关系数只有 0.02。

例如：强生（对，还是强生）的科学家在优化 PDE2 抑制剂的过程中，发现苯环/吡啶环上的取代基大小会影响蛋白质中 Leu770 的朝向和水分子的有无（下图），而晶体复合物中的这种细微差别对 FEP 计算的预测准确性有非常大的影响（Sci Rep. 2018 20;8(1):4883.）。

例如：力场的影响（Free Energy Workshop 2016）：

例如：复合物的影响（Alchemical Free Energy Workshop 2019）：

更多的影响因素讨论，建议精读上文提到的默克的科学家发表的利用 FEP 加速研发的回顾性文章（J. Chem. Inf. Model. 2020, 60, 11, 5457–5474）。

借业内专家的观点总结一下，影响 FEP 计算精度的因素有很多，主要可以分为 2 个方面的因素：

①算法和程序方面的因素：力场参数的准确性，采样算法的效率，perturbation scale 的设计，⼀些极端情况下的特殊算法稳定性，模拟时长等。

②使用者经验方面的因素：复合物初始结构的准确性，Ligands 变化的幅度，Ligands Alignment 和 Atom Mapping 的合理性检查，Perturbed Network 的设计等。

关于算的准不准，再放张默克的图吧（Workshop on Free Energy 2018）。图片里的曲线是 Gartner 技术成熟度曲线，也可以说是关于认知的达克效应曲线。默克使用 FEP 两年之后的 summary 可以这样解读：

Technology Trigger - 技术启蒙 -- 原来 FEP 代表的是这个意思，可以这样用~

Peak of Inflated Expectations - 期望膨胀之巅 --牛 X，最准的计算方法

Trough of Disillusionment - 质疑、绝望之谷 -- 在我的项目上预测的根本不准啊，是不是骗人的啊~

Slope of Enlightenment - 开悟之坡 -- 原来应该这样用，要这样设置；果然，算的很准~

Plateau of productivity - 加速研发 -- 所有合适的项目分子合成前，先用 FEP 算一把；开搞~

总之，FEP 是个非常好的工具，但是也需要学习、实践如何去用好它，发挥它的最大价值。

看到这里，也许你想试试 FEP，那如何开始 FEP 计算呢？

（这里指前瞻性计算，理想情况下最好先做下回顾性计算）

简单的说，你需要准备

1. 含有小分子的某靶点共晶复合物（最好有，或经过专家复核的高精度对接结果）。

2. 基于共晶复合物中小分子而设计的、结构类似的新分子

然后就需要一款可以进行 FEP 计算的专业软件了，比如，商业化的软件：薛定谔的 FEP+、Cresset 的 Flare V3；或者开源软件，比如分子动力学模拟软件 Gromacs。

再或者，你也许可以考虑下深势科技的 Uni-FEP

Uni-FEP 能够能够兼顾 CADD 专家及药物化学的先导化合物优化需求，提供：

1. 一站式自动化的蛋白准备、配体准备、计算力场参数、分配电荷、弛豫与平衡体系的全自动工作流的端对端服务，最小化用户工作；

2. 更精确且适配的分子力场

3. 多种配体对齐方式

4. 自动生成微扰图，且微扰图可自定义修改；

5. REST2 增强采样，提高精度与效率；

6. 基于 MBAR 统计方法计算相对结合自由能

7. 计算结果的多种可视化、交互式分析

8. 可扩展的计算资源

9. 相比 FEP+，更高的性价比；

10. 与 Hermite 其他功能组成完整的从靶点结构到苗头化合物筛选，再到先导化合物优化的整体解决方案；

11. 完善的售后服务及专家交流群

简而言之，Uni-FEP作为为国内最早公开发布测试的 FEP 计算模块（可能也是国内既「看」的到，也用的到、屈指可数的 FEP 产品），深势科技团队在算法设计、动力学引擎等方面储备大量的研发经验，尤其在前面提到的影响 FEP 计算精度的力场和采样方面形成了比较显著的技术壁垒，同时深势科技的产品团队对计算流程中大量的指令操作充分优化，开发了易用简洁的可视化界面，使其真正具备了「工业级」的工具能力。

国内已经有多家企业开始使用 Uni-FEP：翰森、恩华、泓博、加科思，更多的合作企业即将披露~

来源：中企经济网

最新文章