2024-11-28 06:46来源:大智报
一种新的药物设计机器学习工具通过对分子几何结构的巧妙处理,提出了更好、更现实的药物。FragGen软件一个片段一个片段地构建分子,并为每个决策使用不同的机器学习过程,以最大限度地减少每个决策的固有缺陷。FragGen的创造者能够选择一个抗癌目标,设计一种新药,合成它,并通过实验证明它的效力。
许多药物通过与蛋白质中的特定口袋结合而起作用。与靶标结合强烈的药物往往更有效。机器学习方法应该能够学习这些目标的结构和擅长与它们结合的分子的质量之间的关系。然而,与所有分子和所有蛋白质口袋的空间相比,可用于教学模型的示例数量很少,因此药物发明的预言还不太可能。一些模型可能会提出原子在化学上不合理的排列,而另一些模型可能会提出含有许多融合芳香环的分子,这些分子在化学上是合理的,结合强烈,但不像药物,很难合成。
用碎片一块一块地构建分子,更有可能形成化学上敏感的结构。“以前基于结构的分子生成方法基本上是学习如何与分子紧密结合,通常是通过训练隐性地学习真实的、可合成的分子是什么样子,”FragGen的创造者之一、浙江大学的张奥丁(Odin Zhang)解释说。“基于构建块设计分子迫使分子生成路径是可合成的。“然而,这种方法的渐进式本质意味着每个片段放置的任何错误都会累积,因此分子可能会扭曲成装订口袋中难以置信的几何形状。”
FragGen是一种基于片段的方法,它通过非常谨慎地处理分子的几何形状来施加秩序。从一个空口袋开始,一个机器学习模型决定应该向哪个原子添加新片段;另一个片段应该是什么;另一个是它如何与目标原子结合;对于化学角和二面角等几何变量也是如此。它用一种不同的模型来解决这些小问题,这种模型已知对这种预测很好。
加拿大康考迪亚大学(Concordia University)的计算生物物理学家r
FragGen通过一系列的小决定来构建药物分子
FragGen的药物建议在效力和容易合成的一些常见理论指标上得分很高。更重要的是,它们通过了实验测试。研究人员使用FragGen设计了一种ii型激酶抑制剂。该软件在短短10分钟内就提出了97种候选物质,其中最有利的三种被发现在微摩尔和纳摩尔浓度下既可合成又有效。
为了安全起见,药物还必须对结合袋具有特异性,并且不能与其他重要蛋白质结合并影响它们。像FragGen这样的工具还不能做到这一点,但它们在发现过程中提供了一个有价值的起点。曼斯巴赫说:“你想要应用人工智能和深度学习方法的地方通常是在设计之初,这样你就可以扫描空间中你没有想到的东西,并将搜索范围缩小到可管理的东西。”