Review Article

晶体学数据对开发机器学习模型以预测蛋白质-配体结合亲和力的影响

卷 28, 期 34, 2021

发表于: 10 February, 2021

页: [7006 - 7022] 页: 17

弟呕挨: 10.2174/0929867328666210210121320

价格: $65

摘要

背景:药物发现早期阶段的主要挑战之一是蛋白质-配体结合亲和力的计算评估。机器学习技术有助于预测这种类型的交互。我们可以按照两种方法应用这些技术。首先,使用具有亲和力数据的实验结构。其次,使用蛋白质配体对接模拟。 目标:在这篇综述中,我们描述了最近发表的基于晶体结构的机器学习模型,这些模型可以获得结合亲和力和热力学数据。 方法:我们使用蛋白质数据库中可用的实验结构,并通过 BindingDB、Binding MOAD 和 PDBbind 数据库访问结合亲和力和热力学数据。我们回顾了机器学习模型,以预测使用开源程序(例如 SANDReS 和 Taba)创建的绑定。 结果:对由晶体结构复合物组成的数据集训练的机器学习模型的分析表明,与经典评分函数相比,这些模型具有较高的预测性能。 结论:蛋白质-配体复合物晶体结构数量的快速增加为开发机器学习模型以预测结合亲和力创造了有利的局面。这些模型依赖于来自两个来源的实验数据,结构数据和亲和力数据。实验数据的组合生成了优于经典评分函数的计算模型。

关键词: 晶体结构、机器学习、评分函数空间、结合亲和力、SANDReS、Taba。


Rights & Permissions Print Cite
© 2024 Bentham Science Publishers | Privacy Policy