0

0

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

心靈之曲

心靈之曲

发布时间:2024-11-28 18:39:18

|

707人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

准确率84.09%,腾讯ai lab发布interformer,用于蛋白质-配体对接及亲和力预测,登nature子刊

编辑 | 萝卜皮

近年来,深度学习模型在蛋白质-配体对接和亲和力预测中的应用引起了越来越多的关注,而这两者都对基于结构的药物设计至关重要。

然而,许多此类模型忽略了复合物中配体和蛋白质原子之间相互作用的复杂建模,从而限制了它们的泛化和可解释性。

在最新的研究中,腾讯 AI Lab 的研究人员提出了 Interformer,这是一个基于 Graph-Transformer 架构的统一模型。

该模型旨在利用交互感知混合密度网络捕获非共价相互作用。该团队引入了负采样策略,有助于有效校正相互作用分布以进行亲和力预测。

这种方法可以通过准确模拟特定的蛋白质-配体相互作用来提高性能,且具备通用性。

该研究以「Interformer: an interaction-aware model for protein-ligand docking and affinity prediction」为题,于 2024 年 11 月 25 日发布在《Nature Communications》。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

在错综复杂的药物研发过程中,蛋白质-配体对接和亲和力预测任务多年来一直是药物发现过程中的重要组成部分。

蛋白质-配体对接是药物分子结构优化的关键任务,目的是预测配体(小分子)与蛋白质受体或酶结合时的位置和方向。

亲和力预测任务利用准确的结合姿势(蛋白质-配体结合复合物构象),提供配体与其目标蛋白质之间结合强度的计算估计,从而有助于筛选具有潜在亲和力的配体。

近年来,人们对使用深度学习 (DL) 方法进行分子建模的兴趣激增。比如科学家将对接视为生成建模问题,引入了 DiffDock,这是一种基于图神经网络 (GNN) 的模型,已在结合姿势生成方面建立了基准。

然而,现有的深度学习模型往往忽视了蛋白质和配体原子之间非共价相互作用的建模,而这对于可解释性和泛化至关重要。

如图 1 左图所示,DiffDock 产生的对接构象与晶体结构非常相似,但无法捕捉非共价相互作用。此外,虽然传统的亲和力预测方法在晶体结构方面表现出色,但在处理不太精确的结合姿势时,其性能会急剧下降,这对实际应用构成了挑战。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 1:对接姿势中的非共价相互作用与现有和拟议方法的比较。(来源:论文)

新方法:Interformer

在最新的研究中,腾讯 AI Lab 的研究人员提出了 Interformer,这是一种计算 AI 模型,旨在缓解蛋白质-配体对接中的相互作用感知问题,并在实际应用中采用建设性学习进行亲和力预测。

首先,研究人员提出了一种相互作用感知混合密度网络 (MDN) 来模拟非共价相互作用,明确关注蛋白质-配体晶体结构中存在的氢键和疏水相互作用。如图 1 右图所示,Interformer 可以准确地产生结合姿势中的特定相互作用。

其次,团队提出了一个伪 Huber 损失函数,利用对比学习的能力来指导模型区分有利和不利的结合姿势。

第三,该模型基于 Graph-Transformer 框架,该框架在各种图表示学习任务中都表现出比基于 GNN 的模型更优的性能。

Interformer 的另一个优点是通过检查 MDN 的融合系数来解释蛋白质-配体相互作用的内部机制。

具体来说

Interformer 模型的架构灵感来自 Graph-Transformer,最初是为图表示学习任务而提出的。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

AI Room Planner
AI Room Planner

AI 室内设计工具,免费为您的房间提供上百种设计方案

下载

图 2:Interformer 架构概述。(来源:论文)

在第一阶段,该模型从晶体结构中获取单个初始配体 3D 构象和蛋白质结合位点作为输入。图形在各种方法中被广泛用于说明配体和蛋白质,如图 2a 所示,其中节点代表原子,边表示两个原子之间的接近度。

研究人员使用药效团原子类型作为节点特征,并使用两个原子之间的欧几里得距离作为边缘特征。这些药效团原子类型提供了必要的化学信息,从而使模型能够更好地理解特定的相互作用,例如氢键或疏水相互作用。

在第二阶段,对接流程如图 2b 所示,通过 Intra-Blocks 处理来自蛋白质和配体的节点特征和边缘特征。

Intra-Blocks 旨在通过捕获同一分子内的内部相互作用来更新每个原子的节点特征。这些更新后的节点特征随后输入到 Inter-Blocks,捕捉蛋白质和配体原子对之间的相互作用,进一步更新节点和边缘特征。

接着,通过交互感知的 MDN 预测每个蛋白质-配体原子对的四个高斯函数参数,并结合形成混合密度函数(MDF),用于估计蛋白质和配体原子之间最可能的距离。MDF 模型能够精确反映特定的相互作用,如氢键和疏水作用,从而生成更加符合自然晶体结构的对接姿势。

最后,所有蛋白质-配体对的 MDF 聚合后,通过蒙特卡洛采样方法生成前 k 个候选配体构象。

在第三阶段,姿势得分和亲和力预测管道如图 2c 所示。生成的对接姿势中蛋白质和配体原子之间的距离和特定相互作用更新了新的边缘特征。

然后通过块内和块间处理节点和边缘特征以创建隐式交互。虚拟节点通过自注意力机制收集有关绑定姿势的所有信息。

最后,虚拟节点的绑定嵌入被输入到亲和力和姿势层,以预测相应对接姿势的绑定亲和力值和置信姿势得分。

通过纳入不良姿势,对比性伪 Huber 损失函数可用于指导模型辨别姿势是好还是坏。训练目标可确保模型为不良姿势预测较低的值,为良好姿势预测较高的值。良好姿势与不良姿势之间的主要区别在于它们的相互作用。

此策略可帮助模型学习关键相互作用,而不是人工特征。研究人员将此特性称为 pose-sensitive,在现实世界的药物开发项目中表现出色。

性能评估

当使用两个广泛使用的基准对蛋白质-配体对接进行评估时,Interformer 在 Posebusters 基准上实现了 84.09% 的准确率,在 PDBbind 时间分割基准上实现了 63.9% 的准确率,且均方根偏差 (RMSD) 小于 2 Å,从而实现了 top-1 预测性能。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 3:对蛋白质-配体对接任务的评估。(来源:论文)

这一改进归功于该模型增强了捕捉配体和蛋白质之间非共价相互作用的能力,这对于产生不太模糊的构象至关重要,对于下游任务的成功执行至关重要。

此外,即使绑定姿势不太准确,该模型也能预测合理的亲和力值。团队内部真实世界基准的评估表明,该模型的性能与其他模型相当,证实了其姿势敏感和强大的泛化能力。

在应用于真实的内部药物管道时,研究人员成功鉴定出两个小分子,在各自的项目中,每个小分子的亲和力 IC50 值分别为 0.7 nM 和 16 nM,从而证明了其在推进治疗发展方面的实用价值。

这种方法使 Interformer 能够通过关注蛋白质和配体原子对之间的特定相互作用来区分不太准确和更有利的对接姿势。这种强大的功能使该模型能够增强在现实场景中预测的通用性。

准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊

图 4:对蛋白质-配体亲和力预测任务的评估。(来源:论文)

在亲和力预测领域,Interformer 在四个内部真实世界亲和力基准上表现出持续的进步。Interformer 在两个内部药物开发流程中的进一步应用已成功在纳摩尔水平上识别出两种高效分子。

该研究展示了 Interformer 对计算生物学和加速药物设计过程的巨大潜力。

未来,研究人员的目标是将 Interformer 的应用扩展到更广泛的现实世界生物挑战中,并增强其对各种分子相互作用类型的性能,包括蛋白质-蛋白质和蛋白质-核酸相互作用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

12

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

4

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

18

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

19

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 3.2万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

MySQL 教程
MySQL 教程

共48课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号