0

0

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

WBOY

WBOY

发布时间:2024-08-09 08:22:16

|

846人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

nature子刊,北大团队通用ai框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

编辑 | 萝卜皮

蛋白质复合物结构预测在药物研发、抗体设计等应用中发挥着重要作用,然而由于预测精度有限,预测结果与实验结果经常出现不一致。

北京大学、昌平实验室以及哈佛大学的研究团队提出了 ColabDock,这是一个通用框架,它采用深度学习结构预测模型来整合不同形式和来源的实验约束,而无需进一步进行大规模的再训练或微调。

ColabDock 的表现优于使用 AlphaFold2 作为结构预测模型的 HADDOCK 和 ClusPro,不止在具有模拟残基和表面限制的复杂结构预测中,在借助核磁共振化学位移扰动以及共价标记进行的结构预测中也是如此。

另外,它还可以通过模拟界面扫描限制来帮助抗体-抗原界面预测。

该研究以「Integrated structure prediction of protein–protein docking with experimental restraints using ColabDock」为题,于 2024 年 8 月 5 日发布在《Nature Machine Intelligence》。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

蛋白质对接为理解生物机制提供了重要的结构信息。尽管深度模型在蛋白质结构预测方面发展迅速,但大多数模型都是以自由对接的方式进行预测,这可能会导致实验约束与预测结构不一致。

为了解决这个问题,北京大学、昌平实验室等机构的研究团队提出了用于受限复合物构象预测的通用框架——ColabDock,它是一个由稀疏实验约束引导的蛋白质-蛋白质对接的通用框架。

通过梯度反向传播,该方法有效地整合了实验约束的先验和数据驱动的蛋白质结构预测模型的能量景观,自动搜索满足两者的构象,同时容忍约束中的冲突或模糊性。

ColabDock 可以利用不同形式和来源的实验约束,而无需进一步进行大规模重新训练或微调。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

图示:ColabDock 的工作流程。(来源:论文)

该框架包含两个阶段:生成阶段和预测阶段。

在生成阶段,ColabDock 采用了基于 AlphaFold2 开发的蛋白质设计框架 ColabDesign。在 logit 空间中优化输入序列配置文件,以指导结构预测模型根据给定的实验约束和模板生成复杂结构,同时最大化 pLDDT 和 pAE 测量。

在预测阶段,根据生成的复合物结构和给定的模板预测结构。对于每个目标,ColabDock 会执行多次运行并生成不同的构象。最终构象由排序支持向量机 (SVM) 算法选择。

性能稳健

作为概念验证,研究人员采用 AlphaFold2  作为 ColabDock 中的结构预测模型。当然,这里也可以使用其他数据驱动的深度学习模型,例如 RoseTTAFold2 和 AF-Multimer。

研究人员用合成数据集和几种类型的实验约束上测试 ColabDock,包括 NMR 化学位移扰动 (CSP)、共价标记 (CL) 和模拟深度突变扫描 (DMS)。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

图示:ColabDock 在验证集上的表现。(来源:论文)

燕雀Logo
燕雀Logo

为用户提供LOGO免费设计在线生成服务

下载

ColabDock 评估了两种类型的约束,即 1v1 和 MvN 约束。前者是残基-残基级别的,实例包括来自 XL-MS 的约束。后者是界面级别的,与 NMR 和 CL 实验有关。

在合成数据集上的测试结果表明 ColabDock 取得了令人满意的性能。此外,正如预期的那样,随着约束数量的增加,ColabDock 的性能也得到了提高。

即使只有很少的限制,ColabDock 在基准数据集和相同的框架设置上的表现也优于 AF-Multimer,并且在提供更多限制的情况下收敛到更少的构象,表明有效应用了附加信息。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

图示:在基准测试集上对 ColabDock、HADDOCK 和 ClusPro 进行比较。(来源:论文)

与 HADDOCK 和 ClusPro 相比,当约束质量较高时,ColabDock 的表现更为突出。在两个实验数据集上,无论提供的约束数量和质量如何,ColabDock 的表现仍然优于 HADDOCK 和 ClusPro。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

图示:ColabDock 在 CSP 集上的性能及约束分析。(来源:论文)

最后,研究人员在抗体-抗原数据集上评估了不同对接方法的性能。ColabDock 预测的中等或更高质量结构的比例远高于 HADDOCK 和 ClusPro。

Nature子刊,北大团队通用AI框架对蛋白-蛋白对接进行综合结构预测,弥合实验与计算的差距

图示:ColabDock、HADDOCK 和 ClusPro 在抗体-抗原基准集上的比较。(来源:论文)

这表明 ColabDock 在抗体设计方面具有潜在的应用价值。并且,在新发布的无偏数据集上,ColabDock 仍然表现出与 AF-Multimer 相当甚至更好的性能。

局限性与结语

ColabDock 也存在一些局限性。目前,ColabDock 只能接受距离小于 22 Å 的限制,这是由 AlphaFold2 中距离图的上限决定的。这一限制使得该模型仅适用于一小部分 XL-MS 试剂。

如果没有基于片段的优化,ColabDock 只能在 NVIDIA A100 图形处理单元 (GPU) 上处理少于 1,200 个残基的复合物,因为内存有限。

此外,该方法可能非常耗时,尤其是对于大型蛋白质复合物。使用 AlphaFold2 的 bfloat16 浮点格式版本有望帮助节省内存并加速计算。

相信未来,研究人员迭代优化之后,作为一个统一的框架,ColabDock 必将能够帮助弥合实验和计算蛋白质科学之间的差距。

论文链接:https://www.nature.com/articles/s42256-024-00873-z


热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2079

2024.08.16

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

1

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

1

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

23

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

120

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

51

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

192

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

7

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号