0

0

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

WBOY

WBOY

发布时间:2024-07-11 20:04:01

|

1018人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

精度媲美alphafold,epfl的ai方法从序列中匹配蛋白质互作

1. 蛋白质相互作用的重要性

蛋白质是生命的基石,参与几乎所有生物过程。了解蛋白质如何相互作用对于解释细胞功能的复杂性至关重要。

2. 新方法:配对相互作用的蛋白质序列

洛桑联邦理工学院(EPFL)的 Anne-Florence Bitbol 团队提出了一种配对相互作用的蛋白质序列的方法。该方法利用了在多个序列比对上训练的蛋白质语言模型的强大功能。

3. 方法优点

该方法对于小型数据集表现良好,并且可以通过监督方法改进蛋白质复合物的结构预测。

4. 研究成果发表

该研究以「Pairing interacting protein sequences using masked language modeling」为题,于 2024 年 6 月 24 日发布在《PNAS》。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

蛋白质间相互作用的预测

蛋白质间的相互作用对细胞功能至关重要,它们确保了信号传导的特定性和多蛋白复合体(如分子马达或受体)的形成。预测蛋白质-蛋白质相互作用及其复合体结构是计算生物学和生物物理学中的重要课题。

尽管 AlphaFold 等深度学习方法在蛋白质单体结构预测上取得重大进展,但对于复合体结构的预测性能仍不如同单体预测,且存在异质性。AlphaFold 首先构建查询蛋白序列的同源多序列比对(MSA),而 MSA 的质量对预测准确性极为关键。

异源多聚体的配对 MSA

对于涉及多种链的蛋白质复合体(异源多聚体),配对 MSA 能提供交互伙伴间的协同进化信息,有助于推断链间接触,但构建正确配对的 MSA 是一大挑战;尤其是在真核生物中,因存在众多同源蛋白且非依赖于基因组邻近性。

协同进化方法

目前,结合基因组邻近性、近似同源性、基于系统发生的方法及协同进化策略等手段来应对这一挑战,其中协同进化方法虽数据需求大,但在优化配对和预测复合体结构方面展现出潜力,特别是通过最大化协同进化信号来匹配同源蛋白。

DiffPALM:一种可微分配对方法

DALL·E 2
DALL·E 2

OpenAI基于GPT-3模型开发的AI绘图生成工具,可以根据自然语言的描述创建逼真的图像和艺术。

下载

EPFL 的 Anne-Florence Bitbol 团队开发了一种配对相互作用蛋白质序列的方法,该方法利用了在多序列比对 (MSA) 上训练的蛋白质语言模型的强大功能,例如 MSA Transformer 和 AlphaFold 的 EvoFormer 模块。这使它能够高度准确地理解和预测蛋白质之间的复杂相互作用。

基于这些,研究人员提出了使用基于对齐的语言模型(DiffPALM)的可微分配对,这是一种使用 MLM 预测同源词匹配的可微分方法。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:DiffPALM 在小型 HK-RR MSA 上的性能。(来源:论文)

DiffPALM 在从普遍存在的原核生物蛋白质数据集中提取的浅层 MSA 的困难基准测试中,它的表现远胜于现有的协同进化方法。当提供已知的相互作用对作为示例时,DiffPALM 性能会进一步快速提高。

基于协同进化的配对方法,主要研究蛋白质序列在紧密相互作用时如何随着时间的推移一起进化——一种蛋白质的变化可能导致其相互作用分子的变化。这是分子和细胞生物学中一个极其重要的课题,在 MSA 上训练的蛋白质语言模型可以很好地捕捉到这一点。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:使用不同配对方法的 AFM 性能。(来源:论文)

之后,该团队将 DiffPALM 应用于真核蛋白质复合物的同源物匹配难题。为此,研究人员将 DiffPALM 配对的序列作为 AFM 的输入。在测试的复合物中,使用 DiffPALM 在某些情况下可以显著改善 AFM 的结构预测。它还实现了与使用基于直系同源物的配对相媲美的性能。

精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

图示:正例的影响、MSA 深度以及对另一对蛋白质家族的扩展。(来源:论文)

DiffPALM 的应用在基础蛋白质生物学领域显而易见,但它的应用范围不止于此,因为它有可能成为医学研究和药物开发的有力工具。例如,准确预测蛋白质相互作用有助于了解疾病机制和开发有针对性的治疗方法。

研究人员已免费提供 DiffPALM,希望科学界广泛采用它以进一步推动计算生物学的发展,并使研究人员能够探索蛋白质相互作用的复杂性。

DiffPALM 结合先进的机器学习技术和对复杂生物数据的有效处理,标志着计算生物学向前迈出了重大一步。

它不仅增强了科学家对蛋白质相互作用的理解,而且开辟了医学研究的新途径,有可能带来疾病治疗和药物开发的突破。

论文链接:
https://www.pnas.org/doi/10.1073/pnas.2311887121

相关报道:
https://phys.org/news/2024-06-ai-based-approach-protein-interaction.html

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2081

2024.08.16

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

177

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

35

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

79

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

4

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

24

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

122

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.2万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号