0

0

TOMG-Bench:大语言模型开放域分子生成新基准

碧海醫心

碧海醫心

发布时间:2025-02-18 17:44:45

|

869人浏览过

|

来源于php中文网

原创

TOMG-Bench:评估大语言模型开放域分子生成能力的新基准

科学家们开发了一个新的基准测试——tomg-bench,用于评估大型语言模型 (llm) 在分子领域的开放域生成能力。该基准测试旨在弥补现有分子-文本数据集的不足,更准确地评估 llm 在实际分子设计中的应用潜力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

项目资源:

挑战与机遇:

传统的分子发现方法效率低且成本高。虽然图神经网络 (GNN) 等 AI 工具展现出潜力,但其泛化能力和生成特定性质分子结构的能力有限。LLM 强大的语言理解和生成能力为分子发现带来了新的机遇,但分子与文本数据的对齐仍然是一个挑战。现有数据集通常是目标导向的,无法满足化学家在实际工作中对模糊需求的多种解决方案的生成。

图片

TOMG-Bench 的设计:

TOMG-Bench 旨在评估 LLM 在开放域分子生成中的能力,更贴近实际应用场景。它包含三个主要任务,每个任务又细分为三个子任务:

  1. 分子编辑 (MolEdit): 添加、删除或替换分子中的官能团。
  2. 分子优化 (MolOpt): 优化分子的 LogP、MR 或 QED 值。
  3. 定制分子生成 (MolCustom): 根据原子数量、键数量或官能团生成分子。

每个子任务包含 5000 个测试样本,提供全面的性能评估。

图片

数据生成和评估指标:

TOMG-Bench 使用 Zinc250K 数据库和随机生成的方法创建测试用例。评估指标包括成功率、相似性、有效性以及新颖性(针对 MolCustom 任务)。为了综合评估,引入了平均加权成功率指标。

Cutout.Pro
Cutout.Pro

AI驱动的视觉设计平台

下载

图片

OpenMolIns 指令微调数据集:

为了提升 LLM 的性能,研究人员还开发了 OpenMolIns 指令微调数据集,包含不同规模的数据,涵盖所有九个子任务。

图片

实验结果与发现:

实验结果表明,开放域分子生成任务具有挑战性,即使是先进的 LLM 也存在局限性。开源模型的性能正在快速提升,模型能力与性能正相关,数据规模也对性能有显著影响。TOMG-Bench 揭示了 LLM 在分子领域的优势和不足,为未来的研究提供了方向。

排行榜 (Leaderboard):

TOMG-Bench 提供了模型性能排行榜,方便比较不同 LLM 的表现。

总结:

TOMG-Bench 为评估 LLM 在开放域分子生成能力方面提供了一个重要的基准,推动了 LLM 在分子发现领域的应用和发展。其开源的数据集和测试脚本为研究人员提供了宝贵的资源。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

1043

2026.01.21

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

359

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2082

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

349

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

256

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

326

2023.10.09

数据库对象名无效怎么解决
数据库对象名无效怎么解决

数据库对象名无效解决办法:1、检查使用的对象名是否正确,确保没有拼写错误;2、检查数据库中是否已存在具有相同名称的对象,如果是,请更改对象名为一个不同的名称,然后重新创建;3、确保在连接数据库时使用了正确的用户名、密码和数据库名称;4、尝试重启数据库服务,然后再次尝试创建或使用对象;5、尝试更新驱动程序,然后再次尝试创建或使用对象。

412

2023.10.16

vb连接access数据库的方法
vb连接access数据库的方法

vb连接access数据库方法:1、使用ADO连接,首先导入System.Data.OleDb模块,然后定义一个连接字符串,接着创建一个OleDbConnection对象并使用Open() 方法打开连接;2、使用DAO连接,首先导入 Microsoft.Jet.OLEDB模块,然后定义一个连接字符串,接着创建一个JetConnection对象并使用Open()方法打开连接即可。

411

2023.10.16

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号