0

0

Agent像人一样分工协作,还能“群聊”交换信息

王林

王林

发布时间:2024-02-04 14:36:30

|

1431人浏览过

|

来源于51CTO.COM

转载

智能体也要有“规范手册”!

一项名为MetaGPT的研究,通过对智能体角色进行明确分工,并要求多个智能体在协作中采用统一规范的“交流格式”等方法,让智能体性能大增。

目前,这项研究在GitHub上已狂揽33.6k星,并在深度学习顶会ICLR 2024上被收录为Oral论文。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Agent像人一样分工协作,还能“群聊”交换信息

总的来说,MetaGPT是模仿人类的分工协作方式,将各种任务的标准操作流程编码为智能体的“规范手册”,不同角色的智能体负责不同的专业任务。

比如产品经理角色可以使用网络搜索工具,而工程师角色可以执行代码:

Agent像人一样分工协作,还能“群聊”交换信息

由此多智能体协作完成任务。

研究人员为智能体们设置了一个“消息共享群”,智能体可以自由查看其他智能体发送的相关消息。

经测试,使用这种方法,在代码补全任务的公开数据集HumanEval和MBPP上,MetaGPT分别取得了85.9%和87.7%的新SOTA。

目前这项工作已开源,在全网受到不少网友关注:

Agent像人一样分工协作,还能“群聊”交换信息

MetaGPT长啥样?

这项研究由DeepWisdom团队联合KAUST AI中心、厦门大学、CUHK(SZ)、南京大学、UPenn以及UCB等众多高校机构的学者共同提出。

Agent像人一样分工协作,还能“群聊”交换信息

随着大模型能力的不断提升,基于大模型的智能体来解决各种任务在学术界和工业界的兴趣日益增长。

值得注意的是,对于采用多个智能体协作解决特定领域问题的研究仍处于早期阶段。现有研究主要集中在通过角色扮演机制和通信拓扑设定来增强任务理解和推理决策能力。尽管取得了一定进展,但这些方法仍然依赖于直接的对话形式,缺乏对智能体行为的标准规范和约束。

近期的一些工作也指出,基于对话形式的多智能体系统可能面临信息不一致、歧义以及可能的无效重复和无限循环等问题。

相较之下,人类工作流程中的标准操作流程(SOPs)不仅明确定义了参与角色的分工和拓扑结构,还建立了角色产出结果的标准规范。

研究表明,明确定义的SOPs可以提高任务执行的一致性和准确性,确保最终结果符合规定的质量标准。因此,为解决多智能体协作中的挑战,研究人员设计了基于大模型的智能体元编程框架MetaGPT。

MetaGPT要求智能体以专家形式参与协作,并按要求生成结构化的输出,例如高质量的需求文档、架构设计图和流程图等。

结构化的输出对于单个智能体即是更高层次的思维链(Chain-of-Thought),对于下游角色则是语义清晰、目标明确的上下文(Context)

在MetaGPT的框架中,研究人员将SOPs的概念对齐至角色专业化、通信协议设计以及迭代式的可执行反馈设计。

角色专业化

通过明确定义的角色分工,复杂的工作得以分解为更小、更具体的任务。

如下图所示,不同专业的角色,初始化为不同的目标和约束,以及不同的专业技能。如产品经理角色可以使用网络搜索工具,而工程师角色可以执行代码。与此同时,每个角色都默认遵循ReAct的行为模式。

Agent像人一样分工协作,还能“群聊”交换信息

角色专业化使得每个智能体能够专注于其领域内的具体任务,从而提升了大模型的输出质量。

对于软件开发而言,通过角色的流转,这种分工更巧妙地完成了从自然语言到编程语言的对齐。论文中的角色消融实验进一步证明了这一部分的效果。

甲骨文AI协同平台
甲骨文AI协同平台

专门用于甲骨文研究的革命性平台

下载

通信协议设计

在实际应用中,自然语言虽然具备语义的丰富性,但由于其非结构化的特性,在消息传递过程中常常会导致信息的歪曲甚至重要内容的丢失。

为解决这一问题,作者约束智能体以结构化的输出(包括文档和图表)参与协作,来提高信息的清晰度和完整性。为验证这一设计,作者设计了多种软件开发任务,通过生成代码的可执行性以及生产力指标强调结构化输出在协作中的关键性。

Agent像人一样分工协作,还能“群聊”交换信息

在多智能体协作过程中,为提高通信效率,MetaGPT引入了基于消息共享的发布-订阅机制(Publish-Subscribe Mechanism)

如上图所示,共享消息池允许直接交换消息,任何智能体都可以透明地访问来自其他智能体的消息,无需询问并等待响应。订阅机制使智能体更倾向于接收与自我任务相关的信息,避免分心于不相关的细节。同时,每个智能体可直接从共享消息池中检索所需信息,形成自我记忆。

可执行反馈

智能体根据环境反馈进行自我优化和主动更新,是智能体具备自主意识的表现。

在软件开发任务上,MetaGPT为工程师的智能体设计了可执行反馈机制,以进行代码质量自动优化。

具体而言,工程师编写并执行相应的单元测试用例,通过观察到的执行结果,递归地进行决策和自我提示,实现自动debug。这种设计-测试-反馈的迭代过程持续进行,直到单元测试通过或达到最大重试次数。

多个基准测试新SOTA

在代码生成能力上,研究人员采用了两个公开基准数据集:HumanEval和MBPP,并报告Pass@1指标。

另外,他们还收集了涵盖70个典型软件开发任务(如迷你游戏、数据可视化、图像处理等)的数据集SoftwareDev,并进行了多个智能体开源框架的对比,对多个软件开发任务的可执行性和生产效率上进行了统计分析和定性说明。

如下图所示,MetaGPT在HumanEval和MBPP基准测试中均优于之前的方法,分别达到了85.9%和87.7%。相比于GPT-4的结果,MetaGPT在HumanEval数据集上相对提升了28.2%,而加入可执行反馈机制分别在HumanEval和MBPP上提升了4.2%和5.4%。

Agent像人一样分工协作,还能“群聊”交换信息

在具有挑战性的SoftwareDev数据集上,MetaGPT在可执行性上的得分为3.75,非常接近4,而所需的运行时间较短(503秒);生成的代码行数相对基线框架增加了2.24倍,而单位代码行数所消耗的token数下降了50%。

这些结果突显了多智能体协作过程中SOPs带来的效率提升。

Agent像人一样分工协作,还能“群聊”交换信息

MetaGPT在软件开发任务中的高可执行性和相对较短的运行时间表明了其在实际应用中的实用性和效率。

Agent像人一样分工协作,还能“群聊”交换信息

聚焦在软件开发领域,研究人员提供了不同智能体框架能力的定性对比。

他们发现,MetaGPT不仅具备多种模态的文件生成能力,也是目前众多框架中唯一完整覆盖了真实世界中软件开发过程的开源框架。

Agent像人一样分工协作,还能“群聊”交换信息

总的来说,MetaGPT是一个新颖的多智能体框架,结合元编程思想,嵌入SOPs来增强大模型在多智能体协作上的能力。

通过角色专业化,工作流管理和灵活的消息机制,使其成为通用性和可移植性高的多智能体框架。

结合迭代式的反馈机制,MetaGPT在多个基准测试上取得SOTA性能。

结合人类社会实践的SOPs,启发了未来对于多智能体社会的研究和探索,也可视为对基于大模型的多智能体框架进行调节的早期尝试。

论文链接:https://arxiv.org/abs/2308.00352
代码链接:https://github.com/geekan/MetaGPT

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6100

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

810

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1063

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1268

2024.03.01

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

7

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2001

2024.08.16

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

9

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

3

2026.01.21

无人机驾驶证报考 uom民用无人机综合管理平台官网
无人机驾驶证报考 uom民用无人机综合管理平台官网

无人机驾驶证(CAAC执照)报考需年满16周岁,初中以上学历,身体健康(矫正视力1.0以上,无严重疾病),且无犯罪记录。个人需通过民航局授权的训练机构报名,经理论(法规、原理)、模拟飞行、实操(GPS/姿态模式)及地面站训练后考试合格,通常15-25天拿证。

13

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.3万人学习

Go 教程
Go 教程

共32课时 | 4万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号