0

0

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成

WBOY

WBOY

发布时间:2023-10-04 20:29:06

|

976人浏览过

|

来源于51CTO.COM

转载

对于大模型来说,擅长的是本地化编码任务。

如果任务涉及多个相互依赖的文件,LLM无法解决这个问题

微软研究人员为此设计了一个名为CodePlan的任务无关的神经网络框架

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

论文地址:https://arxiv.org/pdf/2309.12412499.pdf

论文中,CodePlan综合了多步骤编辑链(chain-of-edits),是一种将程序分析、规划和LLM结合在一起的新方法。

一起来具体看看,CodePlan是如何设计的?

CodePlan:大模型+规划

软件工程活动中,例如软件包迁移、修复静态分析或测试的错误报告,以及向代码库添加类型提示或其他规范,涉及到对整个代码存储库的普遍编辑。

研究人员计划这些活动,以实现"存储库级别的编码任务"

编码工具如GitHub Copilot、Code Whisperer已经获得了大模型能力的支持,为码农在本地化编码问题上提供了解决方案

然而,事实是,「存储库级别的编码任务」更加复杂,无法直接通过LLM解决,因为存储库中的代码是相互依赖的,整个存储库可能太大而无法纳入提示

这项研究中,微软团队将库级编码框架作为一个规划问题,并提出了一个任务不可知的框架,称为CodePlan。

CodePlan综合了一个多步骤的编辑链(计划) ,其中每一步都会调用代码位置上的LLM。该代码位置上的上下文来自整个存储库、以前的代码更改和特定于任务的指令。

CodePlan是一种新型组合,它基于增量依赖分析、变更可能影响分析和自适应规划算法

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

如下图,展示了复数库API的变化,微软研究人员的任务是根据这一变化迁移代码库。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

在图3的左侧展示了代码库中与使用复数库相关的部分

具体来说,Create.cs文件中的方法func,调用了库中的create_complex方法,Process.cs文件中的方法Process.cs调用了func。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

研究人员将任务描述和func主体从图1传递给LLM,以生成修改后的func代码,如图3右侧所示

可以看到,LLM已经正确地编辑了对create_complex API的调用,以便它返回一个Complex类型的对象,而不是两个浮点值的元组。

注意,这个编辑导致了方法func的签名发生了变化——它现在返回了一个Complex类型的对象。

需要进行修改的是:需要修改方法func的调用者,例如在Process.cs文件中的process方法,如图3左下角所示。如果不对process方法的主体进行适当的修改,代码将无法构建!

图3右下方显示了对process方法的适当修改,它能使版本库达到一致的状态,从而在编译时不会出错。

研究人员的主要任务是建立一个「存储库级别的编码系统」,该系统能够自动生成编辑所需的派生规范

LLM驱动的库级编码任务定义如下:

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

在CodePlan的整体框架中,输入包括一个存储库、一个通过自然语言指令或一组初始代码编辑表达种子规范的任务、一个正确性oracle和一个LLM

CodePlan创建了一个计划图,其中每个节点都代表LLM需要执行的代码编辑任务,而边表示目标节点需要在源节点之后执行

CodePlan监控代码编辑,并自适应地扩展计划图。

一旦计划中的所有步骤都已完成,存储库将由oracle进行分析。如果oracle验证了资源库,则任务完成。如果发现错误,错误报告将作为下一轮计划生成和执行的种子规范。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

此外,CodePlan算法还维护了一个依赖关系图,图4说明了依赖关系图的结构。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

刷新SOTA

研究人员对CodePlan在两个存储库级任务上的有效性进行了评估:包迁移(C#)和时态代码编辑(Python)

每个任务在多个代码库上进行评估,每个代码库都需要对多个文件(2-97个文件)进行相互依赖的更改。

码农狂喜!微软提出CodePlan,跨168个代码库编码任务,LLM自动化完成图片

以前从未有过使用LLM自动完成这种复杂程度的编码任务

研究结果显示,与基准相比,CodePlan更符合基本事实,能够使5/6个存储库通过有效性检查,例如无错误构建和正确的代码编辑

总的来说,CodePlan为自动化复杂的库级编码任务提供了一种有前途的方法,既提高了生产效率,又提高了准确性

它成功地应对了许多挑战,为高效可靠的软件工程实践开辟了新的可能性

参考资料:https://www.php.cn/link/23b1f559d8bd157d0d741c83957ed4f2

YOO必优科技-AI写作
YOO必优科技-AI写作

智能图文创作平台,让内容创作更简单

下载

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

4450

2026.01.21

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

504

2023.08.14

oracle清空表数据
oracle清空表数据

当表中的数据不需要时,则应该删除该数据并释放所占用的空间。本专题为大家提供oracle清空表数据的相关文章,帮助大家解决该问题。

271

2023.08.16

Oracle中declare的使用
Oracle中declare的使用

Oracle DECLARE语句是PL/SQL编程语言中用于声明变量、常量、游标或异常的关键字。它的主要作用是在程序中定义这些对象,以便在后续的代码中使用。DECLARE语句的语法简单明了,可以根据需要声明多个对象。通过使用这些声明的对象,可以进行各种操作,如计算、查询数据库、处理异常等 。

221

2023.09.15

oracle怎么分页
oracle怎么分页

实现分页的步骤:1、使用ROWNUM进行分页查询;2、在执行查询之前进行设置分页参数;3、使用"COUNT(*)"函数来获取总行数,并使用"CEIL"函数来向上取整计算总页数;4、在外部查询中使用"WHERE"子句来筛选出特定的行号范围,以实现分页查询。想了解更多oracle怎么分页的文章,可以来阅读本专题先的文章。

246

2023.09.18

Oracle查看表操作历史记录
Oracle查看表操作历史记录

查看操作历史记录的方法:1、使用Oracle内置的审计功能,可以记录数据库中发生的各种操作,包括登录、DDL语句、DML语句等;2、使用Oracle日志文件,其中包含了数据库中发生的各种操作,可以通过查看日志文件来获取操作历史记录;3、使用Oracle的Flashback功能,可以查看数据库在某个时间点的操作历史记录;4、使用第三方工具等。本专题还提供其他查看表操作的文章,大家可以免费阅读。

464

2023.09.19

Oracle中RAC的用法
Oracle中RAC的用法

Oracle中RAC的用法:1、通过在多个服务器上运行数据库实例来提供高可用性;2、允许在需要时增加或减少节点数量;3、通过将工作负载分布到多个节点上来实现负载均衡;4、使用共享存储来实现多个节点之间的数据共享;5、允许多个节点同时处理数据库请求,从而实现并行处理;6、提供了透明故障切换功能;7、使用了一些技术来确保数据的一致性;8、提供了管理工具来简化RAC环境的管理和维护。本专题还提供RAC相关的其他文章,大家可以免费阅读。

451

2023.09.19

oracle imp
oracle imp

imp是Oracle数据库中的一个命令行工具,用于将导出的数据和对象从一个数据库实例导入到另一个数据库实例。imp命令的一般语法为“imp username/password@connect_string file=file_name [options]”。

342

2023.09.19

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
手把手实现数据传输编码
手把手实现数据传输编码

共1课时 | 771人学习

PHP自制框架
PHP自制框架

共8课时 | 0.6万人学习

【李炎恢】ThinkPHP8.x 后端框架课程
【李炎恢】ThinkPHP8.x 后端框架课程

共50课时 | 4.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号