0

0

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!

爱谁谁

爱谁谁

发布时间:2025-07-02 13:04:01

|

846人浏览过

|

来源于php中文网

原创

ai编程已杀疯,机器学习论文代码自动生成,100%开源,支持deepseek!图片

大家好,我是 ai 学习的老章

之前推荐过 N 多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的 ArXiv MCP 服务器、整篇译并保留样式的看论文神器,一键译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、译,效率飙升100倍!的 AlphaXiv

今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code

开源代码不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!https://arxiv.org/pdf/2504.17192

https://arxiv.org/pdf/2504.17192

一句话总结,PaperCoder 旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

PaperCoder 通过将研究库生成形式化为软件开发问题来解决可重复性挑战。

该框架可以表示为 M(R) = C,其中:

R 是包含方法和算法的研究论文C 是生成的代码库M 是执行转换的基于 LLM 的模型

该系统采用三阶段方法,该方法反映了人类的软件开发过程:

规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。生成阶段:根据规划期间确定的执行顺序合成整个代码库。

每个阶段都使用专门的 LLM 代理来实现,这些代理协同工作以完成任务,这使得 PaperCoder 成为一个复杂的多代理系统。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

效果怎么样呢?

PaperCoder 的性能优于软件开发工作基线,如 ChatDev 和 MetaGPT,表明其专门设计的有效性。

作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:

Clips AI
Clips AI

自动将长视频或音频内容转换为社交媒体短片

下载
PaperCoder 生成的存储库中有 77% 被人类评估者评为最佳85% 的人类评审员报告说生成的存储库很有帮助
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

如何使用呢?

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

安装

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">pip install openaiexport OPENAI_API_KEY="<OPENAI_API_KEY>"git clone https://github.com/going-doer/Paper2Codecd Paper2Codegit clone https://github.com/allenai/s2orc-doc2json.gitcd scriptsbash run.sh</code>

输出结果如下

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">outputs├── Transformer│   ├── analyzing_artifacts│   ├── coding_artifacts│   └── planning_artifacts└── Transformer_repo  # Final output repository</code>

系统的工作流程是:

将 PDF 论文转换为 JSON 格式 0_pdf_process.py:4-17分析论文内容并生成实现计划 1_planning.py:26-36进行逻辑分析 2_analyzing.py:49-54生成代码实现 3_coding.py:43-50
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

不过这个项目是默认 OpenAI 的 api,本地运行也只支持 vllm 拉起的模型

我看了一下,其实该起来也非常简单

比如把 OpenAI 切换为 DeepSeek,需要修改的脚本不多

修改 API 客户端初始化和调用:

codes/1_planning.py - 规划生成组件 1_planning.py:1-16codes/2_analyzing.py - 逻辑分析组件 2_analyzing.py:1-20codes/3_coding.py - 代码生成组件 3_coding.py:1-19

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])</code>

修改为下面即可

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")</code>

如果你用的是 DeepSeek 官方 API,base_url 改为 https://api.deepseek.com_/v1

其他类似

然后修改scripts/run.sh中的环境变量设置: run.sh:1-3

代码语言:javascript代码运行次数:0运行复制
<code class="javascript">export OPENAI_API_KEY="sk-XXXXXX"GPT_VERSION="deepseek-ai/DeepSeek-R1"</code>

然后就全部 ok

最后推荐一个我正在学习的Cusor快速入门与实战

相关文章

AI工具
AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型,支持联网搜索。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

452

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

330

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

487

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2825

2024.08.16

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

2

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

58

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

31

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 4万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.6万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 94人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号