0

0

开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了

DDD

DDD

发布时间:2025-02-12 16:34:20

|

1079人浏览过

|

来源于php中文网

原创

deepseek 的影响力持续发酵,中国ai军团实现了反向技术输出,引发全球复现 deepseek 的热潮。尽管 deepseek-r1 部分开源,但关键信息仍未公开。然而,技术报告已为复现提供了指导,许多团队利用小型模型取得了成功,其中 hugging face 的 open r1 项目最为引人注目。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

Open R1 项目旨在完全开放复现 DeepSeek-R1,并补充所有未公开的技术细节。几周内,他们已完成 GRPO 实现、训练与评估代码以及合成数据生成器。项目地址:https://www.php.cn/link/59a6cd2175a468225a105a7cd7f20ec4

近期,Open R1 发布了 OpenR1-Math-220k 数据集,填补了 DeepSeek R1 合成数据缺口。该数据集包含 22 万条高质量数据,源自 80 万条 DeepSeek R1 推理轨迹。

图片OpenR1-Math-220k 数据集概览 数据集链接:https://www.php.cn/link/058d732557d3b439eb2ffdd074bbf347

DeepSeek R1 的优势在于其将高级推理能力迁移到小型模型的能力。DeepSeek 团队使用了 60 万条推理数据,证明了这种迁移能力,即使不使用强化学习也能实现强大的推理性能。OpenR1-Math-220k 数据集弥补了 DeepSeek 未公开合成数据的不足。基于该数据集训练的 Qwen-7B-Math-Instruct 模型,性能与 DeepSeek-Distill-Qwen-7B 相当。

OpenR1-Math-220k 数据集特点:

  • 利用 DeepSeek R1 生成 80 万条推理轨迹,筛选后保留 22 万条高质量数据。
  • 本地高效生成,利用 512 个 H100 服务器,每天生成 18 万条推理轨迹。
  • 基于 NuminaMath 1.5,专注于数学推理公式。
  • 自动过滤,通过数学验证和 Llama3.3-70B-Instruct 模型筛选,确保数据质量。

数据集分为 default (94k 问题) 和 extended (131k 问题) 两个部分。

图片

腾讯AI 开放平台
腾讯AI 开放平台

腾讯AI开放平台

下载

Open R1 团队希望这种可扩展、高质量的推理数据生成过程能够启发其他领域。数据生成过程使用了 vLLM 和 SGLang,并对 Math-Verify 工具进行了改进,利用 Llama-3.3-70B-Instruct 模型进行二次评估,确保数据质量。数据生成脚本:https://www.php.cn/link/59a6cd2175a468225a105a7cd7f20ec4/tree/main/slurm

在 OpenR1-Math-220k 数据集上训练的 Qwen-7B-Math-Instruct 模型,与 DeepSeek-Distill-Qwen-7B 的性能相当。

图片

Open R1 项目的成果表明,少量高质量的推理数据也能实现强大的推理能力,并引发了关于 LLM 推理机制、数据规模和 CoT 长度等问题的深入探讨。 相关研究表明,更小、更高质量的数据集可能更有效。 Open R1 团队正在进行更多实验,以优化 GRPO 训练。

图片图片图片

参考链接:https://www.php.cn/link/ddc751074ed4db1ce8e65aec173d16e3, https://www.php.cn/link/6e3a0a9abe898f51ff56c491b528b302, https://www.php.cn/link/a87c3e8f9b58723ac1c4f6ab69c0d0c9, https://www.php.cn/link/0af07e9885819ecb85897611e758433b, https://www.php.cn/link/b8742743f35ad13e837cb8fc849f759d

相关专题

更多
default gateway怎么配置
default gateway怎么配置

配置default gateway的步骤:1、了解网络环境;2、获取路由器IP地址;3、登录路由器管理界面;4、找到并配置WAN口设置;5、配置默认网关;6、保存设置并退出;7、检查网络连接是否正常。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

220

2023.12.07

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

387

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2057

2024.08.16

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

29

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

117

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

178

2026.01.23

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

16

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

70

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号