0

0

DeepSeek开源最后一天,大鹏今日同风起。

蓮花仙者

蓮花仙者

发布时间:2025-04-24 17:04:01

|

979人浏览过

|

来源于php中文网

原创

弄完openai的gpt-4.5,已经是7点多了。

但是感觉我真的有罪,我居然熬夜就为了看这个大垃圾。

虽然很想睡觉,但,今天可是DeepSeek开源的最后一天。

之前,连续4天,5个硬核项目,FlashMLA、DeepGEMM、DeepE、DualPipe、EPLB,两万多个Github星星,这都是全世界开源小伙伴们的倾情贡献。

既然已经肝了4天了,那最后一天,我才不要错过。

等到早上9点,DeepSeek如期而至。

DeepSeek开源最后一天,大鹏今日同风起。

这次,他们开源的东西还是极度硬核:

3FS(Fire-Flyer File System)

链接在此:https://github.com/deepseek-ai/3FS

还给了一个基于3FS的数据处理框架:

Smallpond。

https://github.com/deepseek-ai/smallpond

先说3FS。

简单来说,3FS就是一个专门AI模型和推理做的文件系统,只不过,它是分布式的,性能太强了。

昨天是面包厂,那我今天,在用奶茶工厂来给大家举个例子。

比如,你是一个奶茶世家,经营着一家超大规模的超级奶茶原材料工厂,开的贼大,专门给喜茶、霸王茶姬、CoCo、茶百道、蜜雪冰城等等全国各大奶茶品牌供应原材料。

每天有上万家门店等待着你的各种果汁、茶汤、蔗糖、珍珠、椰果啥的全都得从你这儿以极快的速度输送过去。

因为一旦原材料供不上,各家奶茶店就没法及时出茶,排队的顾客就得锤门店,门店就会来捶你。

而切大家的配方比例是要严格控制的,一旦某些配方仓库搞混数据,比如喜茶家的葡萄果肉和茶冻比例调错了,或芭乐瓶里面的原料配比发错了,又可能要被顾客捶。

DeepSeek开源最后一天,大鹏今日同风起。

所以你可以想象,这工厂听着就很牛逼很复杂对吧。

所以你为了保持整套工厂是靠谱的、准确的,不会被各大家品牌方捶,你就需要一个无比宽敞、极度智能的流水线+库存网络。

这就是你的究极智能奶茶原料分发系统。

而3FS(Fire-Flyer File System),就是你的这个究极分发系统。

每天都有成千上万的奶茶店要来仓库调取、回传各种信息,比如店家库存不足时要申请更多原材料,原材料运到门店后又需要登记消耗情况,遇到新品上线还要紧急调度不同产线来增产。

所有这些海量数据读写都得在极短时间内完成,否则延时太高就会造成门店断供或生产线浪费。

3FS不仅能把所有的分发全部处理掉,而且延时极低。

核心技术就在于,我们在厂区里安插了大量全新的高速自动化储物柜(这就是SSD),这些储物柜随时能被调度,门店的所有配方、原材料需求等信息都是数字化的,一按按钮就能知道哪里还剩下多少牛奶,哪里的茶叶正处在发货阶段。

而且,我们还造了一堆的光速传送带(RDMA),不需要过多的中转,一旦原料从储物柜那边这边发出,直接可以到达对应的节点,而不用像传统的先装车,然后普通货车开一大圈,再交给搬运工二次处理。

效率拉满。

同时,我们这个工厂,把原材料加工区和原材料存储区分开,还把各种茶叶处理流水线和配料混合区都搞成了独立模块。

当某天喜茶或者蜜雪冰城研发了一个新品,门店突然给你下单了一个全新的配方,需要一种新的组合了,也没关系。

3FS让你不必关心这个原料是存在哪个仓库、由谁负责加工,因为在逻辑上,你可以看作整个工厂就是一个大同心圆,任何角落都能直接访问存储资源。这叫 locality-oblivious(不用再因为地理位置不同而做繁琐的调度),相当于你只要告诉工厂我要一批A茶叶和B奶盖,系统就能自动把所有加工、分发环节安排好。

对你来说几乎毫无感知,就像整个工厂是一个统一的池子。

这就是3FS的“分离式架构”。

现在再回去看DeepSeek给出的介绍,是不是就大概能看懂,知道这玩意是个啥了?

DeepSeek开源最后一天,大鹏今日同风起。

再看看3FS的实际表现。

也比较炸裂,性能直接拉满。

现在我们假设,你家的这个奶茶工厂,有180个高速自动化储物柜(存储节点),16个超大容量(14TB)的冷冻箱(NVMe SSDs),还有两个超快的光速传送带(200Gbps InfiniBand网卡)。

那在3FS的加持下,这个奶茶工厂,它1秒钟能送出6.6TiB的原材料。。。(1 TiB约等于1.1TB,有个有个换算关系,1TiB=1024GiB,1TB=1000GB)

DeepSeek开源最后一天,大鹏今日同风起。

这吞吐量是啥概念呢?

MyMap AI
MyMap AI

使用AI将想法转化为图表

下载

约等于你可以一次性加载数千部高清乃至4K影片,一部 1080p 高清电影大小在2~3GB,4K电影大概10GB往上跑,以6.6TiB/s的吞吐来说,一秒钟就可以把几百到上千部电影打包塞进内存。

6.6 TiB/s已经属于往里塞东西时,硬盘都来不及转,网络都快成瓶颈的级别。

在现实的大规模分布式集群里能跑到这种速度,说明它已经把SSD和 RDMA网络的优势榨到极致,远超一般人日常认知的网速或存储吞吐。

然后还有一个KVCache,其实就是优化大模型推理过程的技术。

DeepSeek开源最后一天,大鹏今日同风起。

KVCache 的读吞吐能飙到40GiB/s,也就意味着,当大量门店需要不断查询某些关键库存或实时交易数据时,3FS依然能挺住。

不至于像传统系统那样面对上万次请求就卡死。对比之下,其他系统要么没有足够的带宽,要么在同时进行移除垃圾或归档时会大幅拖慢读取速度。但在3FS这套工厂体系里,即使一边有人清理过期原材料(GC IOPS),另一边的订单读操作也能流畅进行,互不掣肘。

如果只看平均速度,那也稳的不能再稳了。这玩意儿最可怕的是,上下限都极高。

整个3FS就像DeepSeek开源的老作风,他们把所有使用教程统统给了出来,真是生怕我们不会用。。。

DeepSeek开源最后一天,大鹏今日同风起。

我还发现个好玩的,除了上面这个使用操作,还有个说明书大礼包。

就在这。设计笔记、安装指南、API参考、详细参数表都一应俱全。

安装指南这部分,还给了一个测试集群,随便运行。

我甚至以为DeepSeek,不想把日子过下去了。。。

DeepSeek开源最后一天,大鹏今日同风起。

再回过头,提一嘴开源的另一个东西,Smallpond。

简单来说,这是一个特别轻量化的、但确实厉害的数据处理工具,基于DuckDB和3FS打造的。

比如,你可能想知道,哪些门店最喜欢什么口味?要从几十TB的销售记录里跑SQL查询统计,这在过去可能得搭Spark、Hadoop又或者别的大型分布式系统。

但现在,smallpond就能搞定了。

特点一共三个:

处理数据太快了。

能处理PB级(也就是千万亿字节那种牛逼的级别)的数据。

用起来确实省心,操作简单不费脑子。

它背后最大的功臣,还是3FS提供的高并发读写和存储共享能力,以及 DuckDB提供的高效SQL执行引擎。

所以,smallpond+3FS就是绝配,一个负责调度数据加工,一个负责高速数据通道,让PB级别的数据处理变得像做一杯奶茶那么轻松,真的。

Python 3.8到3.12版本就能用。DeepSeek一并把操作链接放下面了。

DeepSeek开源最后一天,大鹏今日同风起。

总结下这几天。

这几天,DeepSeek对老黄的GPU,下多少猛料了?

在V3刚出来时,本来大家觉得。

一张好卡,是不是没那么重要了?

马斯克在孟菲斯的万卡集群是不是不用搞了?

但你回过头来看,会发现:

DeepSeek跟老黄的命运,扯的太深了。

英伟达的卡,尼玛有无穷的优化潜力啊。

这下,为期五天的DeepSeek开源节正式华丽落幕了。

但是,新的英雄之旅说不定现在才刚刚开始。

路漫漫其修远兮。

吾将上下而求索。

深度求索DeepSeek。

想必也是抱着这个信念。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

751

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

350

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1304

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

361

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

881

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

425

2024.04.29

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

54

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号