0

0

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

聖光之護

聖光之護

发布时间:2025-09-30 11:42:04

|

781人浏览过

|

来源于php中文网

原创

deepseek v4被曝下月发布:100m上下文 全面用国产ai芯片训练

9月29日,DeepSeek正式推出DeepSeek-V3.2-Exp大模型,距离此前发布DeepSeek-V3.1-Terminus仅过去不久,再次展现了其在重大节点前更新模型的节奏。此次发布的v3.2版本带有“Exp”(Experimental)后缀,表明其主要定位为技术探索性质,并非追求性能全面超越,而是为后续重大升级铺路。

本次更新的核心亮点在于引入了DeepSeek Sparse Attention(DSA),该机制首次实现细粒度稀疏注意力,在几乎不牺牲输出质量的前提下,显著提升了长文本场景下的训练与推理效率,为处理更长上下文和降低计算开销提供了新的技术路径。

尽管V3.2本身属于小步迭代,业界更关注的是传闻中的DeepSeek-V4基座大模型及其可能带来的革命性升级。有推特账号“DeepSeek News Commentary”声称,V4将于10月发布,或将支持高达100万token的上下文长度,采用GRPO驱动推理、NSA/SPCT等新技术,在数学与编程能力上大幅提升,同时具备更快的响应速度和更低的成本。

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

不过该账号虽位于杭州,但并非官方认证渠道,消息尚未得到证实。尽管如此,10月发布V4并非全无可能——当前V3.2的技术验证正为此积累经验。早在此前,DeepSeek已明确表示下一代模型将支持FP8算法,并全面适配国产AI芯片。

LobeHub
LobeHub

LobeChat brings you the best user experience of ChatGPT, OLLaMA, Gemini, Claude

下载

目前,包括华为昇腾、寒武纪、海光信息在内的多家国产芯片厂商均已宣布完成对DeepSeek-V3.2-Exp的适配。特别是华为昇腾,不仅实现了0day支持,还开源了推理代码。结合昇腾近期公布的路线图,预计明年Q1发布的昇腾950PR将支持FP8/FP4等多种精度格式,算力强劲,互联带宽高达2TB/s,内存带宽达4TB/s,堪称国产算力的里程碑产品。

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

因此,不少观点认为,DeepSeek-V4的最佳亮相时机或与昇腾950PR等先进国产芯片的成熟部署同步。此前已有消息称DeepSeek正在使用国产芯片进行模型训练,V3.2已同时支持CUDA与华为CANN,预示着V4在国产化适配上将更加深入,未来也有望陆续推出针对寒武纪、海光等平台的优化版本。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6099

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

810

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1063

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1267

2024.03.01

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

403

2023.08.14

云朵浏览器入口合集
云朵浏览器入口合集

本专题整合了云朵浏览器入口合集,阅读专题下面的文章了解更多详细地址。

20

2026.01.20

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

28

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

146

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

120

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.7万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号