据英国《金融时报》上周五报道,中国人工智能企业深度求索(deepseek)即将推出全新一代大型语言模型v4,该模型为原生多模态架构,可同步实现文本、图像与视频的生成能力。此次发布计划定于3月4日全国两会召开前,具有显著的战略时点意义。

这是DeepSeek继2025年1月发布R1推理模型后的首次重大模型升级。R1曾以极低算力消耗达成媲美国际主流模型的推理性能,而V4则在多模态理解与生成、长上下文处理、国产芯片协同优化等维度实现全面跃升。目前,DeepSeek已联合华为、寒武纪完成对昇腾及思元系列AI芯片的深度适配,优先支持国产算力平台,明确回避英伟达与AMD生态。
《金融时报》指出,此举或将推动DeepSeek成为事实上的国家级AI技术代表——其技术路线高度契合当前中国在AI底层自主可控与高效落地的双重战略导向。
值得注意的是,在V4正式发布前,轻量版V4 Lite(代号“sealion-lite”)已进入封闭测试阶段:具备100万token上下文窗口、约2000亿参数规模、原生融合图文表征能力;实测中仅用54行代码即可生成高精度SVG图像(如Xbox手柄),在空间建模与结构化输出方面显著优于V3.2及Claude Opus 4.6等竞品。
至于是否迈向通用人工智能(AGI),业界仍持审慎态度。DeepLearning.AI与Coursera联合创始人吴恩达(Andrew Ng)近日向Fast Company强调,若严格依照AGI原始定义——即具备与人类同等广度与深度的学习与执行能力(例如自学驾驶重型卡车或独立撰写博士论文),当前技术距离真正AGI仍有数十年差距。“我们离那个目标,依然非常遥远。”他重申。
延伸阅读:
中国DeepSeek被Anthropic抓到!用假帐号发动蒸馏攻击











