2月5日,由中科曙光承建的3套万卡级超大规模ai集群系统,在国家超算互联网郑州核心节点同步启动试运行,正式成为全国首个完成3万张国产加速卡部署并投入实际运营的ai算力基础设施,全面支撑万亿参数大模型训练、高并发推理任务以及ai for science等前沿ai计算需求。

从构想到落地,一步到位
当前,人工智能大模型正加速迈向万亿参数规模、多模态融合与世界模型构建的新阶段,对底层算力底座提出了更高要求。去年12月,scaleX万卡超集群在HAIC大会首次实现真机展示;仅隔不到两个月,便以超3万卡的国产AI算力规模成功交付并投入运行。这也意味着,我国自主研发的万卡级AI集群已全面迈入规模化部署与真实业务承载的新纪元。
这背后是一场系统性攻坚。中科曙光围绕高速互联网络架构、存-算-传一体化紧耦合设计、超高密度供电与液冷散热方案、跨节点统一资源智能调度等关键环节,开展多项核心技术突破,构建起稳定可靠、高效协同的万卡级AI算力平台。
从自主可控走向开放共享
随着AI产业持续升温,全球范围内智能算力需求呈爆发式增长。新一代算力基础设施亟需具备生态兼容性、弹性伸缩能力及低门槛接入特性,从而更好适配多样化应用场景,显著降低行业用户的使用成本与迁移难度。
曙光scaleX万卡超集群采用开放型AI计算架构,全面兼容CUDA等主流编程生态,支持多种国产加速芯片混合部署,有效缩短开发者适配周期;同时具备向十万卡乃至百万卡级别平滑扩展的能力,为AI产业规模化发展提供坚实支撑。
依托上述优势,scaleX万卡超集群已成为国家超算互联网郑州节点的核心AI算力引擎,并通过国家超算互联网平台实现全域算力统一分发与协同调度,面向全球用户提供通用性强、操作便捷、性能卓越且普惠可及的中国自主AI算力服务。
从基础支撑到生态赋能
打造繁荣可持续的AI产业生态,离不开“算力—算法—数据—应用”的深度融合。目前,scaleX万卡超集群已完成对400余个主流大模型及世界模型的深度适配与性能调优;借助国家超算互联网平台,还可无缝接入上千款AI应用,广泛连接高校、科研机构与产业链上下游企业,真正实现“算力+应用”一体化交付与联合创新。
在具体实践中,该集群已在多个领域展现出强大赋能能力:
- 面向超大规模模型训练,支持整机级万亿参数模型训练,并具备断点续训与自动容错恢复能力;
- 在高通量推理场景中,已稳定服务于多家头部互联网企业的核心智能业务系统,并通过联合深度优化不断提升推理吞吐与响应效率;
- 在AI for Science方向,助力国内某材料科学大模型登顶国际权威评测榜单;支撑顶尖科研团队将蛋白质结构预测与功能分析效率提升3至6个数量级;
- 同步搭载OneScience科学大模型一站式开发平台,显著降低跨学科AI科研的入门门槛与协作成本。
“智能化浪潮正以前所未有的广度与深度重塑人类社会。”中科曙光高级副总裁李斌表示,“郑州核心节点的成功上线,是国产智能算力迈向高质量发展的关键一步。未来,我们将持续加大技术研发投入与场景落地实践,推动中国自主AI算力更高效、更稳定、更普惠地融入千行百业,全面赋能经济社会数字化转型。”










