0

0

华为助力京东建设高性能智算网络,星河AI数据中心网络亮相JDD大会

絕刀狂花

絕刀狂花

发布时间:2025-09-29 13:28:28

|

974人浏览过

|

来源于php中文网

原创

硬件是基础,软件是灵魂。在2025年9月25日举行的京东全球科技探索者大会(jdd)上,京东集团再次全面升级其ai战略,进一步明确了“以零售为根基的技术与服务企业”的整体定位。为支撑这一新战略的落地实施,京东不仅将自研的“言犀”大模型扩展为全新的“joyai”大模型家族,还发布了joyagent3.0、joycode2.0等一系列智能体产品。同时,京东宣布将在未来三年持续加大投入,推动构建万亿级规模的人工智能生态体系。

显然,如此宏大的AI战略布局和不断涌现的AI业务场景,离不开强大且高效的基础设施支持。在本次大会的展示区域,华为首次对外亮相了多款专为AI时代打造的前沿基础设施新品,包括高密128*400GE盒式以太交换机、400G/800G高速星联光模块等,充分展现了其在AI基础设施领域的技术领先性,也预示着京东与华为在联合创新方面拥有广阔的合作空间。

华为助力京东建设高性能智算网络,星河AI数据中心网络亮相JDD大会

华为展台

AI不仅是算力的挑战,更是网络的考验

随着京东AI战略的深入推进以及各类AI应用需求的爆发式增长,其智算集群正加速向万卡乃至十万卡规模迈进。在此过程中,网络架构的组网能力、负载均衡性能以及运维管理效率,已成为决定智算集群整体效能的核心瓶颈。

组网规模难题:在单台交换机端口数量固定的前提下,集群规模的扩大意味着更多网络设备的部署,这不仅占用大量机架空间、推高总体拥有成本(TCO),还会显著增加网络拓扑复杂度。与此同时,计算节点对带宽的需求也在迅速攀升。

负载均衡压力:在大规模智算集群中,一旦发生网络拥塞,整个训练任务的性能可能急剧下降。因此,如何实现高效负载均衡成为关键课题。特别是在MoE等新型模型架构广泛应用后,整网流量调度的复杂性进一步加剧。

运维管理挑战:随着集群规模扩大和网络结构日益复杂,传统运维模式已难以应对。面对AI作为核心业务的高可用要求,提升故障响应速度和运维质量已成为刚需。

华为助力京东建设高性能智算网络,星河AI数据中心网络亮相JDD大会

华为数据中心网络128*400GE交换机

面对上述多重挑战,以京东为代表的头部互联网企业亟需更先进、更具算效比的网络解决方案。正是在此背景下,华为推出星河AI高算效数据中心网络,通过“以网强算”,助力客户最大化释放智算集群的算力潜能。

以高密度400GE网络

酷兔AI论文
酷兔AI论文

专业原创高质量、低查重,免费论文大纲,在线AI生成原创论文,AI辅助生成论文的神器!

下载

打造超大规模智算集群

为满足京东不断增长的AI算力需求,构建更大规模的智算集群势在必行。在这一过程中,华为推出的高密128*400GE盒式交换机与576*400GE框式交换机发挥了关键作用,采用两层组网架构可支持最大达3.6万卡的集群规模。相比传统的三层架构,该方案减少40%的400GE光模块使用量,相应地使光互联成本降低40%,大幅优化了部署效率与经济性。

以全局负载均衡提升集群性能

网络负载均衡是保障智算效率的基础。华为星河AI网络搭载全新升级的NSLB-DP动态负载均衡方案,通过智能动态调度算法实现本地与全局链路的协同优化,有效克服了传统静态算法缺乏全局视角的局限,并已在京东实际网络环境中完成测试验证。

测试结果显示:在集合通信场景下,NSLB-DP相较于原有的NSLB-S(静态算法)在Allreduce、ReduceScatter、Allgather等常用算子上的带宽表现均有提升,最高增幅达24.62%;在真实模型训练场景中,NSLB-DP亦带来训练吞吐量的显著提高,性能提升最高达7.32%。

以智能运维实现提质增效

传统Telemetry技术在高负载、超大规模集群中存在指标采集不全、上报延迟等问题,导致故障排查耗时长达数小时,难以满足京东对AI系统稳定性的严苛要求。

为此,华为星河AI网络引入iFIT(随流检测)与Packet-Event(丢包及超时延可视)两大创新技术。iFIT可实现业务流路径的可视化,并支持逐跳实时监测丢包与时延情况,帮助运维团队快速定位故障节点;Packet-Event则深入芯片层级,主动上报丢包根因和超时延流信息。两项技术结合,使得典型网络问题可在分钟级完成定界定位,极大提升了运维效率与系统可用性。

连接算力,也连接未来

华为长期坚持在以网络为核心的根技术领域高强度投入,星河AI高算效数据中心网络正是这些积累的集中体现。通过先进的网络技术,华为不仅实现了海量算力的高效互联,更在AI应用、业务价值与未来发展之间搭建起稳固桥梁——这也正是京东与华为能够持续深化合作、共创共赢的根本所在。

星河AI网络只是华为与京东深度协作的一个缩影,但它所映射出的,是华为与中国互联网产业携手同行、共赴AI浪潮的坚定步伐。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

403

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

411

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

305

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

632

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

34

2025.10.21

云朵浏览器入口合集
云朵浏览器入口合集

本专题整合了云朵浏览器入口合集,阅读专题下面的文章了解更多详细地址。

20

2026.01.20

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

28

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

146

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

120

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
前端开发(基础+实战项目合集)
前端开发(基础+实战项目合集)

共60课时 | 3.9万人学习

Go语言教程-全程干货无废话
Go语言教程-全程干货无废话

共100课时 | 9.8万人学习

javascript开发购物车教程
javascript开发购物车教程

共9课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号