0

0

英伟达收购消息传出,或将进一步扩大其软件生态护城河

P粉986688829

P粉986688829

发布时间:2025-12-21 13:32:03

|

637人浏览过

|

来源于php中文网

原创

英伟达收购SchedMD以掌控Slurm开源调度系统,承诺维持其开源中立性并整合CUDA实现SM级GPU调度;升级企业支持体系,原生集成DGX Cloud,并扩展机密计算安全调度能力。

英伟达近期宣布收购ai软件公司schedmd,此举直接关联其slurm开源工作负载管理系统的控制权与演进路径。slurm作为全球超算中心广泛采用的调度系统,其深度适配英伟达最新硬件后,已成为生成式ai模型训练与推理的关键基础设施组件。以下是针对该收购事件所引发的生态影响与技术整合路径的解析:

本文运行环境:MacBook Pro M3 Max,macOS Sequoia

一、Slurm开源治理权的承接与延续

英伟达明确承诺维持Slurm的开源属性与厂商中立定位,确保其继续以自由分发形式供全球HPC及AI开发者使用。此举旨在巩固社区信任,避免因商业接管导致核心用户迁移或分支分裂。

1、英伟达已正式接管SchedMD全部Slurm代码仓库与CI/CD基础设施。

2、原Slurm维护团队核心成员整体转入英伟达HPC软件部门,保留技术决策席位。

3、未来所有Slurm主版本更新将同步发布于GitHub官方仓库,并标注“NVIDIA-supported”标识。

二、CUDA与Slurm的深度协同优化

通过将Slurm调度逻辑与CUDA运行时堆进行底层对齐,可实现GPU资源分配粒度从节点级细化至流处理器组(SM)级,显著提升多租户AI训练作业的隔离性与吞吐效率。

1、启用CUDA-aware Slurm插件,自动识别NCCL通信拓扑并绑定GPU实例。

2、在slurm.conf中配置GresType=gpu与GresFlags=cooperative参数,启用协作式GPU共享。

3、调用sbatch提交任务时,通过--gpus-per-task=2 --cpus-per-gpu=8精确声明异构资源配比。

三、企业级支持服务架构升级

英伟达将沿用SchedMD原有商业模式,即基础软件免费开源,营收来源于工程实施、定制化开发与SLA保障服务。新架构下,支持响应等级按客户类型分级,覆盖从学术实验室到超大规模云服务商。

1、设立三级支持通道:社区论坛(免费)、NVIDIA Enterprise Support(年费订阅)、NVIDIA AI Infrastructure Concierge(专属客户经理+现场驻场)。

Nimo.space
Nimo.space

智能画布式AI工作台

下载

2、所有付费支持合同默认包含Slurm与CUDA版本兼容性矩阵验证服务。

3、面向CoreWeave等云合作伙伴,提供白标Slurm管理控制台集成SDK。

四、Slurm调度器与DGX Cloud的原生集成

DGX Cloud作为英伟达托管式AI基础设施平台,需将Slurm抽象为云原生服务接口。此次收购使Slurm可直接嵌入DGX Cloud的Kubernetes Operator中,实现AI作业从YAML定义到GPU物理调度的端到端自动化。

1、在DGX Cloud控制台启用“Slurm Mode”,自动部署高可用Slurm Controller集群。

2、用户通过kubectl apply -f job.yaml提交PyTorch DDP训练任务,Operator自动转换为srun指令并注入NCCL环境变量

3、GPU利用率、显存占用、NVLink带宽等指标实时回传至DGX Cloud监控面板,与Prometheus无缝对接。

五、安全增强型调度策略扩展

针对多租户AI推理场景中日益突出的侧信道攻击风险,英伟达正基于Slurm底层框架开发硬件辅助隔离模块,利用NVIDIA Confidential Computing技术,在调度层强制实施GPU内存加密与执行上下文锁定。

1、启用slurm.conf中的ConfidentialCompute=yes参数,触发GPU可信执行环境(TEE)初始化。

2、所有srun启动的容器进程自动加载NVIDIA Driver 550+ Confidential Compute驱动模块。

3、调度器拒绝未签署Enclave签名的模型加载请求,错误码返回SLURM_ERROR_CONFIDENTIALITY_VIOLATION

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1025

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

66

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

451

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

0

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.8万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号