VMware 与 NVIDIA 为企业开启生成式 AI 时代

WBOY

发布时间：2023-08-25 08:45:07

1315人浏览过

来源于搜狐

转载

vmware和 nvidia于今日宣布扩展双方的战略合作伙伴关系，帮助成千上万家使用 vmware 云基础架构的企业做好准备，迎接ai时代的到来。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

VMware 与 NVIDIA 为企业开启生成式 AI 时代

VMware Private AI Foundation with NVIDIA 将使企业能够自定义模型并运行各种生成式 AI 应用，如智能聊天机器人、助手、搜索和摘要等。该平台将作为全集成式解决方案，采用 NVIDIA 提供的生成式 AI 软件和加速计算，基于 VMware Cloud Foundation 构建，并针对 AI 进行了优化。

VMware 首席执行官 Raghu Raghuram 表示：“生成式 AI 与多云可谓珠联璧合。客户的数据无处不在，遍布其数据中心、边缘、云等多处。我们将与 NVIDIA 一同助力企业放心地在数据附近运行生成式 AI 工作负载，并解决其在企业数据隐私、安全和控制方面的问题。”

NVIDIA 创始人兼首席执行官黄仁勋表示：“世界各地的企业都在竞相将生成式 AI 整合到自身业务中。通过与 VMware 扩大合作，我们将能够为金融服务、医疗、制造等领域的成千上万家客户提供其所需的全栈式软件和计算，使其能够使用基于自身数据定制的应用，充分挖掘生成式 AI 的潜力。”

全栈式计算大幅提升生成式 AI 的性能

为更快实现业务效益，企业希望简化并提高生成式 AI 应用的开发、测试和部署效率。根据麦肯锡的预测，生成式 AI 每年可为全球经济带来多达 4.4 万亿美元的增长(1)。

VMware Private AI Foundation with NVIDIA 将助力企业充分利用这一能力，以定制大语言模型，创建供内部使用的更加安全的私有模型，将生成式 AI 作为一项服务提供给用户，并更加安全地大规模运行推理工作负载。

该平台计划提供的各种集成式 AI 工具，将帮助企业经济高效地运行使用其私有数据训练而成的成熟模型。这一建立在 VMware Cloud Foundation 和 NVIDIA AI Enterprise 软件上的平台预计能够提供以下方面的优势：

• 隐私：将通过能够保护数据隐私并确保访问安全的架构，使客户能够在任何数据所在地轻松运行 AI 服务。

• 选择：从NVIDIA NeMo™到Llama 2等，企业在构建和运行其模型的位置上将拥有广泛的选择空间，包括领先的 OEM 硬件配置以及未来的公有云和服务提供商解决方案。

• 性能：近期的行业基准测试表明，某些用例在 NVIDIA 加速的基础设施上运行的性能与裸机性能相当，甚至超过了裸机性能。

• 数据中心规模：虚拟化环境中的 GPU 扩展优化使 AI 工作负载能够在单个虚拟机和多个节点上扩展到最多 16 颗 vGPU/GPU，从而加快生成式 AI 模型的微调和部署速度。

• 更低的成本：将最大程度地利用 GPU、DPU 和 CPU 的所有计算资源以降低总体成本，并创建可在各个团队间高效共享的池化资源环境。

• 加速存储：VMware vSAN Express Storage Architecture 提供性能经过优化的 NVMe 存储，并支持通过 RDMA 实现 GPUDirect® 存储，从而无需 CPU 即可实现从存储到 GPU 的直接 I/O 传输。

PathFinder

AI驱动的销售漏斗分析工具

下载

• 加速网络：vSphere 与 NVIDIA NVSwitch™ 技术之间的深度集成将进一步确保多 GPU 模型的执行不会出现 GPU 间瓶颈问题。

• 快速部署和价值实现时间：vSphere Deep Learning VM 镜像和镜像库将提供稳定的交钥匙解决方案镜像，该镜像预先安装了各种框架和性能经过优化的库，可实现快速原型开发。

该平台将采用的 NVIDIA NeMo是 NVIDIA AI Enterprise（NVIDIA AI 平台的操作系统）中包含的端到端云原生框架，可助力企业在几乎任何地点构建、自定义和部署生成式 AI 模型。NeMo 集自定义框架、护栏工具包、数据整理工具和预训练模型于一身，使企业能够以一种简单、经济且快速的方式来采用生成式 AI。

为将生成式 AI 部署到生产中，NeMo 使用 TensorRT for Large Language Models（TRT-LLM），以加速并优化 NVIDIA GPU 上最新 LLM 的推理性能。通过 NeMo，VMware Private AI Foundation with NVIDIA 将使企业能够导入自己的数据，并在 VMware 混合云基础架构上构建和运行自定义生成式 AI 模型。

在VMware Explore 2023大会上，NVIDIA与VMware将重点介绍企业内部的开发人员如何使用全新 NVIDIA AI Workbench 提取社区模型（例如 Hugging Face 上提供的 Llama 2），对这些模型进行远程自定义并在VMware环境中部署生产级生成式 AI。

生态圈对 VMware Private AI Foundation With NVIDIA 的广泛支持

VMware Private AI Foundation with NVIDIA将得到戴尔、慧与和联想的支持。这三家企业将率先提供搭载 NVIDIA L40S GPU、NVIDIA BlueField®-3 DPU 和 NVIDIA ConnectX®-7 智能网卡的系统，这些系统将加速企业 LLM 定制和推理工作负载。

相较于 NVIDIA A100 Tensor Core GPU，NVIDIA L40S GPU 可将生成式 AI 的推理性能和训练性能分别提高 1.2 倍和 1.7 倍。

NVIDIA BlueField-3 DPU 可加速、卸载和隔离 GPU 或 CPU 上的巨大计算工作负载，其中包含虚拟化、网络、存储、安全，以及其他云原生 AI 服务。

NVIDIA ConnectX-7 智能网卡可为数据中心基础设施提供智能、加速网络，以承载全球一些要求严苛的 AI 工作负载。

VMware Private AI Foundation with NVIDIA 建立在两家公司长达十年的合作基础之上。双方的联合研发成果优化了 VMware 的云基础架构，使其能够以媲美裸机的性能运行NVIDIA AI Enterprise。VMware Cloud Foundation 所提供的资源及基础架构管理与灵活性将进一步惠及双方共同的客户。

供应情况

VMware 计划于 2024 年初发布 VMware Private AI Foundation with NVIDIA。

Hugging Face终极指南：AI模型、数据集和应用构建

怎么使用网页版deepseek【教程】

Hugging Face Transformers：文本分类的完整指南

Hugging Face AI 应用构建指南：Gradio 快速上手

Hugging Face怎么下载模型抱抱脸Hugging Face模型文件下载方法【指南】

相关专题

Node.js后端开发与Express框架实践

本专题针对初中级 Node.js 开发者，系统讲解如何使用 Express 框架搭建高性能后端服务。内容包括路由设计、中间件开发、数据库集成、API 安全与异常处理，以及 RESTful API 的设计与优化。通过实际项目演示，帮助开发者快速掌握 Node.js 后端开发流程。

423

2026.02.10

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

445

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

虚拟化软件介绍

虚拟化软件有VMware、VirtualBox、Hyper-V、Parallels Desktop、Oracle VirtualBox等。想了解更多虚拟化的相关内容，可以阅读本专题下面的文章。

394

2023.12.20

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

177

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

热门下载

网站特效

网站源码

网站素材

前端模板