0

0

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

花韻仙語

花韻仙語

发布时间:2025-10-29 19:27:01

|

934人浏览过

|

来源于php中文网

原创

要点:

Qualcomm® AI200与AI250解决方案凭借行业领先的总体拥有成本(TCO),为数据中心的生成式AI推理提供机架级性能和卓越内存容量。Qualcomm AI250采用创新的近存计算架构,显著提升有效内存带宽与能效,实现AI工作负载处理能力的飞跃。两款产品均配备全面优化的软件,并兼容主流AI框架,助力企业及开发者在跨数据中心环境中安全、高效地部署可扩展的生成式AI应用。这些解决方案是高通技术公司多代数据中心AI推理路线图的重要组成,延续每年迭代的技术发展节奏。

2025年10月28日,圣迭戈——高通技术公司今日发布面向数据中心的新一代AI推理加速产品:基于Qualcomm AI200与AI250芯片的加速卡及整机架系统。依托公司在NPU领域的深厚积累,该系列产品实现了机架级高性能与大容量内存的结合,以更高的每瓦每美元性能支持高速生成式AI推理,标志着各行业迈向高效、灵活且可扩展AI部署的关键一步。

Qualcomm AI200专为大规模AI推理场景设计,适用于大语言模型(LLM)、多模态模型(LMM)及其他复杂AI任务,在保证优异性能的同时大幅降低总体拥有成本。单张加速卡配备高达768GB LPDDR内存,兼顾高容量与低成本优势,为AI推理带来更强的扩展性与部署灵活性。

Qualcomm AI250则首次引入近存计算(Near-Memory Computing)架构,使有效内存带宽提升超过10倍,同时显著降低功耗,全面增强AI推理的能效比与处理性能。该架构支持解耦式推理模式,实现硬件资源的动态调配与高效利用,精准匹配不同客户对性能与成本的多样化需求。

两款机架级系统均支持直接液冷技术,提升散热效率;支持PCIe纵向扩展和以太网横向扩展能力,并集成机密计算功能,保障AI工作负载的数据安全。整机架设计功耗为160千瓦,满足高性能运算下的能效与稳定性要求。

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

析稿Ai写作
析稿Ai写作

科研人的高效工具:AI论文自动生成,十分钟万字,无限大纲规划写作思路。

下载

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)表示:“通过Qualcomm AI200与AI250,我们正在重新定义机架级AI推理的边界。这些先进的基础设施方案让客户能够以极具竞争力的TCO部署生成式AI,同时满足现代数据中心对安全性、灵活性和可扩展性的严苛要求。凭借完整的软件生态与开放支持,我们使开发者和企业可以更便捷地集成、管理和扩展已训练模型。得益于与主流AI框架的无缝对接以及一键部署能力,AI200与AI250将加速应用落地与技术创新。”

高通提供的超大规模AI软件栈覆盖从应用层到系统底层的全链路,专为AI推理深度优化。该栈支持主流机器学习(ML)框架、推理引擎、生成式AI平台以及针对LLM/LMM的解耦服务等先进优化技术。开发者可通过高通高效的Transformer库(Efficient Transformers Library)和Qualcomm® AI Inference Suite,轻松实现模型接入,并支持Hugging Face模型的一键部署。软件体系还提供即用型AI应用、智能体、开发工具、函数库、API接口以及AI运维服务,全面提升开发与运营效率。

Qualcomm AI200预计于2026年投入商用,AI250将于2027年紧随其后。未来,高通技术公司将持续按照年度更新节奏推进数据中心AI产品路线图,聚焦打造行业领先的AI推理性能、能效表现与总体成本优势。更多详情,请访问官方网站。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1024

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

66

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

450

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

0

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

85

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 6.2万人学习

Node.js 教程
Node.js 教程

共57课时 | 8.9万人学习

Rust 教程
Rust 教程

共28课时 | 4.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号