0

0

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

花韻仙語

花韻仙語

发布时间:2025-10-29 19:27:01

|

934人浏览过

|

来源于php中文网

原创

要点:

Qualcomm® AI200与AI250解决方案凭借行业领先的总体拥有成本(TCO),为数据中心的生成式AI推理提供机架级性能和卓越内存容量。Qualcomm AI250采用创新的近存计算架构,显著提升有效内存带宽与能效,实现AI工作负载处理能力的飞跃。两款产品均配备全面优化的软件,并兼容主流AI框架,助力企业及开发者在跨数据中心环境中安全、高效地部署可扩展的生成式AI应用。这些解决方案是高通技术公司多代数据中心AI推理路线图的重要组成,延续每年迭代的技术发展节奏。

2025年10月28日,圣迭戈——高通技术公司今日发布面向数据中心的新一代AI推理加速产品:基于Qualcomm AI200与AI250芯片的加速卡及整机架系统。依托公司在NPU领域的深厚积累,该系列产品实现了机架级高性能与大容量内存的结合,以更高的每瓦每美元性能支持高速生成式AI推理,标志着各行业迈向高效、灵活且可扩展AI部署的关键一步。

Qualcomm AI200专为大规模AI推理场景设计,适用于大语言模型(LLM)、多模态模型(LMM)及其他复杂AI任务,在保证优异性能的同时大幅降低总体拥有成本。单张加速卡配备高达768GB LPDDR内存,兼顾高容量与低成本优势,为AI推理带来更强的扩展性与部署灵活性。

Qualcomm AI250则首次引入近存计算(Near-Memory Computing)架构,使有效内存带宽提升超过10倍,同时显著降低功耗,全面增强AI推理的能效比与处理性能。该架构支持解耦式推理模式,实现硬件资源的动态调配与高效利用,精准匹配不同客户对性能与成本的多样化需求。

两款机架级系统均支持直接液冷技术,提升散热效率;支持PCIe纵向扩展和以太网横向扩展能力,并集成机密计算功能,保障AI工作负载的数据安全。整机架设计功耗为160千瓦,满足高性能运算下的能效与稳定性要求。

VIVA
VIVA

一个免费的AI创意视觉设计平台

下载

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能

高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)表示:“通过Qualcomm AI200与AI250,我们正在重新定义机架级AI推理的边界。这些先进的基础设施方案让客户能够以极具竞争力的TCO部署生成式AI,同时满足现代数据中心对安全性、灵活性和可扩展性的严苛要求。凭借完整的软件生态与开放支持,我们使开发者和企业可以更便捷地集成、管理和扩展已训练模型。得益于与主流AI框架的无缝对接以及一键部署能力,AI200与AI250将加速应用落地与技术创新。”

高通提供的超大规模AI软件栈覆盖从应用层到系统底层的全链路,专为AI推理深度优化。该栈支持主流机器学习(ML)框架、推理引擎、生成式AI平台以及针对LLM/LMM的解耦服务等先进优化技术。开发者可通过高通高效的Transformer库(Efficient Transformers Library)和Qualcomm® AI Inference Suite,轻松实现模型接入,并支持Hugging Face模型的一键部署。软件体系还提供即用型AI应用、智能体、开发工具、函数库、API接口以及AI运维服务,全面提升开发与运营效率。

Qualcomm AI200预计于2026年投入商用,AI250将于2027年紧随其后。未来,高通技术公司将持续按照年度更新节奏推进数据中心AI产品路线图,聚焦打造行业领先的AI推理性能、能效表现与总体成本优势。更多详情,请访问官方网站。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1923

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2392

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

22

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

48

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

93

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Node.js 教程
Node.js 教程

共57课时 | 13.2万人学习

Rust 教程
Rust 教程

共28课时 | 6.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号