0

0

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

雪夜

雪夜

发布时间:2025-07-29 09:44:02

|

559人浏览过

|

来源于php中文网

原创

7月27日,移远通信正式宣布与rwkv公司达成深度战略合作,双方将基于移远的高性能算力平台,对rwkv最新模型架构进行优化与适配,携手推进大模型在终端设备上的低资源、高效率部署。此次合作成果首次在2025世界人工智能大会(waic)上惊艳亮相,标志着端侧大模型技术向更高效能、更广泛应用场景迈出了重要一步。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

RWKV(Receptance Weighted KeyValue)是全球领先的RNN类大模型架构,创新性地融合了递归神经网络(RNN)的恒定计算复杂度与高效串行推理能力,同时吸收了Transformer的并行训练优势,在文本生成、语音处理、图像视频分析及时间序列预测等多个领域表现卓越,且训练与推理成本远低于传统Transformer模型。

其核心技术在于以RWKV算子替代Transformer中的位置编码和多头注意力机制,成功破解了后者在处理长序列时面临的内存与时间复杂度激增难题。该设计实现了token级计算和内存占用的恒定,无论序列多长,推理速度与资源消耗均保持稳定,从而显著提升效率。这一特性使其在资源受限的终端设备中极具优势,堪称赋予终端一个“轻量级AI大脑”。

在WAIC 2025展会上,基于高通QCS8550平台的两大联合解决方案重磅发布:

RWKVChat:持续思考,离线对话

RWKVChat是一款完全离线运行的AI聊天应用,无需联网即可实现本地推理、深度对话与文本续写,支持个性化设置,成为用户随身的“智能助手”。例如,搭载于高通手机平台的RWKV7-G12.9B模型,推理速度可达30token/s。得益于RWKV架构无需KV缓存的特性,在长时间对话中仍能保持速度与内存占用的恒定,体验流畅不卡顿。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

RWKVSudoku:超长链式推理

RWKV数独展示了仅20M参数的小模型在超长思维链(Chain-of-Thought, CoT)任务中的惊人表现。凭借恒定内存占用与极低token消耗,它能够高效解决复杂数独难题,直观体现了RWKV在端侧设备上实现高效推理的巨大潜力。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

琅琅配音
琅琅配音

全能AI配音神器

下载

在当前Transformer主导的大模型技术格局下,移远通信展现出前瞻性的战略布局,积极拓展非Transformer技术路径,致力于为行业提供更低功耗、更少内存依赖的端侧AI解决方案。

本次展出的RWKV7-G11.5B模型,在移远通信SG885G模组上经过深度工程优化后,性能表现远超同参数量级的Transformer模型。实测数据显示:

在Prefill阶段:

  • 平均耗时降低83%
  • 处理速度提升345%

在Decoding阶段:

  • CPU平均使用率下降23%
  • 内存占用减少36%
  • 功耗降低18%

SG885G模组基于高通QCS8550平台打造,具备高达48TOPS的AI算力,可支持约7B参数的多模态模型本地推理,实现图像理解与多源信息融合的实时响应。在模型兼容方面,移远已构建完善的端侧适配体系,全面支持Llama、通义千问、DeepSeek等主流开源模型,覆盖0.5B至8B参数范围,打造了一个功能强大的端侧大模型运行平台。尤为关键的是,SG885G率先支持非Transformer路线的RWKV7架构,大幅降低对硬件资源的需求。

移远通信首席运营官张栋表示:“此次与RWKV的合作,是我们‘让终端拥有AI大心脏’理念的重要实践。RWKV的线性注意力机制,彻底打破了终端设备处理长序列数据的瓶颈。结合移远的高算力模组,我们真正把大模型‘装进’了物联网终端。当农机能‘读懂’土壤状态,当手表可‘预判’健康风险,AI就不再只是云端的概念,而是深入田间地头、融入日常生活的现实力量。”

RWKV联合创始人兼COO罗璇表示:“我们的目标是让每一台设备都具备思考能力,就像植入一颗会学习的‘大脑’。随着RWKV架构在移远算力平台上的规模化落地,终端将突破资源限制,形成‘云端能力+本地智能’的双轮驱动生态,为万物智联时代打下坚实的技术基础。”

移远通信与RWKV的强强联合,不仅是硬件与算法的深度融合,更是推动智能普惠化的重要里程碑,让大模型真正从云端走向终端,赋能千行百业、千家万户。

7月26日至29日,欢迎莅临WAIC 2025移远通信展台(H1D815),亲身体验端侧大模型带来的智能变革。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6112

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

816

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1064

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1302

2024.03.01

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

405

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

451

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

632

2024.09.10

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

52

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
帝国CMS企业仿站教程
帝国CMS企业仿站教程

共17课时 | 1.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号