苹果新AI模型实现端侧GUI智能性能超大型模型24倍

絕刀狂花

发布时间：2026-02-22 20:33:21

719人浏览过

来源于php中文网

原创

近日，外媒消息称，苹果科研团队已成功研发出一款名为ferret-ui lite的新型端侧人工智能代理。该轻量级模型可直接在终端设备上部署运行，并能依据用户指令，自主操作各类应用程序的图形界面（gui）。

苹果新AI模型实现端侧GUI智能性能超大型模型24倍

据CNMO获悉，该项目是苹果在多模态大语言模型领域，尤其是Ferret系列持续深耕的重要成果。早在2023年末，苹果便推出了基础模型“FERRET”，旨在赋予AI对图像中局部区域的理解能力。随后，团队进一步推出专为移动UI理解优化的Ferret-UI，以及升级版Ferret-UI 2。尽管这些早期模型功能全面，但参数量庞大，主要面向服务器端部署。

苹果新AI模型实现端侧GUI智能性能超大型模型24倍

而本次发布的Ferret-UI Lite则聚焦于效率与精简——它仅含30亿参数，核心使命是在算力与内存受限的终端设备（如智能手机）上，高效执行GUI交互任务。

星绘

豆包旗下 AI 写真、P 图、换装和视频生成

下载

研究团队指出，当前主流GUI代理普遍依赖参数量巨大的基础模型。这类模型虽具备较强的推理与任务规划能力，却因体积臃肿、计算开销高，难以实现在设备本地稳定运行。为突破这一瓶颈，Ferret-UI Lite融合多项创新设计，达成性能与轻量化的协同优化。其中关键一环是“实时区域裁剪与动态放大”机制：模型首先对整屏内容进行粗粒度分析，识别关键区域后，自动裁切并放大该区域，再进行精细化语义解析。此举显著缓解了小规模模型处理高分辨率界面图像时的信息捕捉压力。

苹果新AI模型实现端侧GUI智能性能超大型模型24倍

实测数据显示，尽管参数量大幅缩减，Ferret-UI Lite在多项标准GUI理解与操作基准测试中，性能表现不仅媲美主流竞品，甚至超越参数规模达其24倍的同类大模型。其优势尤为体现在短周期、低复杂度的界面操作任务中。虽然在需多步协同、逻辑嵌套较深的长程交互场景中尚存提升空间，但作为完全离线运行的端侧AI代理，它带来了根本性价值：所有界面感知、指令解析与操作决策均在设备本地闭环完成，无需任何数据上传云端，从而从源头保障用户隐私与敏感信息的安全。

据悉，区别于此前主要基于iPhone截图开展验证的版本，Ferret-UI Lite的训练与评估工作主要依托Android系统、网页端及桌面级GUI环境展开。这一选择或受当前主流GUI自动化测试平台生态分布影响，同时也侧面印证了该模型在跨操作系统、跨设备形态场景下的适配潜力与泛化能力。

苹果将推多款智能家居产品包含AI家庭中心与摄像头

苹果官宣3月4日发布新品 iPhone 17e等新机将亮相

苹果翻盖式折叠屏iPhone曝光竖折叠新形态正在路上

华为Pura X2和苹果折叠屏爆料信息对比华为或先发布

三星或将推出阔折叠产品丰富2026年折叠屏市场

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

苹果 ai android iphone ui 自动化

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：曝iPhone Fold与iPhone 18 Pro于7月量产还将同步发售下一篇：APP加短视频模块,用户更活跃!

作者最新文章

PHP变量常见错误怎么解决_PHP变量错误排查指南【教程】

2026-02-22 16:45

必应搜索缓存怎么清理_Bing浏览器缓存清除释放空间【操作】

2026-02-22 16:57

燕云十六声费云怎么结交费云对话攻略

2026-02-22 18:31

选技大乱斗最新兑换码选技大乱斗兑换码长期有效汇总2026

2026-02-22 19:04

QQ浏览器怎么关联微信账号_QQ浏览器微信登录快速绑定方法【技巧】

2026-02-22 19:06

搜狗浏览器怎么屏蔽网页广告_搜狗浏览器广告过滤规则订阅方法【汇总】

2026-02-22 19:09

FeiKua浏览器怎么同步书签_FeiKua浏览器跨设备书签同步方法【指南】

2026-02-22 19:22

2025 企业微信 SCRM 实测避坑：微伴互动雷达封神，7 款工具实测对比

2026-02-22 19:33

战略大师速成秘籍：打造你的无敌军团

2026-02-22 19:52

紫阳花双控流教学：纸舞花影下的战场艺术！

2026-02-22 20:02

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

android开发三大框架

android开发三大框架是XUtil框架、volley框架、ImageLoader框架。本专题为大家提供android开发三大框架相关的各种文章、以及下载和课程。

324

2023.08.14

android是什么系统

Android是一种功能强大、灵活可定制、应用丰富、多任务处理能力强、兼容性好、网络连接能力强的操作系统。本专题为大家提供android相关的文章、下载、课程内容，供大家免费下载体验。

1793

2023.08.22

android权限限制怎么解开

android权限限制可以使用Root权限、第三方权限管理应用程序、ADB命令和Xposed框架解开。详细介绍：1、Root权限，通过获取Root权限，用户可以解锁所有权限，并对系统进行自定义和修改；2、第三方权限管理应用程序，用户可以轻松地控制和管理应用程序的权限；3、ADB命令，用户可以在设备上执行各种操作，包括解锁权限；4、Xposed框架，用户可以在不修改系统文件的情况下修改应用程序的行为和权限。

2104

2023.09.19