0

0

苹果展示 AI 新模型 MGIE,可一句话精修图片

PHPz

PHPz

发布时间:2024-02-08 11:33:25

|

1369人浏览过

|

来源于51CTO.COM

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

苹果展示 AI 新模型 MGIE,可一句话精修图片

2 月 8 日消息,相比较微软的风生水起,苹果公司在 ai 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。苹果公司近日发布了名为“mgie”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。

苹果展示 AI 新模型 MGIE,可一句话精修图片

图源:VentureBeat 与 Midjourney 合作制作

MGIE(MLLM-Guided Image Editing)是一种利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作的技术。它能够理解用户的自然语言命令,并进行类似于Photoshop的修改、全局照片优化和局部编辑等操作。通过MGIE,用户可以轻松地对图片进行各种编辑,而无需熟悉复杂的图像处理软件。这项技术在简化图像编辑流程的同时,也提供了更直观和高效的编辑方式。

苹果展示 AI 新模型 MGIE,可一句话精修图片

苹果公司与加州大学圣巴巴拉分校的研究人员合作,在2024年国际学习表征会议(ICLR)上公布了与MGIE相关的研究成果。ICLR是人工智能研究领域中最重要的会议之一。

在介绍 MGIE 之前,本站先来简要介绍一下 MLLM(Multimodal Language Learning Model)。MLLM 是一种强大的人工智能模型,其独特之处在于可以同时处理文本和图像,从而增强了基于指令的图像编辑能力。MLLM 在跨模态理解和视觉感知响应生成方面表现出卓越的能力,然而,目前尚未广泛应用于图像编辑任务。

苹果展示 AI 新模型 MGIE,可一句话精修图片

MGIE 通过两种方式将 MLLMs 集成到图像编辑过程中:其一,利用 MLLMs 从用户输入中推导出精确而富有表现力的指令。这些指令既简洁又明了,为编辑过程提供了清晰的指引。

例如,当输入“让天空更蓝”时,MGIE 可以生成“将天空区域的饱和度提高 20%”的指令。

CA.LA
CA.LA

第一款时尚产品在线设计平台,服装设计系统

下载

其次,它使用 MLLM 生成视觉想象力,即所需编辑的潜在表征。这一表征捕捉了编辑的本质,可用于指导像素级操作。MGIE 采用了一种新颖的端到端训练方案,可联合优化指令推导、视觉想象和图像编辑模块。

苹果展示 AI 新模型 MGIE,可一句话精修图片

MGIE 可以处理各种编辑情况,从简单的颜色调整到复杂的对象操作。该模型还可以根据用户的偏好执行全局和局部编辑。MGIE 的部分特性和功能包括:

  • 基于指令的表达式编辑:MGIE 可以生成简洁明了的说明,有效指导编辑过程。这不仅能提高编辑质量,还能增强用户的整体体验。
  • Photoshop 风格修改:MGIE 可以执行常见的 Photoshop 风格编辑,如裁剪、调整大小、旋转、翻转和添加滤镜。该模型还可以应用更高级的编辑,如更改背景、添加或删除对象以及混合图像。
  • 全局照片优化:MGIE 可以优化照片的整体质量,如亮度、对比度、清晰度和色彩平衡。该模型还能应用素描、绘画和漫画等艺术效果。
  • 局部编辑:MGIE 可以编辑图像中的特定区域或对象,如脸部、眼睛、头发、衣服和配饰。模型还可以修改这些区域或对象的属性,如形状、大小、颜色、纹理和风格。

苹果展示 AI 新模型 MGIE,可一句话精修图片

MGIE 是 GitHub 上的一个开源项目,用户可以点击这里找到代码、数据和预训练模型。该项目还提供了一个演示笔记本,展示如何使用 MGIE 完成各种编辑任务。

相关专题

更多
人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

409

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

300

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

628

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

33

2025.10.21

photoshop cs5序列号
photoshop cs5序列号

Photoshop序列号是指Adobe公司为其图像编辑软件Photoshop提供的一种许可证认证方式。每个购买正版Photoshop软件的用户都会得到一个独特的序列号,用于激活软件并证明其合法性。通过输入正确的序列号,用户可以解锁软件的所有功能,并享受Adobe提供的更新和技术支持。那么有没有什么永久免费的序列号呢,php中文网就给大家带来了photoshop cs5序列号序列号大全,同时还为大家带来了ps的相关课程,欢迎大家前来下载学

481

2023.07.06

ps暂存盘已满怎么办
ps暂存盘已满怎么办

ps暂存盘已满解决方法:1、更改暂存盘位置;2、清理缓存和历史记录;3、增加暂存盘空间。想了解更详细的解决方法,可以访问下面的文章。

400

2023.12.07

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

0

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

21

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

6

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号