120亿参数图像模型FLUX.1 Kontext[dev]开源，性能对标GPT - image - 1

蓮花仙者

发布时间：2025-09-19 12:04:01

897人浏览过

来源于php中文网

原创

图像模型开源领域迎来新突破！Black Forest Labs正式宣布开源其旗舰级图像编辑模型FLUX.1 Kontext[dev]。这款模型虽仅有12B参数，却展现出与GPT-image-1等闭源大模型相媲美的强大能力，并且支持在消费级显卡上流畅运行。借助FLUX.1 Kontext[dev]，用户可轻松完成多种图像编辑任务。例如让小狗瞬间从画面中消失，为小老鼠“戴上”胡须，添加文字或更换背景也变得异常简单。更值得一提的是，该模型支持多轮指令输入，允许用户反复调整，直到生成满意的图像效果。 FLUX.1 Kontext[dev]具备多项突出特性：它能根据文本指令直接对现有图像进行修改，实现精准的局部和全局编辑。无需微调即可复用角色、风格和物体元素。支持连续多次编辑操作，在保证视觉一致性的同时显著降低视觉漂移问题。此外，模型还针对NVIDIA Blackwell架构进行了TensorRT权重优化，进一步提升性能表现。网友们对该模型表现出极大热情，纷纷动手实测。有人创作出戴着墨镜、身穿红毛衣的旅行CPU青蛙；有人复制心仪动漫人物形象；更有创意达人将其与LoRA结合，开发出一款Kontext风格化肖像生成APP。目前，FLUX.1 Kontext[dev]已全面兼容ComfyUI，官方还开放了试玩API接口，点击文末链接上传图片即可立即体验。不少网友评价Black Forest Labs堪称“图像界的DeepSeek”。此前发布的FLUX.1 Kontext系列因出色的上下文理解与图像编辑能力广受赞誉。不同于传统文生图模型，FLUX.1 Kontext支持上下文感知的图像生成，能够同时接受图像和文本作为提示输入，无缝提取并修改图像细节。目前已推出专业版FLUX.1 Kontext[pro]和高配版FLUX.1 Kontext[max]。此次开源的FLUX.1 Kontext[dev]继承了该系列的核心优势，专注于图像编辑功能，并可在普通消费级硬件上高效运行。模型架构基于FLUX.1——一种在图像自动编码器潜在空间中训练的整流流Transformer结构，采用双流与单流模块混合设计。在此基础上，通过优化标记序列构建和位置信息编码增强性能。其中，标记序列构建是将图像经由冻结的FLUX自动编码器编码为潜在上下文图像标记，并送入模型的视觉流；位置编码则利用三维旋转位置嵌入（3D RoPE），为上下文标记引入恒定偏移量，视作虚拟时间步，有效分离上下文块与目标块，同时保留其内部空间结构。训练过程中，采用整流流匹配损失函数，从FLUX.1文生图检查点出发，收集并整理数百万组关系对用于优化。随后使用潜在对抗扩散蒸馏（LADD）技术对优化后的流匹配模型进行压缩，在减少采样步数的同时提升生成质量，使模型更加高效。最终版本的FLUX.1 Kontext[dev]包含120亿参数，专精于编辑任务，支持迭代式编辑，能在复杂场景中稳定保留角色特征，实现精细的局部或整体修改。为了评估模型性能，团队推出了自研评测基准KontextBench，涵盖1026个图像-提示对，涉及局部编辑、全局编辑、角色参考、风格参考和文本编辑五大类别。实验结果显示，FLUX.1 Kontext[dev]在多个指标上超越现有开源及闭源模型，包括字节跳动的Bagel、HiDream-E1-Full以及OpenAI的GPT-image-1等。值得一提的是，FLUX.1 Kontext[dev]特别针对NVIDIA Blackwell架构完成了TensorRT权重优化，不仅大幅提升推理速度，还显著降低内存占用。官方提供了BF16、FP8和FP4三种TensorRT权重变体，用户可根据需求灵活权衡速度、效率与画质，充分发挥新一代GPU硬件潜力。实际测试反馈显示，该模型推理速度相较前代提升了4到5倍，在NVIDIA H100 GPU上平均5秒内即可完成一次生成，在Replicate平台上的单次调用成本约为0.0067美元，相当于每1美元可运行约149次。不过也有用户指出，在MacBook Pro搭载的M系列芯片上运行时，每次迭代耗时较长，大约需要1分钟。欢迎各位亲自尝试这一强大工具，并在评论区分享你的使用体验！试玩链接：https://huggingface.co/spaces/black-forest-labs/FLUX.1-Kontext-Dev 论文链接：https://arxiv.org/abs/2506.15742 代码链接：https://github.com/black-forest-labs/flux/blob/main/docs/image-editing.md

OpenClaw怎么联机对战 OpenClaw多人模式开启步骤【实测】

如何提高技术文档的可读性利用DeepSeek进行代码注释自动化生成

OpenClaw怎么安装运行 OpenClaw官方版安装详细步骤【教程】

如何提升代码的安全性和防攻击能力利用DeepSeek进行静态安全扫描

人工智能怎么运行MiniMax模型_人工智能本地加载ABAB大模型教程

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：智谱旗舰模型GLM - 4.5发布，成本低性能优，相关企业或迎风口下一篇：RephraseAI改写直播台词脚本_RephraseAI改写AI直播台词脚本详尽教程

作者最新文章

2026建筑施工许可证怎么办理_2026建筑工程开工前审批流程

2026-03-11 09:30

神鲸办公怎么配置角色权限_神鲸办公管理员分配功能权限

2026-03-11 09:34

6s整理通知怎么设置_苹果6s消息通知整理与屏蔽设置方法

2026-03-11 09:50

抖音商城怎样抢限时年货券抖音直播间专属优惠领取方法【速看】

2026-03-11 09:55

小7手游平台app怎么查看游戏排行小7手游平台app查排行入口【指引】

2026-03-11 09:57

答题666红包入口答题666红包入口查找【教程】

2026-03-11 10:05

艾尔登法环噩兆妖鬼实战攻略菜鸟轻松拿捏马尔基特

2026-03-11 10:09

11怎么设置密码_苹果11锁屏/账户密码设置方法【步骤】

2026-03-11 10:17

春节跨年班算三倍工资吗_零点前后排班认定实例解读【指南】

2026-03-11 10:19

QClaw内测申请链接 QClaw内测申请入口在哪

2026-03-11 10:38

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全

2026最全AI工具安装教程专题：包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好，附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新，收藏这一篇就够了，让AI安装不再报错！

169

2026.03.04

Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践，系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例，帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

246

2026.03.03

C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开，深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例，帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

2026.03.03

热门下载

网站特效

网站源码

网站素材

前端模板