0

0

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

聖光之護

聖光之護

发布时间:2024-11-05 16:42:35

|

755人浏览过

|

来源于机器之心

转载

最近的文本到图像生成器由文本编码器和扩散模型组成。如果在没有适当安全措施的情况下部署,它们会产生滥用风险(左图)。我们提出了潜在保护方法(右图),这是一种旨在阻止恶意输入提示的安全方法。我们的想法是在文本编码器的基础上,检测学习的潜在空间中黑名单概念的存在。这使我们能够检测到超出其确切措辞的黑名单概念,并且还扩展到一些对抗性攻击(“”)。黑名单在测试时是可调的,可以添加或删除概念而无需重新训练。被阻止的提示不会被扩散模型处理,从而节省计算成本。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

随着生成高质量图像的能力,文本到图像(T2I)模型可能被滥用于创建不当内容。为了防止滥用,现有的安全措施要么基于文本黑名单,这很容易被规避,要么基于有害内容分类,这需要大量数据集进行训练且灵活性较低。因此,我们提出了潜在保护(Latent Guard),这是一个旨在改善文本到图像生成安全措施的框架。受到基于黑名单方法的启发,潜在保护在T2I模型的文本编码器上学习了一个潜在空间,在该空间中可以检查输入文本嵌入中有害概念的存在。我们提出的框架由一个特定于该任务的数据生成管道、专门的架构组件和一种对比学习策略组成,以从生成的数据中受益。我们的方法在三个数据集上进行了验证,并与四个基准进行了对比。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

论文标题:Latent Guard: a Safety Framework for Text-to-image Generation

论文链接:https://www.php.cn/link/c92b32fbc94e2dff3e5516401d9bb463

代码&数据集链接:https://github.com/rt219/LatentGuard

方法与数据集构建

我们首先生成围绕黑名单概念的安全和不安全提示的数据集(左侧)。然后,我们利用预训练的文本编码器提取特征,并通过我们的嵌入映射层将其映射到一个学习的潜在空间(中间)。在训练过程中,只有嵌入映射层会更新,所有其他参数保持冻结状态。我们通过在提取的嵌入上施加对比损失进行训练,拉近不安全提示和概念的嵌入,同时将它们与安全提示的嵌入区分开来(右侧)。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

对于 C 个概念,我们根据第 3.1 节中的描述,使用大型语言模型 (LLM) 对不安全的 U 提示进行采样。然后,我们通过用同义词替换 c(同样使用 LLM)来创建同义词提示,并得到 U^syn。此外,我们使用对抗攻击方法将 c 替换为 "" 对抗文本 (U^adv)。安全提示 S 从 U 中获得。这对于每个 ID 和 OOD 数据都执行。

实验结果

WeShop唯象
WeShop唯象

WeShop唯象是国内首款AI商拍工具,专注电商产品图片的智能生成。

下载

我们提供了 Latent Guard 和基准模型在 CoPro 上的准确率 (a) 和 AUC (b)。在所有设置中,我们的排名均为第一或第二,仅在显式 ID 训练数据上进行训练。图 (c) 显示了 CoPro 提示和生成图像的示例。不安全的生成图像证明了我们数据集的质量。Latent Guard 是唯一能够阻止所有测试提示的方法。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

在未见数据集上的评估。我们在现有数据集上测试了 Latent Guard,包括 Unsafe Diffusion 和 I2P++。尽管输入的 T2I 提示分布与 CoPro 中的分布不同,我们仍然超越了所有基准,并实现了稳健的分类。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

速度和特征空间分

计算成本。我们测量了在 c_check 中不同批次大小和概念下的处理时间和内存使用。在所有情况下,资源需求都很有限。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

特征空间分析。在 CoPro 上训练 Latent Guard 会自然地出现安全/不安全区域(右侧)。在 CLIP 潜在空间中,安全和不安全的嵌入混合在一起(左侧)。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

更多研究细节,可参考原论文。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

306

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2035

2024.08.16

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

17

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

22

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

91

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

124

2026.01.23

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

14

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

65

2026.01.22

PHP后端开发相关内容汇总
PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容,阅读专题下面的文章了解更多详细内容。

59

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.9万人学习

Django 教程
Django 教程

共28课时 | 3.4万人学习

MySQL 教程
MySQL 教程

共48课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号