0

0

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)

絕刀狂花

絕刀狂花

发布时间:2025-07-17 10:12:04

|

733人浏览过

|

来源于php中文网

原创

lccl网络:相互指导博弈来提升目标检测精度(附源代码)lccl网络:相互指导博弈来提升目标检测精度(附源代码)论文地址:https://www.php.cn/link/233e90f3f8794e85bc244be259a99724

源代码地址:https://www.php.cn/link/1fe165377d4907f0ea45a5397520b85c

计算机视觉研究院专栏

作者:Edison_G

一、背景

监督学习下的目标检测是计算机视觉领域中的一项关键任务,旨在通过边界框定位目标并将每个目标分配到预定义的类别中。深度学习方法在这一领域占据主导地位,近期的方法多基于Anchor机制。Anchor是在整个图像上均匀分布的不同大小和纵横比的预定义参考框,它们通过将目标检测问题转换为基于Anchor的边界框回归和分类问题,帮助网络处理目标尺寸和形状的变化。大多数先进的基于Anchor的目标检测器使用预定义的Anchor boxes与GT框(简称IoU-anchor)之间的交并比(IoU)来将样本Anchor分配给目标(正样本Anchor)或背景(负样本Anchor)。然后,使用这些分配的Anchors来最小化训练期间的边界框回归和分类损失。

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)Anchor A和Anchor B与GT框具有相同的IoU,但包含不同的视觉语义信息。图中虚线框为真实情况标注。

基于深度学习的目标检测涉及两个子任务:实例定位和分类。它们分别预测图像上的“位置”和“是什么”目标。在训练阶段,这两个任务通过梯度下降联合优化,但静态Anchor匹配策略并未明确受益于这两个任务的联合解决方案,这可能导致任务错位问题,即在评估阶段,模型可能会生成分类正确但定位不精确的边界框预测,以及定位精确但分类错误的预测。这些预测显著降低了整体检测质量。

二、前言

为了克服基于IoU-anchor策略的这两个局限性,研究者提出了一种新的自适应Anchor匹配准则,通过定位和分类任务的相互指导,动态分配训练Anchor样本以优化分类,反之亦然。特别是,将定位良好的Anchor限制为也分类良好(定位到分类),以及那些分类良好的Anchor也定位良好(分类到定位)。这些策略导致了基于内容/上下文的Anchor匹配,并避免了任务错位问题。尽管所提出的策略非常简单,但在PASCAL VOC和MS COCO数据集上,尤其是在严格的指标(如AP75)上,Mutual Guidance与不同深度学习架构的传统静态策略相比,带来了持续的平均精度(AP)提升。

新方法有望在需要精确实例定位的应用中更有效,例如自动驾驶、机器人、户外视频监控等。

三、新框架

传统的Anchor通常预定义了一组Anchor的纵横比,在实际的滑窗训练过程中,首先使用二分类模型判断这些Anchor的框内是否有物体,并根据设定的阈值将样本标注为positive或negative或ignored,然后进行边界框回归以进行调整,最后进行多分类并再次调整位置。

这里作者将预定义的Anchor和GT的IoU称为IoU-anchor,IoU-anchor大于50%的作为positive,小于40%的作为negative,其余作为ignored samples。如果没有Anchor的大于50%,则选取IoU最大的作为positive。如下图所示:

TicNote
TicNote

出门问问推出的Agent AI智能硬件

下载

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)定位到分类(Localize to Classify)动态调整分类方法中正负样本的阈值。由于随着训练进行,正样本数量增加(因为二分类模型能力逐渐增强,但阈值未变),作者认为这会导致训练不稳定。

因此,作者提出将分类模型的分类能力纳入阈值设置的考量范围,以动态设置阈值:在根据IoU-regressed标注确定正负样本时,不再直接采用固定阈值,而是根据IoU-anchor中的正样本数量n来选择IoU-regressed的前n个样本标注为positive,其余的negative和ignored同理。

这种策略能够随着定位能力的提高而提高,同时也保持了训练过程中正负样本分配的一致性!

分类到定位(Classify to localize)在分类早期,模型处于初始状态,大多数分类的结果都接近于0,存在类似于推荐系统的冷启动问题,同时也可能导致训练不稳定,因此研究者定义了一个Classify to localize策略来避免这种问题。

首先,作者定义了一个IoU-amplified来替换传统的IoU-regressed,其表达式如下:

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)其中σ是用于调整的增强系数超参数,p是分类得分。此外,这一部分也采用了类似于前面定位到分类部分动态阈值设置的策略来设置这里的正样本阈值。

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)显然,初始时与GT的IoU较大的anchor box置信度通常更高,被选中的概率也更高;当IoU相同时,置信度p较高的anchor得到的IOUamplified也更大。上图的第四列是直接预测的置信度,第五列是amplified之后的score。可以发现amplified后的结果与IoU和p都有关。

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)IoU-amplified总是高于IoU-anchor,并且amplification与预测的Classif分数成正比。特别是σ越小,amplification越强(注意σ要大于1),σ变大时就消失。

通过这种交互作用,训练过程能够让回归好但分类差的Anchor尽可能地提升分类精度,同样让分类好但回归差的Anchor尽可能地提升回归精度,从而在一定程度上解决了task-misalignment问题。

四、实验及可视化

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)LCCL网络:相互指导博弈来提升目标检测精度(附源代码)LCCL网络:相互指导博弈来提升目标检测精度(附源代码)训练阶段标签分配差异的可视化(图像大小设置为320×320像素)。红色、黄色和绿色Anchor框分别是由基于IoU-anchor、Localize to Classify和Classify to Localize分配的正样本Anchor。

LCCL网络:相互指导博弈来提升目标检测精度(附源代码)© THE END

转载请联系本公众号获得授权

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

3726

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2862

2024.08.16

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

26

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

68

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

164

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

84

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

113

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

29

2026.03.03

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

79

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.5万人学习

ThinkPHP6.x 微实战--十天技能课堂
ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.8万人学习

前端开发(基础+实战项目合集)
前端开发(基础+实战项目合集)

共60课时 | 4.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号