0

0

改进的检测算法:用于高分辨率光学遥感图像目标检测

王林

王林

发布时间:2024-06-05 15:13:01

|

1049人浏览过

|

来源于51CTO.COM

转载

01 前景概要

目前,难以在检测效率和检测结果之间取得适当的平衡。我们就研究出了一种用于高分辨率光学遥感图像中目标检测的增强YOLOv5算法,利用多层特征金字塔、多检测头策略和混合注意力模块来提高光学遥感图像的目标检测网络的效果。根据SIMD数据集,新算法的mAP比YOLOv5好2.2%,比YOLOX好8.48%,在检测结果和速度之间实现了更好的平衡。

02 背景&动机

随着远感技术的快速发展,高分辨率光学远感图像已被用于描述地球表面的许多物体,包括飞机、汽车、建筑物等。目标检测在远感图像的解释中起着至关重要的作用,可用于远感图像的分割、描述和目标跟踪。然而,由于其相对较大的视场和高海拔的必要性,航空光学远感图像表现出尺度、视点特异性、随机定向和高背景复杂性的多样性,而大多数传统数据集包含地面视图。因此,用于构建人工特征检测技术传统上在精度和速度方面具有较大差异的记录。由于社会的需求和深度学习发展的支持,在光学远感图像中使用神经网络进行目标检测是必要的。

目前结合深度学习分析光学远感照片的目标检测算法可以分为有监督、无监督和弱监督三种。然而,由于无监督和弱监督算法的复杂性和不确定性,监督算法是最常用的算法。此外,监督目标检测算法可分为单阶段或两阶段。基于飞机通常位于机场,船舶通常位于港口和海洋的假设,在下采样星图像中检测机场和港口,然后将发现的目标映射回原始的超高分辨率卫星图像,可以同时检测不同大小的物体。有研究者提出了一种基于RCNN的旋转目标检测方法,通过解决目标方向的随机化问题,提高遥感图像中目标检测的准确性。

03 新算法研究

目前的大多数YOLO系列检测头都是基于FPN和PAFPN的输出特性,其中基于FPN的网络,如YOLOv3,及其变体如下图a所示,它们直接利用单向融合特性进行输出。而基于PAFPN算法的YOLOv4和YOLOv5在此基础上增加了一个低电平到高电平的信道,它直接向上传输低级信号(下图b)。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

改进的检测算法:用于高分辨率光学遥感图像目标检测

如上图所示,在一些研究中,TPH-YOLOv5模型中的特定检测任务添加了一个检测头。在上图b和c中,只有PAFPN功能可以用于输出,而FPN功能未得到充分利用。因此,YOLOv7将三个辅助磁头连接到FPN输出,如上图d所示,尽管辅助磁头仅用于“粗粮选择”,并且重量评估较低。SSD的检测头是为了改善YOLO网络对锚集过于粗糙的设计而提出的,并提出了基于多尺度的密集锚设计组成。如图f所示,该策略可以同时利用PANet和FPN的特征信息。此外,还有64倍下采样处理直接添加了输出,这使得网络包含先前的全局信息。

多检测头方法可以有效地利用网络的输出特征。改进的YOLO是一个用于高分辨率遥感照片的目标检测网络。如下图所示:

改进的检测算法:用于高分辨率光学遥感图像目标检测

主干网的基本结构是以C3和卷积模块为核心的CSP密集网。在数据增强之后,图像被馈送到网络中,并且在核大小为6的Conv模块进行信道混合之后,许多卷积模块进行特征检索。在名为SPPF的特征增强模块之后,它们连接到Neck的PANet。为了提高网络的检测能力,进行了双向特征融合。Conv2d用于独立扩放融合的特征层,以生成多层输出。如下图所示,NMS算法将所有单层检测器的输出组合在一起,生成最终的检测帧。

改进的检测算法:用于高分辨率光学遥感图像目标检测

下图b描述了改进的YOLO网络每个模块的结构组成。

改进的检测算法:用于高分辨率光学遥感图像目标检测

Conv包括2D卷积层、BN层批量归一化和Silu激活函数,C3包括两个2D卷积层和一个瓶颈层,Upsample是上采样层。SPPF模块是SPP模块的加速版本,MAB模块如上面提及的所示,其中ECA如左下角所示。在没有降维的信道级全局平均池化之后,考虑到每个信道与其k个邻居的关系,使用大小为k的快速1D卷积来捕获局部跨信道交互信息,从而有效地执行ECA。上述两个变换沿着两个空间方向收集特征,以产生一对方向感知特征图,然后将其连接起来,并使用卷积和Sigmoid函数进行修改,以提供注意力输出。

04 实验及可视化

SIMD数据集是一个多类别、开源、高分辨率遥感对象检测数据集,共包含15个类别,如图4所示。此外,SIMD数据集更多地分布在中小型目标(w<0.4,h<0.4)中,并且我们提出的改进YOLO用于检测该区域的检测头是普通YOLO算法使用的检测头数量的两倍,因此改进的YOLO在该数据集上具有更大的优势。

改进的检测算法:用于高分辨率光学遥感图像目标检测

改进的检测算法:用于高分辨率光学遥感图像目标检测

可以将SPPF模块的输出连接到输出头,从而识别图像中的大目标。然而,SPPF模块的输出具有多个连接,并且涉及多个尺度的目标,因此直接将其用于探测头来识别大型物体将导致较差的模型表示,如上图所示,显示了添加MAB模块前后一些检测结果热图的视觉比较。在添加MAB模块后,该检测头专注于检测大目标,而将小目标的预测分配给其他预测头,提高了模型的表达效果,也更符合YOLO算法中基于目标大小划分检测头的要求。

改进的检测算法:用于高分辨率光学遥感图像目标检测

一些检测结果如上图所示。从各个检测结果来看,与其他算法没有太大差异,但与其他算法相比,我们研究的算法在保证时间消耗不显著增加的同时,提高了模型的检测效果,并利用注意力机制增强了模型的表达效果。

改进的检测算法:用于高分辨率光学遥感图像目标检测

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

40

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

67

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

47

2025.11.27

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

497

2023.08.14

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

69

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

37

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

82

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号