0

0

百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案

P粉084495128

P粉084495128

发布时间:2025-07-29 10:03:56

|

844人浏览过

|

来源于php中文网

原创

本赛题要求建立模型消除屏摄图片的摩尔纹噪声。数据集含1000个训练样本及A、B榜各200个测试样本,为image-to-image任务。基线采用WDNet模型,结合DenseNet与空洞卷积,新增随机旋转、裁剪等数据增强,优化损失权重与学习率衰减策略,最终B榜得分63.013。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘ai大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网

赛题介绍

选手需要建立模型,对比赛给定的带有摩尔纹的图片进行处理,消除屏摄产生的摩尔纹噪声,还原图片原本的样子,并提交模型输出的结果图片。

数据集简介

本次比赛的数据集所有的图像数据均由真实场景采集得到,再通过技术手段进行相应处理,生成可用的脱敏数据集。该任务为image-to-image的形式,因此源数据和GT数据均以图片的形式来提供。本次比赛不限制使用额外的训练数据来优化模型。测试数据集的GT不做公开。

数据集构成

|- root  
    |- images
    |- gts

       

本次比赛最新发布的数据集共包含训练集、A榜测试集、B榜测试集三个部分,其中训练集共1000个样本,A榜测试集共200个样本,B榜测试集共200个样本; images 为带摩尔纹的源图像数据,gts 为无摩尔纹的真值数据(仅有训练集数据提供gts ,A榜测试集、B榜测试集数据均不提供gts); images 与 gts 中的图片根据图片名称一一对应。

以下图片为数据中的样本,左侧图片为原图,右侧图片为已经去除摩尔纹,同时亮度也有所调整的GT图(GroundTruth)。

百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网 百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        
百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网 百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

Baseline模型WDNet介绍

整体结构

WDNet是ECCV 2020提出一种去除摩尔纹的模型。该模型是一种基于小波与双分支的神经网络,结构如下:

百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

首先RGB图片需要通过WaveletTransform模块进行转换,得到一个48通道的数据,通过WDNet网络同样得到一个通道数与尺寸不变的特征图。最后在一次通过WaveletTransform使用转置卷积将图片还原得到最终预测结果。

这里WaveletTransform的权重是固定不变不需要训练的。

DenseNet

百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

DenseNet中使用旁路连接和特征复用的方式缓解了梯度消失的问题,同时减少了网络参数。DenseNet已经被用于去雾和超分辨率网络。

如上图所示,该模型中的dense分支新增了一个方向感知模块(DPM),用于找到摩尔纹的方向。DPM的输出和每一个dense的输出相乘,然后乘以一个因子β然后与输入相加。该设计可以有效的定位摩尔纹的位置。

Dilation

百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

下采样和池化可以增大感受野,但同时也丢失了一些细节。空洞卷积可以解决这个问题。在每一个dilation分支里,都有两层,有一个3x3的空洞卷积和3x3的普通卷积组成。

思路步骤

基于WDNet模型实现的baseline,对摩尔纹图像进行观察,增加了随机度数旋转和随机裁剪的数据增强策略和对loss权值的修改,以及修改学习率衰减的策略。

代码组织结构

demoire-baseline/
├── train.py
    └── dataset.py
    └── transforms.py
    └── vgg.py
    └── losses.py
    └── model.py
    ├── predict.py
    └── utils.py
        └── train_result/model/epoch_1200/model.pdparams
    └── model.py
       

数据增强策略

在RandomHorizontalFlip、Resize、Normalize的基础上,

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

下载
  1. 因摩尔纹是以一定曲线的状态存在,所以对图像进行0-90度的随机旋转(Rotate);

  2. 直接将图像resize成一个较小图片,可能会损失图像上摩尔纹的信息,所以先裁取大小为(512,512)的图像,再resize成(512,512)大小(Crop)。

其中,根据https://aistudio.baidu.com/paddle/forum/topic/show/993042 可知,尺寸不变的resize不会与原图像不同。 百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

调参优化策略

  1. 使用baseline的原loss函数形式,preceptual loss的权值的改变对结果有增益,将preceptual loss的权值由1改为1.1。

  2. 学习率衰减采用余弦退火(CosineAnnealingDecay),在训练时梯度下降算法可能陷入局部最小值,此时可以通过突然提高学习率,来“跳出”局部最小值并找到通向全局最小值的路径。

3)较小的batch_size和较多的epoch对结果有增益,其中batch_size = 4,epoch = 1200。

4)优化器选择AdamW。百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

下一步优化方向

  1. 在数据增强上加上仿射变换

  2. 在模型修改方面加上MBCNN的结果进行融合

训练

准备数据集

In [ ]
%cd /home/aistudio/data/
!unzip /home/aistudio/data/data120844/moire_train_dataset.zip!unzip /home/aistudio/data/data120844/moire_testA_dataset.zip
   

解压数据集之后,数据集目录如下

moire_train_dataset/
├── gts
└── images
   

启动训练命令

In [ ]
%cd /home/aistudio/demoire-baseline/
!python train.py --dataset_root ../data/moire_train_dataset/ --max_epochs 1200 --batch_size 4 --sample_interval 100
   

在训练过程中,可以设置sample_interval的值,来获取中间模型的预测推理效果图。比如100,代表每迭代100次,则使用模型进行一次推理预测,并生成一张对比图。

epoch 8: 百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网 epoch 12:百度网盘AI大赛——图像处理挑战赛:文档图像摩尔纹消除第七名方案 - php中文网        

在上面的图片中,左侧的图片为数据集中的原始图片,右边的图片为GT图,中间的图片为模型推理预测输出。可以看出随着模型训练迭代次数的增加,预测图越来越与GT图相似。

In [ ]
# 预测## 启动预测脚本
   
In [ ]
!unzip /home/aistudio/moire_testB_dataset.zip -d /home/aistudio/data/
   
In [ ]
%cd /home/aistudio/demoire-baseline/
!python predict.py --dataset_root ../data/moire_testB_dataset/ --pretrained train_result/model/epoch_1200/model.pdparams
   

运行结束后,结果文件保存在output/pre目录下。进入pre目录创建readme.txt文件。输入以下内容:

训练框架:PaddlePaddle
代码运行环境:V100
是否使用GPU:是
单张图片耗时/s:0.2
模型大小:15MB
其他说明:该算法参考WDNET网络。
       

然后压缩所有文件。

In [ ]
%cd /home/aistudio/demoire-baseline/output/pre/
!zip result.zip *.jpg *.txt
   

最后下载result.zip文件,提交即可。最终B榜得分63.013。

相关文章

百度网盘
百度网盘

百度网盘是一款省心、好用的超级云存储产品,已为超过7亿用户提供云服务,空间超大,支持多类型文件的备份、分享、查看和处理,自建多个数据存储中心。有需要的小伙伴快来保存下载体验吧!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

9

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

12

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

4

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

18

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

19

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号