0

0

腾讯OCR团队斩获ICDAR大赛四项冠军

PHPz

PHPz

发布时间:2023-10-20 18:45:04

|

1213人浏览过

|

来源于机器之心

转载

在全球文字识别(ocr)领域顶级盛会icdar 2023上,腾讯ocr团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯ocr技术在全球的一流水平。

ICDAR大会是全球文档图像分析识别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞赛因其极高的技术难度和强大的实用性享誉国内外,与赛后非正式刷榜不同,ICDAR官方认证的正式竞赛采用全新的数据集,并且在比赛期间不公布参赛团队的信息和成绩,同时限制了结果提交时间和次数,属于高难度的“盲打”。

今年,腾讯OCR参赛团队是由腾讯数据平台部、微信技术架构部联合组成,重点参加了DSText(稠密小文本视频文本识别)和SVRD(结构化信息抽取)两大项目的比赛,取得4项赛道冠军。

DSText赛道,腾讯包揽全部两项冠军

DSText(稠密小文本视频文本识别)竞赛设置了2个任务:视频文本跟踪、视频文本端到端识别。由于文字非常密集且非常小,再加上环境干扰(相机抖动、运动模糊、光照变化等)与后期编辑(多镜头切屏、人工背景、游戏界面切换等),从视频帧中准确检测、跟踪、识别文本对算法鲁棒性要求很高,挑战性极大。部分比赛视频帧展示如下:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

腾讯OCR团队斩获ICDAR大赛四项冠军

ICDAR-DSText竞赛示意帧

在DSText竞赛的全部2个任务中,腾讯OCR团队均以绝对领先的优势获得冠军。

其中,任务1中,旨在跟踪视频中所有文本流,将视频帧间属于同一个文本实例的检测框聚合起来,评价指标是MOTA,腾讯以领先第二名12.04%的成绩取得冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军视频文本跟踪:冠军证书

在任务2中,旨在评估视频文本识别的端到端性能,任务要求在每一帧上正确检测文本,在视频帧上正确跟踪,并在序列级别正确识别,评价指标是OCR-MOTA,腾讯以领先第二名11.93%的成绩取得冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军视频文本端到端识别:冠军证书

SVRD赛道,腾讯以绝对优势获得两项冠军

SVRD(结构化信息抽取)竞赛包含HUST-CELL和BAIDU-FEST两大赛道共4个任务:复杂文档实体关系提取(E2E Complex Entity Linking)、复杂文档实体语义提取(E2E Complex Entity Labeling)、零样本结构化信息抽取(E2E Zero-shot Structured Text Extraction)和小样本结构化信息提取(Few-shot Structured Text Extraction)。由于文档图像版式复杂、结构多样,自然场景图像采集不规范、存在背景复杂、折损、弯曲、形变等问题,竞赛存在较大的挑战难度。部分比赛图片展示如下:

蕉点AI
蕉点AI

AI电商商品图生成平台 | 智能商品素材制作工具

下载

腾讯OCR团队斩获ICDAR大赛四项冠军

ICDAR-SVRD结构化信息抽取大赛样例

在SVRD竞赛中腾讯OCR团队共获得了2个冠军。

其中,任务2(E2E Complex Entity Labeling)旨在提取复杂文档图像上的语义实体,如标题、机构名、日期、金额、数字、商品名、人名等,腾讯在这个任务上以较大优势取得了冠军

腾讯OCR团队斩获ICDAR大赛四项冠军

E2E Complex Entity Labeling:冠军证书

任务4(E2E Few-shot Structured Text Extraction)赛题需要在提供非常少量训练数据的前提下,提取10个不同场景下的图像的关键信息,如银行卡、营业执照、出租车发票、购物小票、交通发票、定额发票、论文等场景下的关键信息,腾讯同样取得了冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军

E2E Few-shot Structured Text Extraction:冠军证书

据介绍,腾讯OCR团队是腾讯内部致力于研究和开发OCR技术的专业团队,团队在技术上自主研发了高精准度、高稳定性的文本检测和识别技术,在应用上,支持了腾讯内数百个业务场景,如腾讯广告、微信、QQ、腾讯云、腾讯视频、腾讯信息流产品。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

405

2023.08.14

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.23

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

31

2026.01.23

yy漫画官方登录入口地址合集
yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集,阅读专题下面的文章了解更多详细内容。

119

2026.01.23

漫蛙最新入口地址汇总2026
漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全,阅读专题下面的文章了解更多详细内容。

180

2026.01.23

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

16

2026.01.23

php远程文件教程合集
php远程文件教程合集

本专题整合了php远程文件相关教程,阅读专题下面的文章了解更多详细内容。

70

2026.01.22

PHP后端开发相关内容汇总
PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容,阅读专题下面的文章了解更多详细内容。

63

2026.01.22

php会话教程合集
php会话教程合集

本专题整合了php会话教程相关合集,阅读专题下面的文章了解更多详细内容。

64

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号