0

0

AgentOCR:一个多语言支持、易于使用的 OCR 项目

P粉084495128

P粉084495128

发布时间:2025-07-18 10:52:32

|

201人浏览过

|

来源于php中文网

原创

AgentOCR 是基于 PaddleOCR 和 ONNXRuntime 开发的 OCR 项目,含 Python 包和标注软件。其 API 与 PPOCR 基本一致,易切换,依赖少、易打包。可通过 pip 安装,需手动装 ONNXRuntime。支持多语言识别,通过配置文件快速切换,调用简单,能输出识别文本及位置、置信度等信息。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

agentocr:一个多语言支持、易于使用的 ocr 项目 - php中文网

引入

  • AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目
  • 本项目目前包含 Python Package 【AgentOCR】 和 OCR 标注软件 【AgentOCRLabeling】

项目细节

  • Github:AgentMaker/AgentOCR
  • 使用指南:AgentOCR Package 使用说明

特性

  • API 基本与 PPOCR Package 保持一致,只需简单改动模型加载代码即可直接切换
  • 基于 ONNXRuntime 开发,剔除无用依赖,易于 Python 程序打包

安装

  • AgentOCR 可直接通过 pip 进行下载安装
  • Package 依赖 ONNXRuntime,不过由于 ONNXRuntime 的版本过多,安装 AgentOCR 不会自动安装该依赖
  • 需要根据 ONNX 官网安装提示,手动选择合适的平台版本进行安装
In [1]
# 安装 AgentOCR!pip install agentocr# 安装 CPU 版本 ONNXRuntime!pip install onnxruntime# 安装 GPU 版本 ONNXRuntime# !pip install onnxruntime-gpu

使用

  • 支持多语言识别模型,可通过内置的配置文件进行快速切换

中/英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - php中文网

In [2]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='ch')# 设置测试图片路径img_path = 'images/ch.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2021/08/20 17:30:08] root INFO: All available providers: ['CPU']
[2021/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:08] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:09] root DEBUG: dt_boxes num : 16, elapse : 0.13202476501464844
[2021/08/20 17:30:09] root DEBUG: rec_res num  : 16, elapse : 0.590078592300415
[[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.9713771]]
[[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.99220806]]
[[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤,100公斤起订)', 0.961909]]
[[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元,1000瓶起订)', 0.99086225]]
[[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】:代加工方式/OEMODM', 0.9834662]]
[[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】:纯臻营养护发素', 0.9786148]]
[[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】:YM-X-3011', 0.98218465]]
[[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.88782406]]
[[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】:220ml', 0.9954411]]
[[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】:适合所有肤质', 0.9606319]]
[[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】:鲸蜡硬脂醇、燕麦-葡聚', 0.9720796]]
[[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油xian胺内基甜菜碱、泛醇', 0.8544037]]
[[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['(成品包材)', 0.9908909]]
[[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['(主要功能】:可紧致头发磷层,从而达到', 0.9463466]]
[[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果,给十燥的头', 0.94709635]]
[[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.99771744]]

英文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - php中文网

mallcloud商城
mallcloud商城

mallcloud商城基于SpringBoot2.x、SpringCloud和SpringCloudAlibaba并采用前后端分离vue的企业级微服务敏捷开发系统架构。并引入组件化的思想实现高内聚低耦合,项目代码简洁注释丰富上手容易,适合学习和企业中使用。真正实现了基于RBAC、jwt和oauth2的无状态统一权限认证的解决方案,面向互联网设计同时适合B端和C端用户,支持CI/CD多环境部署,并提

下载
In [3]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='en')# 设置测试图片路径img_path = 'images/en.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2021/08/20 17:30:13] root INFO: All available providers: ['CPU']
[2021/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:13] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:13] root DEBUG: dt_boxes num : 3, elapse : 0.030713796615600586
[2021/08/20 17:30:13] root DEBUG: rec_res num  : 3, elapse : 0.027882814407348633
[[[77.0, 121.0], [268.0, 124124.0], [268.0, 164.0], [77.0, 161.0]], ['EPPING', 0.9977331]]
[[[100.0, 182.0], [247.0, 185.0], [246.0, 206.0], [100.0, 203.0]], ['Twinned with', 0.997261]]
[[[67.0, 204.0], [275.0, 209.0], [275.0, 231.0], [66.0, 227.0]], ['EppingenGermany', 0.9897056]]

韩文识别

AgentOCR:一个多语言支持、易于使用的 OCR 项目 - php中文网

In [4]
from agentocr import OCRSystem# 通过 config 参数来进行模型配置,内置多国语言的配置文件ocr = OCRSystem(config='korean')# 设置测试图片路径img_path = 'images/korean.jpg'# 调用 OCR API 进行全流程识别result = ocr.ocr(img_path)# 打印结果for line in result:    print(line)
[2021/08/20 17:30:16] root INFO: All available providers: ['CPU']
[2021/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:16] root INFO: Using providers: ['CPU']
[2021/08/20 17:30:17] root DEBUG: dt_boxes num : 5, elapse : 0.3222081661224365
[2021/08/20 17:30:17] root DEBUG: rec_res num  : 5, elapse : 0.06328773498535156
[[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.758096]]
[[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가간차좋아하는사양이성서서호과공증', 0.60792387]]
[[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가죽어어킬것만갈하서어기를한다', 0.7302016]]
[[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈앞에아른아른거리는잘생긴열굴가푸', 0.6773213]]
[[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에명도는 그의촉촉한 옥소리예', 0.8373457]]

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

8

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

8

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

6

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

1

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

17

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

18

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

3

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号