如何在OCR实时识别中过滤并仅显示预设关键词

心靈之曲

发布时间：2026-01-16 10:21:02

839人浏览过

来源于php中文网

原创

如何在OCR实时识别中过滤并仅显示预设关键词

本文介绍如何在android ocr应用中，对识别出的文本进行关键词匹配过滤，只将匹配到的预设词汇（如“abc”）显示在textview中，避免无效内容干扰，同时规避常见逻辑与作用域错误。

在OCR实时识别场景中，receiveDetections() 回调会持续返回识别出的文本块（TextBlock）。原始代码将所有识别结果拼接后直接显示，但实际需求往往是白名单式过滤：仅当识别文本中包含预定义关键词（如 "abc"）时，才在 TextView 中展示匹配项（可选择显示完整识别句或仅匹配词）。

关键问题在于你尝试使用的逻辑存在三处典型错误：

作用域错误：stringBuilder 是方法内局部变量，无法在 while 循环中被访问（且该循环本身无意义——它阻塞主线程、无退出条件、也未更新判断依据）；
逻辑颠倒：list.contains(stringBuilder) 试图用 StringBuilder 对象去匹配字符串列表，类型不匹配（应检查 stringBuilder.toString() 是否包含列表中的某词，而非反过来）；
越界风险：for (int j = 0; j

✅ 正确做法是在构建完识别文本后，立即进行关键词扫描，并生成过滤结果：

Getsound

基于当前天气条件生成个性化音景音乐

下载

@Override
public void receiveDetections(Detector.Detections detections) {
    final SparseArray items = detections.getDetectedItems();
    if (items.size() == 0) return;

    // 1. 拼接全部识别文本（保留换行便于调试）
    StringBuilder fullText = new StringBuilder();
    for (int i = 0; i < items.size(); i++) {
        TextBlock item = items.valueAt(i);
        fullText.append(item.getValue()).append("\n");
    }
    String detected = fullText.toString().trim();

    // 2. 定义关键词白名单（建议声明为成员变量，避免重复创建）
    List keywords = Arrays.asList("abc", "def", "xyz"); // 示例

    // 3. 提取所有匹配到的关键词（去重 + 保持顺序）
    Set matched = new LinkedHashSet<>();
    for (String keyword : keywords) {
        if (detected.toLowerCase().contains(keyword.toLowerCase())) {
            matched.add(keyword);
        }
    }

    // 4. 更新UI：显示匹配项（用换行分隔），无匹配则清空
    final String result = matched.isEmpty() 
        ? "" 
        : String.join("\n", matched);

    textView.post(() -> textView.setText(result));
}

? 注意事项：

✅ 使用 toLowerCase() 实现大小写不敏感匹配（OCR输出大小写不稳定）；
✅ 用 LinkedHashSet 保证匹配词按白名单顺序首次出现，并自动去重；
✅ textView.post() 确保在主线程安全更新UI；
⚠️ 避免在主线程做耗时操作（如正则全文匹配大量关键词），若词库极大（>1000条），建议预编译为 Aho-Corasick 自动机；
? 进阶需求（如高亮原文中匹配位置、显示上下文）可结合 SpannableStringBuilder 实现。

总结：过滤逻辑必须嵌入 receiveDetections() 内部，在 stringBuilder 可见范围内完成；核心是「遍历关键词 → 检查是否存在于识别文本中 → 汇总结果 → 更新UI」，而非在外部轮询 TextView 内容。

解决Docx4J 3.3.3处理Word文档出现“内容不可读”错误的方案

解决Docx4J 3.3.3生成Word文档的“不可读内容”错误：源码修补指南

解决Docx4J v3.3.3生成Word文档的“内容不可读”错误

Docx4j PDF转换中页眉页脚临时图片残留问题解析与规避

将 Docx4j 文档转换为 PDF 时如何处理临时图片文件

相关标签:

word android app ai 作用域 asic for while 局部变量字符串 int 循环线程主线程对象作用域 android ocr ui

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何正确测试共享私有方法的多个公共接口下一篇：在Java里如何使用contains方法判断元素存在_Java集合元素检测说明

作者最新文章

Go 项目中如何组织同包文件到不同子目录（如 models）

2026-01-15 15:43

国产像素《菲尔纳传说》登陆Steam 5年打造复古RPG

2026-01-15 15:45

如何让按钮在响应式布局中保持固定位置不随屏幕缩放偏移

2026-01-15 15:48

标题：使用 AspectJ 实现对带注解成员变量的读写访问拦截

2026-01-15 15:48

使用 Socket.IO 连接 Node.js 与 Go 服务端的潜在缺陷分析

2026-01-15 15:50

程序员笔记 CherryTree 1.6.3 发布

2026-01-15 15:52

搜打撤热门新游《ARC Raiders》Steam版现已封锁国区

2026-01-15 15:56

美团外卖开学季红包怎么领取

2026-01-15 15:59

Go 项目中如何正确组织多目录结构的同包代码

2026-01-15 16:02

标题：使用 AspectJ 实现基于字段注解的读写访问拦截教程

2026-01-15 16:06

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

while的用法

while的用法是“while 条件: 代码块”，条件是一个表达式，当条件为真时，执行代码块，然后再次判断条件是否为真，如果为真则继续执行代码块，直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容，供大家免费下载体验。

2023.09.25

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

256

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

208

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1465

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

619

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

550

2024.03.22

php中定义字符串的方式

php中定义字符串的方式：单引号；双引号；heredoc语法等等。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

545

2024.04.29

go语言字符串相关教程

本专题整合了go语言字符串相关教程，阅读专题下面的文章了解更多详细内容。

161

2025.07.29

C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法，包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程，以及常见代码质量问题的发现与修复。通过工程化示例，帮助开发者建立可测试、可维护、高质量的 C++ 项目体系。

2026.01.16

热门下载

网站特效

网站源码

网站素材

前端模板