如何在Python中实现不区分大小写的文本高亮（含边界定位与区间高亮）

聖光之護

发布时间：2026-03-06 16:09:31

487人浏览过

来源于php中文网

原创

如何在Python中实现不区分大小写的文本高亮（含边界定位与区间高亮）

本文介绍一种灵活、鲁棒的Python文本高亮方案：支持不区分大小写匹配，并可将两个指定关键词之间的全部文本（不含关键词本身）统一高亮，适用于日志解析、文档摘要提取等多行文本处理场景。

本文介绍一种灵活、鲁棒的python文本高亮方案：支持不区分大小写匹配，并可将**两个指定关键词之间的全部文本**（不含关键词本身）统一高亮，适用于日志解析、文档摘要提取等多行文本处理场景。

在实际文本处理中（如从日志、配置文件或网页内容中提取段落），我们常需先定位起始与结束标记词（例如 "START" 和 "END"），再对二者之间的内容进行格式化处理——比如加粗、变色或转为大写以作视觉强调。但原生 str.replace() 方法存在两大局限：严格区分大小写，且仅能替换精确匹配的子串，无法识别上下文边界。若直接用 sentence.replace(word, word.upper())，则 "Nice" 不会匹配 "nice"，更无法实现“高亮两处 nice 之间的中间内容”。

下面提供一个经过优化的 highlight_between() 函数，它真正解决上述问题：

import re

def highlight_between(text: str, start_word: str, end_word: str, case_sensitive: bool = False) -> str:
    """
    高亮文本中所有位于 start_word 与 end_word 之间的内容（不包含边界词本身）

    Args:
        text: 原始字符串（支持多行）
        start_word: 起始标记词
        end_word: 结束标记词
        case_sensitive: 是否区分大小写，默认 False

    Returns:
        高亮后的新字符串（中间内容转为大写）
    """
    flags = 0 if case_sensitive else re.IGNORECASE
    pattern = rf'({re.escape(start_word)})((?:(?!{re.escape(start_word)}|{re.escape(end_word)}).)*)({re.escape(end_word)})'

    def replacer(match):
        start, middle, end = match.groups()
        return f"{start}{middle.upper()}{end}"

    # 使用 re.sub 迭代替换所有匹配区间
    result = re.sub(pattern, replacer, text, flags=flags)
    return result

# 示例：多行文本中高亮两个 "nice" 之间的内容
original = """Have a nIcE day,
you nice person!! 
nice people nice people"""

print("原文：")
print(repr(original))
print("\n高亮结果（'nice' 为边界，中间内容大写）：")
highlighted = highlight_between(original, "nice", "nice")
print(repr(highlighted))

✅ 输出效果示意（关键部分已加粗）：
'Have a nIcE day,\nyou **NICE PERSON!! \nNICE PEOPLE** nice people'

68爱写

专业高质量AI4.0论文写作平台，免费生成大纲，支持无线改稿

下载

? 说明：该函数使用正则表达式 (?:(?!...).)* 实现非贪婪、跨行、无嵌套的区间捕获，自动跳过嵌套边界，确保逻辑清晰可靠。

立即学习“Python免费学习笔记（深入）”；

注意事项与最佳实践

✅ 安全转义关键词：使用 re.escape() 防止 start_word 或 end_word 含正则元字符（如 .、*、(）导致意外匹配；
✅ 支持多行文本：默认启用 re.DOTALL（可通过 flags |= re.DOTALL 显式开启），使 . 匹配换行符；
⚠️ 避免重叠匹配：本实现采用单次扫描+非贪婪匹配，不支持“首尾重叠”场景（如 niceXXXniceYYYnice 中只匹配第一对）；如需全量覆盖，可改用 finditer 手动遍历；
? 扩展建议：如需 HTML 高亮（如 ...）或 ANSI 彩色终端输出，只需修改 replacer 函数中的返回值即可，核心逻辑完全复用。

掌握这一模式，你便能稳健地构建文本抽取—高亮—呈现的完整流水线，显著提升脚本的可读性与调试效率。

Python元组与列表区别_不可变对象解析

Python时间相关单元测试_时间mock实践

Python属性查找顺序_实例与类解析

Python面向对象设计原则_单一职责实践

如何在循环中正确维护并更新测验程序的分数变量

相关标签:

python 正则表达式 word

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何基于行列匹配从宽格式DataFrame中提取值并填充新列下一篇：Python字符串拼接优化_性能对比分析

作者最新文章

MagicAgent— 荣耀联合复旦推出的智能体基础模型

2026-03-06 13:18

实现水平滚动后无法垂直返回顶部的问题修复方案

2026-03-06 13:26

Python 中按命名规则批量加载并分组处理图像数据集的完整教程

2026-03-06 13:36

CSS 文件覆盖问题解析：加载顺序、选择器权重与字体资源一致性

2026-03-06 13:49

Highcharts 世界地图钻取后回退时视角错乱的解决方案

2026-03-06 13:53

JavaScript 中按指定属性分离唯一项与重复项的高效实现

2026-03-06 14:03

JavaScript 数组按指定属性分离唯一项与重复项的实用方法

2026-03-06 14:07

Python脚本高效解析专有配置文件为CSV格式

2026-03-06 14:09

Laravel 5.5 注册成功后自定义跳转路径的完整配置指南

2026-03-06 14:11

R503指纹传感器与树莓派通信失败的排查与解决指南

2026-03-06 14:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

530

2023.06.20

正则表达式不包含

正则表达式，又称规则表达式,，是一种文本模式，包括普通字符和特殊字符，是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章，希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

765

2023.07.05

java正则表达式匹配字符串

在Java中，我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容，帮助大家解决问题。

219

2023.08.11

正则表达式空格

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容，供大家免费下载体验。

356

2023.08.31

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容，可以访问下面的文章。

244

2023.11.17

正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

546

2023.12.06

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板