0

0

Python正则替换技巧_re.sub进阶用法

舞夢輝影

舞夢輝影

发布时间:2026-03-06 15:38:40

|

569人浏览过

|

来源于php中文网

原创

re.sub支持字符串、函数、对象等多种替换方式,结合分组引用、字典映射和状态管理,可高效处理文本清洗、格式转换等复杂任务。

python正则替换技巧_re.sub进阶用法

Python 的 re.sub 不只是简单“找一个换一个”,关键在于灵活利用 替换参数的多种形态——支持字符串、函数、甚至带状态的对象,配合分组引用和条件逻辑,能解决大量文本清洗、格式转换、模板填充等实际问题。

用函数做动态替换,处理复杂逻辑

当替换内容依赖匹配结果(如大小写转换、计数、查表映射),直接传入函数比拼接字符串更清晰可靠。函数接收一个 Match 对象,返回替换字符串:

  • 把所有数字加 1:re.sub(r'd+', lambda m: str(int(m.group()) + 1), text)
  • 将驼峰命名转下划线(如 userNameuser_name):
    re.sub(r'([a-z])([A-Z])', lambda m: f'{m.group(1)}_{m.group(2).lower()}', text)
  • 统计并标记第几次出现:
    count = {'n': 0}; re.sub(r'pattern', lambda m: f'[#{(count["n"] := count["n"] + 1)}]', text)(Python 3.8+ 海象运算符)

用分组引用实现结构化重排

在替换字符串中用 g<name></name> 引用捕获组,可轻松调整顺序、补前缀后缀、或选择性保留部分内容:

68爱写
68爱写

专业高质量AI4.0论文写作平台,免费生成大纲,支持无线改稿

下载
  • 交换日期格式 2023-04-0101/04/2023
    re.sub(r'(d{4})-(d{2})-(d{2})', r'//', date_str)
  • 提取邮箱用户名并加域名前缀:
    re.sub(r'(w+)@(w+.w+)', r'prefix_@\2', 'alice@gmail.com')'prefix_alice@gmail.com'
  • 命名组更易读:
    re.sub(r'(?P<year>d{4})-(?P<month>d{2})', r'g<month>/g<year>', s)</year></month></month></year>

用字典/对象控制替换行为(避免硬编码)

把替换规则抽离到字典或类中,提升可维护性,尤其适合多规则映射或需复用逻辑的场景:

立即学习Python免费学习笔记(深入)”;

  • 用字典映射关键词:
    mapping = {'cat': 'feline', 'dog': 'canine'};<br>re.sub(r'cat|dog', lambda m: mapping[m.group()], text)
  • 用类封装带状态的替换器(如自动编号标题):
    class NumberedReplacer:
      def __init__(self): self.count = 0
      def __call__(self, m): self.count += 1; return f'[{self.count}] {m.group(1)}'

    re.sub(r'##s+(.+)', NumberedReplacer(), markdown)

注意边界与性能:避免常见坑

看似简单的 re.sub 容易因忽略细节导致意外结果:

  • 贪婪 vs 非贪婪:默认贪婪匹配,r'a.*b''a1b2b' 中匹配整个 'a1b2b';需写成 r'a.*?b' 才匹配 'a1b'
  • 特殊字符转义:替换字符串中 &$ 有特殊含义,如要字面量输出反斜杠,写 r'\''\\'
  • 编译正则提升性能:对高频调用,先 pat = re.compile(r'...'),再反复用 pat.sub(...)
  • 不匹配时返回原串re.sub 总是返回新字符串,未匹配则原样返回,无需额外判断

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1561

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

241

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

128

2025.10.17

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

203

2023.11.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

718

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

219

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1561

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

648

2023.11.24

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

1

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号