如何在 Go 中使用正则表达式准确匹配段落（不含空行）

心靈之曲

发布时间：2026-01-25 11:56:07

495人浏览过

来源于php中文网

原创

如何在 Go 中使用正则表达式准确匹配段落（不含空行）

本文介绍如何在 go 中借助 `regexp` 包正确提取文本中的非空段落，避免误匹配空行，并提供可直接运行的示例代码与关键注意事项。

在 Go 中使用正则表达式匹配“段落”时，需明确段落的定义：通常指由一个或多个非空行组成、以两个及以上连续换行符（\n\n）或文本结尾分隔的内容块。原始代码 (.+)(\n\n) 存在两个核心问题：

.+ 默认是贪婪且不跨行的（Go 的 regexp 默认不启用 (?s) 单行模式），无法匹配含换行符的多行段落；
它只匹配到 \n\n 前的内容，但会将 \n\n 本身作为捕获组的一部分，导致结果中混入空行，且无法捕获末尾无双换行的最后一个段落。

✅ 正确方案是使用 非贪婪单行模式：(?s).*?(\n\n|$)

(?s) 启用单行模式，使 . 可匹配包括 \n 在内的任意字符；
.*? 是非贪婪匹配，确保尽可能少地匹配字符，停在第一个 \n\n 或字符串末尾 $ 处；
(\n\n|$) 作为分隔符捕获组，既识别段落边界，又保证末尾段落（无后续空行）也能被完整捕获。

以下是修正后的完整示例：

package main

import (
    "fmt"
    "regexp"
)

func main() {
    str := `first paragraph
second line of first paragraph

second paragraph

third paragraph
second line of third paragraph`

    // 使用 (?s) 开启单行模式，.*? 非贪婪匹配段落内容，(\n\n|$) 匹配分隔符
    r, err := regexp.Compile(`(?s).*?(\n\n|$)`)
    if err != nil {
        panic(err)
    }

    matches := r.FindAllString(str, -1)
    // 清理匹配结果：去除末尾的 \n\n 或空字符串，并过滤空段落
    var paragraphs []string
    for _, m := range matches {
        // 去除末尾的 \n\n 和可能的前后空白
        trimmed := regexp.MustCompile(`\n\n$`).ReplaceAllString(m, "")
        trimmed = regexp.MustCompile(`^\s+|\s+$`).ReplaceAllString(trimmed, "")
        if trimmed != "" {
            paragraphs = append(paragraphs, trimmed)
        }
    }

    fmt.Printf("Extracted paragraphs (%d):\n", len(paragraphs))
    for i, p := range paragraphs {
        fmt.Printf("%d: %q\n", i+1, p)
    }
}

输出：

Gambo

世界上首个游戏氛围编程智能体

下载

Extracted paragraphs (3):
1: "first paragraph\nsecond line of first paragraph"
2: "second paragraph"
3: "third paragraph\nsecond line of third paragraph"

⚠️ 注意事项：

regexp.Compile 返回错误，切勿忽略（如原示例中的 _），生产环境务必检查 err；
FindAllString 返回的是包含分隔符的完整匹配串，需后处理去除 \n\n 和空白；
若需更健壮的段落分割（如兼容 \r\n\r\n、首尾空白敏感等），建议优先考虑字符串切分：strings.Split(strings.TrimSpace(str), "\n\n")，它更高效、更易读，且天然规避正则复杂性；
Go 的 regexp 基于 RE2，不支持反向引用、环视等高级特性，设计模式时请参考 RE2 语法文档。

总结：正则适用于边界清晰的复杂模式，但对纯段落分割，strings.Split 往往是更简单、安全、高效的选择；若必须用正则，请牢记 (?s) 与 .*? 的组合是跨行非贪婪匹配的关键。

如何在Golang中利用Asdf插件管理工具链 Go语言多语言环境统一管理

Golang中的容器化应用文件权限陷阱 Go语言处理USER指令下的文件写权限

解析Golang应用在容器化后的堆栈打印 Go语言捕获SIGQUIT输出分析

如何在Golang中实现Pod安全标准PSS Go语言容器安全配置

解析Golang中的组合模式与递归处理 Go语言解析复杂JSON树结构

相关标签:

go 正则表达式 ai 正则表达式字符串 regexp

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Martini 中正确集成 HTTP 文件服务下一篇：如何使用Golang处理HTTP重定向_Golang net/http Client操作技巧

作者最新文章

Maven 多模块项目中按 Profile 动态构建子集模块的正确实践

2026-03-15 15:56

河马剧场短剧在线浏览入口在哪

2026-03-15 16:00

Java 控制台输出日文颜文字（Kaomoji）乱码问题的完整解决方案

2026-03-15 16:00

TypeScript ESM 导入中省略文件扩展名的正确配置方案

2026-03-15 16:02

如何在 Go 中正确处理 HTTP 超时错误并准确获取响应状态码

2026-03-15 16:52

如何在 Java 中正确编写空值检查以避免 @Nonnull 赋值警告

2026-03-15 16:58

Python 中安全高效地解析并验证字典键值对的自定义条件表达式

2026-03-15 17:01

实现 Circle 类的 add 方法：基于面积叠加计算新半径

2026-03-15 17:01

如何让包含多个的长 div 自动换行

2026-03-15 17:06

如何在 Go 中正确反序列化 JSON 并访问结构体字段

2026-03-15 17:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

531

2023.06.20

正则表达式不包含

正则表达式，又称规则表达式,，是一种文本模式，包括普通字符和特殊字符，是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串，通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章，希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

767

2023.07.05

java正则表达式匹配字符串

在Java中，我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容，帮助大家解决问题。

219

2023.08.11

正则表达式空格

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容，供大家免费下载体验。

357

2023.08.31

Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据，或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示

正则表达式空格可以用“s”来表示，它是一个特殊的元字符，用于匹配任意空白字符，包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容，可以访问下面的文章。

245

2023.11.17

正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

549

2023.12.06

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板