0

0

C++怎么实现AC自动机_C++多模式串匹配算法【文本】

穿越時空

穿越時空

发布时间:2026-02-23 15:33:34

|

767人浏览过

|

来源于php中文网

原创

ac自动机核心是trie树加bfs构建fail指针:先插入模式串建trie,再用队列bfs为每个节点计算fail——u的子节点v的fail指向fail[u]向下找v->ch的子节点,找不到则继续跳fail链;node需含next[26]/map、fail、end_id;匹配时每步沿fail链回溯收集所有end_id,支持重叠匹配;内存宜用静态数组预分配,end_id用int标识单匹配,多匹配另设output映射。

c++怎么实现ac自动机_c++多模式串匹配算法【文本】

AC自动机核心结构怎么建:Node设计和fail指针构造

AC自动机本质是Trie树 + BFS构建的fail指针,不是靠递归或暴力回溯。关键在两个动作:插入所有模式串建Trie,再用BFS给每个节点算fail指针。

常见错误是把fail写成“父节点的子节点匹配失败就跳到父节点的fail”,漏掉“继续往下找子节点”这步——正确逻辑是:当前节点u的子节点v,其fail[v] = fail[u]向下找v->ch对应的子节点,找不到就继续跳fail[fail[u]],直到根或找到为止。

  • Node里至少存next[26](或unordered_map<char node></char>)、failend_id(标记是否为某模式串结尾,可存多个ID)
  • fail必须用队列BFS,不能DFS;否则深度不够,上层fail还没算好,下层就依赖它
  • 根节点fail指向自身或nullptr,但后续遍历中要特殊处理,避免空指针解引用

多模式匹配时怎么跑文本:边走边跳fail,别只走next

单靠Trie的next只能匹配前缀,AC自动机真正发力在失配时沿fail跳转并累积输出。文本指针每走一位,都要从当前节点出发,不断跳fail,收集所有经过的end_id

典型错误是“匹配到一个模式串就重置节点回根”,这会漏掉重叠匹配(如文本"ababab"中模式"abab""baba");或者只检查当前节点end_id,不向上跳fail链查更短的后缀模式。

立即学习C++免费学习笔记(深入)”;

MyMap AI
MyMap AI

使用AI将想法转化为图表

下载
  • 对文本每个字符c,先尝试cur = cur->next[c];若为空,则cur = cur->fail直到cur非空或到根
  • 然后从该cur开始,沿fail链向上遍历(用while循环),只要节点end_id != -1就记录匹配
  • 如果模式串允许重叠(绝大多数场景都允许),不能在匹配后cur = root,必须保持当前cur继续跑下一个字符

内存和性能怎么控:静态数组 vs 指针,以及end_id怎么存

AC自动机最耗资源的是节点数,最大可能达所有模式串总长度(比如10万串,平均长50,节点就500万)。用动态new Node易触发频繁分配,用静态数组预分配更稳,但得估算上限。

end_id如果只存一个int,就无法支持同一位置匹配多个模式;若用vector<int></int>又增内存开销。实际项目中常用位图或单独的output[]数组映射。

  • 小写字母场景直接用Node* next[26],访问快;含大小写/数字时改用unordered_map<char node></char>,但哈希有常数开销
  • 静态数组建议按max_nodes = total_pattern_length + 10预分配,配合pool[idx]alloc()管理,避免new/delete抖动
  • end_id推荐存为int,-1表示无,>=0表示唯一ID;多个模式需匹配则另建vector<vector>> outputs</vector>,以节点ID为索引

调试fail指针总出错?用BFS序打印+手动验3个节点

fail指针错,90%是因为BFS入队顺序或空节点处理不对。最有效验证法:打印BFS序中前3个非根节点的fail指向,并手算它们应该跳去哪。

例如插入"he""she""his""hers",节点"she"结尾的s-h-e,其fail应指向根下'e'(即"he"的结尾),而不是"h"nullptr。一旦发现跳到了不存在的字符路径,说明BFS时没处理next[c] == nullptr的补全逻辑。

  • BFS循环内,对每个出队节点u,遍历所有c,若u->next[c]存在,则设其fail;若不存在,显式设u->next[c] = u->fail->next[c](前提是u->fail已设好)
  • 打印时加一句:printf("node[%d] fail→%d (ch='%c')\n", idx, fail_idx, c),比GDB单步快得多
  • 测试用例务必包含前缀/后缀重叠,如"abc""bc",否则fail链根本不会被触发

C++里AC自动机的坑不在算法本身,而在fail指针构造时对空next的补全逻辑、匹配时对fail链的完整遍历、以及节点内存布局对缓存友好性的隐性影响。这些地方一错,表现就是漏匹配、崩溃、或速度骤降几倍。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

103

2023.09.25

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

300

2023.11.28

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

830

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

580

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

294

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

210

2025.08.29

空指针异常处理
空指针异常处理

本专题整合了空指针异常解决方法,阅读专题下面的文章了解更多详细内容。

23

2025.11.16

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10万人学习

C 教程
C 教程

共75课时 | 4.9万人学习

C++教程
C++教程

共115课时 | 18.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号